Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

生成的 csv 中不包含 score,gender,age 和 feature。 #2

Open
OrvilleQ opened this issue Jun 18, 2024 · 1 comment
Open

生成的 csv 中不包含 score,gender,age 和 feature。 #2

OrvilleQ opened this issue Jun 18, 2024 · 1 comment

Comments

@OrvilleQ
Copy link

您好。

我根据您在 2noise/ChatTTS#317 的代码本地进行了测试。音频生成部分的代码有改动,但评估部分的代码是直接用的您在 PR 当中提交的代码。

当最后生成 evaluation_results.csv 文件时,其中只包含三项测试的打分,而不像您在 Huggingface 上提供的数据集,包含一个总的 Score,以及声音的 gender,age 和 feature。

image

请问该 PR 中的评估部分的代码是应该生成这样的结果吗?如果是的话,请问更进一步生成 gender、age 和 feature 的代码有没有放出来的计划。因为我觉得比起声音一致性来讲,能够快速分辨声音的性质是这个项目更大的闪光点。

谢谢。

@6drf21e
Copy link
Owner

6drf21e commented Jun 18, 2024

是的 pr 部分只包括稳定性评估。
gender、age 和 feature 是自己找了一些样本音色, 然后根据 https://modelscope.cn/models/iic/speech_eres2netv2_sv_zh-cn_16k-common/ 计算目标音色的相似度。 男女准确度还行 其他不太准 所以就没放出代码。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants