We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
トークソフトにはよくある .lab ファイルの出力機能がソング側にもあると面白そうです。 実際の需要の声↓
https://x.com/Sazanami_ch35/status/1795808363064013058
VOICEVOXは原理的に、音声合成の途中で音素列を求めます。 その情報はエディタ内にもあるので、どうにかしてファイル出力まで持っていけば可能だとは思います。
voicevox/src/openapi/models/FrameAudioQuery.ts
Line 46 in a07c776
口パクで歌えるようになるので動画映えする
音素列を取得し、labに加工してファイル保存すればOKなはずです。
labに加工する方法はトーク側にあります。
voicevox/src/store/audioGenerate.ts
Line 70 in a07c776
ファイル保存は、wav保存時に同じファイル名.labを保存すればOK。
問題はどうやって音素列を保存関数まで持っていくかだと思います。 現状音声合成はリアルタイム性を加味するためにRENDER関数で閉じていて、音素列を持ってこれないはずです。 また給付ごとに区切ったフレーズごとに音声合成しているので、フレーズごとに散らばっている音素列をどうにかして集約する必要もありそうです。
このあたりの設計を整理するところからなのかなと思います。
設計だけでもコメントウェルカムです! 不明な点などあれば気軽にお聞きください 🙏
The text was updated successfully, but these errors were encountered:
EXPORT_WAVE_FILEはレンダリング完了を待ってから書き出すようになっていて、これと同じようにレンダリング完了を待つようにすれば音素列を持ってこれると思います。 音素列はstate.singingGuides.get(phrase.singingGuideKey)してsingingGuide.query.phonemesで取得できます。
EXPORT_WAVE_FILE
state.singingGuides.get(phrase.singingGuideKey)
singingGuide.query.phonemes
フレーズごとに散らばっている音素列は、以下の流れで集約できると思います。
Sorry, something went wrong.
この機能の要望を結構見かけるので、優先度中にしたいと思います!挑戦者求む! https://x.com/roxtarland/status/1819718592163918197
#2356 で実装した処理を使用すれば、こちらすぐ実装できそうです、取り組みます。
sigprogramming
No branches or pull requests
内容
トークソフトにはよくある .lab ファイルの出力機能がソング側にもあると面白そうです。
実際の需要の声↓
https://x.com/Sazanami_ch35/status/1795808363064013058
VOICEVOXは原理的に、音声合成の途中で音素列を求めます。
その情報はエディタ内にもあるので、どうにかしてファイル出力まで持っていけば可能だとは思います。
voicevox/src/openapi/models/FrameAudioQuery.ts
Line 46 in a07c776
Pros 良くなる点
口パクで歌えるようになるので動画映えする
実現方法
音素列を取得し、labに加工してファイル保存すればOKなはずです。
labに加工する方法はトーク側にあります。
voicevox/src/store/audioGenerate.ts
Line 70 in a07c776
ファイル保存は、wav保存時に同じファイル名.labを保存すればOK。
問題はどうやって音素列を保存関数まで持っていくかだと思います。
現状音声合成はリアルタイム性を加味するためにRENDER関数で閉じていて、音素列を持ってこれないはずです。
また給付ごとに区切ったフレーズごとに音声合成しているので、フレーズごとに散らばっている音素列をどうにかして集約する必要もありそうです。
このあたりの設計を整理するところからなのかなと思います。
その他
設計だけでもコメントウェルカムです!
不明な点などあれば気軽にお聞きください 🙏
The text was updated successfully, but these errors were encountered: