翻訳(Translate)

設定：音声認識/合成

このページでは右クリックメニューの「設定」サブメニューにある項目「本体設定」で開くダイアログの、「音声認識/合成」ページについて解説しています。

このページではSSPの音声認識・合成機能の設定を行います。

各項目の解説

音声認識

機能→音声認識メニューをONにして使用してください。

認識エンジン: 音声認識エンジンを変更します。(System Default)で音声認識コントロールパネルで選択したものが使用されます。
プロファイル: 認識精度を高めるための学習情報を切り替えます。(System Default)で音声認識コントロールパネルで選択したものが使用されます。
認識エンジンの設定・マイクの設定・トレーニング: それぞれ、認識エンジンによっては設定可能になります。通常はすべて無効です。
音声入力元: 音声入力元となるマイク端子やヘッドセットなどを切り替えます。(System Default)で音声認識コントロールパネルで選択したものが使用されます。

音声合成

機能→音声合成メニューをONにして使用してください。

\0（メインキャラクター）: メインキャラクター（\0）の音声を設定します。音声の選択、ピッチの調整、設定ボタンから詳細設定が行えます。
\1（サブキャラクター）: サブキャラクター（\1）の音声を設定します。音声の選択(\0や\2と同じでも可)、ピッチの調整、設定ボタンから詳細設定が行えます。
\2～（その他のキャラクター）: \2以降の追加キャラクターの音声を設定します。音声の選択(\0や\1と同じでも可)、ピッチの調整、設定ボタンから詳細設定が行えます。
音声出力先: 音声を出力するスピーカーやイヤホン端子等の出力先を切り替えます。設定ボタンから詳細設定が行えます。
喋る速度: 音声合成の読み上げスピードを調整します。スライダーで「遅い」から「速い」まで設定できます。標準位置から調整してください。
音量: 音声合成の音量レベルを調整します。スライダーで0%から100%まで設定できます。
音声合成の進行速度に合わせてスクリプトの再生待ちを行う: 音声合成の読み上げ速度に合わせて、スクリプトの表示タイミングを同期させます。

音声合成の詳細設定ダイアログ (右側の設定ボタン)

LocalAPI

VOICEVOX,VOICEVOX Nemo,SHAREVOX,AivisSpeech: ボイスIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
COEIROINK v2: ボイスIDとスタイルIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
スタイルIDにはスタイル名（「れいせい」など）を入力してください。IDが分かっている方はIDも通ります。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
Style-BERT-VITS2: ボイスIDとスタイルIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
スタイルIDにはスタイル名を入力してください。IDが分かっている方はIDも通ります。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
Server.bat(server_fastapi.py)を起動してください。
OpenAI TTS - Local (ローカルAPI互換): ボイスIDにはText-to-speech AIモデルの名前を入力してください。例えば「irodori-tts」などです。
スタイルIDは互換サーバの仕様の従って入力してください。例えばIrodori-TTS-Serverの場合はvoicesフォルダに入れた参照音声のwavファイル名（拡張子なし）です。
ホスト名は同じPC内で動かすなら空欄で問題ありません。ポート番号はサービスごとの設定が必要です。例えばIrodori-TTS-Serverの場合は8088になります。

CloudAPI

Aivis Cloud API: ボイスIDには「モデル UUID」をコピーして入力してください。注意！話者UUIDではありません。
スタイルIDはボイスの詳細ページに書いてあります。
ピッチは0が推奨です。それ以外だと合成スピードが落ちるそうです。
APIキーはこちらのダッシュボードから取得できますので、キー欄に貼りつけてください。
OpenAI TTS - Cloud (クラウドAPI・または互換サービス): ボイスIDにはText-to-speech AIモデルの名前を入力してください。例えば「gpt-4o-mini-tts」「tts-1」などです。
スタイルIDはこちらのドキュメントの「Voice options」セクションに書いてある名前を入力してください。例：「marin」「cedar」
APIキーはこちらのダッシュボードから取得できますので、キー欄に貼りつけてください。
互換サービスを使う場合は、ホスト名を設定してください。OpenAIのText-to-speechを使う場合は空欄で問題ありません。

下部のボタン

ヘルプ: 本体設定ダイアログの、設定中のページのヘルプ（つまりこのページ）を開きます。
ダイアログ右上の「？」マークも同様です。
閉じる: 本体設定ダイアログを閉じます。
ダイアログ右上の「×」マークも同様です。