翻訳(Translate)

設定:音声認識/合成

このページでは右クリックメニューの「設定」サブメニューにある項目「本体設定」で開くダイアログの、「音声認識/合成」ページについて解説しています。

このページではSSPの音声認識・合成機能の設定を行います。

各項目の解説

音声認識

機能→音声認識 メニューをONにして使用してください。

認識エンジン
音声認識エンジンを変更します。(System Default)で音声認識コントロールパネルで選択したものが使用されます。
プロファイル
認識精度を高めるための学習情報を切り替えます。(System Default)で音声認識コントロールパネルで選択したものが使用されます。
認識エンジンの設定・マイクの設定・トレーニング
それぞれ、認識エンジンによっては設定可能になります。通常はすべて無効です。
音声入力元
音声入力元となるマイク端子やヘッドセットなどを切り替えます。(System Default)で音声認識コントロールパネルで選択したものが使用されます。

音声合成

機能→音声合成 メニューをONにして使用してください。

\0(メインキャラクター)
メインキャラクター(\0)の音声を設定します。音声の選択、ピッチの調整、設定ボタンから詳細設定が行えます。
\1(サブキャラクター)
サブキャラクター(\1)の音声を設定します。音声の選択(\0や\2と同じでも可)、ピッチの調整、設定ボタンから詳細設定が行えます。
\2~(その他のキャラクター)
\2以降の追加キャラクターの音声を設定します。音声の選択(\0や\1と同じでも可)、ピッチの調整、設定ボタンから詳細設定が行えます。
音声出力先
音声を出力するスピーカーやイヤホン端子等の出力先を切り替えます。設定ボタンから詳細設定が行えます。
喋る速度
音声合成の読み上げスピードを調整します。スライダーで「遅い」から「速い」まで設定できます。標準位置から調整してください。
音量
音声合成の音量レベルを調整します。スライダーで0%から100%まで設定できます。
音声合成の進行速度に合わせてスクリプトの再生待ちを行う
音声合成の読み上げ速度に合わせて、スクリプトの表示タイミングを同期させます。

音声合成の詳細設定ダイアログ (右側の設定ボタン)

LocalAPI

VOICEVOX,VOICEVOX Nemo,SHAREVOX,AivisSpeech
ボイスIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
COEIROINK v2
ボイスIDとスタイルIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
スタイルIDにはスタイル名(「れいせい」など)を入力してください。IDが分かっている方はIDも通ります。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
Style-BERT-VITS2
ボイスIDとスタイルIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
スタイルIDにはスタイル名を入力してください。IDが分かっている方はIDも通ります。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
Server.bat(server_fastapi.py)を起動してください。
OpenAI TTS - Local (ローカルAPI互換)
ボイスIDにはText-to-speech AIモデルの名前を入力してください。例えば「irodori-tts」などです。
スタイルIDは互換サーバの仕様の従って入力してください。例えばIrodori-TTS-Serverの場合はvoicesフォルダに入れた参照音声のwavファイル名(拡張子なし)です。
ホスト名は同じPC内で動かすなら空欄で問題ありません。ポート番号はサービスごとの設定が必要です。例えばIrodori-TTS-Serverの場合は8088になります。

CloudAPI

Aivis Cloud API
ボイスIDには「モデル UUID」をコピーして入力してください。注意!話者UUIDではありません。
スタイルIDはボイスの詳細ページに書いてあります。
ピッチは0が推奨です。それ以外だと合成スピードが落ちるそうです。
APIキーはこちらのダッシュボードから取得できますので、キー欄に貼りつけてください。
OpenAI TTS - Cloud (クラウドAPI・または互換サービス)
ボイスIDにはText-to-speech AIモデルの名前を入力してください。例えば「gpt-4o-mini-tts」「tts-1」などです。
スタイルIDはこちらのドキュメントの「Voice options」セクションに書いてある名前を入力してください。例:「marin」「cedar」
APIキーはこちらのダッシュボードから取得できますので、キー欄に貼りつけてください。
互換サービスを使う場合は、ホスト名を設定してください。OpenAIのText-to-speechを使う場合は空欄で問題ありません。

下部のボタン

ヘルプ
本体設定ダイアログの、設定中のページのヘルプ(つまりこのページ)を開きます。
ダイアログ右上の「?」マークも同様です。
閉じる
本体設定ダイアログを閉じます。
ダイアログ右上の「×」マークも同様です。