OpenAI Realtime APIを使用した音声対話システムです。マイクで話しかけると、AIがリアルタイムで音声で応答します。
# 仮想環境を作成(初回のみ)
python3 -m venv venv
# 仮想環境を有効化
source venv/bin/activatepip install -r requirements.txtこのプログラムを実行するには、OpenAI APIキーが必要です。
export OPENAI_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"シェルの設定ファイルに追加します。
zsh(macOS デフォルト)の場合:
echo 'export OPENAI_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"' >> ~/.zshrc
source ~/.zshrcbash の場合:
echo 'export OPENAI_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"' >> ~/.bashrc
source ~/.bashrcecho $OPENAI_KEYAPIキーが表示されればOKです。
python voice_chat.py- マイクに向かって話しかけてください
- AIがリアルタイムで音声で応答します
- 終了するには
Ctrl+Cを押してください
- リアルタイム音声対話(Voice-to-Voice)
- 音声認識によるトランスクリプト表示(gpt-4o-transcribe)
- Semantic VAD による発話区間検出
- 割り込み対応(AI応答中に話しかけると応答を停止)
- 日本語対応
- サンプリングレート: 24000Hz
- チャンネル: モノラル
- フォーマット: PCM 16bit
- モデル: gpt-realtime
- 音声: alloy