Skip to content

s-robot/realtime-chat

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

OpenAI Realtime API Voice-to-Voice 対話システム

OpenAI Realtime APIを使用した音声対話システムです。マイクで話しかけると、AIがリアルタイムで音声で応答します。

セットアップ

1. 仮想環境の作成と有効化

# 仮想環境を作成(初回のみ)
python3 -m venv venv

# 仮想環境を有効化
source venv/bin/activate

2. 依存関係のインストール

pip install -r requirements.txt

3. 環境変数の設定

このプログラムを実行するには、OpenAI APIキーが必要です。

方法1: 一時的に設定する(ターミナルを閉じると消えます)

export OPENAI_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"

方法2: 永続的に設定する

シェルの設定ファイルに追加します。

zsh(macOS デフォルト)の場合:

echo 'export OPENAI_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"' >> ~/.zshrc
source ~/.zshrc

bash の場合:

echo 'export OPENAI_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"' >> ~/.bashrc
source ~/.bashrc

設定の確認

echo $OPENAI_KEY

APIキーが表示されればOKです。

使用方法

python voice_chat.py
  • マイクに向かって話しかけてください
  • AIがリアルタイムで音声で応答します
  • 終了するには Ctrl+C を押してください

機能

  • リアルタイム音声対話(Voice-to-Voice)
  • 音声認識によるトランスクリプト表示(gpt-4o-transcribe)
  • Semantic VAD による発話区間検出
  • 割り込み対応(AI応答中に話しかけると応答を停止)
  • 日本語対応

技術仕様

  • サンプリングレート: 24000Hz
  • チャンネル: モノラル
  • フォーマット: PCM 16bit
  • モデル: gpt-realtime
  • 音声: alloy

About

OpenAI realtime apiによるvoice-to-voiceデモ

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages