OpenAI-WhisperをつかってDiscordの音声通話の文字起こしをするBot
日本語のみに対応しています。
- 音声転写: リアルタイムで音声をテキストに変換
- WebHookによる表示: Teams風に話者を表示
- レポート出力: 会話の記録をテキストファイルで保存
- 音声録音: 複数ユーザーの音声を時間軸に合わせて1つのファイルに結合
- 自動退室: ボイスチャットが0人になると自動で退室
- 細かな制御: 各機能をコマンドオプションで個別にON/OFF可能
ボイスチャンネルに参加して音声転写を開始します。
オプション:
realtime: リアルタイムメッセージ送信 (デフォルト:true)report: 退室時のレポート出力 (デフォルト:true)audio: 音声ファイルの録音・出力 (デフォルト:true)
ボイスチャンネルから退室します。
このBotを動作させるには以下のソフトウェアが必要です:
- Node.js (v16.0.0以上)
- FFmpeg - 音声ファイルの処理に必要
- Windows: 公式サイトからダウンロードしてPATHに追加
- macOS:
brew install ffmpeg - Linux:
sudo apt install ffmpegまたはsudo yum install ffmpeg
.envファイルを作成し、以下を設定してください:
BOT_TOKEN=your_discord_bot_token# Node.js依存関係のインストール
npm install
# Whisperモデルのダウンロード(初回のみ)
npx nodejs-whisper downloadWarning
nodejs-whisperのインストールについて
このライブラリはWhisperのネイティブバイナリをダウンロードします:
- 初回実行時に約1.5GB〜3GBのモデルファイルをダウンロード
- ダウンロードには時間がかかる場合があります
- CUDAが利用可能な場合、GPU加速が有効になります
- インストールに失敗する場合はnodejs-whisper公式ドキュメントを参照してください
npm run startBot起動後、DiscordサーバーでSlashコマンドが利用可能になります。