ローカル STT(MLX-Whisper)
音声認識が MLX-Whisper large-v3-mlx-4bit を使用して Apple Silicon Mac 上で完全にローカル実行。クラウド API なし、使用料なし、音声はマシンを離れません。
どこからでも AI アシスタントと自然に会話 — 有料音声 API ゼロ
概要
Voice Control は OpenClaw をハンズフリー AI アシスタントに変えます。完全セルフホストの WebRTC スタック — ローカル音声認識に MLX-Whisper、無料 TTS に Edge-TTS、リアルタイム音声に LiveKit。ワンタイムリンクを生成し、スマートフォンで開いて話しかけるだけ。
機能
すべてのコンポーネントがローカルまたは無料サービスで動作 — 音声機能に継続的な API コストなし。
音声認識が MLX-Whisper large-v3-mlx-4bit を使用して Apple Silicon Mac 上で完全にローカル実行。クラウド API なし、使用料なし、音声はマシンを離れません。
Microsoft の無料 Edge-TTS サービスによるテキスト読み上げ — 高品質の自然な音声、サブスクリプションや文字課金なし。
LiveKit でセルフホストした WebRTC によるリアルタイム音声ストリーミング。低遅延の双方向音声で、任意のブラウザや iOS Safari から確実に動作。
どこからでも iPhone で AI を呼び出せます。Tailscale が信頼された HTTPS エンドポイントを提供し、iOS Safari が証明書警告なしで接続。
会話を通じて自然にトリガー:ファイルRead、シェルコマンド実行、メモリストア検索、アクティブセッション一覧 — すべて音声で。
Tailscale ネットワーク内のどこからでもアクセス可能。ワンタイム通話リンクは1時間後に期限切れ、各セッションを新鮮かつ安全に保ちます。
アーキテクチャ
完全セルフホストの音声パイプライン — マイクから Claude の声まで、ネットワークを離れません。
すべての通話は確定的な6ステップパイプラインを通ります。音声が Silero VAD で検出され、MLX-Whisper でデバイス上でローカル転写され、Claude で処理され、Edge-TTS で音声に変換 — すべてリアルタイムで WebRTC 経由。
ワンタイムリンクフロー
./call.sh を実行 — 署名付き JWT + ユニークルームを生成
Tailscale DNS 経由でリンクを配信(信頼された Let's Encrypt 証明書)
iPhone またはブラウザで開く — トークンサーバー経由の WebRTC ハンドシェイク
音声が LiveKit を通じて音声エージェントにストリーミング
リンクは1時間後に期限切れ — 次の通話は新しいリンク
STT
MLX-Whisper
ローカル、Apple Silicon
TTS
Edge-TTS
Microsoft 無料
Transport
LiveKit
セルフホスト WebRTC
Access
Tailscale
ゼロ設定 VPN
カバレッジ
音声エージェントは OpenClaw ツールへのフルアクセスを持っています — タイプできることはすべて今や言えます。
Claude と自然に会話 — 何でも聞いて、ブレインストーミング、ハンズフリーで素早く回答。
音声で Mac mini でシェルコマンドを実行 — キーボード不要。
OpenClaw メモリストアを声でクエリし、音声で即座に回答を受け取る。
Claude にシステム上の任意のファイルをReadしてもらい、内容を要約または説明してもらう。
どのエージェントがアクティブか、どのタスクが実行中か、どのセッションがあるか — 聞くだけ。
サブエージェントを操作し、タスクステータスを確認、どこからでも音声で OpenClaw をオーケストレーション。
もうすぐリリース
このプラグインのリリース時に最初にお知らせします。