🐾claw-stack
プラグイン OpenClaw エコシステム

Voice Control

どこからでも AI アシスタントと自然に会話 — 有料音声 API ゼロ

概要

Voice Control は OpenClaw をハンズフリー AI アシスタントに変えます。完全セルフホストの WebRTC スタック — ローカル音声認識に MLX-Whisper、無料 TTS に Edge-TTS、リアルタイム音声に LiveKit。ワンタイムリンクを生成し、スマートフォンで開いて話しかけるだけ。

0
有料 STT/TTS API
1h
リンク有効期限
Apple Silicon
最適化プラットフォーム
WebRTC
音声トランスポート

機能

主な機能

すべてのコンポーネントがローカルまたは無料サービスで動作 — 音声機能に継続的な API コストなし。

ローカル STT(MLX-Whisper)

音声認識が MLX-Whisper large-v3-mlx-4bit を使用して Apple Silicon Mac 上で完全にローカル実行。クラウド API なし、使用料なし、音声はマシンを離れません。

無料 TTS(Edge-TTS)

Microsoft の無料 Edge-TTS サービスによるテキスト読み上げ — 高品質の自然な音声、サブスクリプションや文字課金なし。

WebRTC(LiveKit)

LiveKit でセルフホストした WebRTC によるリアルタイム音声ストリーミング。低遅延の双方向音声で、任意のブラウザや iOS Safari から確実に動作。

iPhone 対応

どこからでも iPhone で AI を呼び出せます。Tailscale が信頼された HTTPS エンドポイントを提供し、iOS Safari が証明書警告なしで接続。

音声によるツール呼び出し

会話を通じて自然にトリガー:ファイルRead、シェルコマンド実行、メモリストア検索、アクティブセッション一覧 — すべて音声で。

Tailscale リモートアクセス

Tailscale ネットワーク内のどこからでもアクセス可能。ワンタイム通話リンクは1時間後に期限切れ、各セッションを新鮮かつ安全に保ちます。

アーキテクチャ

仕組み

完全セルフホストの音声パイプライン — マイクから Claude の声まで、ネットワークを離れません。

すべての通話は確定的な6ステップパイプラインを通ります。音声が Silero VAD で検出され、MLX-Whisper でデバイス上でローカル転写され、Claude で処理され、Edge-TTS で音声に変換 — すべてリアルタイムで WebRTC 経由。

1
マイク / iPhone WebRTC 経由で音声をキャプチャ
2
VAD Silero が音声の区切りを検出
3
STT MLX-Whisper がローカルで転写
4
Claude LLM がレスポンスとツール呼び出しを生成
5
Edge-TTS レスポンスを音声に合成
6
スピーカー LiveKit 経由で音声をストリームバック

ワンタイムリンクフロー

./call.sh を実行 — 署名付き JWT + ユニークルームを生成

Tailscale DNS 経由でリンクを配信(信頼された Let's Encrypt 証明書)

iPhone またはブラウザで開く — トークンサーバー経由の WebRTC ハンドシェイク

音声が LiveKit を通じて音声エージェントにストリーミング

リンクは1時間後に期限切れ — 次の通話は新しいリンク

STT

MLX-Whisper

ローカル、Apple Silicon

TTS

Edge-TTS

Microsoft 無料

Transport

LiveKit

セルフホスト WebRTC

Access

Tailscale

ゼロ設定 VPN

カバレッジ

音声でできること

音声エージェントは OpenClaw ツールへのフルアクセスを持っています — タイプできることはすべて今や言えます。

質問する

Claude と自然に会話 — 何でも聞いて、ブレインストーミング、ハンズフリーで素早く回答。

コマンド実行

音声で Mac mini でシェルコマンドを実行 — キーボード不要。

メモリ検索

OpenClaw メモリストアを声でクエリし、音声で即座に回答を受け取る。

ファイルRead

Claude にシステム上の任意のファイルをReadしてもらい、内容を要約または説明してもらう。

セッション一覧

どのエージェントがアクティブか、どのタスクが実行中か、どのセッションがあるか — 聞くだけ。

エージェント制御

サブエージェントを操作し、タスクステータスを確認、どこからでも音声で OpenClaw をオーケストレーション。

もうすぐリリース

ウェイトリストに参加

このプラグインのリリース時に最初にお知らせします。

ウェイトリストに参加