小智AIよくある質問解答
小智AIチャットロボットよくある質問解答
表現を簡潔にするため、以下で小智AI端末は小智AIチャットロボットを指し、ESP32-S3-WROOM-1シリーズ開発ボード関連以外、以下の問題の大部分はブレッドボード構成方案に対するものです。他のメーカーの方案やカスタム方案の問題はここには整理していません。
基本入門問題
Q0:小智AIロボット複製操作手順は?
A:ブレッドボード、またはデュポン線、または自分で配線をはんだ付けする組立方式で、以下の5つの手順に分かれます:
- 材料とモジュール購入:リストに従って必要な材料とモジュールを購入。具体的には文書参照:小智AIチャットロボットハードウェアリストと配線チュートリアル
- ハードウェア配線:ユーザーが購入した開発ボード(44ピンまたは42ピン)に応じて、対応する配線図または接続表チュートリアル文書を選択し、対応する英文と数字番号に従って配線を接続
- ファームウェアダウンロードと書き込み:
- デフォルトWIFI版:WIFI版ファームウェア
v0.X.X_WiFi.zip
をダウンロード・書き込み(X.Xはバージョン番号) - ML307R-4G版(オプション):4G版ファームウェア
v0.X.X_ML307.zip
をダウンロード・書き込み(X.Xはバージョン番号) - 書き込みツールとファームウェアダウンロード:ファームウェアダウンロード
- デフォルトWIFI版:WIFI版ファームウェア
- デバイスネットワーク設定:
- ESP32S3開発ボードはデフォルトでWIFIネットワークをサポート。使用場所のWIFIまたは携帯電話ホットスポットを設定(2.4G帯域WIFI限定、二次認証が必要なWIFIネットワークは非サポート)
- ML307R-4G版:SIMカード/データカード(IoTカード)を挿入すればネットワーク接続可能
- デバイス登録:ウェブサイト後台コントロールパネルでデバイス登録、デバイス認証コード追加。「你好小智」で音声認識すれば使用可能
- ウェブサイト後台コントロールパネルURL:https://xiaozhi.dev
注意:
- 第3手順と第4手順のWIFI設定は、ハードウェアモジュール配線前に操作可能
- サードパーティ開発ボードまたは組立済み製品購入の場合、関連説明を参照。一般的に配線不要で、対応するファームウェアバージョンを直接書き込み可能
Q1:はんだごてができませんが、小智AIチャットロボットを複製できますか?
A:可能です。プロジェクトチュートリアル文書に従って、ブレッドボード構成WIFI方案を使用し、購入時にはんだ付け済みピンの電子部品モジュールを選択し、文書手順に従って配線とファームウェアダウンロードを開発ボードに行い、WIFIネットワークとデバイス登録設定後に小智AIチャットロボットを複製できます。全過程でははんだごてを使用する必要がありません。
Q2:小智AI複製のハードウェア材料と部品リストはどこで見て、どこで購入しますか?
A:
- 小智AI端末のハードウェア材料とモジュールリストは、配線文書第1部分と第2部分を参照
- 購入リンクについて、以下の方式があります:
- 散件:モジュール名で検索。例:開発ボードは「ESP32 S3 開発ボード」、マイクは「INMP441」、オーディオアンプは「MAX98357」など
- 組合せキット:「小智AI ESP32」または「小智AI ESP32S3」などのキーワードで検索
- 購入リンク参考:小智AIチャットロボットハードウェア購入説明とリンク
注意:商家製品に差異があるため、できる限り信頼性が高く販売量が多く評価の良い店舗で購入し、購入相談とアフターサービス品質問題は商家と直接協議してください。
Q3:ML307R-4Gモジュールを購入する必要がありますか?
A:ML307R-4Gモジュールはオプションで、主に以下の状況で使用:
- 使用場所にWIFIがない、またはWIFIが制限されている(一部のキャンパスネットワーク、商業施設など二次認証が必要なネットワーク)
- 非WIFI環境で、携帯電話ホットスポット接続が不便、またはユーザーがスマートフォンを持っていない
結論:正常なWIFIまたは携帯電話ホットスポットが使用可能であれば、ML307R-4Gモジュールを購入する必要はありません(wifiに接続したくない、またはWIFI接続を面倒と感じ、データ使用料を気にしない場合は除く)。
ファームウェアと書き込み問題
Q4:小智AIのファームウェアプログラムを書き込む方法、エラーが出た場合の対処法は?
A:IDF開発環境なし書き込みチュートリアルを参照。重要ポイント:
- チップ型番はESP32-S3を選択
- ロードモードはデフォルトUART、開発ボード右側のUSBインターフェースに挿入(背面シルクスクリーンでCOMに対応)
- 書き込むBINファイルにチェックを入れ、アドレスは0または0x0を入力
- COMポートは自分のコンピューターで認識されるCOMポート番号を選択
注意:
- 携帯電話または開発ボード設定のTYPE-Cデータケーブルを使用し、細い USB充電ケーブルは使用しない
- 書き込むBINファイルパスに中国語文字を含めてはいけません。そうでないと書き込みロードができません
Q5:IDFとは何の開発環境で、IDF開発環境を設定する必要がありますか?
A:
- 一般ユーザーはIDF開発環境をインストール・設定する必要はありません。開発者またはプログラミング学習ユーザーのみ設定が必要
- IDFはESP-IDFを指し、ESP32チップ会社楽鑫科技が公式に発表した開発プラットフォームで、C/C++言語でのESP32アプリケーション開発をサポート
- 設定が必要な場合:
- Windows設定開発環境参考:Windows ESP-IDF 5.3開発環境構築と小智コンパイル
- Linuxユーザーは関連資料を自分で調べて設定
ハードウェア問題
Q6:複製した小智AI端末のスピーカーから音が出ないのはなぜ?
A:
- スピーカーが正しく接続されているかチェック。一般的に赤線が正極、黒線が負極
- デジタルアンプが正しく接続され、接触が良好かチェック。配線表を参照
- コンピューターUSBポート供電を使用している場合、スピーカー出力3Wで供電不足の可能性。5V2A以上のUSB充電ヘッドまたは5V2.1Aの充電バンクUSBポート供電に変更をお勧め
配線が正しいことを確認しても解決できない場合、予備スピーカーとデジタルアンプモジュールでテストしてください。
Q7:複製した小智AI端末のスピーカーからかすれた音/異常音が出るのはなぜ?
A:
- スピーカーのかすれ音は一般的にデジタルアンプGAINが接地GNDに接続されていない、またはGND配線が不安定
- スピーカー内の音にざらざらした電子音がある場合は電磁干渉の可能性。小智AI端末を強磁場設備やモジュールから離し、充放電電源などを分離
Q8:小智AI端末の音量を調整する方法は?
A:
- 小智AI端末ファームウェアバージョン0.9.7以上では、音声認識による音量制御をサポート。直接「音量を○○に調整して」または「音量を小さく/大きくして」と話す
- 小智端末ファームウェアバージョン0.9.7未満では、物理ボタン接続で音量調節をサポート。ESP32-S3開発ボードIO39ピンが音量減、IO40ピンが音量増に対応
Q9:小智AI端末で「你好小智」が音声認識できない/反応しないのはなぜ?
A:
- 音声認識ワードが正しいことを確認(「你好小智」であり「小智你好」やその他ではない)
- マイク6ピンの配線が正しく、接触が良好かチェック
- INMP441マイクはデフォルトでマイクアイコンとシルクスクリーン文字がある音入口面が上向きになることに注意
- 配線が正しくても解決できない場合、予備マイクでテスト
- シリアル通信ツールで開発ボード出力情報をチェックすることで問題の特定に役立つ
Q10:小智AI端末がネットワーク設定を促すが、xiaozhi-xxx WIFIが見つからない?
A:これはESP32S3開発ボードのWIFI信号に問題があることを示します。対処法:
- 一時的に手で開発ボードアンテナ位置を押さえるか配線してアンテナ信号を強化
- シリアルツールで開発ボード出力情報をチェックし、問題を特定
Q11:小智AIでWIFI再設定/WIFI切替をする方法は?
A:
- 開発ボードを再給電/再起動し、WIFI接続で青ライト点滅時にBootボタンを押してから離し、通知音を聞いてWIFIネットワーク設定モードに再入場
- 小智AIが前回設定のWIFI接続に3回失敗した場合も、自動的にWIFIネットワー設定モードに再入場
注意:現在小智AIは前回接続のWIFIとパスワードのみデフォルト記憶。WIFIの変更やWIFI/ホットスポット停止の場合、再設定が必要。
Q12:スクリーンが点灯しないのはなぜ?
A:
- スクリーン配線が正しく、接触が良好かチェック
- ブレッドボード品質に良し悪しがあるため、問題がある場合はマルチメーターで導通状況をテスト
- 配線が正しいことを確認しても解決できない場合、予備スクリーンでテスト
機能と使用問題
Q13:小智AI端末は音楽再生をサポートしますか?
A:テスト音楽の再生をサポートします。著作権問題により、楽曲はテスト歌曲とネットユーザー提供歌曲、および一部の童謡などに限定されています。より多くの音楽に接続したい場合、自分でIOインターフェースを拡張してローカル音楽を再生するか、自分でコードを実装してサードパーティプラットフォーム音楽再生インターフェースに接続してください。
Q14:小智AI端末はDeepSeeKなどの大規模モデル切替をサポートしますか?
A:サポートします。現在以下の大規模モデル/APIをサポート:
- Qwen 2.5(リアルタイム)
- DeepSeek V3
- DouBao 1.5 Pro
- Qwen Max 2.5
操作:小智AI管理後台コントロールパネルにログインし、コンソール/デバイス管理/設定役割ページでAI役割大規模モデルを切替。 管理後台コントロールパネル:https://xiaozhi.dev
Q15:小智AI端末はBluetooth接続をサポートしますか?
A:一時的にサポートしていません。
- ESP32S3チップ/モジュールはBluetooth BLEスレーブモード(接続される側のみ)をサポート。小智AIプロジェクトはこの機能を使用していません
- スレーブモードのみサポートのため、小智AI端末はBluetoothヘッドホンやスピーカーへの接続をサポートしていません
Q16:小智AI端末により大きなスピーカーに交換できますか?
A:可能です。現在小智AI端末デフォルトのデジタルアンプMAX98357は3W前後のスピーカーをサポート。より大きな出力が必要な場合、I2Sをサポートする他のアンプモジュールに交換可能ですが、ESP32開発ボードのUSB供電は一般的に5Wを超えないため、より高出力には別途単独供電が必要です。
Q17:小智AI端末はヘッドホンまたは3.5MMオーディオ孔出力をサポートしますか?
A:デフォルトでは非サポート。オーディオモジュール交換が必要:
- PCM5102オーディオモジュール(ステレオDACサポート、約10元)
- UDA1334A I2Sステレオデコーダー(約13-15元)
上記デコーダーはすべて3.5MMオーディオ出力をサポートし、プログラムコード変更は不要です。
Q18:小智AI端末により大きなスクリーンに交換できますか?
A:以下タイプのスクリーン交換をサポート:
- SSD1306ドライバーOLEDスクリーン:
- デフォルト0.91インチ4ピンOLED単色スクリーン(128*32解像度)
- 0.96インチ、1.3インチ、1.5インチ(128*64解像度)などSSD1306ドライバーシリーズ4ピンスクリーンに交換可能
- 設定ファイルで解像度調整と再コンパイルが必要
- SPI-LCDスクリーン:
- ST7789ドライバー、ILI9341ドライバー、ST7735の3種をサポート
- DIY開発ボードタイプで対応するスクリーンドライバーと解像度を選択し、コンパイル後に書き込み
Q19:小智AIは音声認識ワード変更をサポートしますか?
A:サポートしますが、IDF開発環境設定、オープンソースプロジェクトコード修正、menuconfigでの音声認識ワード修正が必要。現在約25個選択可能。参考音声認識ワード変更文書。
注意:本プロジェクトは完全カスタム音声認識ワードを一時的にサポートしていません。ESP32楽鑫公式のオフライン音声認識ワード認識は公式への申請が必要です。
Q20:小智AIの役割名称は変更できますか?
A:可能です。小智AI管理後台コントロールパネル——役割設定でAI役割名前を修正し、保存後に有効。
注意:役割名前は大規模モデル設定のエージェント名称で、オフライン音声認識ワード「你好小智」とは無関係。両者に関連性はありません。 コンソールアドレス:https://xiaozhi.dev/console/
Q21:小智AIは音声/音色変更をサポートしますか?
A:サポートします。小智AIウェブサイトコンソール——設定役割で役割音声を切替。先に試聴してから設定保存を送信してください。次回対話では新設定の音色を使用します。 管理後台:https://xiaozhi.dev
Q22:小智AIに声で人を識別し、私が誰かを覚えてもらうことはできますか?
A:可能です。操作手順:
- 小智AIウェブサイト後台コンソール——エージェント——声紋認識を見つける
- ドロップダウンメニューで音声録音を1つ選択(比較的長く明瞭なものを推奨)
- 名称と説明を入力(対話者と役割の関係)
- OKボタンをクリックして話者を追加
- 小智AIを再度音声認識し、次回対話で質問すると、あなたが誰かを知っています
注意:技術制限により、認識正確率は100%ではありません。話者が多いほど、識別正確率は低下します。
Q23:小智AIを自分専用の音声にカスタマイズすることはサポートしますか?
A:内部テスト中です。この機能にはサーバー側サポートが必要で、カスタム音色アップロードは一時的に開放されていません。後続更新公告にご注目ください。
Q24:小智AI端末はバッテリー供電をサポートしますか?どのように接続しますか?
A:5V電圧昇圧モジュール追加が必要:
- ESP32S3開発ボードは5V供電が必要。リチウムバッテリーは通常3.8V電圧で不足のため、5V充放電一体ボード装着をお勧め
- 開発ボード外部5V供電:5V充放電一体ボードのVOUT/5V+を開発ボードの5Vinピンに接続、GNDを開発ボードGNDピンに接続
- 充電バンク/モバイル電源をTYPE-Cインターフェース経由で直接供電することも可能。5V2.1A出力インターフェース使用をお勧め
Q25:小智AI端末は音声でモーター/サーボモーター制御をサポートしますか?
A:デフォルトでは非サポート。サーボモーター/モータードライバーモジュール追加が必要。ESP32-S3は接続済みのIOTフレームワークを利用して拡張でき、音声制御でドライバーボードに信号出力可能。
現在小智AIはESP-SparkBot開発ボード(戦車)に適応して小車運動制御を実現。 オープンソースプロジェクトアドレス:https://oshwhub.com/esp-college/esp-sparkbot
Q26:小智AI端末は音声で他のデバイス制御をサポートしますか?
A:0.9.7以上バージョンでIOT IoTフレームワークをサポート済み。ピン制御でオン/オフライト試験定義をサポート。より多くの機能は必要に応じて自己開発可能。
Q27:小智AIは市場のどの開発ボードをサポートしますか?
A:現在以下の開発ボード/製品をサポート:
- 楽鑫ESP32-S3-DevKitC-1開発ボード
- 楽鑫esp-box-3
- 立創S3実戦派lichuang-dev
- 酷世開発ボードkevin-box-1とkevin-box-2
書き込み時は対応ファームウェアを選択。コンパイル時はmenuconfigで対応開発ボードを選択。他の開発ボードはプログラムソースコード修正と再コンパイル適応が必要。
Q28:小智AIプロジェクトが使用するのはどの大規模モデル?サーバー側はオープンソースですか?
A:サーバー側基本フレームワークはオープンソースですが、大規模モデルはプライベート訓練とデプロイ。使用しているのはAlibabaオープンのQWen 72B大規模モデルで、自己接続と訓練、デプロイには約4枚の4090グラフィックカード(96G メモリ)以上が必要。 サーバー側オープンソースアドレス:https://github.com/78/xiaozhi
Q29:小智AIはGPTなどの大規模モデル接続をサポートしますか?
A:一時的に非サポート。この機能はサーバー側実装が必要で、小智AIは他の大規模モデルAPI設定を一時的に開放していません。他の大規模モデルサポートが必要な場合、サーバー側を自己実装する必要があり、小智AIサーバー側オープンソース基本フレームワークを参考可能。
詳細情報は公式ウェブサイトを参照:https://xiaozhi.dev