小智AIよくある質問解答

小智AIチャットロボットよくある質問解答

表現を簡潔にするため、以下で小智AI端末は小智AIチャットロボットを指し、ESP32-S3-WROOM-1シリーズ開発ボード関連以外、以下の問題の大部分はブレッドボード構成方案に対するものです。他のメーカーの方案やカスタム方案の問題はここには整理していません。

基本入門問題

Q0:小智AIロボット複製操作手順は?

A:ブレッドボード、またはデュポン線、または自分で配線をはんだ付けする組立方式で、以下の5つの手順に分かれます:

  1. 材料とモジュール購入:リストに従って必要な材料とモジュールを購入。具体的には文書参照:小智AIチャットロボットハードウェアリストと配線チュートリアル
  2. ハードウェア配線:ユーザーが購入した開発ボード(44ピンまたは42ピン)に応じて、対応する配線図または接続表チュートリアル文書を選択し、対応する英文と数字番号に従って配線を接続
  3. ファームウェアダウンロードと書き込み
    • デフォルトWIFI版:WIFI版ファームウェア v0.X.X_WiFi.zipをダウンロード・書き込み(X.Xはバージョン番号)
    • ML307R-4G版(オプション):4G版ファームウェア v0.X.X_ML307.zipをダウンロード・書き込み(X.Xはバージョン番号)
    • 書き込みツールとファームウェアダウンロード:ファームウェアダウンロード
  4. デバイスネットワーク設定
    • ESP32S3開発ボードはデフォルトでWIFIネットワークをサポート。使用場所のWIFIまたは携帯電話ホットスポットを設定(2.4G帯域WIFI限定、二次認証が必要なWIFIネットワークは非サポート)
    • ML307R-4G版:SIMカード/データカード(IoTカード)を挿入すればネットワーク接続可能
  5. デバイス登録:ウェブサイト後台コントロールパネルでデバイス登録、デバイス認証コード追加。「你好小智」で音声認識すれば使用可能

注意

  • 第3手順と第4手順のWIFI設定は、ハードウェアモジュール配線前に操作可能
  • サードパーティ開発ボードまたは組立済み製品購入の場合、関連説明を参照。一般的に配線不要で、対応するファームウェアバージョンを直接書き込み可能

Q1:はんだごてができませんが、小智AIチャットロボットを複製できますか?

A:可能です。プロジェクトチュートリアル文書に従って、ブレッドボード構成WIFI方案を使用し、購入時にはんだ付け済みピンの電子部品モジュールを選択し、文書手順に従って配線とファームウェアダウンロードを開発ボードに行い、WIFIネットワークとデバイス登録設定後に小智AIチャットロボットを複製できます。全過程でははんだごてを使用する必要がありません。

Q2:小智AI複製のハードウェア材料と部品リストはどこで見て、どこで購入しますか?

A

  1. 小智AI端末のハードウェア材料とモジュールリストは、配線文書第1部分と第2部分を参照
  2. 購入リンクについて、以下の方式があります:
    • 散件:モジュール名で検索。例:開発ボードは「ESP32 S3 開発ボード」、マイクは「INMP441」、オーディオアンプは「MAX98357」など
    • 組合せキット:「小智AI ESP32」または「小智AI ESP32S3」などのキーワードで検索
    • 購入リンク参考:小智AIチャットロボットハードウェア購入説明とリンク

注意:商家製品に差異があるため、できる限り信頼性が高く販売量が多く評価の良い店舗で購入し、購入相談とアフターサービス品質問題は商家と直接協議してください。

Q3:ML307R-4Gモジュールを購入する必要がありますか?

A:ML307R-4Gモジュールはオプションで、主に以下の状況で使用:

  • 使用場所にWIFIがない、またはWIFIが制限されている(一部のキャンパスネットワーク、商業施設など二次認証が必要なネットワーク)
  • 非WIFI環境で、携帯電話ホットスポット接続が不便、またはユーザーがスマートフォンを持っていない

結論:正常なWIFIまたは携帯電話ホットスポットが使用可能であれば、ML307R-4Gモジュールを購入する必要はありません(wifiに接続したくない、またはWIFI接続を面倒と感じ、データ使用料を気にしない場合は除く)。

ファームウェアと書き込み問題

Q4:小智AIのファームウェアプログラムを書き込む方法、エラーが出た場合の対処法は?

AIDF開発環境なし書き込みチュートリアルを参照。重要ポイント:

  1. チップ型番はESP32-S3を選択
  2. ロードモードはデフォルトUART、開発ボード右側のUSBインターフェースに挿入(背面シルクスクリーンでCOMに対応)
  3. 書き込むBINファイルにチェックを入れ、アドレスは0または0x0を入力
  4. COMポートは自分のコンピューターで認識されるCOMポート番号を選択

注意

  • 携帯電話または開発ボード設定のTYPE-Cデータケーブルを使用し、細い USB充電ケーブルは使用しない
  • 書き込むBINファイルパスに中国語文字を含めてはいけません。そうでないと書き込みロードができません

Q5:IDFとは何の開発環境で、IDF開発環境を設定する必要がありますか?

A

  1. 一般ユーザーはIDF開発環境をインストール・設定する必要はありません。開発者またはプログラミング学習ユーザーのみ設定が必要
  2. IDFはESP-IDFを指し、ESP32チップ会社楽鑫科技が公式に発表した開発プラットフォームで、C/C++言語でのESP32アプリケーション開発をサポート
  3. 設定が必要な場合:

ハードウェア問題

Q6:複製した小智AI端末のスピーカーから音が出ないのはなぜ?

A

  1. スピーカーが正しく接続されているかチェック。一般的に赤線が正極、黒線が負極
  2. デジタルアンプが正しく接続され、接触が良好かチェック。配線表を参照
  3. コンピューターUSBポート供電を使用している場合、スピーカー出力3Wで供電不足の可能性。5V2A以上のUSB充電ヘッドまたは5V2.1Aの充電バンクUSBポート供電に変更をお勧め

配線が正しいことを確認しても解決できない場合、予備スピーカーとデジタルアンプモジュールでテストしてください。

Q7:複製した小智AI端末のスピーカーからかすれた音/異常音が出るのはなぜ?

A

  1. スピーカーのかすれ音は一般的にデジタルアンプGAINが接地GNDに接続されていない、またはGND配線が不安定
  2. スピーカー内の音にざらざらした電子音がある場合は電磁干渉の可能性。小智AI端末を強磁場設備やモジュールから離し、充放電電源などを分離

Q8:小智AI端末の音量を調整する方法は?

A

  1. 小智AI端末ファームウェアバージョン0.9.7以上では、音声認識による音量制御をサポート。直接「音量を○○に調整して」または「音量を小さく/大きくして」と話す
  2. 小智端末ファームウェアバージョン0.9.7未満では、物理ボタン接続で音量調節をサポート。ESP32-S3開発ボードIO39ピンが音量減、IO40ピンが音量増に対応

Q9:小智AI端末で「你好小智」が音声認識できない/反応しないのはなぜ?

A

  1. 音声認識ワードが正しいことを確認(「你好小智」であり「小智你好」やその他ではない)
  2. マイク6ピンの配線が正しく、接触が良好かチェック
  3. INMP441マイクはデフォルトでマイクアイコンとシルクスクリーン文字がある音入口面が上向きになることに注意
  4. 配線が正しくても解決できない場合、予備マイクでテスト
  5. シリアル通信ツールで開発ボード出力情報をチェックすることで問題の特定に役立つ

Q10:小智AI端末がネットワーク設定を促すが、xiaozhi-xxx WIFIが見つからない?

A:これはESP32S3開発ボードのWIFI信号に問題があることを示します。対処法:

  1. 一時的に手で開発ボードアンテナ位置を押さえるか配線してアンテナ信号を強化
  2. シリアルツールで開発ボード出力情報をチェックし、問題を特定

Q11:小智AIでWIFI再設定/WIFI切替をする方法は?

A

  1. 開発ボードを再給電/再起動し、WIFI接続で青ライト点滅時にBootボタンを押してから離し、通知音を聞いてWIFIネットワーク設定モードに再入場
  2. 小智AIが前回設定のWIFI接続に3回失敗した場合も、自動的にWIFIネットワー設定モードに再入場

注意:現在小智AIは前回接続のWIFIとパスワードのみデフォルト記憶。WIFIの変更やWIFI/ホットスポット停止の場合、再設定が必要。

Q12:スクリーンが点灯しないのはなぜ?

A

  1. スクリーン配線が正しく、接触が良好かチェック
  2. ブレッドボード品質に良し悪しがあるため、問題がある場合はマルチメーターで導通状況をテスト
  3. 配線が正しいことを確認しても解決できない場合、予備スクリーンでテスト

機能と使用問題

Q13:小智AI端末は音楽再生をサポートしますか?

A:テスト音楽の再生をサポートします。著作権問題により、楽曲はテスト歌曲とネットユーザー提供歌曲、および一部の童謡などに限定されています。より多くの音楽に接続したい場合、自分でIOインターフェースを拡張してローカル音楽を再生するか、自分でコードを実装してサードパーティプラットフォーム音楽再生インターフェースに接続してください。

Q14:小智AI端末はDeepSeeKなどの大規模モデル切替をサポートしますか?

A:サポートします。現在以下の大規模モデル/APIをサポート:

  • Qwen 2.5(リアルタイム)
  • DeepSeek V3
  • DouBao 1.5 Pro
  • Qwen Max 2.5

操作:小智AI管理後台コントロールパネルにログインし、コンソール/デバイス管理/設定役割ページでAI役割大規模モデルを切替。 管理後台コントロールパネル:https://xiaozhi.dev

Q15:小智AI端末はBluetooth接続をサポートしますか?

A:一時的にサポートしていません。

  • ESP32S3チップ/モジュールはBluetooth BLEスレーブモード(接続される側のみ)をサポート。小智AIプロジェクトはこの機能を使用していません
  • スレーブモードのみサポートのため、小智AI端末はBluetoothヘッドホンやスピーカーへの接続をサポートしていません

Q16:小智AI端末により大きなスピーカーに交換できますか?

A:可能です。現在小智AI端末デフォルトのデジタルアンプMAX98357は3W前後のスピーカーをサポート。より大きな出力が必要な場合、I2Sをサポートする他のアンプモジュールに交換可能ですが、ESP32開発ボードのUSB供電は一般的に5Wを超えないため、より高出力には別途単独供電が必要です。

Q17:小智AI端末はヘッドホンまたは3.5MMオーディオ孔出力をサポートしますか?

A:デフォルトでは非サポート。オーディオモジュール交換が必要:

  • PCM5102オーディオモジュール(ステレオDACサポート、約10元)
  • UDA1334A I2Sステレオデコーダー(約13-15元)

上記デコーダーはすべて3.5MMオーディオ出力をサポートし、プログラムコード変更は不要です。

Q18:小智AI端末により大きなスクリーンに交換できますか?

A:以下タイプのスクリーン交換をサポート:

  1. SSD1306ドライバーOLEDスクリーン:
    • デフォルト0.91インチ4ピンOLED単色スクリーン(128*32解像度)
    • 0.96インチ、1.3インチ、1.5インチ(128*64解像度)などSSD1306ドライバーシリーズ4ピンスクリーンに交換可能
    • 設定ファイルで解像度調整と再コンパイルが必要
  2. SPI-LCDスクリーン:
    • ST7789ドライバー、ILI9341ドライバー、ST7735の3種をサポート
    • DIY開発ボードタイプで対応するスクリーンドライバーと解像度を選択し、コンパイル後に書き込み

Q19:小智AIは音声認識ワード変更をサポートしますか?

A:サポートしますが、IDF開発環境設定、オープンソースプロジェクトコード修正、menuconfigでの音声認識ワード修正が必要。現在約25個選択可能。参考音声認識ワード変更文書

注意:本プロジェクトは完全カスタム音声認識ワードを一時的にサポートしていません。ESP32楽鑫公式のオフライン音声認識ワード認識は公式への申請が必要です。

Q20:小智AIの役割名称は変更できますか?

A:可能です。小智AI管理後台コントロールパネル——役割設定でAI役割名前を修正し、保存後に有効。

注意:役割名前は大規模モデル設定のエージェント名称で、オフライン音声認識ワード「你好小智」とは無関係。両者に関連性はありません。 コンソールアドレス:https://xiaozhi.dev/console/

Q21:小智AIは音声/音色変更をサポートしますか?

A:サポートします。小智AIウェブサイトコンソール——設定役割で役割音声を切替。先に試聴してから設定保存を送信してください。次回対話では新設定の音色を使用します。 管理後台:https://xiaozhi.dev

Q22:小智AIに声で人を識別し、私が誰かを覚えてもらうことはできますか?

A:可能です。操作手順:

  1. 小智AIウェブサイト後台コンソール——エージェント——声紋認識を見つける
  2. ドロップダウンメニューで音声録音を1つ選択(比較的長く明瞭なものを推奨)
  3. 名称と説明を入力(対話者と役割の関係)
  4. OKボタンをクリックして話者を追加
  5. 小智AIを再度音声認識し、次回対話で質問すると、あなたが誰かを知っています

注意:技術制限により、認識正確率は100%ではありません。話者が多いほど、識別正確率は低下します。

Q23:小智AIを自分専用の音声にカスタマイズすることはサポートしますか?

A:内部テスト中です。この機能にはサーバー側サポートが必要で、カスタム音色アップロードは一時的に開放されていません。後続更新公告にご注目ください。

Q24:小智AI端末はバッテリー供電をサポートしますか?どのように接続しますか?

A:5V電圧昇圧モジュール追加が必要:

  1. ESP32S3開発ボードは5V供電が必要。リチウムバッテリーは通常3.8V電圧で不足のため、5V充放電一体ボード装着をお勧め
  2. 開発ボード外部5V供電:5V充放電一体ボードのVOUT/5V+を開発ボードの5Vinピンに接続、GNDを開発ボードGNDピンに接続
  3. 充電バンク/モバイル電源をTYPE-Cインターフェース経由で直接供電することも可能。5V2.1A出力インターフェース使用をお勧め

Q25:小智AI端末は音声でモーター/サーボモーター制御をサポートしますか?

A:デフォルトでは非サポート。サーボモーター/モータードライバーモジュール追加が必要。ESP32-S3は接続済みのIOTフレームワークを利用して拡張でき、音声制御でドライバーボードに信号出力可能。

現在小智AIはESP-SparkBot開発ボード(戦車)に適応して小車運動制御を実現。 オープンソースプロジェクトアドレス:https://oshwhub.com/esp-college/esp-sparkbot

Q26:小智AI端末は音声で他のデバイス制御をサポートしますか?

A:0.9.7以上バージョンでIOT IoTフレームワークをサポート済み。ピン制御でオン/オフライト試験定義をサポート。より多くの機能は必要に応じて自己開発可能。

Q27:小智AIは市場のどの開発ボードをサポートしますか?

A:現在以下の開発ボード/製品をサポート:

  1. 楽鑫ESP32-S3-DevKitC-1開発ボード
  2. 楽鑫esp-box-3
  3. 立創S3実戦派lichuang-dev
  4. 酷世開発ボードkevin-box-1とkevin-box-2

書き込み時は対応ファームウェアを選択。コンパイル時はmenuconfigで対応開発ボードを選択。他の開発ボードはプログラムソースコード修正と再コンパイル適応が必要。

Q28:小智AIプロジェクトが使用するのはどの大規模モデル?サーバー側はオープンソースですか?

A:サーバー側基本フレームワークはオープンソースですが、大規模モデルはプライベート訓練とデプロイ。使用しているのはAlibabaオープンのQWen 72B大規模モデルで、自己接続と訓練、デプロイには約4枚の4090グラフィックカード(96G メモリ)以上が必要。 サーバー側オープンソースアドレス:https://github.com/78/xiaozhi

Q29:小智AIはGPTなどの大規模モデル接続をサポートしますか?

A:一時的に非サポート。この機能はサーバー側実装が必要で、小智AIは他の大規模モデルAPI設定を一時的に開放していません。他の大規模モデルサポートが必要な場合、サーバー側を自己実装する必要があり、小智AIサーバー側オープンソース基本フレームワークを参考可能。

詳細情報は公式ウェブサイトを参照:https://xiaozhi.dev