小智AI常见问题解答

小智AI聊天机器人常见问题解答

为简化表述,以下小智AI终端代指小智AI聊天机器人,除了ESP32-S3-WROOM-1系列开发板相关外,以下问题大部分针对面包板配置方案,其他厂商的方案或定制的方案的问题不在此整理之列。

基础入门问题

Q0:小智AI机器人复刻操作步骤是怎样的?

A:使用面包板,或杜邦线,或自己焊接导线组装方式,分以下5个步骤:

  1. 购买材料与模块:按照清单购买所需要的材料及模块,具体参考文档:小智AI聊天机器人硬件清单与接线教程
  2. 硬件接线:根据用户购买的开发板(44引脚或42引脚),选择对应的接线图或连线表格教程文档,按照对应英文及数字编号连线接好导线。
  3. 下载烧录固件
    • 默认WIFI版本,下载烧录WIFI版本固件 v0.X.X_WiFi.zip(X.X代表版本号)
    • ML307R-4G版本(可选)下载烧录4G版本固件 v0.X.X_ML307.zip(X.X代表版本号)
    • 烧录工具和固件下载:固件下载
  4. 配置设备联网
    • ESP32S3开发板默认支持WIFI网络,请配置您所在场所的WIFI或手机热点(限2.4G频段WIFI,不支持二次验证的WIFI网络)
    • ML307R-4G版本插上SIM卡/流量卡(物联网卡)即可联网
  5. 登记设备:到网站后台控制面板登记设备,添加设备验证码。唤醒"你好小智"即可使用。

注意

  • 第3步和第4步的WIFI配置,可以在硬件模块接线之前先操作
  • 购买第三方开发板或已经组装好的产品,参考相关说明,一般无需接线,可以直接按对应固件版本烧录即可

Q1:我不会焊接电烙铁,可以复刻小智AI聊天机器人吗?

A:可以的,按照项目教程文档,使用面包板配置WIFI方案,在购买时选择焊接好的排针的电子元件模块,再按照文档步骤操作接线和下载固件到开发板,配置WIFI网络和登记设备后即可复刻小智AI聊天机器人,整个过程不需要使用到电烙铁。

Q2:请问复刻小智AI的硬件材料及元件清单到哪里看,到哪里买?

A

  1. 小智AI终端的硬件材料及模块清单,请参考接线文档第1部分和第2部分
  2. 关于购买链接,有以下几种方式:
    • 散件:按模块的名称搜索,例如开发板搜索"ESP32 S3 开发板",麦克风搜索"INMP441",音频功放搜索"MAX98357"等
    • 组合套件:搜索关键词"小智AI ESP32"或"小智AI ESP32S3"等
    • 购买链接参考:小智AI聊天机器人硬件购买说明及链接

注意:由于商家产品存在差异,请尽量选择信誉高销量高评价好的店铺购买,购买咨询和售后质量问题请自行和商家协商。

Q3:请问我需要购买ML307R-4G模块吗?

A:ML307R-4G模块是可选的,主要在以下情况使用:

  • 使用场所没有WIFI或WIFI受限(如部分校园网、商业场所等需要二次认证身份的网络)
  • 非WIFI环境下,连接手机热点不方便或用户没有智能手机

结论:有正常WIFI或手机热点可使用,不用购买ML307R-4G模块(不想连wifi或觉得连WIFI麻烦的,不在意流量费用成本就想使用4G流量的除外)。

固件与烧录问题

Q4:如何烧录小智AI的固件程序,报错了怎么办?

A:请参考无IDF开发环境烧录教程,关键点:

  1. 芯片型号选择为ESP32-S3
  2. 加载模式默认UART,插开发板右侧的USB接口(背面丝印对应COM)
  3. 烧录的BIN文件要勾选上,地址要填写0或0x0
  4. COM端口请选择自己电脑上识别的COM端口号

注意

  • 请使用手机或开发板配置的TYPE-C数据线,不要使用细小的USB充电线
  • 烧录的BIN文件路径里不能包含中文字符,否则无法加载烧录

Q5:IDF是什么开发环境,我需要配置IDF开发环境吗?

A

  1. 普通用户不需要安装配置IDF开发环境,开发者或学习编程用户才需要配置
  2. IDF是指ESP-IDF,是ESP32芯片公司乐鑫科技官方推出的开发平台,支持C/C++语言开发ESP32应用
  3. 如需配置:

硬件问题

Q6:我复刻的小智AI终端喇叭为什么没有声音?

A

  1. 检查喇叭是否接好,一般红色线为正极,黑色线为负极
  2. 检查数字功放是否接对且接触良好,参考接线表格
  3. 如使用电脑USB口供电,喇叭功率达到3W可能会供电不足,建议改用5V2A及以上的USB充电头或5V2.1A的充电宝USB口供电

如确定接线正确仍无法解决,可更换备用喇叭和数字功放模块测试。

Q7:我复刻的小智AI终端喇叭有沙哑的声音/声音异常?

A

  1. 喇叭有沙哑声一般是数字功放GAIN没有接地GND,或GND接线不稳定
  2. 喇叭中声音有沙沙的电声可能是电磁干扰,请将小智AI终端远离强磁场设备或模块,隔离充放电电源等

Q8:如何调整小智AI终端的音量大小?

A

  1. 小智AI终端固件版本大于等于0.9.7,支持语音识别控制音量,直接说"把音量调整到多少"或"音量调小/调大一点"
  2. 小智终端固件版本小于0.9.7,需要接物理按钮支持音量调节,对应ESP32-S3开发板IO39引脚为音量减小,IO40引脚为音量加大

Q9:为什么小智AI终端"你好小智"无法唤醒/无反应?

A

  1. 确认唤醒词正确(“你好小智"而非"小智你好"或其他)
  2. 检查麦克风6个引脚的接线是否正确且接触良好
  3. 注意INMP441麦克风默认是有麦克风图标和丝印字母带进声孔这一面朝上的
  4. 如接线正确仍无法解决,可更换备用麦克风测试
  5. 使用串口通信工具检查开发板输出信息也可帮助定位问题

Q10:小智AI终端提醒我配网,但是找不到xiaozhi-xxx WIFI?

A:这说明ESP32S3开发板的WIFI信号存在问题,可以:

  1. 临时用手按住开发板天线位置或绕线尝试增强天线信号
  2. 使用串口工具检查开发板输出信息,定位问题

Q11:小智AI如何重新配网WIFI/切换WIFI?

A

  1. 将开发板重新上电/重启,在连接WIFI闪烁蓝灯时,按下Boot按钮然后松开,听到提示音重新进入WIFI配网模式
  2. 当小智AI连接上次配置的WIFI失败3次后,也会自动重新进入WIFI配网模式

注意:当前小智AI只默认记住上次连接的WIFI及密码,更换WIFI或WIFI/热点关闭,需要重新配置。

Q12:为什么我的屏幕没有点亮?

A

  1. 检查屏幕接线是否正确且接触良好
  2. 面包板质量有好坏,有问题时可以使用万用表测试通联情况
  3. 如确定接线正确仍无法解决,可更换备用屏幕测试

功能与使用问题

Q13:小智AI终端支持播放音乐吗?

A:支持播放测试的音乐,由于版权问题,曲目仅限测试歌曲和网友提交的歌曲,以及一些儿歌等。如需连接更多音乐,可自己扩展IO接口播放本地音乐或自行代码实现连接第三方平台音乐播放接口。

Q14:小智AI终端支持DeepSeeK等大模型切换吗?

A:支持,目前已支持以下大模型/API:

  • Qwen 2.5(实时)
  • DeepSeek V3
  • DouBao 1.5 Pro
  • Qwen Max 2.5

操作:登录小智AI管理后台控制面板,在控制台/设备管理/配置角色页面切换AI角色大模型。 管理后台控制面板:https://xiaozhi.dev

Q15:小智AI终端支持蓝牙连接吗?

A:暂时不支持。

  • ESP32S3芯片/模块支持蓝牙BLE从机模式(只支持被连接),小智AI项目未使用该功能
  • 由于仅支持从机模式,小智AI终端不支持连接蓝牙耳机或音箱

Q16:可以给小智AI终端的换更大的喇叭吗?

A:可以的,目前小智AI终端默认的数字功放MAX98357支持3W左右的喇叭。如需更大功率,可换用其他支持I2S的功放模块,但注意ESP32开发板的USB供电一般不超过5W,更高功率需要另外单独供电。

Q17:请问小智AI终端支持插耳机或者3.5MM的音频孔输出吗?

A:默认不支持,需要更换音频模块,如:

  • PCM5102音频模块(支持立体声DAC,约10元)
  • UDA1334A I2S立体声解码器(约13-15元)

上述解码器都支持3.5MM音频输出,不需要改动程序代码。

Q18:可以给小智AI终端更换更大的屏幕吗?

A:支持更换以下类型屏幕:

  1. SSD1306驱动的OLED屏幕:
    • 默认0.91寸4脚OLED单色屏幕(128*32分辨率)
    • 可更换0.96寸、1.3寸和1.5寸(128*64分辨率)等SSD1306驱动系列的4脚屏幕
    • 需在配置文件中调整分辨率并重新编译
  2. SPI-LCD屏幕:
    • 支持ST7789驱动、ILI9341驱动、ST7735三种
    • 在DIY开发板类型中选择对应的屏幕驱动和分辨率,编译后烧录

Q19:小智AI支持更换唤醒词吗?

A:支持,但需要配置IDF开发环境,修改开源项目代码,在menuconfig中修改唤醒词,目前可选约25个。参考唤醒词更换文档

注意:本项目暂不支持完全自定义唤醒词,ESP32乐鑫官方的离线唤醒词识别需向官方申请。

Q20:小智AI的角色名称可以换吗?

A:可以,到小智AI管理后台控制面板——角色配置中修改AI角色名字,保存后生效。

注意:角色名字是大模型配置的智能体名称,与离线唤醒词"你好小智"无关,两者不存在关联。 控制台地址:https://xiaozhi.dev/console/

Q21:小智AI支持更换声音/音色吗?

A:支持,到小智AI网站控制台——配置角色中切换角色声音,可以先试听,然后提交保存配置。下次对话就会使用新配置的音色。 管理后台:https://xiaozhi.dev

Q22:请问能让小智AI听声辨人记住我是谁吗?

A:可以,操作步骤:

  1. 到小智AI网站后台控制台——智能体——找到声纹识别
  2. 在下拉菜单中选择一段语音记录(建议较长且清晰的)
  3. 填写名称和描述(对话人和角色的关系)
  4. 点击OK按钮添加说话人
  5. 重新唤醒小智AI,下次对话中询问时,它会知道你是谁

注意:受技术限制,识别准确率不是100%;说话人越多,分辨准确率会下降。

Q23:小智AI支持更换成自己定制的声音吗?

A:内部测试中,此功能需要服务端支持,暂未开放上传定制音色,请关注后续更新公告。

Q24:小智AI终端支持电池供电吗,如何对接?

A:需要增加5V电压升压模块:

  1. ESP32S3开发板需要5V供电,锂电池通常是3.8V电压不够,建议加装5V充放电一体板
  2. 开发板外接5V供电:将5V充放电一体板的VOUT/5V+接开发板的5Vin引脚,GND接开发板GND引脚
  3. 也可使用充电宝/移动电源通过TYPE-C接口直接供电,建议使用5V2.1A输出接口

Q25:小智AI终端支持语音控制电机/舵机吗?

A:默认不支持,需要加舵机/电机驱动模块。ESP32-S3可以利用已接入的IOT框架扩展,通过语音控制输出信号到驱动板。

目前小智AI已适配ESP-SparkBot开发板(坦克)实现小车运动控制。 开源项目地址:https://oshwhub.com/esp-college/esp-sparkbot

Q26:小智AI终端支持语音控制其他的设备吗?

A:0.9.7及以上版本已支持IOT物联网框架,支持定义引脚控制开关灯试验,更多功能可根据需要自行开发。

Q27:请问小智AI支持市面上的哪些开发板?

A:目前已支持以下开发板/产品:

  1. 乐鑫ESP32-S3-DevKitC-1开发板
  2. 乐鑫esp-box-3
  3. 立创S3实战派lichuang-dev
  4. 酷世开发板kevin-box-1和kevin-box-2

烧录时请选择对应固件,编译时在menuconfig中选择对应开发板。其他开发板需修改程序源代码重新编译适配。

Q28:小智AI项目使用的是什么大模型?服务端开源吗?

A:服务端基础框架是开源的,但大模型是私有训练和部署。使用的是阿里开放的QWen 72B大模型,需自行对接和训练,部署需要约4张4090显卡(96G显存)以上。 服务端开源地址:https://github.com/78/xiaozhi

Q29:小智AI支持接入GPT等大模型吗?

A:暂不支持,此功能需在服务端实现,小智AI暂未开放配置其他大模型API。如需支持其他大模型,需自行实现服务端,可参考小智AI服务端开源基础框架。

更多信息请参考官方网站:https://xiaozhi.dev