小智AI常见问题解答
小智AI聊天机器人常见问题解答
为简化表述,以下小智AI终端代指小智AI聊天机器人,除了ESP32-S3-WROOM-1系列开发板相关外,以下问题大部分针对面包板配置方案,其他厂商的方案或定制的方案的问题不在此整理之列。
基础入门问题
Q0:小智AI机器人复刻操作步骤是怎样的?
A:使用面包板,或杜邦线,或自己焊接导线组装方式,分以下5个步骤:
- 购买材料与模块:按照清单购买所需要的材料及模块,具体参考文档:小智AI聊天机器人硬件清单与接线教程
- 硬件接线:根据用户购买的开发板(44引脚或42引脚),选择对应的接线图或连线表格教程文档,按照对应英文及数字编号连线接好导线。
- 下载烧录固件:
- 默认WIFI版本,下载烧录WIFI版本固件
v0.X.X_WiFi.zip
(X.X代表版本号) - ML307R-4G版本(可选)下载烧录4G版本固件
v0.X.X_ML307.zip
(X.X代表版本号) - 烧录工具和固件下载:固件下载
- 默认WIFI版本,下载烧录WIFI版本固件
- 配置设备联网:
- ESP32S3开发板默认支持WIFI网络,请配置您所在场所的WIFI或手机热点(限2.4G频段WIFI,不支持二次验证的WIFI网络)
- ML307R-4G版本插上SIM卡/流量卡(物联网卡)即可联网
- 登记设备:到网站后台控制面板登记设备,添加设备验证码。唤醒"你好小智"即可使用。
- 网站后台控制面板网址:https://xiaozhi.dev
注意:
- 第3步和第4步的WIFI配置,可以在硬件模块接线之前先操作
- 购买第三方开发板或已经组装好的产品,参考相关说明,一般无需接线,可以直接按对应固件版本烧录即可
Q1:我不会焊接电烙铁,可以复刻小智AI聊天机器人吗?
A:可以的,按照项目教程文档,使用面包板配置WIFI方案,在购买时选择焊接好的排针的电子元件模块,再按照文档步骤操作接线和下载固件到开发板,配置WIFI网络和登记设备后即可复刻小智AI聊天机器人,整个过程不需要使用到电烙铁。
Q2:请问复刻小智AI的硬件材料及元件清单到哪里看,到哪里买?
A:
- 小智AI终端的硬件材料及模块清单,请参考接线文档第1部分和第2部分
- 关于购买链接,有以下几种方式:
- 散件:按模块的名称搜索,例如开发板搜索"ESP32 S3 开发板",麦克风搜索"INMP441",音频功放搜索"MAX98357"等
- 组合套件:搜索关键词"小智AI ESP32"或"小智AI ESP32S3"等
- 购买链接参考:小智AI聊天机器人硬件购买说明及链接
注意:由于商家产品存在差异,请尽量选择信誉高销量高评价好的店铺购买,购买咨询和售后质量问题请自行和商家协商。
Q3:请问我需要购买ML307R-4G模块吗?
A:ML307R-4G模块是可选的,主要在以下情况使用:
- 使用场所没有WIFI或WIFI受限(如部分校园网、商业场所等需要二次认证身份的网络)
- 非WIFI环境下,连接手机热点不方便或用户没有智能手机
结论:有正常WIFI或手机热点可使用,不用购买ML307R-4G模块(不想连wifi或觉得连WIFI麻烦的,不在意流量费用成本就想使用4G流量的除外)。
固件与烧录问题
Q4:如何烧录小智AI的固件程序,报错了怎么办?
A:请参考无IDF开发环境烧录教程,关键点:
- 芯片型号选择为ESP32-S3
- 加载模式默认UART,插开发板右侧的USB接口(背面丝印对应COM)
- 烧录的BIN文件要勾选上,地址要填写0或0x0
- COM端口请选择自己电脑上识别的COM端口号
注意:
- 请使用手机或开发板配置的TYPE-C数据线,不要使用细小的USB充电线
- 烧录的BIN文件路径里不能包含中文字符,否则无法加载烧录
Q5:IDF是什么开发环境,我需要配置IDF开发环境吗?
A:
- 普通用户不需要安装配置IDF开发环境,开发者或学习编程用户才需要配置
- IDF是指ESP-IDF,是ESP32芯片公司乐鑫科技官方推出的开发平台,支持C/C++语言开发ESP32应用
- 如需配置:
- Windows配置开发环境参考: Windows搭建ESP-IDF 5.3开发环境以及编译小智
- Linux用户请自行查阅相关资料配置
硬件问题
Q6:我复刻的小智AI终端喇叭为什么没有声音?
A:
- 检查喇叭是否接好,一般红色线为正极,黑色线为负极
- 检查数字功放是否接对且接触良好,参考接线表格
- 如使用电脑USB口供电,喇叭功率达到3W可能会供电不足,建议改用5V2A及以上的USB充电头或5V2.1A的充电宝USB口供电
如确定接线正确仍无法解决,可更换备用喇叭和数字功放模块测试。
Q7:我复刻的小智AI终端喇叭有沙哑的声音/声音异常?
A:
- 喇叭有沙哑声一般是数字功放GAIN没有接地GND,或GND接线不稳定
- 喇叭中声音有沙沙的电声可能是电磁干扰,请将小智AI终端远离强磁场设备或模块,隔离充放电电源等
Q8:如何调整小智AI终端的音量大小?
A:
- 小智AI终端固件版本大于等于0.9.7,支持语音识别控制音量,直接说"把音量调整到多少"或"音量调小/调大一点"
- 小智终端固件版本小于0.9.7,需要接物理按钮支持音量调节,对应ESP32-S3开发板IO39引脚为音量减小,IO40引脚为音量加大
Q9:为什么小智AI终端"你好小智"无法唤醒/无反应?
A:
- 确认唤醒词正确(“你好小智"而非"小智你好"或其他)
- 检查麦克风6个引脚的接线是否正确且接触良好
- 注意INMP441麦克风默认是有麦克风图标和丝印字母带进声孔这一面朝上的
- 如接线正确仍无法解决,可更换备用麦克风测试
- 使用串口通信工具检查开发板输出信息也可帮助定位问题
Q10:小智AI终端提醒我配网,但是找不到xiaozhi-xxx WIFI?
A:这说明ESP32S3开发板的WIFI信号存在问题,可以:
- 临时用手按住开发板天线位置或绕线尝试增强天线信号
- 使用串口工具检查开发板输出信息,定位问题
Q11:小智AI如何重新配网WIFI/切换WIFI?
A:
- 将开发板重新上电/重启,在连接WIFI闪烁蓝灯时,按下Boot按钮然后松开,听到提示音重新进入WIFI配网模式
- 当小智AI连接上次配置的WIFI失败3次后,也会自动重新进入WIFI配网模式
注意:当前小智AI只默认记住上次连接的WIFI及密码,更换WIFI或WIFI/热点关闭,需要重新配置。
Q12:为什么我的屏幕没有点亮?
A:
- 检查屏幕接线是否正确且接触良好
- 面包板质量有好坏,有问题时可以使用万用表测试通联情况
- 如确定接线正确仍无法解决,可更换备用屏幕测试
功能与使用问题
Q13:小智AI终端支持播放音乐吗?
A:支持播放测试的音乐,由于版权问题,曲目仅限测试歌曲和网友提交的歌曲,以及一些儿歌等。如需连接更多音乐,可自己扩展IO接口播放本地音乐或自行代码实现连接第三方平台音乐播放接口。
Q14:小智AI终端支持DeepSeeK等大模型切换吗?
A:支持,目前已支持以下大模型/API:
- Qwen 2.5(实时)
- DeepSeek V3
- DouBao 1.5 Pro
- Qwen Max 2.5
操作:登录小智AI管理后台控制面板,在控制台/设备管理/配置角色页面切换AI角色大模型。 管理后台控制面板:https://xiaozhi.dev
Q15:小智AI终端支持蓝牙连接吗?
A:暂时不支持。
- ESP32S3芯片/模块支持蓝牙BLE从机模式(只支持被连接),小智AI项目未使用该功能
- 由于仅支持从机模式,小智AI终端不支持连接蓝牙耳机或音箱
Q16:可以给小智AI终端的换更大的喇叭吗?
A:可以的,目前小智AI终端默认的数字功放MAX98357支持3W左右的喇叭。如需更大功率,可换用其他支持I2S的功放模块,但注意ESP32开发板的USB供电一般不超过5W,更高功率需要另外单独供电。
Q17:请问小智AI终端支持插耳机或者3.5MM的音频孔输出吗?
A:默认不支持,需要更换音频模块,如:
- PCM5102音频模块(支持立体声DAC,约10元)
- UDA1334A I2S立体声解码器(约13-15元)
上述解码器都支持3.5MM音频输出,不需要改动程序代码。
Q18:可以给小智AI终端更换更大的屏幕吗?
A:支持更换以下类型屏幕:
- SSD1306驱动的OLED屏幕:
- 默认0.91寸4脚OLED单色屏幕(128*32分辨率)
- 可更换0.96寸、1.3寸和1.5寸(128*64分辨率)等SSD1306驱动系列的4脚屏幕
- 需在配置文件中调整分辨率并重新编译
- SPI-LCD屏幕:
- 支持ST7789驱动、ILI9341驱动、ST7735三种
- 在DIY开发板类型中选择对应的屏幕驱动和分辨率,编译后烧录
Q19:小智AI支持更换唤醒词吗?
A:支持,但需要配置IDF开发环境,修改开源项目代码,在menuconfig中修改唤醒词,目前可选约25个。参考唤醒词更换文档。
注意:本项目暂不支持完全自定义唤醒词,ESP32乐鑫官方的离线唤醒词识别需向官方申请。
Q20:小智AI的角色名称可以换吗?
A:可以,到小智AI管理后台控制面板——角色配置中修改AI角色名字,保存后生效。
注意:角色名字是大模型配置的智能体名称,与离线唤醒词"你好小智"无关,两者不存在关联。 控制台地址:https://xiaozhi.dev/console/
Q21:小智AI支持更换声音/音色吗?
A:支持,到小智AI网站控制台——配置角色中切换角色声音,可以先试听,然后提交保存配置。下次对话就会使用新配置的音色。 管理后台:https://xiaozhi.dev
Q22:请问能让小智AI听声辨人记住我是谁吗?
A:可以,操作步骤:
- 到小智AI网站后台控制台——智能体——找到声纹识别
- 在下拉菜单中选择一段语音记录(建议较长且清晰的)
- 填写名称和描述(对话人和角色的关系)
- 点击OK按钮添加说话人
- 重新唤醒小智AI,下次对话中询问时,它会知道你是谁
注意:受技术限制,识别准确率不是100%;说话人越多,分辨准确率会下降。
Q23:小智AI支持更换成自己定制的声音吗?
A:内部测试中,此功能需要服务端支持,暂未开放上传定制音色,请关注后续更新公告。
Q24:小智AI终端支持电池供电吗,如何对接?
A:需要增加5V电压升压模块:
- ESP32S3开发板需要5V供电,锂电池通常是3.8V电压不够,建议加装5V充放电一体板
- 开发板外接5V供电:将5V充放电一体板的VOUT/5V+接开发板的5Vin引脚,GND接开发板GND引脚
- 也可使用充电宝/移动电源通过TYPE-C接口直接供电,建议使用5V2.1A输出接口
Q25:小智AI终端支持语音控制电机/舵机吗?
A:默认不支持,需要加舵机/电机驱动模块。ESP32-S3可以利用已接入的IOT框架扩展,通过语音控制输出信号到驱动板。
目前小智AI已适配ESP-SparkBot开发板(坦克)实现小车运动控制。 开源项目地址:https://oshwhub.com/esp-college/esp-sparkbot
Q26:小智AI终端支持语音控制其他的设备吗?
A:0.9.7及以上版本已支持IOT物联网框架,支持定义引脚控制开关灯试验,更多功能可根据需要自行开发。
Q27:请问小智AI支持市面上的哪些开发板?
A:目前已支持以下开发板/产品:
- 乐鑫ESP32-S3-DevKitC-1开发板
- 乐鑫esp-box-3
- 立创S3实战派lichuang-dev
- 酷世开发板kevin-box-1和kevin-box-2
烧录时请选择对应固件,编译时在menuconfig中选择对应开发板。其他开发板需修改程序源代码重新编译适配。
Q28:小智AI项目使用的是什么大模型?服务端开源吗?
A:服务端基础框架是开源的,但大模型是私有训练和部署。使用的是阿里开放的QWen 72B大模型,需自行对接和训练,部署需要约4张4090显卡(96G显存)以上。 服务端开源地址:https://github.com/78/xiaozhi
Q29:小智AI支持接入GPT等大模型吗?
A:暂不支持,此功能需在服务端实现,小智AI暂未开放配置其他大模型API。如需支持其他大模型,需自行实现服务端,可参考小智AI服务端开源基础框架。
更多信息请参考官方网站:https://xiaozhi.dev