小智 AI 聊天機器人文檔中心 | 小智AI.Dev

小智 AI 聊天機器人文檔中心 | 小智AI.Dev

📖 小智AI文檔中心

小智AI 是一款基於ESP32-S3開發的開源智能語音機器人,整合語音喚醒、AI對話、設備控制和多協定通訊功能。本文檔中心提供從硬體組裝到AI整合的完整技術指南。

專案特色:

  • 🎙️ 語音喚醒: 支援「你好小智」等26種喚醒詞,<200ms響應
  • 🧠 AI整合: 支援DeepSeek、GPT、文心一言等多種大模型
  • 🏠 IoT控制: 整合MQTT、MCP協定,支援智慧家居控制
  • 🔧 開源硬體: 基於ESP32-S3,完整開源方案

🚀 快速開始

新手入門路徑


📚 文檔導覽

🛠️ 使用指南

面向使用者的完整使用教學

💻 開發文檔

面向開發者的技術深度指南

🔧 ESP32開發指南

ESP32-S3平台完整開發教學

🤖 AI功能特性

AI技術整合和能力介紹

  • 🎯 語音處理: 本地喚醒 + 雲端識別的混合方案
  • 🧠 大模型接入: DeepSeek、GPT、Qwen等多模型支援
  • 端側推理: TensorFlow Lite輕量模型整合
  • 🎵 語音合成: 多引擎TTS和情感語音輸出

🛠️ 技術特色

硬體平台

  • 主控晶片: ESP32-S3雙核240MHz,16MB Flash + 8MB PSRAM
  • 音訊處理: INMP441數位麥克風 + MAX98357A數位功放
  • 顯示輸出: SSD1306 OLED顯示器 + RGB狀態燈
  • 網路通訊: Wi-Fi 2.4GHz + 4G Cat.1通訊(可選)

軟體架構

  • 開發框架: ESP-IDF v5.3.2 + Arduino相容
  • AI引擎: 樂鑫Wake Word Engine + 雲端大模型
  • 通訊協定: WebSocket + MQTT + MCP Protocol
  • 音訊編碼: 16kHz PCM + Opus壓縮傳輸

📊 效能指標

功能模組效能指標備註
語音喚醒<200ms延遲,>99%準確率本地離線處理
語音識別<1s延遲,>95%準確率中文識別精度
AI對話<3s響應,支援5+大模型DeepSeek推薦
設備控制<100ms指令響應本地+雲端混合
功耗管理5mA待機,150mA工作智慧功耗最佳化

🗂️ 文檔索引

文檔分類文檔名稱主要內容更新時間
使用指南硬體組裝指南ESP32-S3組裝、接線圖解、零件清單2025-03-19
使用指南韌體下載預編譯韌體、燒錄工具、配置指南2025-03-18
使用指南網路配置Wi-Fi配網、故障排除、進階設定2025-03-18
使用指南功能教學語音互動、設備控制、個人化設定2025-03-18
使用指南ESP32丐版方案低成本ESP32開發板建構方案2025-03-18
使用指南常見問題FAQ使用問題、故障排除、技術支援2025-03-18
開發文檔ESP-IDF環境建置開發環境配置、編譯工具鏈安裝2025-03-06
開發文檔WebSocket協定通訊協定規範、訊息格式定義2025-03-06
開發文檔MCP協定規範Model Context Protocol互動流程2025-03-20
開發文檔MCP使用指南物聯網設備控制的具體應用2025-03-20
開發文檔MQTT+UDP協定控制通道與音訊通道混合通訊2025-03-20
開發文檔Emoji情感顯示大模型情感狀態表達協定2025-03-06
ESP32開發技術規格ESP32-S3硬體架構、效能參數2025-09-25
ESP32開發程式指南GPIO控制到複雜系統開發2025-09-25
ESP32開發進階功能4G通訊、AI推理、多模態互動2025-09-25
ESP32開發故障排查問題診斷、解決方案、除錯技巧2025-09-25
AI特性AI功能整合語音處理、大模型整合、端側推理2025-09-25

🔗 相關資源

社群資源

技術支援: