Центр документации XiaoZhi AI чат-бота | 小智AI.Dev

Центр документации XiaoZhi AI чат-бота | 小智AI.Dev

📖 Центр документации XiaoZhi AI

XiaoZhi AI — это голосовой робот с открытым исходным кодом на базе ESP32-S3, интегрирующий обнаружение команд пробуждения, AI-диалоги, управление устройствами и многопротокольную связь. Данный центр документации предоставляет полные технические руководства от сборки оборудования до интеграции AI.

Особенности проекта:

  • 🎙️ Обнаружение команд пробуждения: Поддержка 26 команд включая “Привет XiaoZhi”, <200мс ответ
  • 🧠 Интеграция AI: Поддержка нескольких LLM включая DeepSeek, GPT, Ernie Bot
  • 🏠 Управление IoT: Интеграция протоколов MQTT, MCP для управления умным домом
  • 🔧 Открытое аппаратное обеспечение: На базе ESP32-S3, полное решение с открытым исходным кодом

🚀 Быстрый старт

Руководство для начинающих


📚 Навигация по документации

🛠️ Руководство пользователя

Полные учебники для пользователей

💻 Документация разработчика

Углубленные технические руководства для разработчиков

🔧 Руководство по разработке ESP32

Полный учебник по разработке на платформе ESP32-S3

🤖 Возможности AI-функций

Интеграция AI-технологий и обзор возможностей

  • 🎯 Обработка голоса: Гибридное решение локальное пробуждение + облачное распознавание
  • 🧠 Интеграция LLM: Поддержка DeepSeek, GPT, Qwen и других моделей
  • Пограничный вывод: Интеграция легких моделей TensorFlow Lite
  • 🎵 Синтез речи: Многодвижковый TTS и эмоциональный голосовой вывод

🛠️ Технические особенности

Аппаратная платформа

  • Основной контроллер: ESP32-S3 двухъядерный 240МГц, 16МБ Flash + 8МБ PSRAM
  • Обработка аудио: Цифровой микрофон INMP441 + цифровой усилитель MAX98357A
  • Вывод дисплея: OLED-дисплей SSD1306 + RGB-индикаторы состояния
  • Сетевая связь: Wi-Fi 2.4ГГц + 4G Cat.1 связь (опционально)

Архитектура программного обеспечения

  • Фреймворк разработки: ESP-IDF v5.3.2 + совместимость с Arduino
  • AI-движок: Espressif Wake Word Engine + облачные LLM
  • Протоколы связи: WebSocket + MQTT + протокол MCP
  • Кодирование аудио: 16кГц PCM + сжатие Opus для передачи

📊 Метрики производительности

Функциональный модульМетрики производительностиПримечания
Обнаружение команд пробуждения<200мс задержка, >99% точностьЛокальная офлайн-обработка
Распознавание речи<1с задержка, >95% точностьТочность распознавания китайского языка
AI-диалог<3с ответ, поддержка 5+ LLMРекомендуется DeepSeek
Управление устройствами<100мс ответ на командуЛокальный + облачный гибрид
Управление питанием5мА ожидание, 150мА работаУмная оптимизация питания

🗂️ Индекс документации

Категория документацииНазвание документаОсновное содержаниеВремя обновления
Руководство пользователяРуководство по сборке оборудованияСборка ESP32-S3, схемы подключения, список компонентов2025-03-19
Руководство пользователяЗагрузка прошивкиПредкомпилированная прошивка, инструменты прошивки, руководство по настройке2025-03-18
Руководство пользователяНастройка сетиНастройка Wi-Fi, устранение неполадок, расширенные настройки2025-03-18
Руководство пользователяУчебник по функциямГолосовое взаимодействие, управление устройствами, персонализация настроек2025-03-18
Руководство пользователяБюджетная версия ESP32Решение для сборки низкозатратной платы разработки ESP322025-03-18
Руководство пользователяЧасто задаваемые вопросыПроблемы использования, устранение неполадок, техническая поддержка2025-03-18
Документация разработчикаНастройка среды ESP-IDFНастройка среды разработки, установка инструментальной цепочки компиляции2025-03-06
Документация разработчикаПротокол WebSocketСпецификации протокола связи, определения формата сообщений2025-03-06
Документация разработчикаСпецификация протокола MCPПоток взаимодействия Model Context Protocol2025-03-20
Документация разработчикаРуководство по использованию MCPКонкретные применения управления IoT-устройствами2025-03-20
Документация разработчикаПротокол MQTT+UDPГибридная связь канала управления и аудиоканала2025-03-20
Документация разработчикаОтображение эмоций EmojiПротокол выражения эмоционального состояния LLM2025-03-06
Разработка ESP32Технические характеристикиАрхитектура оборудования ESP32-S3, параметры производительности2025-09-25
Разработка ESP32Руководство по программированиюОт управления GPIO до разработки сложных систем2025-09-25
Разработка ESP32Продвинутые функции4G-связь, AI-вывод, мультимодальное взаимодействие2025-09-25
Разработка ESP32Устранение неполадокДиагностика проблем, решения, техники отладки2025-09-25
AI-функцииИнтеграция AI-функцийОбработка голоса, интеграция LLM, пограничный вывод2025-09-25

🔗 Связанные ресурсы

Ресурсы сообщества

  • 📖 Онлайн-документация: https://xiaozhi.dev/docs
  • 💬 Технический блог: https://xiaozhi.dev/blog
  • 🚀 Обновления проекта: Следите за обновлениями репозитория GitHub

Техническая поддержка: