Центр документации XiaoZhi AI чат-бота | 小智AI.Dev
Центр документации XiaoZhi AI чат-бота | 小智AI.Dev
📖 Центр документации XiaoZhi AI
XiaoZhi AI — это голосовой робот с открытым исходным кодом на базе ESP32-S3, интегрирующий обнаружение команд пробуждения, AI-диалоги, управление устройствами и многопротокольную связь. Данный центр документации предоставляет полные технические руководства от сборки оборудования до интеграции AI.
Особенности проекта:
- 🎙️ Обнаружение команд пробуждения: Поддержка 26 команд включая “Привет XiaoZhi”, <200мс ответ
- 🧠 Интеграция AI: Поддержка нескольких LLM включая DeepSeek, GPT, Ernie Bot
- 🏠 Управление IoT: Интеграция протоколов MQTT, MCP для управления умным домом
- 🔧 Открытое аппаратное обеспечение: На базе ESP32-S3, полное решение с открытым исходным кодом
🚀 Быстрый старт
Руководство для начинающих
Сборка платы ESP32-S3, схемы подключения и список компонентов
Загрузка предкомпилированной прошивки, инструменты прошивки и руководство по настройке
Настройка Wi-Fi, подключение устройства и устранение неполадок сети
Голосовое взаимодействие, AI-диалоги и функции управления устройствами
📚 Навигация по документации
🛠️ Руководство пользователя
Полные учебники для пользователей
- Руководство по сборке оборудования - Сборка оборудования ESP32-S3 и схемы подключения
- Загрузка и прошивка микропрограммы - Получение и установка предкомпилированной прошивки
- Настройка сети - Настройка Wi-Fi и устранение неполадок сети
- Учебник по использованию функций - Голосовое взаимодействие и функции умного управления
- Бюджетная версия ESP32 - Низкозатратное аппаратное решение ESP32
- Часто задаваемые вопросы - Общие проблемы и решения во время использования
💻 Документация разработчика
Углубленные технические руководства для разработчиков
- Настройка среды ESP-IDF - Настройка среды разработки и руководство по компиляции
- Протокол связи WebSocket - Протокол связи устройство-сервер
- Разработка протокола MCP - Управление IoT по протоколу Model Context Protocol
- Гибридный протокол MQTT+UDP - Гибридная связь управления и аудио
- Отображение эмоций Emoji - Протокол выражения эмоционального состояния LLM
🔧 Руководство по разработке ESP32
Полный учебник по разработке на платформе ESP32-S3
- Технические характеристики - Архитектура оборудования ESP32-S3 и параметры производительности
- Руководство по программированию - От управления GPIO до разработки сложных систем
- Разработка продвинутых функций - 4G-связь, локальный AI-вывод, мультимодальное взаимодействие
- Руководство по устранению неполадок - Диагностика общих проблем и решения
🤖 Возможности AI-функций
Интеграция AI-технологий и обзор возможностей
- 🎯 Обработка голоса: Гибридное решение локальное пробуждение + облачное распознавание
- 🧠 Интеграция LLM: Поддержка DeepSeek, GPT, Qwen и других моделей
- ⚡ Пограничный вывод: Интеграция легких моделей TensorFlow Lite
- 🎵 Синтез речи: Многодвижковый TTS и эмоциональный голосовой вывод
🛠️ Технические особенности
Аппаратная платформа
- Основной контроллер: ESP32-S3 двухъядерный 240МГц, 16МБ Flash + 8МБ PSRAM
- Обработка аудио: Цифровой микрофон INMP441 + цифровой усилитель MAX98357A
- Вывод дисплея: OLED-дисплей SSD1306 + RGB-индикаторы состояния
- Сетевая связь: Wi-Fi 2.4ГГц + 4G Cat.1 связь (опционально)
Архитектура программного обеспечения
- Фреймворк разработки: ESP-IDF v5.3.2 + совместимость с Arduino
- AI-движок: Espressif Wake Word Engine + облачные LLM
- Протоколы связи: WebSocket + MQTT + протокол MCP
- Кодирование аудио: 16кГц PCM + сжатие Opus для передачи
📊 Метрики производительности
| Функциональный модуль | Метрики производительности | Примечания |
|---|---|---|
| Обнаружение команд пробуждения | <200мс задержка, >99% точность | Локальная офлайн-обработка |
| Распознавание речи | <1с задержка, >95% точность | Точность распознавания китайского языка |
| AI-диалог | <3с ответ, поддержка 5+ LLM | Рекомендуется DeepSeek |
| Управление устройствами | <100мс ответ на команду | Локальный + облачный гибрид |
| Управление питанием | 5мА ожидание, 150мА работа | Умная оптимизация питания |
🗂️ Индекс документации
| Категория документации | Название документа | Основное содержание | Время обновления |
|---|---|---|---|
| Руководство пользователя | Руководство по сборке оборудования | Сборка ESP32-S3, схемы подключения, список компонентов | 2025-03-19 |
| Руководство пользователя | Загрузка прошивки | Предкомпилированная прошивка, инструменты прошивки, руководство по настройке | 2025-03-18 |
| Руководство пользователя | Настройка сети | Настройка Wi-Fi, устранение неполадок, расширенные настройки | 2025-03-18 |
| Руководство пользователя | Учебник по функциям | Голосовое взаимодействие, управление устройствами, персонализация настроек | 2025-03-18 |
| Руководство пользователя | Бюджетная версия ESP32 | Решение для сборки низкозатратной платы разработки ESP32 | 2025-03-18 |
| Руководство пользователя | Часто задаваемые вопросы | Проблемы использования, устранение неполадок, техническая поддержка | 2025-03-18 |
| Документация разработчика | Настройка среды ESP-IDF | Настройка среды разработки, установка инструментальной цепочки компиляции | 2025-03-06 |
| Документация разработчика | Протокол WebSocket | Спецификации протокола связи, определения формата сообщений | 2025-03-06 |
| Документация разработчика | Спецификация протокола MCP | Поток взаимодействия Model Context Protocol | 2025-03-20 |
| Документация разработчика | Руководство по использованию MCP | Конкретные применения управления IoT-устройствами | 2025-03-20 |
| Документация разработчика | Протокол MQTT+UDP | Гибридная связь канала управления и аудиоканала | 2025-03-20 |
| Документация разработчика | Отображение эмоций Emoji | Протокол выражения эмоционального состояния LLM | 2025-03-06 |
| Разработка ESP32 | Технические характеристики | Архитектура оборудования ESP32-S3, параметры производительности | 2025-09-25 |
| Разработка ESP32 | Руководство по программированию | От управления GPIO до разработки сложных систем | 2025-09-25 |
| Разработка ESP32 | Продвинутые функции | 4G-связь, AI-вывод, мультимодальное взаимодействие | 2025-09-25 |
| Разработка ESP32 | Устранение неполадок | Диагностика проблем, решения, техники отладки | 2025-09-25 |
| AI-функции | Интеграция AI-функций | Обработка голоса, интеграция LLM, пограничный вывод | 2025-09-25 |
🔗 Связанные ресурсы
Ресурсы сообщества
- 📖 Онлайн-документация: https://xiaozhi.dev/docs
- 💬 Технический блог: https://xiaozhi.dev/blog
- 🚀 Обновления проекта: Следите за обновлениями репозитория GitHub
Техническая поддержка:
- 📧 Контактный email: [email protected]
- 📖 Онлайн-документация: https://xiaozhi.dev/docs