РОЗРОБЛЕННЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ДЛЯ РОЗПІЗНАВАННЯ ГОЛОСОВИХ І ТЕКСТОВИХ КОМАНД ІЗ ВИКОРИСТАННЯМ МОДЕЛЕЙ ШТУЧНОГО ІНТЕЛЕКТУ
Ключові слова:
голосовий асистент, розпізнавання мови, ASR, NLU, штучний інтелект, LLM, Whisper, Ollama, комп'ютерний “зір”Анотація
Метою дослідження є створення програмного забезпечення для розпізнавання голосових і текстових команд із використанням моделей штучного інтелекту, що забезпечує високу точність розпізнавання, швидкість опрацювання та можливість самонавчання для підвищення ефективності та зручності використання комп’ютера. Завданням роботи є розроблення архітектури локального голосового асистента та імплементація інтелектуального ядра з інтеграцією ASR, NLU, LLM та Vision AI. Об’єктом дослідження є процес розпізнавання та опрацювання голосових і текстових команд користувача. Предметом дослідження є методи та технології автоматичного розпізнавання мови, опрацювання природної мови, великих мовних моделей та комп'ютерного “зору”. У дослідженні використано методи системного аналізу, експериментальні та статистичні методи. Результатом є функціонуючий прототип системи з гібридним NLU-рушієм, локальним опрацюванням даних та вебінтерфейсом на базі сучасних технологій.