В Казахстане запустили проект распознавания речи на казахском языке

Проект был разработан Институтом умных систем и искусственного интеллекта на базе Назарбаев Университета (ISSAI). Инициатива по синтезу речи разрабатывалась с целью развития научных исследований и инноваций, а также продвижения использования казахского языка в цифровой сфере в рамках реализации послания Первого Президента Н.А.Назарбаева.


Для построения системы обработки казахской речи используется база данных KazakhTTS.  KazakhTTS – это высококачественная речевая база данных с открытым доступом, которая содержит более 90 часов аудио, записанных двумя профессиональными дикторами: мужчиной и женщиной. База данных общедоступна для академического и коммерческого использования по запросу в соответствии с международной лицензией Creative Commons Attribution 4.0.

Преобразование текста в речь – это искусственное производство человеческой речи. Оно позволяет обрабатывать письменный текст в речевой сигнал.  Такая технология – это важный компонент многих приложений, таких как сетевые виртуальные ассистенты, навигационные системы, системы оповещения, вспомогательные технологии для слабовидящих, где требуется озвучивание казахского текста. Она обеспечивает взаимодействие человека с технологией, не требуя визуального и тактильного интерфейса.

Для ознакомления с проектом переходите по ссылке.


Комментарии 0

Авторизуйтесь чтобы оставить комментарий