В Казахстане запустили проект распознавания речи на казахском языке
Проект был разработан Институтом умных систем и искусственного интеллекта на базе Назарбаев Университета (ISSAI). Инициатива по синтезу речи разрабатывалась с целью развития научных исследований и инноваций, а также продвижения использования казахского языка в цифровой сфере в рамках реализации послания Первого Президента Н.А.Назарбаева.
Для построения системы обработки казахской речи используется база данных KazakhTTS. KazakhTTS – это высококачественная речевая база данных с открытым доступом, которая содержит более 90 часов аудио, записанных двумя профессиональными дикторами: мужчиной и женщиной. База данных общедоступна для академического и коммерческого использования по запросу в соответствии с международной лицензией Creative Commons Attribution 4.0.
Преобразование текста в речь – это искусственное производство человеческой речи. Оно позволяет обрабатывать письменный текст в речевой сигнал. Такая технология – это важный компонент многих приложений, таких как сетевые виртуальные ассистенты, навигационные системы, системы оповещения, вспомогательные технологии для слабовидящих, где требуется озвучивание казахского текста. Она обеспечивает взаимодействие человека с технологией, не требуя визуального и тактильного интерфейса.
Для ознакомления с проектом переходите по ссылке.
Комментарии 0
Авторизуйтесь чтобы оставить комментарий