Работа специалистов Sustainable Innovation and Technology Foundation по проекту KazLLM в сентябре
В сентябре 2024 года работа специалистов Sustainable Innovation and Technology Foundation была сфокусирована на нескольких аспектах развития проекта KazLLM. Во-первых, завершена разработка нового токенизатора, который обеспечивает более эффективное обучение на казахском тексте. Модель KazLLM была переобучена, в нее добавлены датасеты на казахском, русском и турецком языках, что позволит модели работать с более широкой языковой аудиторией и улучшить качество ответов.
Во-вторых, проведена настройка и тренировка вокодера для перевода речи, что позволит осуществлять перевод с казахского языка в реальном времени, запущен продукт Soyle, который уже доступен по адресу soyle.nu.edu.kz. В нем реализованы функции text-to-speech и text-to-text переводов, а также добавлена возможность обработки до 2000 символов в одном запросе.
В-третьих, в рамках работ по разработке цифровых аватаров все компоненты системы были объединены в единое решение на одном компьютере. Теперь система способна автономно генерировать ответы и отображать их через виртуального аватара, при этом время отклика сократилось до 1,46 секунд. Эта интеграция значительно ускорила работу системы и улучшила взаимодействие с пользователями.
Реализация работ в рамках проекта по развитию KazLLM стала возможной при частичной поддержке AstanaHub.
Comments 3
Login to leave a comment
sturdytea · Oct. 1, 2024 16:40
Такой объем работ 🤯 Успехов проекту!
жанель куприенко · Oct. 1, 2024 03:52
👍
Диас · Sept. 30, 2024 17:36
крутой и нужный проект, и text-to-speech неплохой) успехов в развитии