Работа специалистов Sustainable Innovation and Technology Foundation по проекту KazLLM в сентябре

В сентябре 2024 года работа специалистов Sustainable Innovation and Technology Foundation была сфокусирована на нескольких аспектах развития проекта KazLLM. Во-первых, завершена разработка нового токенизатора, который обеспечивает более эффективное обучение на казахском тексте. Модель KazLLM была переобучена, в нее добавлены датасеты на казахском, русском и турецком языках, что позволит модели работать с более широкой языковой аудиторией и улучшить качество ответов.

Во-вторых, проведена настройка и тренировка вокодера для перевода речи, что позволит осуществлять перевод с казахского языка в реальном времени, запущен продукт Soyle, который уже доступен по адресу soyle.nu.edu.kz. В нем реализованы функции text-to-speech и text-to-text переводов, а также добавлена возможность обработки до 2000 символов в одном запросе.

В-третьих, в рамках работ по разработке цифровых аватаров все компоненты системы были объединены в единое решение на одном компьютере. Теперь система способна автономно генерировать ответы и отображать их через виртуального аватара, при этом время отклика сократилось до 1,46 секунд. Эта интеграция значительно ускорила работу системы и улучшила взаимодействие с пользователями.

Реализация работ в рамках проекта по развитию KazLLM стала возможной при частичной поддержке AstanaHub.

Комментарии 4

Авторизуйтесь чтобы оставить комментарий

👌👌👍👍

Ответить

Такой объем работ 🤯 Успехов проекту!

Ответить

крутой и нужный проект, и text-to-speech неплохой) успехов в развитии

Ответить