The post has been translated automatically. Original language: Russian
In September 2024, the work of the Sustainable Innovation and Technology Foundation specialists was focused on several aspects of the KazLLM project development.
First, the development of a new tokenizer was completed, it provides more efficient training on Kazakh text. The KazLLM model was retrained, datasets in Kazakh, Russian and Turkish were added to it, and this will allow the model to work with a wider language audience and improve the quality of responses.
Second, a vocoder for speech translation was configured and trained, and it will allow translation from Kazakh in real time. The Soyle product was launched, which is already available at soyle.nu.edu.kz. It implements text-to-speech and text-to-text translation functions, and can process up to 2000 characters in one request.
Third, as part of the work on the development of digital avatars, all components of the system were combined into a single solution on one computer. The system is now capable of autonomously generating responses and displaying them via a virtual avatar, with response time reduced to 1.46 seconds. This integration has significantly accelerated the system and improved user experience.
The implementation of work within the framework of the KazLLM development project was made possible with partial support from AstanaHub.
В сентябре 2024 года работа специалистов Sustainable Innovation and Technology Foundation была сфокусирована на нескольких аспектах развития проекта KazLLM. Во-первых, завершена разработка нового токенизатора, который обеспечивает более эффективное обучение на казахском тексте. Модель KazLLM была переобучена, в нее добавлены датасеты на казахском, русском и турецком языках, что позволит модели работать с более широкой языковой аудиторией и улучшить качество ответов.
Во-вторых, проведена настройка и тренировка вокодера для перевода речи, что позволит осуществлять перевод с казахского языка в реальном времени, запущен продукт Soyle, который уже доступен по адресу soyle.nu.edu.kz. В нем реализованы функции text-to-speech и text-to-text переводов, а также добавлена возможность обработки до 2000 символов в одном запросе.
В-третьих, в рамках работ по разработке цифровых аватаров все компоненты системы были объединены в единое решение на одном компьютере. Теперь система способна автономно генерировать ответы и отображать их через виртуального аватара, при этом время отклика сократилось до 1,46 секунд. Эта интеграция значительно ускорила работу системы и улучшила взаимодействие с пользователями.
Реализация работ в рамках проекта по развитию KazLLM стала возможной при частичной поддержке AstanaHub.