Специалисты Sustainable Innovation and Technology Foundation продолжают работать над KazLLM

В июне 2024 года группа специалистов Sustainable Innovation and Technology Foundation работала над реализацией проекта по разработке казахской языковой модели. Так, была проведена серия экспериментов по обучению LLM, в ходе которых на текстах на казахском языке был натренирован токенизатор со словарем в десятки тысяч токенов. Кроме того, модель OLMo обучается на токенах текстов на казахском языке.

В целях улучшения модели нейронного машинного перевода был пополнен набор данных параллельного корпуса, содержащего тексты на казахском и других языках. На основе этих данных проводится дальнейшее обучение модели нейронного машинного перевода. Сотрудники проекта также интегрировали набор данных в базовую речевую модель, способную одновременно выполнять задачу текстового машинного перевода, чтобы улучшить результаты модели.

Другая часть группы работала над визуализацией виртуальных аватаров и создает прототип аватара, который мог бы рассказывать материал лекции на казахском языке.

Реализация работ стала возможной при частичной поддержке AstanaHub.

829

Bakyt Ospanova
Июль 1, 2024 03:57

Комментарии 0

Авторизуйтесь чтобы оставить комментарий

Nursultan Kabenov · Сен. 12, 2024 01:10

👍

Ответить

История Очистить

Популярные посты

Как мы подготовили Aurma к росту: про инфраструктуру на Yandex Cloud, которую не видно, но которая важна

Виктория Унгурян
11 августа 2025 г.

🤖 Искусственный интеллект: умный помощник или вызов будущему образования?

ЕРЛАН АБДРАИМОВ
1 августа 2025 г.

📘 Образование в XXI веке: зачем мы учимся и как это меняется

ЕРЛАН АБДРАИМОВ
1 августа 2025 г.

AYCOM: Комплексные IT-услуги для вашего бизнеса

Aycom Technology & Informatics
1 августа 2025 г.

Специалисты Sustainable Innovation and Technology Foundation продолжают работать над KazLLM

Bakyt Ospanova
Июль 1, 2024 03:57

Комментарии 0

Nursultan Kabenov · Сен. 12, 2024 01:10

Популярные посты

Как мы подготовили Aurma к росту: про инфраструктуру на Yandex Cloud, которую не видно, но которая важна

Виктория Унгурян 11 августа 2025 г.

🤖 Искусственный интеллект: умный помощник или вызов будущему образования?

ЕРЛАН АБДРАИМОВ 1 августа 2025 г.

📘 Образование в XXI веке: зачем мы учимся и как это меняется

ЕРЛАН АБДРАИМОВ 1 августа 2025 г.

AYCOM: Комплексные IT-услуги для вашего бизнеса

Aycom Technology & Informatics 1 августа 2025 г.

Специалисты Sustainable Innovation and Technology Foundation продолжают работать над KazLLM

Bakyt Ospanova Июль 1, 2024 03:57

Комментарии 0

Nursultan Kabenov · Сен. 12, 2024 01:10

Виктория Унгурян
11 августа 2025 г.

ЕРЛАН АБДРАИМОВ
1 августа 2025 г.

ЕРЛАН АБДРАИМОВ
1 августа 2025 г.

Aycom Technology & Informatics
1 августа 2025 г.

Bakyt Ospanova
Июль 1, 2024 03:57