Только РК

Сумма: 0

Количество заявок: 0

Прием решений до

16.09.25

Форма награждения

Оплата на карту

Статус продукта

Идея

Тип задачи

Задачи НИОКР

Сфера применения

Медиасфера

Область задачи

Дубляж

Тип продукта

размеченные json файлы

Описание проблемы

Мы занимаемся fine-tuning модели whisper для того, чтобы научить её хорошо определять code switching между языками, для этой цели нам нужны качественные диалоги, которые нужно транскрибировать и сделать разметку по времени.

Ожидаемый эффект

Мы ожидаем получить хорошо размеченные json файлы, пригодные для использования в процессе fine-tunning модели whisper

ФИО ответственного лица

Мутышев Искандер

Контакты ответственного лица

+77085842693

Цель и описание задачи (проекта)

В рамках данной задачи, вам необходимо найти 200 роликов на youtube, в которых есть несколько участников диалога и диалог идёт на смешанном языке (казахско-русский).