Автоматты аударма пайдаланылды

SITF командасы KazLLM жобасы бойынша қарашада атқарған жұмысы

2024 жылдың қарашасы Қазақстанда жасанды интеллект пен технологияларды дамытудың маңызды айына айналды. KazLLM командасы әртүрлі дереккөздерден, мысалы, Қазақша Уикипедия мен жаңалықтар ресурстарынан алынған оқу жинағындағы 409 миллион токенді қоса алғанда, ауқымды деректерді жинауды аяқтады. Жаңа Nemotron 70B моделіне көшу және синтетикалық мәліметтерді қосу KazLLM-ге үш тілдегі түпнұсқалық Llama 70B-ден асып түсуге ғана емес, орыс тіліндегі OpenAI GPT-4o-ны да жеңуге мүмкіндік берді. KazLLM корпусы қазақ, орыс, ағылшын және түрік тілдеріндегі жүздеген мың параллель сызықтарды қамтитын айтарлықтай кеңейді.

Негізгі жетістіктерге SeamlessM4T үлгісіне негізделген Soyle қолданбасын іске қосу кіреді. Енді қосымшада Halyk Epay төлем жүйесін жаңа тарифтік жоспарлармен біріктіру, сондай-ақ бастапқы форматты сақтай отырып, файлдарды жүктеп алу және аудару мүмкіндігі бар. Команда хакатон өткізді, онда әзірлеушілер қолданбаның API негізінде шешімдер жасады және пресс-релизде Soyle қолданбасын кең аудиторияға таныстырды. Сондай-ақ оқу бейнелерін шығару басталды, тұтынушылармен кездесулер өнімді одан әрі жетілдіру үшін құнды пікірлер алуға көмектесті.

Сөйлеуді тану жүйелерін дамыту жалғасуда. Жаңа ASR Whisper Turbo шу мен екпінді қоса алғанда, қиын орталарда жоғары дәлдікті көрсетеді. Ағылшын, орыс және түрік тілдерін қолдау қосылды, көптілді ортада тұрақтылықты қамтамасыз ету үшін деректерді кеңейту жүзеге асырылды. Қателерді түзету және Audio2Face сияқты модульдермен жақсартылған интеграция жүйені икемді және сенімді етті. Бұл қадамдар технологияны кең таралған нақты әлемде қолдануға жақындатады.

KazLLM дамыту жобасы аясындағы жұмыстарды іске асыру AstanaHub-тың ішінара қолдауымен мүмкін болғанын атап өткен жөн.

Пікірлер 2

Кіру пікір қалдыру үшін