Автоматты аударма пайдаланылды

Шілде айында KazLLM дамыту: Sustainable Innovation and Technology Foundation мамандарының жұмысы

2024 жылдың шілдесінде KazLLM қазақ тілінінің моделін әзірлеу бойынша жобаны іске асыру  бірнеше негізгі бағыттарда жүзеге асырылды.

Біріншіден, Sustainable Innovation and Technology Foundation мамандары қазақ тіліндегі орфографиялық қателерді түзетуге үйрету мақсатында қазақ LLM үшін датасетті кеңейтті.

Екіншіден, қазақ тілінің параллель корпус деректер жиынтығын кеңейту жұмыстары жүргізілді, бұл мәтіндердің 4 тілге - қазақ, ағылшын, орыс және түрік тілдеріне - машиналық аудармасын қамтамасыз етуге мүмкіндік береді.

Үшіншіден, мамандар жоғарыда көрсетілген 4 тіл үшін сөйлеуді автоматты түрде тануды (ASR) айтарлықтай жақсарту  және text-to-text аудармасын жетілдіру бойынша жұмыс жасады.

Төртіншіден, мамандар тобы қазақ тілінде, оның ішінде нақты уақыт режимінде оқу дәрістерін жүргізе алатын виртуалды аватардың әртүрлі режимдерін сынақтан өткізді.

KazLLM дамыту жобасы шеңберінде жұмыстарды іске асыру AstanaHub ішінара қолдауымен мүмкін болды.

Пікірлер 1

Кіру пікір қалдыру үшін