ML-инженер
- Табыс деңгейі көрсетілмеген
-
Алматы
Неліктен позиция ашық
Жаңа ірі өнімді шығару (ai платформасы). Қазақ тілінде сөйлейтін дауыстық ассистентті нөлден бастап нақты адам ретінде құру қажет. Команда қазірдің өзінде қазақша мәтінді оқи алатын демо-модель жинады және жұмысты әрі қарай жалғастыратын кез келді.
⚙️ Не істеу керек
- Қазақ тілін өңдеу технологияларын дамыту (NLP, ASR, TTS).
- Қазақ тіліне арналған LLM лексикасы мен контекстін жақсарту бойынша жұмыс жасау.
- Сөйлеуді тану және синтездеу үшін өзіңіздің немесе алдын-ала дайындалған модельдеріңізді жасаңыз және оңтайландырыңыз.
- Мәтіндік модульдерден аудио репликаларға дейін speech-To-speech дауыстық жүйесін құруға қатысу.
- Эксперименттер жүргізу, гипотезаларды жылдам тексеру және модель архитектурасын жақсарту.
- Сөйлеу корпустарымен және бірегей датасеттермен, оның ішінде қазақ датасеттерімен жұмыс істеу.
- Өнім сапасына әсер ететін идеялар мен бастамаларды енгізіңіз.
🧩 Талаптар
Міндетті
- Machine Learning / Deep Learning саласындағы жұмыс тәжірибесі.
- Python және негізгі кітапханалардың бірі туралы білім: PyTorch (жақсырақ) немесе TensorFlow.
- Нейрондық желілер, Алгоритмдер және архитектуралар теориясы туралы негізгі түсінік.
- Мәтіндермен, корпустармен және үлгілермен жұмыс істеу үшін жеткілікті қазақ тілінің деңгейі.
- Өзін-өзі ұйымдастыру дағдылары, тапсырмаларды өз бетінше жоспарлау және нәтижеге жеткізу қабілеті.
- Стартап ортасында жұмыс істеуге дайын болу: тез шешім қабылдау, өзгерістерге ашық болу.
- Проактивтілік-бұл тапсырмаларды орындау ғана емес, сонымен қатар шешімдер, жақсартулар, эксперименттер ұсыну.
Қалаулы
- Бір бағыттағы практикалық тәжірибе: ASR (automatic Speech Recognition), TTS (text-to-Speech) немесе NLP (Natural Language Processing).
- LLM немесе трансформатор модельдерін оқыту және дәл баптау тәжірибесі.
- Speech pipeline принциптері мен сөйлеу синтезі жүйелерін түсіну.
- Жарияланымдар, Kaggle / AI жарыстарына қатысу-плюс болады.
- Қазақ тілі мен жалпы мәдениеті үшін технологияларды дамытуға қызығушылық.
Ах неге бұл қызықты
- Мәдени миссиясы бар жоба-қазақ тілі мен АИ-экожүйесін дамытуға қосқан үлесі.
- "Нөлден" анықтамалық дауыстық жүйені құру мүмкіндігі.
- Шағын, бірақ тәжірибелі команда және бастаманың кең мүмкіндіктері.
- Қуатты есептеу ресурстарына және бірегей деректерге қол жеткізу.
- AI-инженерия, Лингвистика және стартап-динамика қиылысында жұмыс істеу.