The post has been translated automatically. Original language: Russian
Happy New Year to the AstanaHub community! After the publication of the ontology of local language models, an American developer of Tajik origin sent us his work. The word BERT was often found in his works. This word was previously found in scientific articles on comp sci 2022-23. I looked at NLP on New Year's Eve and saw it again about BERT. Now I have a pet prpject to train a model on 10,000 words of Kazakh text. I'm not good at NLP myself, but I was wondering if it would work out. If not— that's fine. At first, I wanted to drive everything on my laptop (Lenovo thinkpad). But I can already imagine how it will melt from overheating. I also looked at cloud. GCP charges about $0.6 per hour. A couple of days of experimentation is already under ten bucks. AWS comes out comparably, sometimes more expensive. Yandex Cloud is also somewhere around $0.5–$0.7, but I'm not sure if it's easy to set up everything there. The developer is now a buyer and a victim of advertising. I talk about Google every day, and I host the devs portal on ps.kz --> prices are in tenge, support can respond without unnecessary formalities. I don't know yet how much the GPU is being pulled. If everything is OK, then cool. In general, I will experiment. I'm not predicting the result yet: maybe the model will learn to understand Kazakh at least a little bit, or maybe everything will work out. But in any case, this is a real chance to get your hands full and gain new experience. If someone has already had a similar case, write - any information will be useful!
The essence of the project: #Devs.Bot Waitlist Guys, the problem is the business customer adds an audio stream of thoughts to the video. The customer doesn't know what he wants. The developer independently comes up with the requirements and implements them himself. To help the developer/analyst/RMu, I'm making a free bot. You throw it to him, he returns the answer to the test case. What other functionality should I add? Follow the link to find the waitlist, go signup. From the creators devs.kz . Here is the link to the Waitlist https://devsbot-a5afc.web.app/
С Новым годом AstanaHub community!
После публикации онтологии местных языковых моделей, нам скинул свои работы американский разраб таджиского происхождения. В его работах часто встречалось слово BERT. Это слово ранее встречал в научных статьях по comp sci 2022-23 годах. На новый год смотрел видел про что такое NLP и там опять про BERT. Вот теперь у меня pet prpject обучить модель на 10 000 слов казахского текста. Сам в NLP не силён, но чё-то стало интересно, вдруг получится. Если нет — ну и ладно. Сначала хотел всё гонять на своём ноуте ( «Lenovo thinkpad»). Но уже представляю, как он плавиться от перегрева. Посмотрел ещё клауд. GCP берёт около $0.6 в час. Пара дней экспериментов — это уже под десять баксов. AWS выходит сопоставимо, иногда дороже. Yandex Cloud тоже где-то на уровне $0.5–$0.7, но я не уверен, легко ли там всё настроить. Разраб нынче - покупатель и жертва рекламы. Каждый день говорю про гугл, а сам портал devs хостю на ps.kz —-> цены в тенге, поддержка может ответить без лишних формальностей. Пока не знаю, насколько там GPU тянут. Если всё ок, то круто. В общем, буду экспериментировать.
Результат пока не прогнозирую: возможно, моделька научится хоть чуть-чуть понимать казахский, а может, всё накроется. Но в любом случае, это реальный шанс набить руку и получить новый опыт. Если у кого-то уже был подобный кейс, напишите — любая инфа пригодится!
Суть проекта: #Devs.Bot Waitlist Guys, проблема бизнес заказчик отрпавляет вацап аудио поток мыслей. Заказчик не знает чего хочет. Разраб самостоятельно придумывает требования и сам их реализует. Чтобы помочь разрабу / аналитику/ РМу я делаю бесплатный бот. Кидаешь прболему, он возвращает ответом тест кейс. Какой функционал еще добавить?
По ссылке найдете waitlist, гоу signup. От создателей devs.kz. Вот ссылка на Waitlist https://devsbot-a5afc.web.app/