The post has been translated automatically. Original language: Russian
In the photo, the signing of a Memorandum of cooperation in the field of AI projects between QazCode and JSC NIT
Artificial intelligence opens up new business opportunities, but not all users can take full advantage of it. Most AI systems are designed for languages with a high level of resources, such as English, Spanish or Russian, which creates a serious language gap and deprives many, including Kazakhstanis, of access to advanced technologies in their native language, necessary for the development and improvement of life in countries with low-resource languages.
In Kazakhstan, the problem of the language gap in AI is being solved by a scientific working group led by the Institute of Smart Systems and Artificial Intelligence at Nazarbayev University (ISSAI NU). They are working on creating a large KAZ-LLM language model that will cover the key languages for Kazakhstanis: Kazakh, Russian and English, so that everyone can use digital technologies in their native language. This fundamental model will become the basis for the development of local services and products, as it will be published in the public domain.
Beeline Kazakhstan digital operator and its subsidiary IT company QazCode participate as a partner in the creation of the KAZ-LLM national large language model . This is far from the operator's first experience in AI development. So, last year Beeline launched and made publicly available to all developers the Kaz-RoBERTA-conversational model, which is actively used to serve subscribers on digital platforms. It has been downloaded more than three thousand times on the Hugging Face platform.
Such initiatives are especially relevant against the background of the importance of digitalization, which is emphasized by the country's leadership. President Kazakhstan's Kassym-Jomart Tokayev stressed the importance of strengthening the country's digital infrastructure and expressed his willingness to personally oversee the creation of an AI system in Kazakhstan. " A new era is unfolding before our eyes. The impact of AI technology is as revolutionary as the discovery of electricity and the Internet. And the development of AI should be ahead of the needs of IT developers. First of all, it is necessary to increase our computing power," the President said, emphasizing the importance of developing domestic technologies.
Thanks to Beeline Kazakhstan and QazCode , the KAZ-LLM project supervised by ISSAI is provided with the necessary infrastructure. The company provided cloud computing capacity of 8 DGX H 100, which significantly increased the amount of training data and training capabilities of the model. The company also provided the collected open data, and QazCode data scientists joined a joint working group on model training.
"KAZ-LLM will be able to create content in the languages most relevant to Kazakhstan: Kazakh, Russian and English. The model will play a crucial role in the preservation of the national cultural heritage and will cover the historical context, specialized areas and colloquial data representing Kazakhstan. By adapting generative AI to local needs, KAZ-LLM will demonstrate how national projects can bridge language gaps and contribute to the global AI innovation landscape.
Most importantly, the KAZ-LLM project contributes to the creation of advanced specialists in the field of generative AI. Thanks to a practical approach to data preparation, training and model implementation, Kazakhstan supports a new wave of advanced scientific personnel capable of creating models and tools for generative AI," ISSAI NU commented.
This contribution to the development of the national economy is great KAZ-LLM's language model reflects the strategy of Beeline's "digital operator", as well as the desire to bridge the language gap in AI technologies. For this purpose, the operator has signed A memorandum with the Supercomputer Center of Barcelona, which specializes in the development of AI of different language groups, and also announced the creation of the first in the Central Asia GPU cloud for the development of AI products based on NVIDIA technology.
Today, the company's portfolio includes many successful AI projects for business: video analytics for sales, computer vision, video surveillance in production, marketing solutions and other products.
"Our accumulated experience, knowledge and cooperation with the Supercomputing Center of Barcelona allow us to focus on three key areas. First, it is the creation of a domestic supercomputer for processing large amounts of data and providing access to these computing capacities to specialists of Nazarbayev University for training models. Secondly, we continue to develop the Kazakh language model Kaz-LLM in order to integrate it into the digital space. And finally, we pay special attention to the development of Data Science professionals so that they can successfully work on complex projects and compete in the international IT arena," said Alexey Sharavar, CEO of QazCode.
The development of large language models in such complex projects as KAZ-LLM plays a key role in the formation and training of strong Data Science personnel for Kazakhstan. These specialists not only gain unique experience working with advanced technologies, but also lay the foundation for further progress in the national AI industry.
The joint efforts of Beeline Kazakhstan, QazCode, Nazarbayev University, a consortium of the country's leading universities, as well as the Ministry of Digital Development, Innovation and Aerospace Industry of the Republic of Kazakhstan and the Ministry of Science and Higher Education of the Republic of Kazakhstan, not only promote AI technologies in the Kazakh language, but also contribute to the further development of the country's digital economy.
На фото подписание Меморандума о сотрудничестве в сфере ИИ-проектов между QazCode и АО "НИТ"
Искусственный интеллект открывает новые возможности для бизнеса, однако не все пользователи могут в полной мере воспользоваться его преимуществами. Большинство ИИ-систем разработаны для языков с высоким уровнем ресурсов, таких как английский, испанский или русский, что создает серьезный языковой разрыв и лишает многих, в том числе казахстанцев, доступа к передовым технологиям на их родном языке, необходимых для развития и улучшения жизни в странах с малоресурсными языками.
В Казахстане проблему языкового разрыва в ИИ решает научная рабочая группа под руководством Института умных систем и искусственного интеллекта при Назарбаев Университете (ISSAI NU). Они работают над созданием большой языковой модели KAZ-LLM, которая охватит ключевые для казахстанцев языки: казахский, русский и английский, чтобы каждый мог использовать цифровые технологии на своем родном языке. Эта фундаментальная модель станет основой для разработки местных сервисов и продуктов, так как будет опубликована в открытом доступе.
Партнером в создании национальной большой языковой модели KAZ-LLM участвует цифровой оператор Beeline Казахстан и его дочерняя ИТ-компания QazCode. Это далеко не первый опыт оператора по разработке ИИ. Так, в прошлом году Beeline запустил и выложил в открытый доступ для всех разработчиков модель Kaz-RoBERTA-conversational, которая активно используется для обслуживания абонентов на цифровых платформах. На платформе Hugging Face ее скачали более трех тысяч раз.
Такие инициативы особенно актуальны на фоне важности цифровизации, которую подчеркивает руководство страны. Президент Казахстана Касым-Жомарт Токаев подчеркнул важность укрепления цифровой инфраструктуры страны и выразил готовность лично курировать создание системы ИИ в Казахстане. «Перед нашими глазами разворачивается новая эра. Воздействие технологий ИИ столь же революционно, как открытие электричества и интернета. И развитие ИИ должно опережать потребности IT-разработчиков. В первую очередь, необходимо нарастить наши вычислительные мощности», — заявил Президент, подчеркивая важность развития отечественных технологий.
Благодаря Beeline Казахстан и QazCode проект по созданию KAZ-LLM, курируемый ISSAI, обеспечен необходимой инфраструктурой. Компанией были предоставлены облачные вычислительные мощности объемом 8 DGX H100, что позволило существенно увеличить объем тренировочных данных и возможности обучения модели. Компания также предоставила собранные открытые данные, а дата-сайентисты QazCode присоединились к совместной рабочей группе по обучению модели.
"KAZ-LLM сможет создавать контент на языках, наиболее актуальных для Казахстана: казахском, русском и английском. Модель будет играть решающую роль в сохранении национального культурного наследия и будет охватывать исторический контекст, специализированные области и разговорные данные, представляющие Казахстан. Адаптируя генеративный ИИ к местным потребностям, KAZ-LLM продемонстрирует, как национальные проекты могут устранить языковые пробелы и внести свой вклад в глобальный ландшафт инноваций в области ИИ.
Наиболее важным является то, что проект KAZ-LLM способствует созданию передовых специалистов в области генеративного ИИ. Благодаря практическому подходу к подготовке данных, обучению и внедрению модели, Казахстан поддерживает новую волну передовых научных кадров, способных создавать модели и инструменты генеративного ИИ",- прокомментировал ISSAI NU.
Этот вклад в развитие национальной большой языковой модели KAZ-LLM отражает стратегию «цифрового оператора» Beeline, а также стремление преодолеть языковой разрыв в ИИ-технологиях. С этой целью оператор подписал Меморандум с Суперкомпьютерным центром Барселоны, который специализируется на развитии ИИ разных языковых групп, а также анонсировал создание первого в Центральной Азии GPU облака для разработки AI-продуктов на базе технологии NVIDIA.
Сегодня в портфеле компании множество успешных ИИ-проектов для бизнеса: видеоаналитика для продаж, компьютерное зрение, видеонаблюдение на производстве, маркетинговые решения и другие продукты.
«Наш накопленный опыт, знания и сотрудничество с Суперкомпьютерным центром Барселоны позволяют сосредоточиться на трех ключевых направлениях. Во-первых, это создание отечественного суперкомпьютера для обработки больших объемов данных и предоставление доступа к этим вычислительным мощностям специалистам Назарбаев Университета для обучения моделей. Во-вторых, мы продолжаем развивать казахскую языковую модель Kaz-LLM, чтобы интегрировать ее в цифровое пространство. И, наконец, мы уделяем особое внимание развитию профессионалов в области Data Science, чтобы они могли успешно работать над сложными проектами и конкурировать на международной ИТ-арене», — отметил Алексей Шаравар, CEO QazCode.
Развитие больших языковых моделей в таких сложных проектах, как KAZ-LLM, играет ключевую роль в формировании и подготовке сильных кадров в области Data Science для Казахстана. Эти специалисты не только получают уникальный опыт работы с передовыми технологиями, но и закладывают основу для дальнейшего прогресса в национальной ИИ-индустрии.
Совместные усилия Beeline Казахстан, QazCode, Назарбаев Университета, консорциума ведущих университетов страны, а также Министерства цифрового развития, инноваций и аэрокосмической промышленности РК и Министерства науки и высшего образования РК, не только продвигают технологии ИИ на казахском языке, но и способствуют дальнейшему развитию цифровой экономики страны.