The post has been translated automatically. Original language: Russian
Hello, my name is Nurlan Zhunusov, I am the CEO and founder of AICA startup (aica.kz ) and we are launching an online speech analytics platform for Kazakhstanis and local businesses with support for Kazakh, Russian and English languages. This year, with one of the AICA services, we entered the TOP 15 best startups of the "Startuparage" program from Astana Hub. We would like to share information about our platform, insights, AI tools and future plans.
The 1st step that we want to talk about is working on a transcription service, using a simple "audio to text translation". The service is designed for users who need to work with audio recordings/files and translate them into text, including analysis, speaker selection and timecoding. These are usually interviews, lectures, speeches by speakers, meetings and meetings, surveys or regular audio messages in messengers. It is very relevant for journalists and researchers, marketers and copywriters, students and schoolchildren. We have allocated separate processing capacities for this service, placed them in the data center, and worked out variations with neural networks and AI models. Technical issues regarding the speed of downloading, processing, transcription and output of results were resolved, however, difficulties arose with processing Kazakh speech and mixed dialogues (Kazakh and Russian at the same time). Currently, the available models for transcribing Kazakh speech produce about 70% accuracy, which leads to errors when converting audio to speech and this does not suit us. At the current stage, we use third-party services (specifically for the Kazakh language and bilingualism).
The service has been launched in test mode, and we continue to refine and improve it. We plan to add an AI processing function for the text issued after transcription for a specific prompt request (by analogy with the gpt chat), so that the user can analyze the text without leaving AICA using our AI models, group it and structure information, summarize, highlight important things, etc.
Step 2 is the development and launch of a speech analytics service for Kazakhstani businesses (SMEs). At the first stage, we focus on the retail business (pharmacies, gas stations, mini-markets, etc.), since in this segment there are problems with personnel, their qualifications, the execution of scripts and assigned functions. The issue of employee work control is one of the most important when working in retail, since an employee (cashier, salesman, pharmacist, etc.) is the point of contact between the client and the company and if the employee is not polite, does not serve the customer well, is rude, does not sell, then this affects the customer experience, revenue and profit of the outlet and the company in general in general, customer returns and other important aspects. AICA's AI speech analytics services transcribe and analyze employee communications with customers in retail outlets 24/7 (without any additional resources and personal data collection) and process data according to specified characteristics. For example, for pharmacies, this will be about 10 characteristics from the level of service and advice on medicines, to the demand for medicines and additional sales. AICA trained AI models objectively evaluate the work of an employee and evaluate his actions, make recommendations for improving work and identify development areas, they can also find violations and payments past the cash registers. Using the AICA speech analytics service, the retail business gets the opportunity not only to improve customer service, but also to increase sales and revenue.
To create a speech analytics service, we conducted castdevs, developed software for cash registers, selected suitable mini-microphones, optimized the format of audio files for processing, allocated a separate IT architecture and GPU capacities for SMEs, configured transcription services, trained AI models. Now we are finishing with the development of an ERP system in which the client receives all consolidated information on the company, outlets, shifts, employees, every conversation with estimates and recommendations, demand for goods, forecasting future demand, etc. This data is needed by both management and managers, as well as HR, marketers, SB, etc. AI-AICA speech analytics services provide opportunities to improve business and processes, and the larger the company, the more effective they show.
Step 3. AI is AICA's tools and assistants. These are highly targeted services with specialized AI models that are currently under development and training. We are preparing solutions for:
- pharmacy business and pharmacists (digital assistant pharmacist);
- self-service points (voice AI assistant functions);
- solutions for call centers, sales departments, offices (AI answering machine with the function of secretary, consultant, assistant);
- voice search of goods (in lists, databases, nomenclature, etc.);
- users of messengers (chatbots for transcription and AI analysis of text with prompta);
Of course, the market will determine which of the tools we will develop faster and with emphasis, we will take into account demand and market volume.
In summary, we can say that the development of the AICA platform and services opens up new horizons for Kazakhstani business, offering modern AI solutions for working with audio files, analyzing speech data and automating business processes. We continue to work on improving the transcription of the Kazakh language and introducing advanced AI tools into the daily tasks of companies.
I would also like to add that we invite medium and large businesses to cooperate in the development and implementation of AI assistants and AI tools. Together we can create unique solutions that will help your business grow and adapt to modern challenges. If you are ready to join innovations and become a part of the digital future of Kazakhstan, contact us to discuss joint projects.
Peace and prosperity to all!
See you soon
Приветствую, меня зовут Нурлан Жунусов я СЕО и основатель стартапа AICA (aica.kz) и мы запускаем онлайн платформу речевой аналитики для казахстанцев и местного бизнеса с поддержкой казахского, русского и английского языков. В этом году с одним из сервисов AICA мы вошли в ТОП-15 лучших стартапов программы "StartupGarage" от Астана Хаб. Хотим поделиться информацией о нашей платформе, инсайтах, ИИ инструментах и дальнейших планах.
1 шаг, о котором мы хотим рассказать это работа над сервисом транскрибации, по простому "перевод аудио в текст". Сервис предназначен для пользователей, которым необходимо работать с аудио записями/файлами и переводить их в текст, включая анализ, выделение спикеров и таймкодингом. Обычно это интервью, лекции, выступления спикеров, встречи и заседания, опросы или обычные аудиосообщения в мессенджерах. Очень актуально для журналистов и исследователей, маркетологов и копирайтеров, студентов и школьников. Мы под данный сервис выделили отдельные мощности для обработки, разместили их в ЦОД, проработали вариации с нейронками и ИИ-моделями. Технические вопросы по скорости скачивая, обработки, транскрибации и выдачи результатов были решены, однако сложности возникли с обработкой казахской речи и смешанными диалогами (казахском и русском одновременно). Сейчас доступные модели для транскрибации казахской речи выдают порядка 70% точности, что ведет к ошибкам при преобразовании аудио в речь и это нам не подходит. На текущем этапе мы используем сторонние сервисы (именно под казахский язык и двуязычие).
Сервис запущен в тестовом режиме, мы продолжаем его дорабатывать и улучшать. Планируем добавить функцию ИИ-обработки выданного после транскрибации текста под определенный запрос "промпт" (по аналогии с чатом gpt), что бы пользователь мог не покидая AICA с помощью наших ИИ-моделей сделать анализ текста, группировать его и структурировать информацию, резюмировать, выделять важное и т.д.
2 шаг - это разработка и запуск сервиса речевой аналитики для казахстанского бизнеса (МСБ). На первом этапе акцентируем внимание на розничном бизнесе (аптеки, АЗС, мини-маркеты и т.д.) так как, в этом сегменте ощущается проблемы с кадрами, их квалификацией, выполнением скриптов и возложенных функций. Вопрос контроля работы сотрудников один из самых важных при работе в рознице так как сотрудник (кассир, продавец, фармацевт и т.д.) являются точкой соприкосновения клиента с компанией и если сотрудник не вежлив, плохо обслуживает покупателя, грубит, не допродает, то это отражается на клиентском опыте, выручке и прибыли торговой точки и компании в целом, возвратности клиентов и прочих важных аспектах. ИИ-сервисы речевой аналитики AICA в режиме 24/7 транскрибируют и анализируют коммуникации сотрудников с клиентами в торговых точках (без каких либо дополнительных ресурсов и сбора персональных данных) и обрабатывают данные по заданным характеристикам. К примеру для аптек это будет порядка 10 характеристик от уровня сервиса и консультации по лекарственным средствам, до спроса на лекарства и дополнительных продаж. Обученные ИИ-модели AICA объективно оценивают работу сотрудника и производят оценку его действий, дают рекомендации по улучшению работы и выделяют зоны развития, так же могут найти нарушения и платежи мимо касс. Используя сервис речевой аналитики AICA розничный бизнес получает возможность не только улучшать клиентский сервис, но и увеличивать продажи и выручку.
Для создания сервиса речевой аналитики мы провели кастдевы, разработали ПО для касс, отобрали подходящие мини-микрофоны, оптимизировали формат аудиофайлов для обработки, выделили отдельную ИТ-архитектуру и мощности GPU под МСБ, настроили сервисы транскрибации, обучили ИИ-модели. Сейчас заканчиваем с разработкой ERP-системы, в которой клиент получает всю консолидированную информацию по компании, торговым точкам, сменам, сотрудникам, каждому разговору с оценками и рекомендациями, спрос на товары, прогнозирование будущего спроса и т.д. Эти данные нужны как руководству и менеджерам так и HR, маркетологам, СБ и т.д. ИИ-сервисы речевой аналитики AICA дают возможности улучшить бизнес и процессы, и чем больше компания, тем большую эффективность они показывают.
3 шаг. ИИ-инструменты и помощники AICA. Это узконаправленные сервисы со специализированными ИИ-моделями, которые находятся сейчас на стадии разработки и обучения. Мы готовим решения для:
- аптечного бизнеса и фармацевтов (цифровой помощник фармацевта);
- точек самообслуживания (функции голосового ИИ-помощника);
- решения для колл-центров, отделов продаж, офисов (ИИ-автоответчик с функцией секретаря, консультанта, помощника);
- голосового поиска товара (в списках, базах данных, номенклатуре и пр);
- пользователей мессенджеров (чат-боты для транскрибации и ИИ-анализа текста с промптами);
Конечно рынок будет определять какой из инструментов мы будем развивать быстрее и акцентированно, будем учитывать спрос и объем рынка.
В виде резюме можно сказать, что развитие платформы и сервисов AICA открывает новые горизонты для казахстанского бизнеса, предлагая современные ИИ-решения для работы с аудиофайлами, анализа речевых данных и автоматизации бизнес-процессов. Мы продолжаем работу над улучшением транскрибации казахского языка и внедрением передовых ИИ-инструментов в повседневные задачи компаний.
Так же хочется добавить что, мы приглашаем средний и крупный бизнес к сотрудничеству в рамках разработки и внедрения ИИ-помощников и ИИ-инструментов. Вместе мы можем создать уникальные решения, которые помогут вашему бизнесу расти и адаптироваться к современным вызовам. Если вы готовы присоединиться к инновациям и стать частью цифрового будущего Казахстана, свяжитесь с нами для обсуждения совместных проектов.
Всем мира и процветания!
До новых встреч