3 шага для запуска казахстанской онлайн платформы распознавания речи AICA - транскрибация, речевая аналитика и ИИ-инструменты.

Приветствую, меня зовут Нурлан Жунусов я СЕО и основатель стартапа AICA (aica.kz) и мы запускаем онлайн платформу речевой аналитики для казахстанцев и местного бизнеса с поддержкой казахского, русского и английского языков. В этом году с одним из сервисов AICA мы вошли в ТОП-15 лучших стартапов программы "StartupGarage" от Астана Хаб. Хотим поделиться информацией о нашей платформе, инсайтах, ИИ инструментах и дальнейших планах.   

1 шаг, о котором мы хотим рассказать это работа над сервисом транскрибации, по простому "перевод аудио в текст". Сервис предназначен для пользователей, которым необходимо работать с аудио записями/файлами и переводить их в текст, включая анализ, выделение спикеров и таймкодингом. Обычно это интервью, лекции, выступления спикеров, встречи и заседания, опросы или обычные аудиосообщения в мессенджерах. Очень актуально для журналистов и исследователей, маркетологов и копирайтеров, студентов и школьников. Мы под данный сервис выделили отдельные мощности для обработки, разместили их в ЦОД, проработали вариации с нейронками и ИИ-моделями. Технические вопросы по скорости скачивая, обработки, транскрибации и выдачи результатов были решены, однако сложности возникли с обработкой казахской речи и смешанными диалогами (казахском и русском одновременно). Сейчас доступные модели для транскрибации казахской речи выдают порядка 70% точности, что ведет к ошибкам при преобразовании аудио в речь и это нам не подходит. На текущем этапе мы используем сторонние сервисы (именно под казахский язык и двуязычие). 

Сервис запущен в тестовом режиме, мы продолжаем его дорабатывать и улучшать. Планируем добавить функцию ИИ-обработки выданного после транскрибации текста под определенный запрос "промпт" (по аналогии с чатом gpt), что бы пользователь мог не покидая AICA с помощью наших ИИ-моделей сделать анализ текста, группировать его и структурировать информацию, резюмировать, выделять важное и т.д.

2 шаг - это разработка и запуск сервиса речевой аналитики для казахстанского бизнеса (МСБ). На первом этапе акцентируем внимание на розничном бизнесе (аптеки, АЗС, мини-маркеты и т.д.) так как, в этом сегменте ощущается проблемы с кадрами, их квалификацией, выполнением скриптов и возложенных функций. Вопрос контроля работы сотрудников один из самых важных при работе в рознице так как сотрудник (кассир, продавец, фармацевт и т.д.) являются точкой соприкосновения клиента с компанией и если сотрудник не вежлив, плохо обслуживает покупателя, грубит, не допродает, то это отражается на клиентском опыте, выручке и прибыли торговой точки и компании в целом, возвратности клиентов и прочих важных аспектах. ИИ-сервисы речевой аналитики AICA в режиме 24/7 транскрибируют и анализируют коммуникации сотрудников с клиентами в торговых точках (без каких либо дополнительных ресурсов и сбора персональных данных) и обрабатывают данные по заданным характеристикам. К примеру для аптек это будет порядка 10 характеристик от уровня сервиса и консультации по лекарственным средствам, до спроса на лекарства и дополнительных продаж. Обученные ИИ-модели AICA объективно оценивают работу сотрудника и производят оценку его действий, дают рекомендации по улучшению работы и выделяют зоны развития, так же могут найти нарушения и платежи мимо касс. Используя сервис речевой аналитики AICA розничный бизнес получает возможность не только улучшать клиентский сервис, но и увеличивать продажи и выручку.

Для создания сервиса речевой аналитики мы провели кастдевы, разработали ПО для касс, отобрали подходящие мини-микрофоны, оптимизировали формат аудиофайлов для обработки, выделили отдельную ИТ-архитектуру и мощности GPU под МСБ, настроили сервисы транскрибации, обучили ИИ-модели. Сейчас заканчиваем с разработкой ERP-системы, в которой клиент получает всю консолидированную информацию по компании, торговым точкам, сменам, сотрудникам, каждому разговору с оценками и рекомендациями, спрос на товары, прогнозирование будущего спроса и т.д. Эти данные нужны как руководству и менеджерам так и HR, маркетологам, СБ и т.д. ИИ-сервисы речевой аналитики AICA дают возможности улучшить бизнес и процессы, и чем больше компания, тем большую эффективность они показывают.       

3 шаг. ИИ-инструменты и помощники AICA. Это узконаправленные сервисы со специализированными ИИ-моделями, которые находятся сейчас на стадии разработки и обучения. Мы готовим решения для:

- аптечного бизнеса и фармацевтов (цифровой помощник фармацевта);

- точек самообслуживания (функции голосового ИИ-помощника);

- решения для колл-центров, отделов продаж, офисов (ИИ-автоответчик с функцией секретаря, консультанта, помощника);

- голосового поиска товара (в списках, базах данных, номенклатуре и пр); 

- пользователей мессенджеров (чат-боты для транскрибации и ИИ-анализа текста с промптами);

Конечно рынок будет определять какой из инструментов мы будем развивать быстрее и акцентированно, будем учитывать спрос и объем рынка.   

В виде резюме можно сказать, что развитие платформы и сервисов AICA открывает новые горизонты для казахстанского бизнеса, предлагая современные ИИ-решения для работы с аудиофайлами, анализа речевых данных и автоматизации бизнес-процессов. Мы продолжаем работу над улучшением транскрибации казахского языка и внедрением передовых ИИ-инструментов в повседневные задачи компаний.

Так же хочется добавить что, мы приглашаем средний и крупный бизнес к сотрудничеству в рамках разработки и внедрения ИИ-помощников и ИИ-инструментов. Вместе мы можем создать уникальные решения, которые помогут вашему бизнесу расти и адаптироваться к современным вызовам. Если вы готовы присоединиться к инновациям и стать частью цифрового будущего Казахстана, свяжитесь с нами для обсуждения совместных проектов.

Всем мира и процветания!

До новых встреч

Комментарии 8

Авторизуйтесь чтобы оставить комментарий

удачи вам команда!

Ответить

жду не дождусь 👍🏻🔥

Ответить

ооо вот эта классная новость🔥

Ответить

👍👍👍👍

Ответить

Успехов и развития 🔥

Ответить