Ақша сомасы: 0
Өтінімдер саны: 3
13.11.25
договорная
Идея
Задачи ИКТ
Робототехника
Интеллектуалды басқару жүйелері
БҚ/АЖ
В ряде контактных центров для приёма и обработки звонков операторы используют исключительно программные телефоны (SoftPhone), работающие через сторонние VoIP-приложения. Такой подход затрудняет доступ к медиапотокам (аудио входящего и исходящего звука) при необходимости выполнения онлайн-распознавания речи (STT) или анализа разговоров в реальном времени. Традиционные методы получения звука через сетевое зеркалирование (port mirroring) или специализированное оборудование неприемлемы из-за сложности внедрения и ограничений инфраструктуры.
Результатом разработки станет программная утилита для ОС Windows, обеспечивающая: 1. Захват аудиопотоков (входящего и исходящего звука) непосредственно со звуковой карты ПК, независимо от используемого VoIP-приложения (например, Zoiper, MicroSIP, Linphone, Teams, Zoom и т.п.). 2. Формирование двух отдельных потоков - входящего и исходящего - для последующей передачи в сервисы распознавания речи (STT) с потоковой обработкой; 3. Работу в реальном времени, без значительных задержек и деградации качества звука; 4. Совместимость с внешними STT API (Google, Whisper, Yandex SpeechKit, Azure Speech и др.); 5. Отсутствие необходимости в настройке сетевого оборудования или изменении конфигурации VoIP-приложений; 6. Простое внедрение - установка и настройка на уровне операционной системы.
Данченко Максим
Тапсырманың (жобаның) мақсаты мен сипаттамасы
Цель: Разработать программную утилиту для Windows, обеспечивающую захват аудиопотоков (входящего и исходящего звука) с уровня звуковой карты персонального компьютера для дальнейшего использования в системах потокового распознавания речи (STT). Описание задачи: Создать решение, которое: 1. Перехватывает аудиосигнал локального микрофона и звука, поступающего в наушники/динамики, без вмешательства в сетевые настройки; 2. Формирует два медиапотока (входящий и исходящий) с минимальной задержкой; 3. Предоставляет доступ к потокам через API или локальный интерфейс для интеграции с сервисами онлайн-распознавания речи; 4. Работает с популярными VoIP-приложениями, не требуя их модификации; 5. Обеспечивает стабильную работу и низкое потребление ресурсов; 6. Не использует технологии зеркалирования портов или вмешательства в сетевое оборудование.