Публикация была переведена автоматически. Исходный язык: Русский
ТОО «Nomad Tech», в рамках заключённого договора с Карагандинским национальным исследовательским университетом им. академика Е.А. Букетова (КарНИУ), разработало прототип интеллектуального аппаратно-программного комплекса, предназначенного для автоматизации процесса ведения протоколов допросов и обеспечения соблюдения прав всех участников. Ключевой особенностью решения является его техническая ориентация на автономную, защищённую и воспроизводимую фиксацию аудио- и видеоинформации с последующей интеллектуальной обработкой данных непосредственно на месте проведения следственного действия.
В основе прототипа лежит специализированная вычислительная платформа класса edge-computing, обеспечивающая обработку аудио- и видеопотоков без передачи чувствительной информации во внешние облачные среды. В качестве вычислительного модуля используется NVIDIA Jetson Orin NX, работающий под управлением операционной системы Linux. Такой подход позволяет обеспечить достаточную производительность для локального запуска алгоритмов искусственного интеллекта при сохранении требований информационной безопасности.
Для обеспечения качественной фиксации речи всех участников следственного действия в аппаратно-программном комплексе реализован микрофонный массив с направленной записью и первичной цифровой обработкой аудиосигнала, а также встроенные камеры для обзорной видеозаписи в 360 градусов с высоким разрешением. Архитектура микрофонного массива позволяет минимизировать посторонние шумы, пространственно селекционировать источники звука для последующей обработки аудиопотоков в модуле автоматического распознавания речи. Аудиоданные в реальном времени передаются на вычислительный модуль устройства, где проходят этапы очистки, нормализации и сегментации.
Ключевым программным компонентом прототипа является модуль автоматического распознавания речи, адаптированный для работы с русским и казахским языками. Система функционирует в офлайн-режиме и не требует постоянного подключения к внешним сервисам. Распознанная речь автоматически преобразуется в текст и сохраняется в структурированном виде, что позволяет автоматически формировать электронный протокол допроса без ручного ввода данных из показаний.
Поверх базового распознавания речи реализован интеллектуальный программный слой анализа текста, обеспечивающий извлечение юридически значимой информации. Архитектура прототипа предусматривает возможность подключения дополнительных модулей анализа, включая определение ролей участников, временных привязок, ключевых событий и логической структуры показаний. Такой подход создаёт техническую основу для дальнейшего перехода от ручного оформления протоколов допросов к автоматизированным электронным материалам.
С точки зрения программной архитектуры прототип реализован по модульному принципу с разделением на backend-сервисы, пользовательский интерфейс и AI-модули. Взаимодействие между компонентами осуществляется через стандартизированные API, что упрощает масштабирование и интеграцию с государственными информационными системами. Для хранения метаданных в прототипе используется локальная реляционная база данных, а аудио- и видеофайлы хранятся в защищённом объектном хранилище с разграничением прав доступа.
Особое внимание в технической реализации уделено обеспечению целостности и неизменности данных. Для этого в прототипе предусмотрено применение технологий распределённого реестра, позволяющих фиксировать контрольные цифровые отпечатки (хэш-ключи) аудио-, видео- и текстовых материалов. Данный механизм исключает возможность незаметного изменения данных и обеспечивает их проверяемость в рамках служебных проверок и судебных процедур.
На текущем этапе разработанный ТОО «Nomad Tech» прототип представляет собой функционально завершённое аппаратно-программное решение, включающее интегрированную вычислительную платформу с микрофонным массивом и обзорными видеокамерами, развернутое системное и прикладное программное обеспечение, а также базовый пользовательский интерфейс. Реализованы основные функции видеозаписи допроса, автоматической транскрипции речи, локального хранения данных и просмотра результатов через пользовательский интерфейс.
Таким образом, разработанный прототип демонстрирует практическую реализуемость применения современных аппаратных платформ и технологий искусственного интеллекта для автоматической фиксации ведения допросов.
ТОО «Nomad Tech», в рамках заключённого договора с Карагандинским национальным исследовательским университетом им. академика Е.А. Букетова (КарНИУ), разработало прототип интеллектуального аппаратно-программного комплекса, предназначенного для автоматизации процесса ведения протоколов допросов и обеспечения соблюдения прав всех участников. Ключевой особенностью решения является его техническая ориентация на автономную, защищённую и воспроизводимую фиксацию аудио- и видеоинформации с последующей интеллектуальной обработкой данных непосредственно на месте проведения следственного действия.
В основе прототипа лежит специализированная вычислительная платформа класса edge-computing, обеспечивающая обработку аудио- и видеопотоков без передачи чувствительной информации во внешние облачные среды. В качестве вычислительного модуля используется NVIDIA Jetson Orin NX, работающий под управлением операционной системы Linux. Такой подход позволяет обеспечить достаточную производительность для локального запуска алгоритмов искусственного интеллекта при сохранении требований информационной безопасности.
Для обеспечения качественной фиксации речи всех участников следственного действия в аппаратно-программном комплексе реализован микрофонный массив с направленной записью и первичной цифровой обработкой аудиосигнала, а также встроенные камеры для обзорной видеозаписи в 360 градусов с высоким разрешением. Архитектура микрофонного массива позволяет минимизировать посторонние шумы, пространственно селекционировать источники звука для последующей обработки аудиопотоков в модуле автоматического распознавания речи. Аудиоданные в реальном времени передаются на вычислительный модуль устройства, где проходят этапы очистки, нормализации и сегментации.
Ключевым программным компонентом прототипа является модуль автоматического распознавания речи, адаптированный для работы с русским и казахским языками. Система функционирует в офлайн-режиме и не требует постоянного подключения к внешним сервисам. Распознанная речь автоматически преобразуется в текст и сохраняется в структурированном виде, что позволяет автоматически формировать электронный протокол допроса без ручного ввода данных из показаний.
Поверх базового распознавания речи реализован интеллектуальный программный слой анализа текста, обеспечивающий извлечение юридически значимой информации. Архитектура прототипа предусматривает возможность подключения дополнительных модулей анализа, включая определение ролей участников, временных привязок, ключевых событий и логической структуры показаний. Такой подход создаёт техническую основу для дальнейшего перехода от ручного оформления протоколов допросов к автоматизированным электронным материалам.
С точки зрения программной архитектуры прототип реализован по модульному принципу с разделением на backend-сервисы, пользовательский интерфейс и AI-модули. Взаимодействие между компонентами осуществляется через стандартизированные API, что упрощает масштабирование и интеграцию с государственными информационными системами. Для хранения метаданных в прототипе используется локальная реляционная база данных, а аудио- и видеофайлы хранятся в защищённом объектном хранилище с разграничением прав доступа.
Особое внимание в технической реализации уделено обеспечению целостности и неизменности данных. Для этого в прототипе предусмотрено применение технологий распределённого реестра, позволяющих фиксировать контрольные цифровые отпечатки (хэш-ключи) аудио-, видео- и текстовых материалов. Данный механизм исключает возможность незаметного изменения данных и обеспечивает их проверяемость в рамках служебных проверок и судебных процедур.
На текущем этапе разработанный ТОО «Nomad Tech» прототип представляет собой функционально завершённое аппаратно-программное решение, включающее интегрированную вычислительную платформу с микрофонным массивом и обзорными видеокамерами, развернутое системное и прикладное программное обеспечение, а также базовый пользовательский интерфейс. Реализованы основные функции видеозаписи допроса, автоматической транскрипции речи, локального хранения данных и просмотра результатов через пользовательский интерфейс.
Таким образом, разработанный прототип демонстрирует практическую реализуемость применения современных аппаратных платформ и технологий искусственного интеллекта для автоматической фиксации ведения допросов.