Публикация была переведена автоматически. Исходный язык: Русский
Компании с большим объёмом документооборота в логистике, торговле и промышленности регулярно сталкиваются с необходимостью ручной проверки товарных накладных. Несмотря на распространение электронных систем, значительная часть документов по-прежнему поступает в виде сканов и PDF-файлов или фотографий, часто в составе разнородных комплектов.
Ручная обработка таких документов требует значительных трудозатрат, а также является рутиной, которую можно и нужно автоматизировать. Особенно критичными остаются задачи сверки с реестрами, проверки обязательных пунктов и контроля наличия и отсутствие подписей.
Вначале мы склонялись к классическим OCR-решениям ориентированным на извлечение текста, но в реальных бизнес-сценариях это приводит к ряду ограничений:
- одна товарная накладная может состоять из нескольких страниц;
- в комплекте часто присутствуют нерелевантные документы;
- наличие подписи определяется визуально, а не текстом, а натренированные Yolo выдают низкий результат на разнородных документах ;
- корректность документа зависит от взаимосвязи полей и страниц.
В результате компании вынуждены сохранять значительную долю ручной проверки даже при наличии OCR.
Мы сделали решение, которое использует мультимодальную AI-модель, способную анализировать изображения и текст одновременно. Это позволяет системе не просто распознавать данные, а понимать логику и структуру товарной накладной как единого документа.
Сервис автоматически обрабатывает комплекты файлов, выделяет товарные накладные и выполняет интеллектуальную валидацию по заданным бизнес-правилам.
Ручная проверка одной товарной накладной с комплектом документов в среднем занимает от 2 до 5 минут. AI-сервис автоматизирует до 70–85% операций первичной проверки, сокращая участие сотрудников до контроля исключений.
Для компаний, обрабатывающих 10 000–20 000 накладных в месяц, это эквивалентно высвобождению 2–5 FTE без увеличения штата.
Решение ориентировано на компании с высоким объёмом документооборота и может применяться в следующих отраслях:
- логистика и транспорт;
- дистрибуция и оптовая торговля;
- промышленное производство;
- компании с централизованной бухгалтерией и распределённой филиальной сетью.
В рамках единого пайплайна сервис выполняет следующие задачи:
- распознаёт номер товарной накладной;
- определяет тип документа и корректно группирует страницы одной накладной;
- сверяет номера накладных с внутренними или внешними реестрами;
- автоматически отсеивает лишние документы в комплекте;
- проверяет корректность заполнения пункта (тип владения);
- определяет наличие или отсутствие подписей в пункте 8;
- определяет наличие или отсутствие подписей в пункте 10.
Результатом работы сервиса является структурированный отчёт с указанием статуса документа и выявленных несоответствий.
В ходе пилотного использования сервиса были достигнуты следующие средние показатели:
- 96% средняя точность распознавания и валидации товарных накладных;
- корректная обработка многостраничных документов и комплектов;
- ≈1 730 токенов в секунду при inference модели.
Указанные значения являются средними и могут варьироваться в зависимости от качества исходных документов и структуры комплектов.
Решение реализовано с использованием современного AI-стека и ориентировано на корпоративное применение:
- vLLM — высокопроизводительный inference-движок;
- Qwen 3 VL Instruct 8B — мультимодальная модель для анализа документов;
- On-premise развёртывание — для работы в закрытом контуре заказчика.
Для стабильной работы и потоковой обработки документов требуется GPU с видеопамятью не менее 48 GB.
Компании с большим объёмом документооборота в логистике, торговле и промышленности регулярно сталкиваются с необходимостью ручной проверки товарных накладных. Несмотря на распространение электронных систем, значительная часть документов по-прежнему поступает в виде сканов и PDF-файлов или фотографий, часто в составе разнородных комплектов.
Ручная обработка таких документов требует значительных трудозатрат, а также является рутиной, которую можно и нужно автоматизировать. Особенно критичными остаются задачи сверки с реестрами, проверки обязательных пунктов и контроля наличия и отсутствие подписей.
Вначале мы склонялись к классическим OCR-решениям ориентированным на извлечение текста, но в реальных бизнес-сценариях это приводит к ряду ограничений:
- одна товарная накладная может состоять из нескольких страниц;
- в комплекте часто присутствуют нерелевантные документы;
- наличие подписи определяется визуально, а не текстом, а натренированные Yolo выдают низкий результат на разнородных документах ;
- корректность документа зависит от взаимосвязи полей и страниц.
В результате компании вынуждены сохранять значительную долю ручной проверки даже при наличии OCR.
Мы сделали решение, которое использует мультимодальную AI-модель, способную анализировать изображения и текст одновременно. Это позволяет системе не просто распознавать данные, а понимать логику и структуру товарной накладной как единого документа.
Сервис автоматически обрабатывает комплекты файлов, выделяет товарные накладные и выполняет интеллектуальную валидацию по заданным бизнес-правилам.
Ручная проверка одной товарной накладной с комплектом документов в среднем занимает от 2 до 5 минут. AI-сервис автоматизирует до 70–85% операций первичной проверки, сокращая участие сотрудников до контроля исключений.
Для компаний, обрабатывающих 10 000–20 000 накладных в месяц, это эквивалентно высвобождению 2–5 FTE без увеличения штата.
Решение ориентировано на компании с высоким объёмом документооборота и может применяться в следующих отраслях:
- логистика и транспорт;
- дистрибуция и оптовая торговля;
- промышленное производство;
- компании с централизованной бухгалтерией и распределённой филиальной сетью.
В рамках единого пайплайна сервис выполняет следующие задачи:
- распознаёт номер товарной накладной;
- определяет тип документа и корректно группирует страницы одной накладной;
- сверяет номера накладных с внутренними или внешними реестрами;
- автоматически отсеивает лишние документы в комплекте;
- проверяет корректность заполнения пункта (тип владения);
- определяет наличие или отсутствие подписей в пункте 8;
- определяет наличие или отсутствие подписей в пункте 10.
Результатом работы сервиса является структурированный отчёт с указанием статуса документа и выявленных несоответствий.
В ходе пилотного использования сервиса были достигнуты следующие средние показатели:
- 96% средняя точность распознавания и валидации товарных накладных;
- корректная обработка многостраничных документов и комплектов;
- ≈1 730 токенов в секунду при inference модели.
Указанные значения являются средними и могут варьироваться в зависимости от качества исходных документов и структуры комплектов.
Решение реализовано с использованием современного AI-стека и ориентировано на корпоративное применение:
- vLLM — высокопроизводительный inference-движок;
- Qwen 3 VL Instruct 8B — мультимодальная модель для анализа документов;
- On-premise развёртывание — для работы в закрытом контуре заказчика.
Для стабильной работы и потоковой обработки документов требуется GPU с видеопамятью не менее 48 GB.