Success Story - rus

Распознавание чеков и платежек

Мотивация запуска проекта заказчиком: потребность масштабирования бизнеса заказчика выявила ограничения в текущем решении: бизнес модель используемого решения для автоматизации документооборота с использованием человека обладала высокой стоимостью и низкими способностями к масштабированию.

Описание исходной ситуации:
  • высокая эффективность документооборота с минимальным числом ошибок предполагает хранение электронных версий документов и быструю оцифровку печатных версий документов.
  • обработка печатных версий документов предполагается перевод изображений в электронное структурированное представление с высокой точностью.
  • используемый для этого бизнес-процесс не подходит для масштабирования, так как применяется ручной труд для распознавания печатных версий документов.
  • по этой причине возникали значительные риски для планируемого роста бизнеса

Цели проекта:
  • создание системы распознавания основных полей документов с достаточных уровнем качества
  • создание инструмента формирования новых форматов документов.

Решение MIL Team: использование существующих решений команды в области детекции и распознавания текста на изображениях, основанных на нейросетевых моделях, позволило в короткие сроки реализовать решение с требуемым уровнем качества.

Итоги:
Построено решения для автоматизации распознавания:
  • Чеков и квитанций;
  • Счет-фактур (invoice);
  • Заказ-наряда;
  • Договора подряда.

Для построения модели были использованы:
  • Размеченный шаблон документа;
  • Опорные поля документа с их характеристиками;
  • Набор изображений документов.

Результаты моделирования:
  • Модель выделения символов OCR;
  • Модель поиска блоков текста Text Detection;
  • Модель распознавания таблиц Table Detection;
  • Модель построения электронной версии документа.

Заказчик: Финансы, Бухгалтерия

Технологический стек: TensorFlow, Python, Flask.

Computer Vision OCR Research Engineering