Success Story - rus

Распознавание идентификационных документов


Мотивация запуска проекта заказчиком: потребность масштабирования бизнеса заказчика выявила ограничения в текущем решении: бизнес модель используемого продукта не позволяла снизить стоимость решения при масштабировании.

Описание исходной ситуации:
  • проверка кредитоспособности клиента при выдачи банковского кредита предполагает распознавание его личных удостоверяющих документов с помощью полуавтоматического и автоматического способов
  • снижение риска неправильного распознавания документов обеспечивается качественной кросс-проверкой документов операторами
  • используемые ручные и автоматические решения имели ограничения для масштабирования
  • по этой причине возникали значительные риски для планируемого роста бизнеса

Цели проекта:
  • создание модели распознавания основных полей удостоверяющих документов с достаточных уровнем качества
  • создание модели за фиксированную стоимость, что позволит избежать неподходящей бизнес-модели (транзакционная) при масштабировании.

Решение MIL Team: использование существующих решений команды в области детекции и распознавания текста на изображениях, основанных на нейросетевых моделях, позволило в короткие сроки реализовать решение с требуемым уровнем качества.

Для построения модели были использованы:
  • Набор изображений и сканов личных документов;
  • Разметка изображений боксами с текстом;
  • Истинное значение каждого поля;
  • База именованных сущностей РФ.

Результаты моделирования:
  • Модель распознавания основных элементов паспорта;
  • Модели распознавания символов для каждого элемента паспорта.

Точность распознавания ФИО >85 %
Точность распознавания Пола >88 %
Точность распознавания Номера и серии >91 %
Точность распознавания Места и даты рождения >73 %
Точность распознавания Органа и даты выдачи >80 %

Заказчик: Финансы, Банкинг, Страхование

Технологический стек: OCR, TensorFlow, Python.
MVP Lab Computer Vision OCR Research Engineering