Мотивация запуска проекта заказчиком: потребность масштабирования бизнеса заказчика выявила ограничения в текущем решении: бизнес модель используемого продукта не позволяла снизить стоимость решения при масштабировании.
Описание исходной ситуации:
- проверка кредитоспособности клиента при выдачи банковского кредита предполагает распознавание его личных удостоверяющих документов с помощью полуавтоматического и автоматического способов
- снижение риска неправильного распознавания документов обеспечивается качественной кросс-проверкой документов операторами
- используемые ручные и автоматические решения имели ограничения для масштабирования
- по этой причине возникали значительные риски для планируемого роста бизнеса
Цели проекта:
- создание модели распознавания основных полей удостоверяющих документов с достаточных уровнем качества
- создание модели за фиксированную стоимость, что позволит избежать неподходящей бизнес-модели (транзакционная) при масштабировании.
Решение MIL Team: использование существующих решений команды в области детекции и распознавания текста на изображениях, основанных на нейросетевых моделях, позволило в короткие сроки реализовать решение с требуемым уровнем качества.
Для построения модели были использованы:
- Набор изображений и сканов личных документов;
- Разметка изображений боксами с текстом;
- Истинное значение каждого поля;
- База именованных сущностей РФ.
Результаты моделирования:
- Модель распознавания основных элементов паспорта;
- Модели распознавания символов для каждого элемента паспорта.
Точность распознавания ФИО >85 %
Точность распознавания Пола >88 %
Точность распознавания Номера и серии >91 %
Точность распознавания Места и даты рождения >73 %
Точность распознавания Органа и даты выдачи >80 %
Заказчик: Финансы, Банкинг, Страхование
Технологический стек: OCR, TensorFlow, Python.