Мотивация запуска проекта заказчиком: потребность масштабирования бизнеса заказчика выявила ограничения в текущем решении: бизнес модель используемого продукта не позволяла снизить стоимость решения при масштабировании.
Описание исходной ситуации:
проверка кредитоспособности клиента при выдачи банковского кредита предполагает распознавание его личных удостоверяющих документов с помощью полуавтоматического и автоматического способов
снижение риска неправильного распознавания документов обеспечивается качественной кросс-проверкой документов операторами
используемые ручные и автоматические решения имели ограничения для масштабирования
по этой причине возникали значительные риски для планируемого роста бизнеса
Цели проекта:
создание модели распознавания основных полей удостоверяющих документов с достаточных уровнем качества
создание модели за фиксированную стоимость, что позволит избежать неподходящей бизнес-модели (транзакционная) при масштабировании.
Решение MIL Team: использование существующих решений команды в области детекции и распознавания текста на изображениях, основанных на нейросетевых моделях, позволило в короткие сроки реализовать решение с требуемым уровнем качества.
Для построения модели были использованы:
Набор изображений и сканов личных документов;
Разметка изображений боксами с текстом;
Истинное значение каждого поля;
База именованных сущностей РФ.
Результаты моделирования:
Модель распознавания основных элементов паспорта;
Модели распознавания символов для каждого элемента паспорта.
Точность распознавания ФИО >85 % Точность распознавания Пола >88 % Точность распознавания Номера и серии >91 % Точность распознавания Места и даты рождения >73 % Точность распознавания Органа и даты выдачи >80 %