MIL

Продукт iDog - это продукт, основанный на технологии собственного производства OCR. Команда MIL Team реализовала продукт, который помогает компаниям в автоматизации процесса бумажного документооборота

ВОЗМОЖНОСТИ НАШЕГО РЕШЕНИЯ
1
БЫСТРОЕ ОБУЧЕНИЕ РАСПОЗНАВАНИЮ НОВЫХ ТИПОВ ДОКУМЕНТОВ И НОВЫХ ЯЗЫКОВ
2
ВОЗМОЖНОСТЬ ТЕСТИРОВАНИЯ РАЗЛИЧНЫХ МОДЕЛЕЙ OCR С ОЦЕНКОЙ ТОЧНОСТИ РЕШЕНИЯ ЗАДАЧИ БИЗНЕСА
3
НАШЕ РЕШЕНИЕ ПОЗВОЛЯЕТ РАБОТАТЬ СО СПЕЦИФИЧНЫМИ СЛУЧАЯМИ - РАСПОЗНАВАНИЕ ТАБЛИЦ, ПОДПИСЕЙ И ПЕЧАТЕЙ, ЛИЧНЫХ ДОКУМЕНТОВ
Решение iDog основано на использовании нейросетевых моделей распознавания символов и детекции текста. Оно превосходит открытые аналоги как по качеству, так и по скорости работы.
МЫ ПОМОГАЕМ РЕШИТЬ ЗАДАЧИ НАШЕГО ЗАКАЗЧИКА
Определить оптимальное OCR решение
Модуль Comparison библиотечки iDog позволяет оценить различных поставщиков решений OCR и выбрать именно то решение, которое предоставляет наилучшее качество для задачи бизнеса
Дообучить на новые языки
Наша библиотека может быть быстро дообучена для распознавания новых символов или языков, так как мы создали технологию, которая обучается на синтетической выборке с высоким качеством.
Дообучить на новые документы
Гибкая система представления документов в формате нашей системы позволяет быстро размечать структуру документа и в дальнейшем автоматизированного доставать информацию из документов схожей структуры.
Распознавание личных документов в потоке
Модуль библиотеки iDog позволяет быстро создать шаблон документа фиксированной структуры и распознавать большой поток таких документов с высоким качеством и скоростью работы.
ПРИМЕРЫ РЕАЛИЗОВАННЫХ РАБОТ
КАКИЕ ТЕХНОЛОГИИ ИСПОЛЬЗОВАНЫ ВНУТРИ
Что используем для написания кода
Основной язык программирования: Python
Backend: Python Flask, Django
Frontend: React, vue.js
Работа с данными: PostgresSQL, MongoDB
Распределенные вычисления: Spark, Hadoop
Notebooks: Colab, Jupyter, H2O;
Упаковка моделей и управление потоком данных: Kubernetes, Docker, Airflow;
Профильные фреймворки
Нейросетевые фреймворки: PyTorch (прототипирование), TensorFlow (production), TensorFlow lite (импорт на устройства);
Работа с данными: pandas, numpy;
Профильные библиотеки: BigARTM, TopicNet, gensim, nltk, DeepPavlov, SpaCy, OpenCV, scipy, etc;
Управление экспериментами: Wandb, MLFlow, Tensorboard;
Code Style и поставка решения
  • Оформление кода в виде python-скриптов с использованием PEP 8
  • Высокий уровень читаемости кода

Варианты поставки:
  • Docker + REST API;
  • Web-service + Frontend;
  • Python-скрипты;
  • Библиотеки на Python.
НАША ЦЕНОВАЯ ПОЛИТИКА
Готовые модули
— Text Detection и OCR
— Детекция и сегментация таблиц
— Сравнение решений
500к+
За модуль
адаптация под запрос
— Text Detection и OCR
— Новый тип документов
— Дообучение новому языку
3к+
За час специалиста
КАК МЫ БУДЕМ РАБОТАТЬ ВМЕСТЕ
1
Постановка задачи и бизнес контекст
Определим набор задач, решение которых актуально для бизнеса.
Обсудим пожелания и ограничения, которые есть у компании.
2
NDA и соглашение о сотрудничестве
Подпишем соглашение о неразглашении.
Подпишем рамочное соглашение о сотрудничестве.
3
Оценка и цели проекта
Определим цели бизнеса в решении задачи и показатели успешности проекта.
Подготовим техническое задание и коммерческое предложение по этапам решения задачи.
4
Договор
Согласуем условия договора и подпишем договор с обеих сторон.
5
Данные и вопросы по задаче
Подготовим срез данных для решения задачи.
Обсудим возникшие в ходе анализа задачи вопросы.
6
Решение и поставка
Проведем несколько итераций решения задачи
Будем поставлять готовые результаты по согласованной дорожной карте проекта
7
Сдача и прием проекта
Заказать проект
Для начала нам нужно поговорить. Достаточно заполнить поля ниже, и мы свяжемся с Вами.