Success Story - rus

Краулеры и разметка данных в режиме Crowdsourcing

Запрос:
Банк обратился к нам с задачей холодной разметки товаров на вне-банковских платформах. Требовалось собрать выборку объектов из открытого доступа, а также организовать их разметку для последующего построения ML моделей классификации.

Решение:
Организовали сбор данных с конкурирующих платформ с предварительной разметкой LLM моделями, а также процесс корректировки разметки с помощью Яндекс Толоки. Собрали как золотой сет для замеров качества, так и обучающий сет.

Сильные стороны команды:
  • Сбор данных из открытых источников
  • Формирование наборов выборок и задач в толоку под запрос заказчика
  • Подготовка витрин данных для решения целевой задачи


Engineering NLP