Middle Researcher в команду Compression

Вилка: 150-250к net за full-time

Формат: full-time (40 часов/неделю), удаленка.

Описание:
Развиваем продукт оптимизации нейросеток, подняли pre-seed.
Ищем нацеленных на результат в кор-команду, с амбициями выйти на международный рынок.
Делаем так, чтобы LLM-ки (и не только они) работали в контуре, дешевле, быстрее.

Задачи:
  • Создавать техническое ядро платформы оптимизации;
  • Решать клиентские кейсы;
  • Разрабатывать новые вариации методов на основе SotA open-source и статей

Мы ждем, что ты:
  • Создавал кастомные методы программной компрессии для трансформеров (Quantization, Pruning, Knowledge distillation etc);
  • Использовал и модифицировал фреймворки запуска сеток (ONNX, TensorRT, llama.cpp, vllm) + писал кастомные CUDA-ядра;
  • Нацелен доводить создаваемое до продакшн-использования у клиентов.

Следующие шаги:
  • Крепи CV (включи в резюме ссылки на открытые проекты);
  • Краткое описание (до 3х абзацев) опыта в компрессии;
  • Мотивашку (1 абзац) почему нам по пути.
  • Мы проверим заявку и проведем собеседование с командой.
ХОЧЕШЬ ПОПАСТЬ В КОМАНДУ?
ПОДАВАЙ РЕЗЮМЕ!
Резюме
Название файла CV_Имя_Фамилия.pdf
Чем мы вам интересны как команда? Почему выбрали нашу вакансию? Можно несколько слов о себе и своих планах.
Прикрепите ссылку на репозиторий, связанный с темой вакансии.
Опыт в компрессии
Прикрепите ссылку на репозиторий, связанный с темой вакансии.
Опишите кратко решение задачи и полученные результаты исследовательских проектов.
This website uses cookies to ensure you get the best experience
OK