Вилка: 150-200к net за part-time
Формат: part-time (20 часов/неделю), удаленка.
Описание:Развиваем продукт оптимизации нейросеток, подняли pre-seed.
Ищем нацеленных на результат в кор-команду, с амбициями выйти на международный рынок.
Делаем так, чтобы LLM-ки (и не только они) работали в контуре, дешевле, быстрее.
Задачи:- Создавать техническое ядро платформы оптимизации;
- Решать клиентские кейсы;
- Разрабатывать новые вариации методов на основе SotA open-source и статей
Мы ждем, что ты:- Создавал кастомные методы программной компрессии для трансформеров (Quantization, Pruning, Knowledge distillation etc);
- Использовал и модифицировал фреймворки запуска сеток (ONNX, TensorRT, llama.cpp, vllm) + писал кастомные CUDA-ядра;
- Нацелен доводить создаваемое до продакшн-использования у клиентов.
Следующие шаги:- Крепи CV (включи в резюме ссылки на открытые проекты);
- Краткое описание (до 3х абзацев) опыта в компрессии;
- Мотивашку (1 абзац) почему нам по пути.
- Мы проверим заявку и проведем собеседование с командой.