К вакансиям
ML Engineer

Senior LLM Engineer Remote

ID: 20685
4 часа назад
Активна

Тип занятости

Полная занятость

Требуемый опыт

Более 6 лет

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

Senior LLM Engineer Remote · Full-time GigaChat Vision Team — делаем все связанное с vision модальностью: VLM (Pretrain, SFT, RL), Video, Streaming Video, Mobile Vision, VLM OCR, Document Intelligence, VLA, Embodied VLA. Обучаем на тысячах A100/H100, инференсим на всем - от кластеров до мобильных устройств. Мы ищем эксперта, который глубоко понимает поведение LLM и умеет целенаправленно управлять им через обучение. Для кандидата действительно высокого уровня компенсация не ограничена рамками — готовы платить за реальную экспертизу. Роль: Работа сфокусирована на обучении и адаптации LLM под реальные продуктовые задачи. Ищем специалиста с эволюцией от classic NLP и LSTM, через BERT, к современным LLM, и практическим опытом их обучения в последние годы. Задачи: • Fine-tuning LLM под сложные сценарии • cross-domain generalization, trajectory fine-tuning, behavior cloning • Применение и выбор методов обучения под задачу • SFT, DPO, PPO / GRPO, RLHF / RLAIF, PEFT, knowledge distillation • Работа с данными: сбор, очистка, анализ влияния на поведение модели • Выбор архитектур и pre-trained моделей • Полный цикл обучения: pre-training, fine-tuning, alignment, inference • Подготовка моделей к продакшену Требования • 3+ лет практического обучения LLM • Опыт SFT, DPO, PPO / GRPO, RLHF / RLAIF, PEFT • Глубокое понимание NLP, transformers и поведения LLM • Понимание RL и classic ML • HuggingFace: transformers, datasets, peft, trl • Коммерческая разработка с нуля • Общий опыт от 6 лет Будет плюсом • Research / публикации • Соревнования, хакатоны • ШАД / Школа 21 Условия • Уровень компенсации обсуждаем индивидуально, ориентируемся на сильных кандидатов • Полностью удалённо, без привязки к стране • Сложные задачи, сильная команда, минимум бюрократии Контакт: @dybovanya

🛠 Навыки

BERT
DPO
GRPO
HuggingFace
Knowledge distillation
LLM
LSTM
Natural language processing
PEFT
PPO
Python (computer programming)
RLAIF
RLHF
SFT
Transformers

🎯 Домены

AI
Computer Vision
Document Intelligence
ML

🤖 ИИ навыки

Behavior Cloning
Cross-domain generalization
Data Analysis
Data Cleaning
Deep Learning
DPO
Fine-tuning
GRPO
Hugging Face Datasets
Hugging Face PEFT
Hugging Face Transformers
Hugging Face TRL
Knowledge distillation
Large language models
Machine Learning
model alignment
model inference
model pre-training
Natural language processing
PEFT
PPO
Reinforcement Learning
RLAIF
RLHF
Supervised Learning
Trajectory fine-tuning
Transformers

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Artificial Intelligence
Computer Vision
Document analysis
Embodied AI
Machine Learning
Mobile computing
Natural Language Processing
Video Processing

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)