ML Engineer
Senior LLM Engineer Remote
ID: 20685
4 часа назад
Активна
Тип занятости
Полная занятость
Требуемый опыт
Более 6 лет
Формат работы
Удаленная работа
📞Способы связи
📄 Оригинальный текст вакансии
Senior LLM Engineer
Remote · Full-time
GigaChat Vision Team — делаем все связанное с vision модальностью: VLM (Pretrain, SFT, RL), Video, Streaming Video, Mobile Vision, VLM OCR, Document Intelligence, VLA, Embodied VLA. Обучаем на тысячах A100/H100, инференсим на всем - от кластеров до мобильных устройств.
Мы ищем эксперта, который глубоко понимает поведение LLM и умеет целенаправленно управлять им через обучение.
Для кандидата действительно высокого уровня компенсация не ограничена рамками — готовы платить за реальную экспертизу.
Роль:
Работа сфокусирована на обучении и адаптации LLM под реальные продуктовые задачи.
Ищем специалиста с эволюцией от classic NLP и LSTM, через BERT, к современным LLM, и практическим опытом их обучения в последние годы.
Задачи:
• Fine-tuning LLM под сложные сценарии
• cross-domain generalization, trajectory fine-tuning, behavior cloning
• Применение и выбор методов обучения под задачу
• SFT, DPO, PPO / GRPO, RLHF / RLAIF, PEFT, knowledge distillation
• Работа с данными: сбор, очистка, анализ влияния на поведение модели
• Выбор архитектур и pre-trained моделей
• Полный цикл обучения: pre-training, fine-tuning, alignment, inference
• Подготовка моделей к продакшену
Требования
• 3+ лет практического обучения LLM
• Опыт SFT, DPO, PPO / GRPO, RLHF / RLAIF, PEFT
• Глубокое понимание NLP, transformers и поведения LLM
• Понимание RL и classic ML
• HuggingFace: transformers, datasets, peft, trl
• Коммерческая разработка с нуля
• Общий опыт от 6 лет
Будет плюсом
• Research / публикации
• Соревнования, хакатоны
• ШАД / Школа 21
Условия
• Уровень компенсации обсуждаем индивидуально, ориентируемся на сильных кандидатов
• Полностью удалённо, без привязки к стране
• Сложные задачи, сильная команда, минимум бюрократии
Контакт: @dybovanya
🛠 Навыки
BERT
DPO
GRPO
HuggingFace
Knowledge distillation
LLM
LSTM
Natural language processing
PEFT
PPO
Python (computer programming)
RLAIF
RLHF
SFT
Transformers
🎯 Домены
AI
Computer Vision
Document Intelligence
ML
🤖 ИИ навыки
Behavior Cloning
Cross-domain generalization
Data Analysis
Data Cleaning
Deep Learning
DPO
Fine-tuning
GRPO
Hugging Face Datasets
Hugging Face PEFT
Hugging Face Transformers
Hugging Face TRL
Knowledge distillation
Large language models
Machine Learning
model alignment
model inference
model pre-training
Natural language processing
PEFT
PPO
Reinforcement Learning
RLAIF
RLHF
Supervised Learning
Trajectory fine-tuning
Transformers
* Навыки определены автоматически с помощью нейросети
🤖 ИИ домены
Artificial Intelligence
Computer Vision
Document analysis
Embodied AI
Machine Learning
Mobile computing
Natural Language Processing
Video Processing
* Домены определены автоматически с помощью нейросети
📢 Информация о публикации
🔗 Оригинальные посты (1)
Канал:Machinelearning_Jobs