ML Engineer

Senior LLM Engineer Remote

ID: 20685

4 часа назад

Активна

Тип занятости

Полная занятость

Требуемый опыт

Более 6 лет

Формат работы

Удаленная работа

📞Способы связи

@dybovanyatelegram

📄 Оригинальный текст вакансии

Senior LLM Engineer Remote · Full-time GigaChat Vision Team — делаем все связанное с vision модальностью: VLM (Pretrain, SFT, RL), Video, Streaming Video, Mobile Vision, VLM OCR, Document Intelligence, VLA, Embodied VLA. Обучаем на тысячах A100/H100, инференсим на всем - от кластеров до мобильных устройств. Мы ищем эксперта, который глубоко понимает поведение LLM и умеет целенаправленно управлять им через обучение. Для кандидата действительно высокого уровня компенсация не ограничена рамками — готовы платить за реальную экспертизу. Роль: Работа сфокусирована на обучении и адаптации LLM под реальные продуктовые задачи. Ищем специалиста с эволюцией от classic NLP и LSTM, через BERT, к современным LLM, и практическим опытом их обучения в последние годы. Задачи: • Fine-tuning LLM под сложные сценарии • cross-domain generalization, trajectory fine-tuning, behavior cloning • Применение и выбор методов обучения под задачу • SFT, DPO, PPO / GRPO, RLHF / RLAIF, PEFT, knowledge distillation • Работа с данными: сбор, очистка, анализ влияния на поведение модели • Выбор архитектур и pre-trained моделей • Полный цикл обучения: pre-training, fine-tuning, alignment, inference • Подготовка моделей к продакшену Требования • 3+ лет практического обучения LLM • Опыт SFT, DPO, PPO / GRPO, RLHF / RLAIF, PEFT • Глубокое понимание NLP, transformers и поведения LLM • Понимание RL и classic ML • HuggingFace: transformers, datasets, peft, trl • Коммерческая разработка с нуля • Общий опыт от 6 лет Будет плюсом • Research / публикации • Соревнования, хакатоны • ШАД / Школа 21 Условия • Уровень компенсации обсуждаем индивидуально, ориентируемся на сильных кандидатов • Полностью удалённо, без привязки к стране • Сложные задачи, сильная команда, минимум бюрократии Контакт: @dybovanya

🛠 Навыки

BERT

DPO

GRPO

HuggingFace

Knowledge distillation

LLM

LSTM

Natural language processing

PEFT

PPO

Python (computer programming)

RLAIF

RLHF

SFT

Transformers

🎯 Домены

Computer Vision

Document Intelligence

🤖 ИИ навыки

Behavior Cloning

Cross-domain generalization

Data Analysis

Data Cleaning

Deep Learning

DPO

Fine-tuning

GRPO

Hugging Face Datasets

Hugging Face PEFT

Hugging Face Transformers

Hugging Face TRL

Knowledge distillation

Large language models

Machine Learning

model alignment

model inference

model pre-training

Natural language processing

PEFT

PPO

Reinforcement Learning

RLAIF

RLHF

Supervised Learning

Trajectory fine-tuning

Transformers

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

Artificial Intelligence

Computer Vision

Document analysis

Embodied AI

Machine Learning

Mobile computing

Natural Language Processing

Video Processing

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)

https://t.me/Machinelearning_Jobs/120916

Канал:Machinelearning_Jobs