К вакансиям
ML Engineer

LLM Engineer Senior Remote

ID: 19721
1 день назад
Активна
HighSky

Тип занятости

Полная занятость

Требуемый опыт

Более 6 лет

Формат работы

Удаленная работа

📞Способы связи

📄 Оригинальный текст вакансии

Senior LLM Engineer HighSky · Remote · Full-time HighSky — AI-стартап, работающий с задачами уровня state-of-the-art: генерация, агенты, сложное обучение LLM, продакшен под реальной нагрузкой. Мы ищем редкого эксперта по обучению LLM — человека, который глубоко понимает поведение моделей и умеет управлять им через обучение. Фокус роли: - fine-tuning LLM: Cross-domain generalization, Trajectory fine-tuning, Behavior Cloning - эксперименты с различными способами обучения: SFT,  DPO, PPO, GRPO, RLHF, PEFT, Knowledge distillation - Сбор, очищение данных - Выбор архитектур и  pre-trained моделей -Объединение моделей и адаптеров Требования к кандидату: - Опыт обучения LLM (fine-tuning / pre-training)  2+ лет - Опыт применения различных методов обучения LLM - Опыт с различными pre-trained моделями - Опыт работы с экосистемой huggingface: transformers, datasets, peft, trl - Хорошее понимание теоретической базы: NLP, transformers, LLM. - Понимание всех циклов предобучения и файнтюнинга RL, classic  ML - Опыт коммерческой разработки с нуля - Опыт работы от 6 лет - Высшее образование в области компьютерных технологий / прикладной математики и (или) прикладной информатики; Будет плюсом: - Научные исследования по Computer Science  - Призовые места в соревнованиях (kaggle, boosters), опыт участия в хакатонах  - ШАД / Школа 21 Условия: • Компенсация без потолка — обсуждаем индивидуально • Полностью удалённо, без привязки к стране • Сложные задачи, сильная команда, минимум бюрократии • Фокус на результат и качество, а не на процессы Если ты действительно силён в обучении LLM — мы готовы сделать очень конкурентное предложение! Контакт: @dybovanya 🎁

🛠 Навыки

analyse big data
build predictive models
Data Warehouse
develop predictive models
hybrid model
Machine Learning
Natural language processing
Open source model
Outsourcing model
process data
SaaS (service-oriented modelling)
service-oriented modelling

🎯 Домены

AI
Machine Learning
Natural Language Processing

🤖 ИИ навыки

Behavior Cloning
Data Cleaning
Data Preprocessing
Deep Learning
Hugging Face Datasets
Hugging Face PEFT
Hugging Face Transformers
Hugging Face TRL
Knowledge distillation
Machine Learning
Model Evaluation
Model Training
Natural language processing
Python (computer programming)
PyTorch
Reinforcement Learning
Supervised Learning
TensorFlow
Unsupervised Learning

* Навыки определены автоматически с помощью нейросети

🤖 ИИ домены

applied informatics
Applied mathematics
Artificial Intelligence
Computer Science
Machine Learning
Natural Language Processing

* Домены определены автоматически с помощью нейросети

📢 Информация о публикации

🔗 Оригинальные посты (1)

Канал:datasciencejobs