Logo
НазадНазад

Ведущий системный инженер данных

ГибридМосква

Обязанности

Внедрение практик разработки и сопровождения с учетом работы ai-агентов. Ускорение T2M системной разработки и инженерных задач на дата-платформе. Постановка требований на команду развития внутренних LLM

Профессиональные навыки

Дообучение (Fine-tuning) open-source LLM (Qwen, Gemma, LLama) с использованием PEFT (LoRA, QLoRA) для специфических доменных задач.
Профессиональное владение принципами работы моделей трансформеров и современных LLM-архитектур, умение объяснять и применять механизм Self-Attention
Работа с эмбеддингами и моделями для ранжирования, семантического поиска, классификации текстов (BERT, RoBERTa, Sentence-BERT).
Решение задач NLP: суммаризация, извлечение именованных сущностей (NER), анализ тональности, машинный перевод.
Проектирование пайплайнов Retrieval-Augmented Generation для работы с частными базами знаний компании.
Оптимизация retrieval: эксперименты с чанкингом (разбиением текста), выбором стратегий поиска (гибридный поиск: ключевые слова + векторный).
Работа с векторными базами данных (ChromaDB, Qdrant, Milvus, FAISS) и классическими (PostgreSQL + pgvector, Redis).
Опыт работы с агентскими LLM-системами и понимание принципов их функционирования.
Развертывание моделей в production (MLOps): упаковка в Docker, оркестрация с Kubernetes, работа с фреймворками для serving (vLLM, TGI, Triton Inference Server).
Мониторинг качества работы моделей в продакшене (детекция дрейфа данных, оценка качества генераций).
Знание метрик для оценки качества генеративных моделей
Анализ научных статей и внедрение актуальных методов в продуктовые сценарии.

Программные навыки

Языки: Python (продвинутый уровень, asyncio, typing).
Фреймворки: PyTorch, Transformers, PEFT, TRL, vLLM, LangGraph, FastAPI
Опыт работы с API OpenAI, а также локальными open-source моделями.
MLOps: Docker, Git, CI/CD для ML (GitHub Actions / GitLab CI), опыт работы с Kubernetes.

Личные качества

Увлеченность разработкой: Активный интерес к новым технологиям и методам разработки. Хороший кругозор: Знание и понимание различных аспектов разработки, включая агентный. Практический опыт: Доказанный опыт практической реализации проектов, особенно в области баз данных и автоматизации.

Требования

Образование
Высшее
Опыт работы
Опыт коммерческой разработки от 2+ лет
Иностранные языки
Английский язык на уровне чтения технической документации и статей.

Условия работы

График работы
Пятидневный

Поможем в обучении и развитии

Научим круто рассказывать

о том, что ты делаешь

  • Внутренняя школа спикеров и авторов
  • Возможность участвовать в крупнейших
    конференциях страны и прокачать
    личный бренд

Вместе прокачаем харды и софты

  • Корпоративный университет, онлайн-библиотека,
    программы развития управленческих навыков
  • Дистанционные курсы на образовательных
    платформах
  • Тренинги, митапы и вебинары

Предоставим не просто социальный пакет, а пакет с пакетами

Наградим плюшками передовой
компании

  • Удалённый или в гибридный формат работы
  • Премии по результатам работы

Позаботимся о здоровье

  • Широкий пакет ДМС со стоматологией
  • Онлайн-психотерапия от «Ясно»

Поделимся скидками сотрудника

«Пятёрочка», «Перекрёсток», «Много лосося», «Перекресток Впрок», а также программа привилегий Prime-zone

Покажем, насколько яркой может быть корпоративная жизнь

Организуем встречи
с топ-менеджментом: слышим
и открыто делимся планами
и результатами

Поощряем активность
сотрудников

За участие в жизни компании награждаем ачивками и баллами, на которые можно купить классный мерч

Развиваем корпоративные
сообщества

Технические, лайфстайл, спортивные или все сразу? Выбирать тебе!

ЕнотикЕнотик

Творим добро

Организовываем благотворительные ярмарки, выезжаем в приюты и устраиваем субботники

Помогаем реализовываться

Корпоративное предпринимательство X5 Idea Challenge

ЕнотикЕнотик

Устраиваем масштабные праздники

Корпоративы, день рождения компании, новый год, день IT-специалиста, день спасибо.

Отклик на вакансию

PDF, до 5 МБ

Поделиться вакансией