Описание вакансии
В 4GIC мы создаем масштабируемые и устойчивые решения, где модели машинного обучения работают в продакшне круглосуточно и без простоев. Мы ищем MLOps Engineer, который готов в полной мере взять на себя ответственность за автоматизацию цикла ML: от сбора данных и тренировки моделей до их деплоя, мониторинга и бесшовного обновления.
В этой роли вы окажетесь в эпицентре инноваций. Вместе с Data Scientists вы будете превращать новые исследования в production-ready сервисы: настраивать CI/CD для моделей, внедрять «инфраструктуру как код» (IaC) и обеспечивать высокую доступность и reproducibility всех этапов ML-пайплайна.
Почему вам стоит выбрать 4GIC:
- Конечный impact: ваши пайплайны позволят клиентам экономить до 40% времени на релиз моделей и обеспечат непрерывную работу AI-систем без простоев.
- Сложные и разнообразные задачи: работа с облачными платформами (AWS, GCP, Azure), MLOps-инструментами (MLflow, Kubeflow, Airflow), контейнеризацией и оркестрацией.
- Инновации и эксперименты: доступ к GPU/TPU-ресурсам, время для R&D, участие в хакатонах и проектах Open Source.
- Командная синергия: тесное взаимодействие с Data Scientists, DevOps, Backend и Product-менеджерами.
- Профессиональный рост: наставничество от Principal Engineers, участие в конференциях, budget для сертификаций (AWS, GCP, TensorFlow).
Если вы хотите создавать надёжные ML-конвейеры, снижать время вывода моделей на рынок и гарантировать их безопасность и соответствие стандартам — присоединяйтесь к 4GIC.
Задачи
- Автоматизация ML-пайплайнов: разработка и поддержка CI/CD для моделей, интеграция Git, MLflow и Argo/Tekton.
- Оркестрация процессов: настройка DAG в Airflow или Kubeflow Pipelines для ETL, тренировки, валидации и деплоя.
- Контейнеризация и управление кластером: упаковка сервисов в Docker, деплой и масштабирование в Kubernetes (EKS/GKE/AKS).
- Мониторинг и алертинг: внедрение систем слежения за метриками качества моделей (drift, accuracy), инфраструктурными метриками (Prometheus, Grafana).
- Инфраструктура как код: написание Terraform/Ansible/Chef рецептов для воспроизводимости среды.
- Оптимизация ресурсов: управление GPU/TPU-кластерами, настройка автоскейлинга, балансировка нагрузок.
- Обеспечение безопасности и соответствия: настройка шифрования данных, управление секретами (Vault), контроль доступа.
Должностные обязанности
- Проектировать и разворачивать сквозные MLOps-решения: от data ingestion до live inference.
- Поддерживать reproducibility экспериментов и версионирование моделей и данных.
- Настраивать и оптимизировать CI/CD-процессы для ML, писать автоматические тесты для пайплайнов.
- Внедрять системы мониторинга и оповещений для моделей и инфраструктуры.
- Документировать архитектуру, процессы и best practices, проводить internal training.
- Сотрудничать с командами разработки и эксплуатации, обеспечивая надёжность и безопасность.
Требования к кандидату
Опыт и образование:
- Высшее техническое образование (Computer Science, Engineering, Data Science).
- Опыт работы в роли MLOps или DevOps Engineer с ML-проектами от 3 лет.
Технический стэк:
- Контейнеризация: Docker, Docker Compose.
- Оркестрация: Kubernetes, Helm.
- МLOps: MLflow, Kubeflow, Airflow, Argo.
- IaC: Terraform, Ansible, CloudFormation.
- CI/CD: Jenkins, GitLab CI, GitHub Actions.
- Облачные: AWS (Sagemaker, EKS), GCP (AI Platform, GKE), Azure ML.
- Мониторинг: Prometheus, Grafana, ELK, Sentry.
- Языки: Python, Bash, familiarity with Go or Java будет плюсом.
Профессиональные достижения:
- Результативные проекты по ускорению time-to-production моделей.
- Опыт снижения затрат на инфраструктуру и повышения устойчивости сервисов.
Soft Skills:
- Проактивность, аналитический подход и системное мышление.
- Коммуникабельность и умение работать в кросс-функциональных командах.
- Внимание к деталям, ответственность и ориентация на надежность.
Условия работы
- Формат: гибрид (2–3 дня в офисе) или удалёнка.
- Заработная плата: 210 000–330 000 ₽ на руки (зависит от опыта).
- Оборудование: MacBook Pro или мощный ПК, доступ к GPU/TPU.
- Отпуск: 28 дней, «Research Days» для личных R&D-проектов.
Дополнительная информация
- Процесс найма: HR-скрининг → техническое интервью → практическое задание → встреча с CTO.
- Карьера: путь до Lead MLOps Engineer или Head of MLOps.
- Комьюнити: внутренние хакатоны, участие в Open Source проектах, внешние митапы.
- Отклик: отправляйте резюме и примеры автоматизированных пайплайнов на team@4gic.com с темой «MLOps Engineer».