Senior Data Engineer / Data Platform Architect

до 350 000 за месяц на руки

Опыт работы: 3–6 лет

Полная занятость

График: 5/2

Рабочие часы: 8

Формат работы: удалённо или гибрид

Social Media Holding

Напишите телефон, чтобы работодатель мог связаться с вами

Чтобы подтвердить, что вы не робот, введите текст с картинки:
captcha

Мы — технологичная и быстрорастущая компания, строим умную, гибкую и масштабируемую data-инфраструктуру с нуля. В команде — ML-инженеры, аналитики, продуктовые команды. Мы уже понимаем, насколько критична роль Data Engineering — и хотим, чтобы этой системой управлял человек с опытом и архитектурным мышлением.

Что предстоит делать:
• Спроектировать и реализовать архитектуру единого профиля клиента (Customer360): все данные о пользователях в одном месте, доступные в near real-time.
• Построить и развивать Data Lake как центральную точку хранения сырых и обработанных данных.
• Создать и поддерживать Data Warehouse и витрины под нужды ML, BI и продуктовых команд.
• Разрабатывать надежные ETL/ELT пайплайны (Python / Airflow / Spark / dbt).
• Выстраивать многоуровневую структуру данных: raw → staging → curated → feature layers.
• Настроить мониторинг качества данных, отслеживание метрик и алерты.
• Участвовать в выборе технологий, постановке архитектуры хранения данных.

Технологический стек:
• Data Lake: S3 / MinIO + Parquet / DeltaLake
• Хранилища: PostgreSQL, ClickHouse
• ETL: Python, Airflow, dbt
• Оркестрация: Airflow, Prefect (по выбору)
• CI/CD и инфраструктура: GitLab, Docker, Kubernetes
• Стриминг: Kafka, RabbitMQ
• ML-инфраструктура: Feature Store, Model Monitoring (совместно с ML-инженерами)
• Мониторинг и алерты: Prometheus, Grafana, кастомные метрики

Требования:
• Опыт проектирования и реализации Data Lake / Data Warehouse с нуля.
• Продвинутые знания SQL (PostgreSQL, ClickHouse).
• Опыт построения ETL/ELT пайплайнов на Python, уверенное владение pandas, pyarrow, SQLAlchemy и т.п.
• Понимание подходов к дата-моделированию: star/snowflake schemas, partitioning, schema evolution.
• Знание CI/CD, Docker
• Опыт работы с стриминговой обработкой данных (Kafka, Spark Streaming, Flink и/или RabbitMQ).

Будет плюсом:
• Опыт работы с Lakehouse архитектурой (например, DeltaLake, Iceberg, Hudi)
• Опыт в совместной работе с ML-командами (feature engineering, пайплайны, мониторинг моделей)
• Опыт работы с векторными базами данных (Faiss, Qdrant, Pinecone и др.)
• Участие в построении Feature Store, реализации data contracts, Data Quality слоёв

Почему это интересно:
• Возможность заложить архитектуру данных с нуля под реальный рост и масштаб.
• Работаете в связке с ML и backend-инженерами, внедряя реальные ML-решения в продакшн.
• Свобода выбора инструментов и подходов, минимум бюрократии.
• Влияние на стек, процессы, культуру — вы не просто исполнитель, вы архитектор системы.

Хочешь строить data-инфраструктуру, которая реально влияет на бизнес?
Пиши — обсудим, расскажем подробнее!

Ключевые навыки

  • Lakehouse
  • Spark
  • Python
  • Scala
  • SQL
  • Kafka
  • Airflow
  • Docker
  • Kubernetes
  • CI/CD
  • Git
  • Data Quality
  • dbt
  • DevOps
  • RabbitMQ

Задайте вопрос работодателю

Он получит его с откликом на вакансию

Вакансия опубликована 1 апреля 2025 в Москве

Похожие вакансии

Data Engineer (Middle)

Опыт 1-3 года
Можно удалённо
Опыт 1-3 года
Можно удалённо
ООО ЕГЭLand
Москва
Москва
ООО ЕГЭLand
Москва
Москва
Построение и поддержка ETL-пайплайнов. Интеграция данных из разных источников (API, базы данных, файлы). Оптимизация хранения и обработки данных.
ЧТО ТАКОЕ EL В ЦИФРАХ? 7 лет создаем аномалии в рынке школьного образования. ТЫ НАМ ТОЧНО ПОДОЙДЕШЬ, ЕСЛИ: У тебя...

Инженер DevOps / ДевОпс

до 200 000 ₽ за месяц, на руки
Опыт более 6 лет
Можно удалённо
до 200 000 ₽ за месяц, на руки
Опыт более 6 лет
Можно удалённо
MLM Soft
Москва
Москва
MLM Soft
Москва
Москва
Обеспечение DevOps инфраструктуры и автоматизации по доставке и управлению облачным программным решением. Администрирование баз данных и инфраструктурных сервисов.
Linux (Ubuntu/Debian). Контейнеризация kubernetes, docker, docker compose. Веб-серверы Nginx, Apache. СУБД Postgresql, MySQL. Системы мониторинга: zabbix, nagios, shinken...

Senior Backend Developer (Node.js)

до 200 000 ₽ за месяц, на руки
Опыт более 6 лет
Можно удалённо
до 200 000 ₽ за месяц, на руки
Опыт более 6 лет
Можно удалённо
MLM Soft
Москва
Москва
MLM Soft
Москва
Москва
Разработка бэкенда (rest api, сервисы, обработчики).
Владение стеком: node.js, postgres, docker, kafka. Действующие в продакшен проекты. Опыт от 6 лет. Разработка в концепции микросервисной архитектуры.

Ведущий сервисный инженер (DevOps)

Опыт 3-6 лет
Можно удалённо
Опыт 3-6 лет
Можно удалённо
ООО Центр внедрения документооборота
Москва
Москва
Консультировать внутренних и внешних клиентов в части вопросов по организации сетевой инфраструктуры. Выявлять проблемы при развертывании и эксплуатации системы, предлагать...
Знать и понимать устройство и принципы работы компьютерных сетей. Понимать принципы работы сети на уровнях L3, L4, L...

DevOps Инженер

Опыт 3-6 лет
Можно удалённо
Опыт 3-6 лет
Можно удалённо
NGENIX
Москва
Аэропорт и еще 2 
Москва
Аэропорт и еще 2 
NGENIX
Москва
Аэропорт и еще 2 
Москва
Аэропорт и еще 2 
Поддерживать и оптимизировать текущие процессы CI/CD. Помогать командам разработки по вопросам подготовки приложений к запуску в production средах.
Уверенные знания Docker, Kubernetes. Практические навыки подготовки Helm шаблонов. Опыт разработки и сопровождения CI/CD pipeline в Gitlab или др.

Team Lead Google UAC (Gambling)

Опыт 3-6 лет
Можно удалённо
Опыт 3-6 лет
Можно удалённо
ИП Урмашов Александр Владимирович
Москва
Москва
Откликнитесь среди первых
Управление командой специалистов по Google UAC: распределение задач, контроль качества, обучение и мотивация. — Разработка и масштабирование рекламных стратегий для Gambling...
Опыт в арбитраже трафика в Gambling вертикале и знание UAC обязательны! — Обязательно: Опыт работы с Google UAC в Gambling/Casino...
Social Media Holding