Старший инженер по данным - Бир Экосистема
Описание работы и требования
Степень в области компьютерных наук, информационных технологий, инженерии, математики или смежной технической дисциплины; 5+ лет опыта работы с технологиями SQL и NoSQL; Опыт работы с базами данных Oracle и PostgreSQL; Обширный опыт разработки ETL с сильными навыками программирования на Python; Продвинутые знания PySpark для обработки больших распределенных данных; Уверенное владение Airflow для планирования, организации и мониторинга сложных ETL/ELT рабочих процессов; Экспертиза в Kafka для потоковой передачи событий и сообщений; Опыт работы с MinIO (совместимое с S3 хранилище), управление данными в форматах Parquet и Iceberg; Знакомство с концепциями Lakehouse; Глубокое понимание концепций архитектуры MPP. Следующий опыт будет рассматриваться как преимущество: Знакомство с Impala для интерактивных SQL-запросов по большим данным; Опыт работы с Greenplum; Знакомство с контейнеризацией (Docker, Kubernetes); Опыт работы с инструментами CDC, такими как Debezium и Oracle GoldenGate для репликации данных в реальном времени; Опыт работы с инструментами визуализации данных (например, Tableau, PowerBI и т.д.); Понимание принципов DataOps и DevOps; Знание моделирования данных и проектирования баз данных; Опыт с лучшими практиками инженерии данных, такими как безопасность данных, контроль доступа к данным и управление данными; Знание Grafana для мониторинга метрик; Умение работать с GitLab для управления версиями; Опыт наставничества младших инженеров по данным и сотрудничества с многофункциональными командами (учеными данных, аналитиками, DevOps).
Должностные обязанности
Мы ищем активного ведущего / старшего инженера по данным, который будет нести ответственность за критические процессы инжекции и lakehouse в высокопроизводительной платформе данных, готовой к производству.
Подать Заявку Сейчас
Эта вакансия требует подачи заявки на сайте работодателя.