? Data Engineer confirmé – Environnement Data Platform / Gouvernance > Paris > Joboolo FR :
Société : Free-Work Lieu : Paris 94700
Contexte de la mission
Dans le cadre du développement d’une plateforme data au sein d’un grand groupe du secteur de l’énergie, vous intervenez au sein d’une équipe transverse dédiée à l’accélération des usages Data et IA.
L’équipe accompagne les différents métiers dans la conception, la mise en œuvre et l’industrialisation de solutions data à grande échelle, dans un environnement moderne (cloud, big data, datagouvernance).
Missions
Collecter et intégrer des données issues de sources multiples (structurées et non structurées)
Concevoir et maintenir des pipelines de données fiables et performants
Structurer et modéliser la donnée (logique sémantique, normalisation)
Mettre en place des processus de data quality (nettoyage, déduplication, validation)
Assurer la qualité et la cohérence des données intégrées dans le Data Lake
Participer à la cartographie et à la gestion des référentiels de données
Collaborer avec les Data Analysts et Data Scientists pour faciliter l’exploitation des données
Contribuer à la gouvernance des données et à la définition du cycle de vie de la donnée
Participer à l’amélioration continue des performances et des coûts des traitements
Environnement technique
SQL (niveau avancé)
Spark
Python
APIs
AWS
Databricks
Outils de datagouvernance (type Collibra – apprécié)
Profil candidat:
Profil recherché
3 à 6 ans d’expérience en DataEngineering
Très bonne maîtrise de SQL et des environnements Big Data
Expérience sur Spark indispensable
Bonne compréhension des enjeux de qualité et de gouvernance des données
Capacité à travailler dans des environnements complexes et multi-sources
Bon niveau d’anglais (écrit et oral)
Atouts
Expérience sur des architectures Data Lake / Lakehouse
Connaissance d’outils de data catalog / data governance
Expérience en environnement cloud (AWS)
Informations complémentaires
Mission à forte visibilité dans un environnementdata en croissance
Interaction avec des équipes métiers, IT et data
Contexte technique moderne avec enjeux de scalabilité et performance