.
La Sonatel recrute un Data Engineer H/F.
Missions
• Coordonner la mise en place de l’architecture data, conçue par le data architect : infrastructures et logiciels.
• Participer à la mise en œuvre des use cases analytiques
• Intégrer de grands volumes de données, structurées et non structurées, à partir de diverses sources au sein d’un data lake
• Industrialiser les algorithmes de récupération et de traitement des données et les modèles d’intelligence artificielle.
• Effectuer une veille sur les nouvelles technologies et solutions matérielles/logicielles de transport, de traitement et de stockage des données.
• Contribuer à l’évolution des pratiques dans son domaine de compétences, en étant actif dans des réseaux de veille
Activités Principales
• Identifier avec le data architecte les sources de données pertinentes pour les uses case data
• Développer les chaînes d’ingestion en tenant compte des aspects techniques et des exigences non fonctionnelles
• Automatiser les processus d’ingestion de données
• Mettre en œuvre les chaines de traitements de données batch et temps réels
• Industrialiser et optimiser les modèles de ML développés par les data scientist
• Cartographier les sources de données qui alimentent le data lake
• Garantir la cohérence et la fiabilité des données du data lake
• Faire le suivi capacitaire des environnements data et mettre en œuvre la politique de gouvernance des données
• Traduire les règles de gestion business en KPIs analytiques
• Mettre en œuvre des dispositifs d’alertes en cas d’indisponibilité des données
• Garantir la cohérence dans la nomenclature des données business et techniques
• Assurer l’interopérabilité du datalake avec l’écosystème data de Sonatel
• Réaliser une veille sur les sources d’informations type open-data.
• Mettre en œuvre les politiques de sécurité en vigueur des données
Profil
Bac + 4/5 en informatique, statistiques, data science , data engineer
Expériences nécessaires
3 ans en gestion et analyse des données
Soft skills
• Connaissance des distributions Hadoop du marché : Hortonworks et/ou Cloudera
• Fortes aptitudes en développement / programmation avec une excellente maîtrise des langages de programmation suivant : Python, Scala, Java, Shell Unix.
• Connaissance de l’environnement cloud : GCP / AWS, …
• Connaissance des technologies de transports de données : Apache NiFi et Kafka
• Excellente maîtrise de l’écosystème Hadoop : HDFS, Yarn, Oozie, Hive
• Excellente maîtrise du framework Spark