.
Description
Mission
• Coordonner la mise en place de l’architecture data, conçue par le data architect : infrastructures et logiciels.
• Participer à la mise en œuvre des use cases analytiques
• Intégrer de grands volumes de données, structurées et non structurées, à partir de diverses sources au sein d’un data Lake
• Industrialiser les algorithmes de récupération et de traitement des données et les modèles d’intelligence artificielle.
• Effectuer une veille sur les nouvelles technologies et solutions matérielles/logicielles de transport, de traitement et de stockage des données.
• Contribuer à l’évolution des pratiques dans son domaine de compétences, en étant actif dans des réseaux de veille.
Activités principales
• Identifier avec le data architecte les sources de données pertinentes pour les uses case data
• Développer les chaines d’ingestion en tenant compte des aspects techniques et des exigences non fonctionnelles
• Automatiser les processus d’ingestion de données
• Mettre en œuvre les chaines de traitements de données batch et temps réels Industrialiser et optimiser les modèles de ML développés par les data scientist
• Cartographier les sources de données qui alimentent le datalake
• Garantir la cohérence et la fiabilité des données du datalake
• Faire le suivi capacitaire des environnements data et mettre en œuvre la politique de gourvernance des données
• Traduire les règles de gestion business en KPIs analytiques
• Mettre en œuvre des dispositifs d’alertes en cas d’indisponibilité des données
• Garantir la cohérence dans la nomenclature des données business et techniques
• Assurer l’interopérabilité du datalake avec l’écosystéme data
• Réaliser une veille sur les sources d’informations type open-data.
• Mettre en œuvre les politiques de sécurité en vigueur des donnée
Informations supplémentaires
• Excellente maitrise du framework Spark
• Maitrise des techniques de gestion de projet du cahier des charges à la recette utilisateur et son déploiement
• Bonne compréhension des enjeux business impliquant le traitement des données