Data Engineer [Alternance]
Certification
Modalité d'évaluation :
Pour obtenir la certification Data Engineer :
- Vous passerez une étude de cas.
- Vous aurez une mise en situation professionnelle.
- Vous ferez une présentation orale devant un jury.
- Vous devrez remettre des travaux avant la présentation
La certification :
- La formation donne un titre professionnel reconnu par l'État.
- Ce titre est inscrit au répertoire national des certifications professionnelles (RNCP).
- La certification s'appelle Expert en infrastructures de données massives
Niveau de la certification :
- La formation est de niveau 7, équivalent à un bac +5.
- Elle est enregistrée au RNCP sous le numéro 37638.
- Vous pouvez aussi obtenir cette certification par la Validation des Acquis de l'Expérience (VAE).
Note :
Le référentiel de cette certification a été récemment mis en place.
Nous ne pouvons pas encore donner de taux de réussite.
Pour une meilleure accessibilité,
cette page a été traduite en s'inspirant de la méthode FALC
(Facile à lire et à comprendre)
Dates de la formation :
- Formation intensive :
du 24 Mars au 4 Juillet 2025
- Formation en alternance :
du 22 Septembre 2025 au 9 Mars 2027
(le calendrier précis sera fourni au moment de la sélection)
Formation en alternance
Rythme : 3 semaines entreprise / 1 semain formation
Format Hybride :
- 60% Présentiel à Toulouse ou Montpellier
- 40% Distanciel
Des questions ?
Contactez Laure Ecorce
lecorce@simplon.co
Participez à une réunion d'information en ligne
> inscriptions ici
Présentation
C’est l’un des métiers émergents de la tech !
Le métier de Data Engineer
Le Data Engineer est un métier très demandé dans le domaine numérique.
C'est l'un des 10 métiers les plus recherchés dans la technologie.
Qu'est-ce que fait un Data Engineer ?
Il crée, développe et maintient les infrastructures de données.
Cela est important surtout quand les données augmentent vite.
Il travaille avec des Data Scientists, des Analystes de données et des Développeurs.
Le but est d'aider les entreprises à utiliser leurs données pour prendre de bonnes décisions.
Formation en Data Engineering
La formation vous apprend les compétences techniques nécessaires.
Vous apprendrez des langages de programmation comme Python, Java ou Scala.
Vous utiliserez des outils Big Data comme Hadoop, Spark et SQL.
Vous acquerrez aussi des connaissances en architecture distribuée et en cloud computing.
Ces compétences sont importantes pour réussir dans ce métier en pleine croissance.
Compétences et débouchés
Le profil de Data Engineer est recherché par de nombreuses entreprises, des start-ups aux grandes entreprises.
Il peut travailler dans des cabinets de conseil (SSII et ESN).
Le Data Engineer peut devenir expert en infrastructures de données massives ou consultant big data.
Salaire
Le salaire d'un Data Engineer est attractif.
Il se situe entre 45 000 € et 60 000 € brut par an.
Compétences visées
Compétences visées
Les compétences sont listées sur le site de France Compétences
sous l'enregistrement n°RNCP37638
Nous les avons traduites en s'inspirant de la méthode FALC ici :
1 - Piloter la conduite d’un projet data
-
Analyser les besoins :
Comprendre ce que l'organisation veut faire avec les données.
Parler avec les personnes concernées pour savoir ce qui est important.
Décider des meilleures options techniques pour le projet.
-
Cartographier les données :
Identifier les données disponibles, d'où elles viennent, comment elles sont utilisées et leurs caractéristiques.
Cela aide à confirmer les choix techniques pour le projet.
-
Concevoir le cadre technique :
Créer un plan pour utiliser les données.
Prendre en compte les contraintes techniques, les ressources disponibles, et les règles de protection des données (RGPD).
Penser aussi à l'impact environnemental.
-
Faire une veille technique et réglementaire :
Se tenir informé des dernières nouveautés et des lois.
Cela aide à proposer des solutions à jour pour le projet.
-
Planifier le projet :
Organiser les étapes du projet, définir les moyens nécessaires et les méthodes de suivi.
-
Superviser le projet :
S'assurer que tout le monde sait quoi faire et que les outils sont bien utilisés.
Communiquer et coordonner avec l'équipe pour réussir le projet.
-
Communiquer sur le projet :
Informer les parties prenantes des avancées et des résultats du projet.
Utiliser des supports de communication adaptés.
2 - Collecte, stockage et mise à disposition des données
-
Automatiser l'extraction de données :
Programmer des scripts pour collecter des données depuis différentes sources (web, fichiers, bases de données).
-
Développer des requêtes SQL :
Utiliser le langage SQL pour extraire les données nécessaires des systèmes de gestion de bases de données.
-
Agrégation des données :
Créer des règles pour combiner des données provenant de différentes sources, en nettoyant et en harmonisant les formats.
-
Créer une base de données :
Concevoir des modèles de données et les importer, tout en respectant les règles du RGPD.
-
Partager les données :
Configurer des interfaces pour que d'autres puissent accéder aux données nécessaires au projet.
3 - Élaborer et maintenir un entrepôt de données (data warehouse)
-
Modéliser la structure des données :
Organiser les données pour faciliter les analyses.
-
Créer un entrepôt de données :
Construire l'entrepôt en tenant compte des besoins du projet et des contraintes techniques.
-
Intégrer les ETL (extraction, transformation et chargement) :
Assurer la qualité des données entrantes et sortantes.
-
Gérer l'entrepôt de données :
Utiliser des outils pour gérer les accès et les mises à jour, en respectant le RGPD.
-
Implémenter des variations :
Ajuster l'entrepôt de données en fonction des changements dans l'activité de l'organisation.
4 - Encadrer la collecte massive et la mise à disposition des données avec un data lake
-
Concevoir l'architecture du data lake :
Choisir les technologies en fonction du volume, de la diversité et de la vitesse des données.
-
Intégrer les composants du data lake :
S'assurer que le système peut collecter, stocker et rendre disponibles les données.
-
Gérer le catalogue des données :
Organiser et suivre les données en tenant compte de leur source et de leur durée de vie, en respectant le RGPD.
-
Implémenter les règles de gouvernance des données :
Sécuriser et contrôler l'accès aux données pour protéger la confidentialité et respecter les politiques de l'organisation.
Programme
Introduction à la formation
- Découvrir le métier de Data Engineer.
- Essayer la pédagogie active de Simplon.
- Apprendre les bases du développement et de l'algorithme.
- Rencontrer les autres personnes de la promotion.
- Comprendre les compétences à acquérir et les critères pour obtenir la certification finale.
Pendant la formation :
- Apprendre des langages de programmation comme Python, Java, ou Scala.
- Utiliser des outils Big Data comme Hadoop, Spark, et SQL.
- Apprendre sur l'architecture distribuée et le cloud computing.
Phase 1 - Travailler sur des bases de données
Créer et gérer des bases de données pour répondre à des besoins simples. Notamment :
- Participer à la gestion d'un projet data.
- Contribuer à la conception et création de bases de données.
- Automatiser l'entrée de données dans les bases de données.
Phase 2 - Évolution d'un data warehouse
Travailler sur l'entrepôt de données de l'entreprise.
Automatiser et standardiser les traitements de données. Par exemple :
- Connaître les structures de données en faits et dimensions du data warehouse.
- Tester l'entrepôt de données en environnement de développement/test.
- Intégrer de nouvelles sources de données en ajustant les scripts.
Phase 3 - Évolution d'un data lake
Travailler sur le datalake, qui stocke les données brutes. Par exemple :
- Adapter les procédures de collecte automatique de données.
- Travailler sur les outils de catalogage de données.
- Configurer les droits d'accès.
Phase 4 - Bases de données pour les équipes d’analyse
Créer une base de données pour répondre à un besoin métier. Par exemple :
- Identifier les données sources pertinentes.
- Concevoir une base de données cible.
- Automatiser l'import des données depuis différentes sources.
- Développer des points de terminaison d'API et des règles d'autorisation.
Phase 5 - Création d'un data warehouse
Créer un entrepôt de données pour différents usages data. Par exemple :
- Cartographier les données collectées par l'entreprise.
- Structurer l'entrepôt de données selon les cas d'usage.
- Choisir les outils de stockage et d'import.
- Maintenir les composants techniques en état de fonctionnement.
Phase 6 - Création d'un datalake
Mettre en place l'architecture et la structure d'un datalake. Par exemple :
- Concevoir l'architecture du datalake.
- Intégrer les composants d'infrastructure.
- Mettre en place un catalogue de données.
- Implémenter des règles de gouvernance des données.
Phase 7 - Missions d’étude, conseil, et intégration
Piloter un projet data. Par exemple :
- Analyser les besoins pour un projet data.
- Faire une veille technique et réglementaire.
- Communiquer tout au long du projet.
Phase 8 - Préparation et passage du titre professionnel
- Réaliser un projet pour démontrer la maîtrise des compétences.
- Présenter le projet devant un jury de professionnels.
La VAE, Validation des Acquis de l'Expérience
Ce titre RNCP à finalité professionnelle est accessible par la VAE,
si vous avez déjà une expérience solide en intelligence artificielle.
Rendez-vous sur cette page pour toutes les informations relatives à la VAE.
Admission
Pré-requis et conditions d’accès
Votre diplôme actuel :
Vous devez avoir un diplôme de niveau Bac+3 en informatique
(comme le développement, les données, la gestion de bases de données ou d'infrastructure).
Si vous n'avez pas ce diplôme, votre dossier peut être examiné pour une admission exceptionnelle.
Votre état d’esprit :
Vous devez être très motivé,
ce qui sera évalué lors de la candidature.
Vous devez être curieux et créatif,
avec une bonne capacité d'expression à l'oral et à l'écrit.
Vous devez être prêt à travailler en équipe et à collaborer sur des projets.
Vous devez avoir la volonté de vous engager sérieusement dans une formation intense.
Votre niveau de maîtrise technique :
La formation est prioritairement destinée à des personnes ayant :
- Des compétences en gestion de projet :
Savoir identifier les besoins,
Savoir rédiger des documents techniques,
Savoir suivre un planning,
Savoircoordonner entre le client et les équipes.
- Des compétences techniques , par exemple :
Installer et gérer des services,
Programmer des scripts d'automatisation sous Linux,
Concevoir de bases de données, maîtriser SQL,
Manipuler des données.
Avoir des connaissance en programmation (PHP, Python, Java)
- Une bonne maîtrise de l'anglais technique.
-
Vous pourrez démontrer vos compétences pendant le processus de candidature, notamment :
par une phase d'auto-apprentissage et la réalisation d'un mini-projet.
Handicap :
Simplon travaille pour rendre ses formations plus accessibles.
Avec l'aide du référent handicap chez Simplon et de partenaires spécialisés,
nous étudierons les besoins des personnes en situation de handicap.
Nous verrons comment nous pouvons mettre en place les solutions nécessaires
pour compenser ces besoins.
Prix
La formation et la certification sont gratuites pour les apprenants
grâce aux partenaires financeurs et aux fonds de financement de la formation.
Cela se fait généralement par alternance (c'est-à-dire en combinant formation et travail).
Pour les financeurs de la formation professionnelle des demandeurs d'emploi :
Le financement est entre 15 et 25 € par heure, selon la qualification et l'accompagnement requis.
Nous pouvons aussi organiser des sessions de formation pour des groupes de salariés dans les entreprises.
Pour cela, veuillez nous contacter directement.