
Data science et transformation digitale
05/02/2024
5 mois
Online
4 500 €
Les nouveaux enjeux de la donnée : data science, cybersécurité et transformation digitale
Dans la peau d’un consultant en agence de conseil en Data Science, vous réalisez plusieurs missions pour accompagner et conseiller vos clients sur la collecte et l’analyse de données dans des contextes de transformation digitale.
La formation certifiante "Data science et transformation digitale", en partenariat avec l'IAE Paris-Sorbonne, s'adresse aux consultants, auditeurs, analystes, chargés d’étude, chefs de projets ainsi que toutes personnes souhaitant maitriser les enjeux de la collecte de l’analyse de données.
Objectifs de la formation
Ce programme vous préparera à :
• Comprendre le rôle stratégique pour l'entreprise de la valeur des données et de l’information
• Maîtriser les enjeux stratégiques, techniques, règlementaires et métiers de la donnée et de l’information
• Développer des techniques de collecte et d’analyses de données et d’informations
• Comprendre l'écosystème technologique nécessaire pour réaliser un projet d’analyses de données
• Appréhender des outils pour collecter et restituer des analyses
Points forts de la formation
• Une approche innovante articulée autour d’une immersion dans la peau d’un consultant
• Des cas pratiques et des contenus variés : vidéos, activités, podcasts, articles...
• Une pédagogie online flexible qui s’adapte à votre rythme : Formez-vous 100% en ligne, à votre rythme, où vous voulez : 12 à 15h d’apprentissage pour chaque module
• Des sessions lives pour échanger et partager avec nos experts et les participants
• La mise à disposition d’outils et logiciels pour réaliser les différents modules d'enseignement
• Un accompagnement de proximité par nos équipes pédagogiques et d’experts
• La délivrance d’un double certificat IAE Paris-Sorbonne et de l'Ecole de Guerre Economique

Programme des cours - 2024/2025
La formation certifiante "Data science et transformation digitale" se compose de 5 modules et se déroule sur 70 heures.
Modalités d’évaluation :
- Exercice individuel d’identification de sources sur un sujet imposé
- Rédaction d’un rapport de synthèse
- Evaluation sur un exercice d’interview et le rendu d’une note de synthèse
- Exercice d’étude de marché
- Exercice de collecte d’infos sur un salon professionnel
Dans ce module introductif, les participants se familiarisent avec les concepts de collecte d’informations. La collecte d’information est aujourd’hui un savoir-faire indispensable à la gestion de projet, pour comprendre un environnement ou un marché, comme pour mieux percevoir un acteur économique ou même le profil d’un individu.
Objectif du module :
- Méthodologie de recherche d’information sur Internet
- Les moteurs de recherche
- Investigations techniques
- Les bases de données
Activités : Les participants réalisent une collecte d’information avec un rendu de chaque étape du projet, mindmapping du questionnement, plan de recherche, dossier de favoris et fiche méthodologique.
Objectif du module :
- Comprendre les nouveaux enjeux des données pour la transformation digitale
- Connaître comment les données sont gérées, traitées et agrégées dans un système d’information
- Appréhender les fondations des technologies web (structure des données)
Semaine 1 : Les fondamentaux
• Créer, capturer et délivrer de la valeur grâce aux données
• La donnée au cœur de la transformation digitale
Semaine 2 : Evolution des données et des usages
• Les technologies et le futur des usages
• Nouveaux usages des données et enjeux réglementaires
Semaine 3 : Décrire, structurer, échanger et afficher les données (langages XML/HTML et intro à la programmation)
• Les outils nécessaires à la programmation
• Technologies web : XML/HTML et CSS – des prérequis au scraping
Semaine 4 : L’habillage de la donnée sur le web (CSS) : Code, technologies web et projet
• Technologies web (continued) : focus sur CSS
• Mini projet de conception web
Activité : Les participants développent un petit projet web afin de mieux appréhender la logique de développement, pour le code R ou le scraping via Python
Objectif du module :
- Maîtriser un logiciel de scraping pour réaliser une collecte de données massive web
- Savoir trier, filtrer, agréger et analyser des données issues du scraping
- Comprendre les problématiques éthiques et les risques liées à la collecte de données massive et la construction de big data
Semaine 1 : Les enjeux éthiques et de sécurité liés à la collecte massive de données
• Gouvernance et maîtrise des risques liés aux données – une mise en perspective des ‘big data breaches’
• Bonnes pratiques de cybersécurité
Semaine 2 : Collecte et analyse de données massive – en théorie
• Data mining et big data
• Le web scraping : cas d’usage et approches (R & Python)
Semaine 3 : Collecte et analyse de données massive – en pratique
• Web scraping – requêtes et XML/HTML, un exemple avec l’extraction visuelle
• Vérifier et comprendre les données extraites
Semaine 4 : Projet de scraping
• Filtrage et tri pour exploiter les données issues d’une collecte massive
• Mini projet d’extraction web
Activités : Les participants livrent un petit projet de scraping web, ce qui peut constituer un premier jeu de données à analyser au cours des modules suivants.
Ce module est centré sur les fondations de la data science (analyse et fouille de données massive pour créer de la valeur). Plus précisément, il aborde les techniques les plus basiques d’analyse et de visualisation de données.
Objectif du module :
- Maîtriser un logiciel de statistiques
- Savoir réaliser des analyses descriptives
- Maîtriser la notion d’inférence statistique
- Savoir réaliser des modèles de régression
Semaine 1 : Les fondamentaux
• Différents niveaux d'utilisation des données
• Différents types de variables
• Les logiciels utilisés
• Statistiques univariées
Semaine 2 : Statistiques bivariées et construction d'indicateurs
• Les différents types d'indicateurs
• Différentes combinaisons de variables
• L'importance des représentations graphiques
Semaine 3 : les tests statistiques
• Définition d’un test statistique
• Le test du chi2
• Le test Anova
• Le test de corrélation
Semaine 4 : Les techniques de régression
• Le raisonnement « toutes choses égales par ailleurs »
• La régression linéaire multiple
• La régression logistique multiple
Activités : Les participants livrent une première analyse du jeu de données produit dans le module précédent. Ils sont évalués par un QCM.
Ce module porte sur les techniques de fouille de données structurées et non structurées. Nous abordons la distinction entre analyse supervisée et non supervisée. Nous utilisons également le logiciel R avec l’interface RStudio.
Objectif du module :
- Maîtriser des techniques de fouille de données structurées (analyses factorielles et typologiques)
- Maîtriser des techniques de fouille de données non structurées (analyse textuelle)
Semaine 1 : L’analyse exploratoire non supervisée
• L’analyse factorielle
• L’analyse en composantes principales
Semaine 2 : L’analyse typologique
• Les grands principes
• Les différentes méthodes d’analyse typologique
Semaine 3 : Le text mining
• L’analyse lexicométrique
• L’analyse sémantique
Semaine 4 : Quelle méthode choisir pour quel objectif ?
• Rappel de toutes les méthodes vues dans les modules 4 et 5
• Mise en correspondance entre les méthodes et les objectifs poursuivis
Activités : Les participants livrent une analyse approfondie de deux jeux de données, l’un constitué de données structurées, l’autre de données non structurées. L’analyse produite pour le module 3 fait également partie de ce livrable et est évaluée dans ce cadre. Un système de correction croisée est organisé (chaque étudiant corrige 3 copies) à partir d’une grille de critères prédéfinie.
Admissions et financement
L’École vous offre la possibilité de candidater en ligne tout au long de l’année jusqu’à 3 semaines avant la date de rentrée.
Prérequis :
Aucun prérequis n’est nécessaire pour suivre cette formation, elle est accessible à toutes et tous.
La demande d’accès au financement en mobilisant votre compte CPF doit être effectuer au moins 15 jours ouvrés avant le début de la formation.
Les frais de formation sont de 4 500 €.
Mon Compte Formation (CPF)
Le Compte personnel de formation (CPF) permet à toute personne active, dès son entrée sur le marché du travail et jusqu’à la date à laquelle elle fait valoir l’ensemble de ses droits à la retraite, d’acquérir des droits à la formation mobilisables tout au long de sa vie professionnelle. L’ambition du Compte personnel de formation (CPF) est ainsi de contribuer, à l’initiative de la personne elle-même, au maintien de l’employabilité et à la sécurisation du parcours professionnel. Chaque personne dispose, sur le site officiel moncompteformation.gouv.fr d’un espace personnel sécurisé lui permettant de s’identifier sur son CPF.
Eligible au CPF, elle couvre l'ensemble du bloc de compétence RNCP34803BC02 "Réaliser une collecte d'informations et mettre en place une veille stratégique" du titre RNCP de niveau 7 "Expert en intelligence économique" délivré par l'Ecole de Guerre Economique.
Si un bloc n'est pas validé après rattrapage, l'étudiant doit redoubler et ne conserve pas le bénéfice des blocs potentiellement validés.
Les intervenants
Clotilde CORON
Professeure des Universités en Gestion des ressources humaines, IAE Paris-Sorbonne
Après un diplôme de l’ENSAE et un doctorat en sciences de gestion soutenu en 2015 et une expérience professionnelle en entreprise, Clotilde CORON est aujourd’hui Maîtresse de Conférences à l’IAE Paris-Sorbonne, où elle est co-responsable du Master RH & RSE en alternance. Elle y enseigne notamment les méthodes quantitatives. Ses recherches et publications portent sur l’égalité professionnelle et l’usage de la quantification en ressources humaines.
Jean-Loup RICHET
Maître de Conférences en Systèmes d’Information, IAE Paris-Sorbonne
Spécialiste en cybersécurité et en cybercriminalité, Jean-Loup RICHET est Maître de Conférences en Systèmes d’Information. Il a publié de nombreux articles dans des revues internationales et est l’auteur de plusieurs études pour l’Office des Nations Unies contre la Drogue et le Crime, Europol, l’Union Internationale des Télécommunications et la Commission Européenne. Il enseigne les systèmes d’information et la gestion de projet auprès de cadres en activité et d’étudiants en alternance.
François JEANNE-BEYLOT
Spécialiste de la recherche d'informations sur Internet, professeur associé à l'EGE
Spécialiste reconnu de la recherche d'informations et de l'influence sur internet (intelligence numérique) depuis près de 15 ans, il accompagne les entreprises dans leurs investigations, la mise en place de cellule de veille, la surveillance active, la détection de relais d'influence, etc. Passionné par l'information, son utilisation, sa diffusion, sa collecte, ... il tient un blog consacré à ces problématiques et intervient régulièrement dans les médias dédiés à l’Intelligence économique.