Nettoyer, structurer et préparer les données pour le Machine Learning

Objectifs

Comprendre l’importance de la qualité des données dans les projets de machine learning
Maîtriser les principales techniques de nettoyage, structuration et transformation des données
Préparer efficacement des jeux de données avant l’entraînement d’un modèle

Participants

Débutants en data science, analystes, développeurs, chefs de projet data, étudiants ou professionnels en reconversion

Pré-requis

Connaissances de base en machine learning ou familiarité avec les tableaux de données (Excel, CSV, pandas…)

Programme

Comprendre l’impact de la qualité des données sur les performances des modèles
Identifier et traiter les données manquantes, doublons et incohérences
Uniformiser les formats, types et unités des données
Encoder les variables catégorielles pour les rendre exploitables par les algorithmes
Normaliser et standardiser les données numériques
Créer de nouvelles variables pertinentes grâce au feature engineering
Réduire la dimension des données pour simplifier l’analyse et le traitement
Préparer les données spécifiques : temporelles, textuelles ou géographiques
Visualiser et analyser la qualité des données avant modélisation
Construire des pipelines de preprocessing reproductibles avec les outils adaptés

Exercices pratiques

Nettoyer un jeu de données contenant erreurs, doublons et valeurs manquantes
Encoder et transformer des variables pour un modèle de classification
Construire un pipeline automatisé de préparation des données

Aptibox

Checklist des étapes essentielles de préparation des données pour le machine learning
Tableau des principales techniques de nettoyage et de transformation des données
Mini-glossaire des méthodes de preprocessing et des outils incontournables

Référence

IAF150

Participants

Individuel
Collectif

Durée

2 heures

Prix

580,00 € HT

Format

Distanciel
Présentiel

Dates

Sur mesure

Options

Aptibox
Coaching
Entrainement intensif
Suivi

Ajouter au panier

Télécharger ce programme

Réserver une séance

Financements

Nous vous aidons dans vos démarches pour financer vos formations. Retrouvez toutes les informations sur les solutions de financement.

Nos forfaits

Nous vous proposons des forfaits/packs d’achat de modules à prix dégressifs, selon la quantité demandée.

Ces modules de 2h sont valables pour nos 5000 aptitudes ( = ateliers de formation 100% sur mesure allant à l’essentiel, tous thèmes confondus, sur tous nos catalogues management, RH, communication, développement personnel, commercial…) et valables également sur toutes nos prestations (séances de coaching, bilan de compétences , feedback 360°, codéveloppement…).

Nettoyer, structurer et préparer les données pour le Machine Learning

Objectifs

Participants

Pré-requis

Programme

Exercices pratiques

Aptibox

Espace client

Prendre RDV

Réservez directement votre séance !

Nous contacter