Nettoyage des données

Le nettoyage des données est un processus qui vise à identifier et corriger les données altérées, inexactes ou non pertinentes. Cette étape du traitement des données améliore la cohérence, fiabilité et valeur des données.

Les causes les plus courantes d’inexactitude dans les données sont les valeurs manquantes, les entrées qui n’apparaissent pas dans l’emplacement adéquat et les fautes de frappe. Dans certains cas, le nettoyage des données exige que certaines valeurs soient renseignées ou corrigées ; dans d’autres cas, les valeurs devront être tout simplement supprimées. Source : Talend

Étape

  • Préparation

Type de données

  • Structuré