Moissonnage du web

Technique d’extraction automatique de données à partir d’un ou de plusieurs sites web dans le but d’utiliser celles-ci, après traitement, dans un autre contexte.

Par exemple, le moissonnage du web (ou web scrapping en anglais) peut être pratiqué à des fins de journalisme (journalisme de données), de conservation et d’archivage, mais aussi à des fins que certains peuvent assimiler à du pillage.

Contrairement à l’exploration du Web, le moissonnage du Web nécessite une bonne étude des sites et de leur structure avant d’entreprendre l’extraction des données, afin d’obtenir de l’information de qualité.

Source : Grand dictionnaire terminologique

Étape

  • Préparation

Types de données

  • Texte
  • Structuré
  • Image
  • Multimédia
  • Géospatial

Références