Moissonnage du web
Technique d’extraction automatique de données à partir d’un ou de plusieurs sites web dans le but d’utiliser celles-ci, après traitement, dans un autre contexte.
Par exemple, le moissonnage du web (ou web scrapping en anglais) peut être pratiqué à des fins de journalisme (journalisme de données), de conservation et d’archivage, mais aussi à des fins que certains peuvent assimiler à du pillage.
Contrairement à l’exploration du Web, le moissonnage du Web nécessite une bonne étude des sites et de leur structure avant d’entreprendre l’extraction des données, afin d’obtenir de l’information de qualité.
Source : Grand dictionnaire terminologique
Étape
- Préparation
Types de données
- Texte
- Structuré
- Image
- Multimédia
- Géospatial
Références
- Patel, J. M. (2020). Getting structured data from the internet : running web crawlers/scrapers on a big data production scale. Apress. https://doi.org/10.1007/978-1-4842-6576-5