.txtlab

Plusieurs jeux de données textuelles en anglais accessibles en libre accès par le laboratoire d’analyse culturelle .txtlab de l’Université McGill. Cet ensemble de données comprend des données dérivées sur une collection d’environ 2 700 livres en anglais publiés entre 2001 et 2021 et couvrant 12 genres différents.

Accès

Données accessibles publiquement et détails des jeux sur https://txtlab.org/data-sets/

Utilisation des données et documents

Jeux de données libres de droits.

Types de données

  • Structuré
  • Texte