Ce répertoire contient des scripts et des fichiers associés utilisés dans le cadre de nos expériences. Voici un aperçu de ce qu'il contient :
- Un notebook principal
recherche_meilleur_classifieur.ipynb
qui permet de voir l'ensemble des expériences que l'on a effectué et de sortir les figures présents dans l'article. - Un dossier
vector
contenant des fichiers .txt et .bin contenant des vecteurs de mots utilisés dans le cadre de ces expériences. Seul le fichier .bin des vecteurs FastText n'est pas disponible (il était trop lourd à télécharger, il se trouve ici https://fasttext.cc/). - Un notebook
features_to_add.ipynb
qui contient des fonctions pour extraires d'autres features. - Un article
Classification de discours politiques
résumant notre travail. - Un dossier
corpus
contenant nos données. - Un dossier
preTraitements
contenant les scripts necessaires aux chargements de nos données. - Un dossier
test_script
contenant quelques premières expériences.
Tous ces éléments sont nécessaires pour reproduire et comprendre les résultats de nos expériences. N'hésitez pas à nous contacter si vous avez des questions ou si vous rencontrez des problèmes lors de l'utilisation de ces scripts.
Le notebook le plus important est recherche_meilleur_classifieur.ipynb
car il retrace l'ensemble de notre travail (nos recherches etc.)