L'objectif de ce dépôt est d'étudier les articles suivants:
- Etude: Le document relatif à notre étude sont disponibles dans le dossier
pdf
: (Filtrage_collaboratof)[https://github.com/Qufst/Filtrage_collaboratif/tree/main/pdf] - Source LaTeX: Le fichier LaTeX original utilisé pour générer le rapport se trouve dans le dossier
tex
- Codes Python: Les scripts Python utilisés dans notre étude sont disponibles dans le dossier
python
. On a décidé de séparer l'étude de la base de donnée réelle Netflix de notre éxemple construit à la main pour l'explication puisque la cross-validation sur la base de données Netflix a un temps de calcul de plusieurs heures. De plus, la base de données Netflix étant trop grande pour github, pour la reproductibilité du code veuillez récupérer la base de données manuellement:dataset, et modifier les paths.
On retrouve les dépendances du projet dans le fichier 'requirements.txt'. les prérequis incluent:
numpy
pandas
matplotlib
scikit-learn
(pourNMF
,cosine_similarity
,pairwise_distances
,SimpleImputer
,KFold
,silhouette_score
,mean_squared_error
etTruncatedSVD
)fancyimpute
(pourSoftImpute
)seaborn
time
Pour générer le rapport, un compilateur LaTeX est nécessaire. Vous pouvez utiliser un outil comme Overleaf pour la compilation en ligne.
Auteurs: Lahjiouj Aicha, Dias Pierre, Festor Quentin