Ce dépôt contient l'implémentation officielle de mon projet de Master de Recherche (IKM) intitulé "A New Multi-View Method for Extractive Text Summarization", réalisé à l'ISG Tunis.
L'explosion de l'information numérique rend la synthèse automatique de documents essentielle. Ce projet propose MVESum, une nouvelle méthode de résumé extractif basée sur une approche Multi-Vues. L'idée centrale est de combiner différentes représentations textuelles pour capturer la richesse sémantique et structurelle des documents.
- Multi-View Learning : Utilisation de plusieurs perspectives (Vues) pour représenter le texte.
- Approche Extractive : Sélection des phrases les plus pertinentes directement depuis le texte source.
- Algorithmes utilisés : Clustering K-Means, TextRank, et représentations sémantiques avancées.
La méthode se décompose en plusieurs étapes majeures :
- Prétraitement : Nettoyage du texte, tokenisation et élimination des mots vides (stop-words).
- Représentation Multi-Vues : Génération de vecteurs (Embeddings) via différentes méthodes (TF-IDF, SBERT, etc.).
- Clustering & Ranking : Utilisation de K-Means pour regrouper les thèmes et de TextRank pour classer l'importance des phrases au sein de chaque vue.
- Fusion des Vues : Agrégation des résultats pour produire le résumé final optimal.
Clonez le dépôt :
git clone [https://github.com/votre-username/MVESum.git](https://github.com/votre-username/MVESum.git)
cd MVESum