← Retour aux projets

Programme d'apprentissage automatique

Développement d’un programme en Java permettant de récupérer des données et de les utiliser pour classifier automatiquement des dépêches de presse selon leur catégorie (sport, politique, culture...).

Nous avons développé un programme analysant la structure de dépêches de presse, pour lesquelles la catégorie était précisée. Nous avons donc pu faire une liste, pour chaque catégorie, des mots qui apparaissaient le plus souvent. Nous avons ensuite pu utiliser notre programme sur des dépêches pour lesquelles aucune catégorie n'était précisée : nous lui demandions de classer ces dépêches dans la catégorie la plus probable, en fonction des mots-clés présents dans le texte.

Réalisations de l'équipe (2 personnes)

  • Développement : création automatique de lexiques à partir des dépêches, attribution de scores aux mots d'une catégorie selon leur nombre d'apparition dans les dépêches, méthodes d'apprentissage automatique
  • Rédaction d'un bilan en anglais : explication du programme, présentation des résultats, analyse de la complexité
Bilan (PDF)

Mes contributions

  • Développement : méthode de tri (tri à bulles), lecture et écriture dans les fichiers .txt, ajout des commmentaires
  • Rédaction du bilan

Outils utilisés

Java

Compétences

  • Mettre en place un découpage en éléments algorithmiques
  • Structurer des fichiers de code
  • Comparer des algorithmes