DEMO

Pour la démonstration, nous nous focalisons sur les deux tâches de base de l’apprentissage automatique que constituent la classification automatique binaire (apprentissage supervisé) et le partitionnement (apprentissage non supervisé).

Vous pouvez tester avec vos propres données dès lors qu’elles respectent le format de l’exemple et qu’elles ne dépassent pas 100 000 caractères par fenêtre de données.

Classification Automatique Binaire (apprentissage supervisé)

Le principe de la classification automatique binaire est assez simple… Le principe de la classification automatique binaire est assez simple. Il s’agit, comme le nom de la tâche l’indique, de dire si des objets dont on possède une description appartiennent ou pas à une classe. Cela permettra de répondre par exemples à des questions du type : Cette dépêche est-elle dans le domaine du sport ? Cette transaction est-elle frauduleuse ? Ce commentaire est-il élogieux ? Cette forme perçue par le robot au moyen de ses capteurs est-elle une porte ?…
Pour que la méthode d’apprentissage automatique arrive à réaliser cette tâche correctement, il faut préalablement lui fournir des descriptions d’objets qui appartiennent à la classe et des descriptions d’objets qui n’appartiennent pas à la classe. Un humain va donc jouer le professeur pour apprendre à la machine à classer automatiquement les objets. On parle dans ce cas d’apprentissage supervisé, l’humain supervisant la machine.

Données d’apprentissage

Ici, il faut placer les données qui…Ici, il faut placer les données qui seront utilisées pour apprendre à distinguer ce qui appartient à la classe (étiqueté OUI) de ce qui n’appartient pas à la classe (étiqueté NON). Certaines données ont été pré-saisies à titre d’exemple (« sport », « politique », …) mais vous pouvez aussi entrer vos propres données en cliquant sur le bouton « ma classe ».






Données de test

Ici, il faut placer les données que…

Ici, il faut placer les données que l’on cherche à classer (OUI ou NON ?) sur la base des données d’apprentissage fournies ci-dessus. Cliquez sur « lancer le tri… » pour faire afficher les données par ordre décroissant de probabilités d’appartenance à la classe. Un seuil de décision d’appartenance est également calculé lorsqu’au moins 30 exemples positifs et 70 exemples négatifs composent les données d’apprentissage.



Les données sont classées par ordre de score…Les objets sont classées par ordre de score d’appartenance à la classe. Si un nombre suffisant d’objets ont été donnés en apprentissage (au moins 30 ‘OUI’ et 70 ‘NON’), une probabilité d’appartenance est calculée pour chaque objet.

Partitionnement (apprentissage non supervisé)

Cette tâche est réputée plus… Cette tâche est réputée plus difficile que la tâche de classification automatique. Il s’agit toujours de classer des objets dont on possède une description mais cette fois-ci, on ne fournit pas d’exemples. La machine crée ses propres classes et range les différents objets dans chacune des classes créées. Cela permettra par exemple de répondre à des questions du type : Quels sont les domaines couverts par ces différents documents ? Comment puis-je segmenter ma clientèle ou mon marché ? Quels types de commentaires sont laissés par les internautes sur mon site ? Combien de formes prototypiques le robot perçoit-il au moyen de ses capteurs (porte, couloir, humain,…) ?

Données à partitionner

Ici, il faut placer les données qu…Ici, il faut placer les données que l’on cherche à partitionner. Les données pré-saisies à titre d’exemple (« Le Monde », « Iris », …) correspondent aux jeux de données utilisés dans la démonstration pour la classification automatique (sans l’information sur les classes bien sûr). L’algorithme arrivera-t-il à reconstruire des groupes correspondant aux classes ? Vous pouvez aussi entrer vos propres données en cliquant sur le bouton « mes données ».




Plusieurs partitions variant sur le nombre de groupes sont…Plusieurs partitions variant sur le nombre de groupes sont proposées (pour la démonstration on se limite à 10 maximum). Le meilleur découpage est sélectionné par défaut, mais vous pouvez en choisir un autre en cliquant sur le bouton correspondant au nombre de groupes que vous cherchez. Vous pouvez aussi faire afficher les descripteurs représentatifs de la partition sélectionnée.