IA, Machine learning, apprendre et tester, pour les enfants…

Un CV transparent et interactif

Un site (promotionnel?) qui s’appuie sur Watson d’IBM

Dale Lane est développeur sur la plateforme Cloud Watson d’IBM.

Watson est une des solutions commercialisées par IBM qui permet d’intégrer et d’indexer des données non structurées et par la suite d’effectuer des recherches en langage naturel (ou pas) sur les données non structurées

Une petite vidéo de présentation de Watson sur le Youtube  d’IBM :

Dale Lane est aussi pédagogue et partage, on suppose avec la bénédiction ou le sponsoring de sa maison mère, ses connaissances à travers une plateforme ouverte de test de Watson (via son API) : https://machinelearningforkids.co.uk

Pour les néophytes, introductions au machine learning

Sur on blog Dale Lane présente simplement le machine learning comme étant un apprentissage a réalisé une tache et l’oppose à la programmation qui est une liste d’ordre pour réaliser une tache…

Mais ce n’est pas si simple, car,après tout, donner une recette (une liste de taches à réaliser) à un ordinateur, n’est-ce pas aussi lui apprendre à faire quelque chose ?

Mais que met-on sous le terme d’apprentissage ? Ou plutôt de « Machine Learning »?

Lorsque je donne à une machine une recette (une liste de taches à réaliser) celle-ci est appliquée aux pieds de la lettre et n’a aucune possibilité de prendre en compte ce qui peut varier autrement qu’en écrivant tous les cas possibles

Ainsi, si je veux apprendre un ordinateur à reconnaître le visage de Pascal Vila classiquement  je lui programmerait des instructions du type :

  • vérifie qu’il a les cheveux châtains
  • vérifie qu’il porte des lunettes rondes
  • vérifie qu’il a une barbe châtain

Mais si je me rase, ou retire mes lunettes ou les changes pour des carrées, ou ai beaucoup plus de cheveux blancs, cette recette de vérification ne fonctionne plus.

L’apprentissage de l’ordinateur ou le machine learning tant à résoudre ce problème soit grâce à des statistiques de variantes connues, soit grâce à un réseau de neurones (Cela me rappelle ma maîtrise universitaire,  il y a 18 ans…)

Comment fait on pour apprendre cela à un ordinateur?

L’IA aujourd’hui s’appuie sur deux possibilités :

  • A partir d’un jeu de données (features) on calcule un modèle statistique. Par la suite à chaque nouvel exemple de visage de Pascal , on calcule la probabilité  (grâce au modèle) que celui-ci soit bien le visage de Pascal. C’est le calcul de ce modèle statistique que l’on appelle alors apprentissage (learning)
  • On soumet à un réseau de neurone artificiel ( plus d’info sur wikipedia)  un jeu de données. Grâce à un algorithme d’apprentissage, on vérifie que les réponses de celui-ci sont exactes. Par exemple, s’il ne reconnaît pas le visage de Pascal, l’algorithme d’apprentissage va diminuer le seuil de certains neurones artificiels.

Dans ces méthodes holistiques d’apprentissage le jeu de données d’apprentissage et le choix du modèle utilisé sont essentiels à l’apprentissage de la machine.

Testons Les exemples

J’ai testé le chat bot et sa chouette : worksheet-chatbots (en python : worksheet-chatbots-python) Et pour le prof (teachersnotes-chatbots)

C’est simpliste mais cela montre bien l’importance du choix des exemples d’apprentissage (featuring). Car n’oublions pas qu’un réseau ne fait que ce qu’on lui a appris. Si le jeu de données d’exemple est parcellaire ou mal fait, le réseau produira des réponses fausses ou incohérentes.

C’est d’ailleurs ce que propose d’étudier cet autre exemple : worksheet-confused (prof : teachersnotes-confused )

Une nouvelle profession naîtra certainement bientôt : celle des « featurer » dont le rôle sera d’identifier les jeux d’exemples d’apprentissage.

Pour aller plus loin

Cet article et le site de Dale Lane est simpliste mais il a le mérite de désacraliser ce qui aujourd’hui est réservé au « Data Scientist » ou autres chercheurs…

Pour aller plus loin et avoir un panorama plus large (et moins centré sur IBM) a lecture de cet ouvrage et de ces exemples en langage R (un héritier du langage S (1980) qui avec le python est l’autre langage de programmation de l’IA actuel) dirigé par François Husson : R pour la statistique et la science des données et plus particulièrement son chapitre 10 sur le machine learning :

  • 10.1 Calibration d’un algorithme avec caret
  • 10.2 Forêts aléatoires
  • 10.3 Régression sous contraintes
  • 10.4 Gradient boosting
  • 10.5 SVM
  • 10.6 Réseaux de neurones et deep learning
  • Comparaison de méthodes

En plus tous les codes et jeu de données sont disponibles et le tout pour un  prix modique (25€) aux éditions pur

 

2 réponses

  1. […] Ainsi nous pouvons reconnaître des images et déterminer à quelle classe d’objet ils appartiennent : c’est une pomme, une poire ; elle est mure ou abîmée… Ou encore c’est une photo de vous jeune, vieux, avec une barbe… (cf. un autre article : « Mais que met-on sous le terme d’apprentissage ? Ou plutôt de « Machine Learning »?« ) […]

  2. […] IA, Machine learning, apprendre et tester, pour les enfants… […]

Les commentaires sont fermés.

%d blogueurs aiment cette page :