IA, Machine learning, apprendre et tester, pour les enfants...

Pascal Vila Programmation 12 janvier 2019 | 2

Un site (promotionnel?) qui s’appuie sur Watson d’IBM

Dale Lane est développeur sur la plateforme Cloud Watson d’IBM.

Watson est une des solutions commercialisées par IBM qui permet d’intégrer et d’indexer des données non structurées et par la suite d’effectuer des recherches en langage naturel (ou pas) sur les données non structurées

Une petite vidéo de présentation de Watson sur le Youtube d’IBM :

Dale Lane est aussi pédagogue et partage, on suppose avec la bénédiction ou le sponsoring de sa maison mère, ses connaissances à travers une plateforme ouverte de test de Watson (via son API) : https://machinelearningforkids.co.uk

Pour les néophytes, introductions au machine learning

Sur on blog Dale Lane présente simplement le machine learning comme étant un apprentissage a réalisé une tache et l’oppose à la programmation qui est une liste d’ordre pour réaliser une tache…

Mais ce n’est pas si simple, car,après tout, donner une recette (une liste de taches à réaliser) à un ordinateur, n’est-ce pas aussi lui apprendre à faire quelque chose ?

Mais que met-on sous le terme d’apprentissage ? Ou plutôt de « Machine Learning »?

Lorsque je donne à une machine une recette (une liste de taches à réaliser) celle-ci est appliquée aux pieds de la lettre et n’a aucune possibilité de prendre en compte ce qui peut varier autrement qu’en écrivant tous les cas possibles

Ainsi, si je veux apprendre un ordinateur à reconnaître le visage de Pascal Vila classiquement je lui programmerait des instructions du type :

vérifie qu’il a les cheveux châtains
vérifie qu’il porte des lunettes rondes
vérifie qu’il a une barbe châtain

Mais si je me rase, ou retire mes lunettes ou les changes pour des carrées, ou ai beaucoup plus de cheveux blancs, cette recette de vérification ne fonctionne plus.

L’apprentissage de l’ordinateur ou le machine learning tant à résoudre ce problème soit grâce à des statistiques de variantes connues, soit grâce à un réseau de neurones (Cela me rappelle ma maîtrise universitaire, il y a 18 ans…)

Comment fait on pour apprendre cela à un ordinateur?

L’IA aujourd’hui s’appuie sur deux possibilités :

A partir d’un jeu de données (features) on calcule un modèle statistique. Par la suite à chaque nouvel exemple de visage de Pascal , on calcule la probabilité (grâce au modèle) que celui-ci soit bien le visage de Pascal. C’est le calcul de ce modèle statistique que l’on appelle alors apprentissage (learning)
On soumet à un réseau de neurone artificiel ( plus d’info sur wikipedia) un jeu de données. Grâce à un algorithme d’apprentissage, on vérifie que les réponses de celui-ci sont exactes. Par exemple, s’il ne reconnaît pas le visage de Pascal, l’algorithme d’apprentissage va diminuer le seuil de certains neurones artificiels.

Dans ces méthodes holistiques d’apprentissage le jeu de données d’apprentissage et le choix du modèle utilisé sont essentiels à l’apprentissage de la machine.

Testons Les exemples

J’ai testé le chat bot et sa chouette : worksheet-chatbots (en python : worksheet-chatbots-python) Et pour le prof (teachersnotes-chatbots)

C’est simpliste mais cela montre bien l’importance du choix des exemples d’apprentissage (featuring). Car n’oublions pas qu’un réseau ne fait que ce qu’on lui a appris. Si le jeu de données d’exemple est parcellaire ou mal fait, le réseau produira des réponses fausses ou incohérentes.

C’est d’ailleurs ce que propose d’étudier cet autre exemple : worksheet-confused (prof : teachersnotes-confused )

Une nouvelle profession naîtra certainement bientôt : celle des « featurer » dont le rôle sera d’identifier les jeux d’exemples d’apprentissage.

Pour aller plus loin

Cet article et le site de Dale Lane est simpliste mais il a le mérite de désacraliser ce qui aujourd’hui est réservé au « Data Scientist » ou autres chercheurs…

Pour aller plus loin et avoir un panorama plus large (et moins centré sur IBM) a lecture de cet ouvrage et de ces exemples en langage R (un héritier du langage S (1980) qui avec le python est l’autre langage de programmation de l’IA actuel) dirigé par François Husson : R pour la statistique et la science des données et plus particulièrement son chapitre 10 sur le machine learning :

10.1 Calibration d’un algorithme avec caret
10.2 Forêts aléatoires
10.3 Régression sous contraintes
10.4 Gradient boosting
10.5 SVM
10.6 Réseaux de neurones et deep learning
Comparaison de méthodes

En plus tous les codes et jeu de données sont disponibles et le tout pour un prix modique (25€) aux éditions pur

2 réponses

IA : De quoi parlons nous ? - Pascal Vila dit :
18 février 2019 à 9 h 16 min
[…] Ainsi nous pouvons reconnaître des images et déterminer à quelle classe d’objet ils appartiennent : c’est une pomme, une poire ; elle est mure ou abîmée… Ou encore c’est une photo de vous jeune, vieux, avec une barbe… (cf. un autre article : « Mais que met-on sous le terme d’apprentissage ? Ou plutôt de « Machine Learning »?« ) […]
IA comment trouver le bon réseau neuronal ? - Pascal Vila dit :
20 février 2019 à 9 h 11 min
[…] IA, Machine learning, apprendre et tester, pour les enfants… […]

Les commentaires sont fermés.

IA, Machine learning, apprendre et tester, pour les enfants…

Un site (promotionnel?) qui s’appuie sur Watson d’IBM

Pour les néophytes, introductions au machine learning

Mais que met-on sous le terme d’apprentissage ? Ou plutôt de « Machine Learning »?

Comment fait on pour apprendre cela à un ordinateur?

Testons Les exemples

Pour aller plus loin

Partager :

J’aime ça :

Articles similaires

2 réponses

Articles récents

Recommandations

Les projets emblématiques

Suivez-moi

Mes publications sur Twitter

Pascal Ravoninjatovo Vila