Le back office à l’heure de l’Intelligence Artificielle... L’histoire continue !
PAR JEAN-JACQUES BÉRARD, VICE-PRÉSIDENT RECHERCHE & DÉVELOPPEMENT D'ESKER
3 ans déjà que le meilleur joueur de Go au monde est une IA carburant au Deep Learning... La presse nous annonçait alors une révolution imminente! L’IA allait très vite prendre le contrôle de notre futur pour le meilleur ou pour le pire... Que s’est-il réellement passé ? D’autres avancées majeures ont elles eu lieu ?
Il faut se rendre à l’évidence, les voitures sont toujours pilotées par des humains, les fake news foisonnent sans réel contrôle et les neurones artificiels n’éradiquent pas encore les pandémies...
Serait-ce alors les prémices d’un second hiver de l’IA, un nouveau “gouffre de la désillusion” ? La réalité est toute autre, le potentiel de ces avancées technologiques est loin d’être épuisé. A l’écart des annonces tonitruantes, ces trois années furent les témoins silencieux de progrès majeurs en entreprise…
COMMENT EXPLIQUER L’APPARITION SOUDAINE DE TELLES PROUESSES ?
La réponse tient en deux mots : "Apprentissage Profond" ou "Deep Learning". Une découverte, popularisée par le français Yann LeCun, qui met en oeuvre des réseaux de neurones virtuels multi-couches. Très schématiquement, cette approche donne d’excellents résultats pour des problèmes qui n’ont pas de solution algorithmique parfaite mais pour lesquels on dispose d’une multitude de cas résolus. Les concepts et algorithmes sont anciens mais l’émergence de cartes graphiques surpuissantes combinées à d’immenses volumes de données, ont permis dès 2012 de battre les meilleurs algorithmes conventionnels dans la reconnaissance d’images.
UN VIEUX RÊVE
Depuis plus d’une décennie, un défi algorithmique tient nos ingénieurs en échec : “la compréhension immédiate d’une commande”. Pouvoir extraire articles, quantités, montants sans aucune intervention humaine. La difficulté vient de l’immense diversité des modèles de commandes. Il y en a quasiment autant que de clients. Nos systèmes auto apprenants sont en mesure de “comprendre” une commande en observant les saisies des utilisateurs mais cela prend du temps, souvent plusieurs semaines. Une IA opérationnelle dès le premier jour ne serait qu’une douce utopie ?
UN JOLI SUJET DE THÈSE
Pour résoudre l’équation d’un tel problème via le Deep Learning, 4 ingrédients sont indispensables :
- Une forte capacité de calcul, très facile à acquérir en s’appuyant sur des cartes graphiques spécialisées,
- Des logiciels de machine learning, les GAFA en fournissent de grande qualité en open source,
- De forts volumes de données correctement étiquetées, nos 10 ans de production constituent un réservoir gigantesque,
- Un cerveau humain bien “entrainé” pour mettre tout cela en musique...
Sur ce dernier point, nous avons démarré notre première thèse avec l’université de Lyon dès 2017 afin de bénéficier de tout le savoir académique accumulé depuis plus de 20 ans en Deep Learning. Un partenariat Entreprise/Université idéal !
LA PISTE DU LANGAGE NATUREL
L’observation de commandes montre qu’il s’agit de groupes de textes très synthétiques répartis sur toute la surface des pages. Souvent la partie haute contient le nom du client et l’adresse de livraison. Les détails des articles, identifiant, quantité, description se trouvent en général insérés dans un tableau à entête au milieu du document. Les totaux et autres taxes se situent plutôt dans le dernier tiers de la page. Il s’agit en quelque sorte d’un “langage du business” entre clients et fournisseurs relativement souple, concis et international...
Très vite les recherches s'orientent vers les réseaux utilisés pour le traitement naturel du langage (NLP). Ceux-ci ont été fortement médiatisés au travers des assistants vocaux ou autres traducteurs proposés par les GAFA.
Après avoir méticuleusement sélectionné des commandes bien labellisées, identifié le vocabulaire et construit un réseau récurrent classifieur de mots (BILSTM), nous avons pu démarrer l’entraînement de notre modèle. Une approche de type essai-erreur s’étalant sur plusieurs mois fut nécessaire afin d’affiner paramètres et données. Le résultat fut à la hauteur de nos efforts puisque nous avons atteint des taux de reconnaissance de plus de 80% sur des documents jamais vus par l’IA. Ce “langage du business” et donc bien un langage compréhensible d’une IA.
Cerise sur le gâteau, cette avancée en matière de reconnaissance nous a permis d’être retenu en 2019 à la plus grande conférence internationale de recherche sur le document : l’ICDAR !
VERS LA COMMANDE ET AU-DELÀ !
Ce “langage du business” ne s'arrête pas aux seules commandes. La même recette à 4 ingrédients, appliquée aux factures et notes de frais, donne des résultats également spectaculaires. Bien sûr, l’abondance de données bien étiquetées est ici la clé !
Enfin, pour que nos utilisateurs puissent appréhender ces technologies en toute confiance, nous avons rajouté un module de détection d’anomalies non supervisé. Les informations proposées par l’IA sont évaluées statistiquement et si elles sont en dehors de valeurs habituelles, des indicateurs visuels permettent de traiter manuellement les erreurs éventuelles.
RENDEZ-VOUS DANS 3 ANS...
La marche est encore longue pour obtenir un assistant 100% virtuel capable de libérer les services administratifs des tâches répétitives. En s’attaquant aux problèmes, un à un, à l’aide des technologies les plus modernes, des logiciels s’en rapprochent chaque jour un peu plus.
Une révolution invisible est en marche. Elle déplace les métiers du back office vers des opérations nécessitant réflexion, connaissance métier et capacité à communiquer.
Le paradoxe de Moravec indique que « le plus difficile en robotique est souvent ce qui est le plus facile pour l'homme ». Ce paradoxe s’applique bien aux métiers du back office. Difficile ne signifie pas impossible et nous sommes en train de le prouver.