Vers l’apprentissage automatique embarqué (Épisode 2/3)

L’avènement des objets connectés dans notre quotidien soulève de nombreuses problématiques en termes de ressources énergétiques et de traitement des données. Le développement de ces technologies nécessite des changements d’approches impliquant les nanotechnologies.

Ce dossier « Vers l’apprentissage automatique embarqué » est proposé en collaboration avec l’Institut des Nanotechnologies de Lyon (INL). Au fil de 3 épisodes, nous vous invitons à explorer les enjeux de l’apprentissage automatique embarqué, les défis scientifiques et technologiques qu’ils soulèvent, et les perspectives offertes par les nanotechnologies dans ce domaine.

Épisode 2 : Les technologies émergentes pour l'IA matérielle écoénergétique

Dans le premier épisode nous avons décrit la nécessité de changer de paradigme dans les architectures de calcul pour adapter l'apprentissage automatique aux contraintes de l'embarqué. Dans ce deuxième épisode, nous vous invitons à explorer les perspectives offertes par les nanotechnologies pour répondre à ces défis scientifiques et technologiques.

Accélérer le calcul avec des ressources matérielles spécifiques

Aujourd'hui, l'exécution efficace des algorithmes d'intelligence artificielle (IA), que ce soit en périphérie ou dans le cloud, nécessite l'intégration d'accélérateurs matériels dédiés spécifiques au sein des architectures de calcul. Dans certains systèmes, ces accélérateurs permettent d’atteindre une efficacité énergétique de mille milliards d’opérations par seconde et par watt. C’est 10 à 100 fois supérieur aux méthodes conventionnelles.

Néanmoins les technologies actuelles ne seront pas suffisantes à long terme. Pour répondre aux besoins futurs, l’INL s’intéresse à trois types de technologies émergentes dans la construction d'accélérateurs dédiés aux calculs de l'IA :

  • la mémoire non volatile qui conserve les données même sans alimentation,
  • les nouveaux transistors verticaux et 3D pour traiter les données de manière plus efficace,
  • la photonique silicium pour marier le calcul, la communication et le stockage.

Les mémoires non-volatiles ferroélectriques

Logo 3eFERRO

Pour rapprocher les opérations de calcul au lieu de stockage des données, l’INL explore les technologies émergentes de mémoire non volatile. Ces mémoires conservent les données même sans alimentation, pour répondre aux exigences de l'efficacité énergétique, de performances et de densité ultra-élevées des opérations de calcul d'IA de pointe. Dans le cadre du projet de recherche européen 3eFerro, le laboratoire explore l'utilisation de dispositifs ferroélectriques intégrés dans des circuits logiques non volatils capables de stocker les données, puis d'exécuter à grande vitesse les opérations, uniquement si elles sont nécessaires. Cette technologie permet de faire d'énormes économies d'énergie sans perte de performances.

En savoir plus sur le projet européen 3eFERRO à l'INL.

Les transistors verticaux et 3D

FVLLMONTI

Un autre axe de recherche concerne les applications embarquées totalement autonomes (pour la traduction automatique par exemple). Plus exactement, dans le cadre du projet européen FVLLMONTI, l’INL étudie la construction d'un "cube de calcul de réseau neuronal" utilisant des technologies avancées de transistors verticaux à l'échelle nanométrique. Cette brique de calcul très polyvalente peut être assemblée en trois dimensions pour permettre la mise en œuvre naturelle de réseaux de neurones. Les travaux préliminaires permettent d'estimer que le produit énergie-délai (une mesure typique des performances de la technologie de calcul) peut être réduit d'un facteur d'au moins 10 par rapport aux technologies actuelles.

La photonique sur silicium

Logo ANR

L'IA embarquée vise une mise en œuvre efficace des opérations d'algèbre linéaire des modèles contemporains. Une refonte fondamentale de la nature même du matériel sous-jacent est aujourd'hui nécessaire. Une technologie particulièrement intéressante est celle de la photonique, où les technologies de calcul et de communication se confondent. Dans le cadre des projets ANR français OpticALL2 et Octane, l'INL a mené des recherches sur la façon dont la photonique sur silicium peut améliorer à la fois la communication dans des opérations critiques et dans la réalisation les opérations mathématiques complexes elles-mêmes.

D’autres programmes permettent au laboratoire d’étudier par exemple la fiabilité des calculs réalisés par la photonique sur silicium, ou encore les perspectives offertes par le calcul par réservoir. Ce dernier, qui utilise également la photonique sur silicium, vise en particulier des implémentations évolutives et écoénergétiques d'applications d'IA dépendant du temps telles que l'identification de séquences ou la reconnaissance de la parole.

Suivez la suite de ce dossier en 3 épisodes ! Dans le dernier épisode, nous dresserons un aperçu des nouveaux paradigmes architecturaux et de calculs étudiés à l’INL pour améliorer les performances des applications d’IA.

Ces axes de recherche sur l'apprentissage automatique embarqué sont portés par Ian O'Connor et Alberto Bosio, professeurs à l'École Centrale de Lyon/INL.