Ce qu'il faut retenir
L'IA consomme surtout de l'énergie dans les centres de données qui exécutent les calculs. Pour Ian O'Connor, chercheur en nano-électronique à Centrale Lyon, une partie de la réponse se trouve au niveau matériel, en rendant les puces et les circuits plus économes dès leur conception, et en adaptant la taille des modèles aux usages réels.
Pourquoi l'IA consomme autant d'énergie
L'intelligence artificielle représenterait aujourd'hui environ 1,5 % de la consommation mondiale d'énergie, une part qui pourrait doubler d'ici 2030. Cette consommation se concentre dans les centres de données, où s'effectuent les calculs nécessaires aux modèles.
![]()
Un centre de données consomme environ un gigawatt. C'est une centrale nucléaire, c'est aussi la consommation d'une grande ville.
Ian O'Connor, professeur des universités en nano-électronique à l'INL
La raison tient à la taille des modèles. Les plus grands reposent sur plus de mille milliards de paramètres, ce qui multiplie les couches de calcul à chaque requête, et donc l'énergie dépensée.
Agir dès le matériel
Pour Ian O'Connor, l'efficacité énergétique se gagne d'abord dans le matériel, les puces et les circuits qui exécutent les calculs. L'enjeu n'est pas de corriger après coup, mais d'intégrer la sobriété dès la conception des composants. Trois pistes sont explorées en laboratoire.
Des matériaux qui conservent la mémoire sans courant
Les matériaux dits ferroélectriques peuvent conserver l'information même sans alimentation électrique. De quoi réduire l'énergie dépensée en permanence pour entretenir la mémoire des systèmes.
Rapprocher le calcul de la mémoire
Aujourd'hui, les données font de nombreux allers-retours entre l'endroit où elles sont stockées et celui où elles sont traitées. Ces trajets coûtent de l'énergie. Calculer au plus près de la mémoire permettrait de les éviter.
Réduire la précision quand c'est possible
La précision de représentation des données peut souvent être réduite, par exemple de 64 bits à quelques bits, sans perte notable pour une application donnée. Mais ce gain vaut pour un usage ciblé, un même composant ainsi optimisé ne convient pas à toutes les applications. Et la réduction atteint ses limites dans les cas critiques, comme l'aéronautique, où la marge d'erreur est nulle.
Choisir le bon modèle selon l'usage
La sobriété ne dépend pas seulement des composants. Elle tient aussi à un choix, celui d'adapter la puissance du modèle au besoin réel plutôt que de recourir par défaut au plus puissant.
Utiliser ChatGPT avec ses 1000 milliards de paramètres, c'est comme si on utilisait une fusée pour aller de la maison au supermarché.
Ian O'Connor, à propos de l'usage de modèles surdimensionnés pour des requêtes simples
Écouter l'épisode
Retrouvez l'intégralité de l'échange avec Ian O'Connor dans le premier épisode de la saison 2 de PRISME, le podcast de Centrale Lyon.
Questions fréquentes
Pourquoi l'IA consomme-t-elle autant d'énergie ?
Parce que les modèles reposent sur un très grand nombre de paramètres, ce qui exige d'immenses volumes de calculs, concentrés dans des centres de données très gourmands en électricité.
Qu'est-ce qu'une IA frugale ?
Une IA conçue pour réduire sa consommation de ressources, énergie et matériaux, à plusieurs niveaux, du matériel aux usages. En France, l'État a publié un référentiel général pour l'IA frugale.
Comment réduire la consommation énergétique de l'IA ?
En agissant dès le matériel, avec des composants plus sobres, en rapprochant calcul et mémoire, en réduisant la précision des calculs pour les usages qui le permettent, et en adaptant la taille des modèles aux besoins réels.
Qu'est-ce qu'un matériau ferroélectrique ?
Un matériau capable de conserver une information même une fois le courant coupé, ce qui évite de dépenser de l'énergie en continu pour entretenir la mémoire.
L'intervieweuse
Dans PRISME, on pense la science pour éclairer la société. Bienvenue dans le podcast de Centrale Lyon, qui décrypte les grands enjeux contemporains avec un regard critique et réflexif. Si vous nous avez déjà écoutés, vous savez que j'interroge à chaque fois trois experts de trois disciplines différentes, pour recueillir les points de vue de la recherche, de l'industrie et de la société civile.
Pour cette nouvelle trilogie d'entretiens, nous allons nous intéresser à l'intelligence artificielle. En novembre 2022, la toute première version de ChatGPT était lancée. Depuis, on entend partout parler de révolution. Un Français sur deux utilise l'IA quotidiennement, et 75 % des entreprises l'ont adoptée. Face à ce bouleversement, les inquiétudes ont vite émergé, car l'intelligence artificielle consomme énormément d'énergie.
Pour fonctionner, elle dépend d'immenses centres de données, de composants électroniques complexes et de ressources toujours plus nombreuses. À mesure que les usages explosent, une question devient incontournable, comment concilier le développement de l'IA et les enjeux climatiques ? Peut-on continuer cette course technologique sans aggraver notre empreinte environnementale ? Puisque tout est affaire de centres de données, nous allons parler aujourd'hui de hardware et de matériaux.
Comment fonctionnent concrètement les puces qui alimentent l'IA ? Pourquoi consomme-t-elle autant ? Et surtout, quelles solutions imaginent les chercheurs pour concevoir des technologies plus sobres ? Je vais poser la question à Ian O'Connor, chercheur et professeur à Centrale Lyon. Il va nous aider à décrypter l'intelligence artificielle par le prisme des matériaux. Ian O'Connor, bonjour.
Ian O'Connor
Bonjour.
L'intervieweuse
L'IA est souvent présentée comme une révolution, mais aussi comme une menace pour l'environnement. Aujourd'hui, elle représente 1,5 % de la consommation mondiale d'énergie, et cela pourrait doubler d'ici 2030. À titre de comparaison, cela représente la consommation d'électricité du Japon. Pourquoi l'IA telle qu'on la connaît aujourd'hui pose-t-elle un problème environnemental ?
Ian O'Connor
Il y a effectivement tous ces aspects de consommation énergétique. Les centres de données, où s'effectuent tous les calculs de l'IA, consomment environ un gigawatt. Pour relier ce chiffre à la vie réelle, un gigawatt, c'est une centrale nucléaire. C'est aussi la consommation d'une grande ville. Même Lyon, je pense, ne consomme pas un gigawatt.
Il y a donc énormément d'énergie concentrée dans ces data centers qui exécutent les modèles d'IA. Pourquoi cela consomme-t-il autant ? Parce qu'on leur demande de faire énormément de calculs. Les grands modèles, comme ChatGPT, Claude ou Perplexity, contiennent énormément de paramètres, plus de mille milliards pour ChatGPT.
Cela veut dire qu'il faut beaucoup de couches et beaucoup de calculs pour répondre à une requête d'utilisateur. On dit qu'une requête d'IA coûte dix fois la consommation énergétique d'une recherche Google. La consommation énergétique est donc déjà un vrai problème.
L'intervieweuse
Et l'IA consomme de l'électricité, mais aussi beaucoup d'eau. Elle est gourmande en plusieurs types de ressources, c'est bien ça ?
Ian O'Connor
Oui, exactement. Il faut aussi beaucoup d'eau pour refroidir. Quand on fait un calcul, l'énergie électrique est transformée en énergie thermique. On a donc besoin de refroidir les processeurs, et pour cela on utilise de l'eau, ce qui contribue encore à la consommation électrique. En général, environ un tiers de l'énergie sert juste au refroidissement, dans un système de climatisation. C'est aussi un vrai problème.
L'intervieweuse
Vous êtes chercheur et professeur à Centrale Lyon, spécialiste de l'IA et plus particulièrement du hardware. Le hardware, c'est une notion complexe. On pense souvent aux puces, on entend parler de CPU, de GPU, on pense aussi aux data centers, mais cela regroupe des éléments plus larges. Qu'est-ce que le hardware exactement dans l'IA ?
Ian O'Connor
Le hardware, le matériel, c'est tout ce qui va de la fabrication des puces jusqu'à la construction des processeurs ou des GPU. C'est tout le matériel sur lequel le logiciel va pouvoir tourner. On a besoin du logiciel pour dire au matériel ce qu'il faut faire, mais c'est le matériel qui effectue les opérations. L'un ne peut pas exister sans l'autre.
Le matériel, aujourd'hui, ce sont des puces organisées de manière à assembler des transistors. On peut faire une analogie avec le bâtiment. Les transistors, ce sont des interrupteurs, comme des briques. On organise ces briques en pièces, puis on construit tout le processeur, comme une maison qui réunit les ressources nécessaires. Le logiciel, ce sont les habitants qui viennent utiliser ces ressources pour accomplir leurs tâches.
Aujourd'hui, on a des puces très petites, de l'ordre de quelques centimètres, qui contiennent des transistors encore plus petits. Un transistor n'est pas très loin de la taille d'une molécule de protéine. C'est l'une de nos plus grandes réussites d'avoir pu miniaturiser ces puces, mais c'est aussi notre malédiction, parce que cela rend notre travail intangible.
Cette intangibilité, due à des composants déjà très petits et à l'électricité qui n'est pas visible à l'œil nu, rend les choses difficiles à comprendre. On ne peut ni les manipuler ni les toucher.
L'intervieweuse
Et c'est notre but aujourd'hui d'essayer de rendre tangibles ces notions. Si j'essaie de résumer, vous me coupez si je dis n'importe quoi. En gros, le hardware, c'est comme une maison. Dans une maison, il y a des matériaux, des briques, c'est le matériau qui construit l'IA, et il y a une architecture.
L'intervieweuse
C'est l'assemblage des matériaux pour créer des circuits, ces circuits qui passent par l'électricité et qui apportent les informations.
Ian O'Connor
Oui, c'est ça. Un processeur, c'est l'association de plusieurs blocs. Si un processeur est une maison, là où on utilise des briques ou du placo pour construire les pièces, on utilise ici des transistors à base de silicium.
L'intervieweuse
Et pourquoi le hardware est-il au cœur des enjeux environnementaux de l'IA ?
Ian O'Connor
Parce que c'est là que l'électricité est consommée. Le logiciel, en tant que tel, ne consomme pas d'électricité. C'est lorsqu'on exécute le logiciel, donc lorsqu'on utilise le hardware, qu'apparaît la consommation électrique.
L'intervieweuse
Face à ces constats, vous travaillez sur des solutions qui permettent de développer des IA dites frugales. Qu'est-ce qu'une IA frugale ?
Ian O'Connor
Il y a pas mal de définitions. Souvent, le terme indique qu'on va être très parcimonieux dans l'utilisation des données. La frugalité peut aussi concerner les modèles eux-mêmes, c'est-à-dire construire des modèles toujours aussi performants mais avec moins de paramètres, qui nécessitent moins de calculs.
Il y a donc plusieurs niveaux. Le niveau dont je m'occupe, c'est le niveau matériel, où l'on cherche à rendre chaque opération plus économe en énergie. Cela permet de réduire la consommation à chaque requête.
L'intervieweuse
Je comprends qu'il faut repenser le hardware en priorité, si l'on veut ensuite développer en software des usages plus compatibles avec les enjeux du développement durable.
Ian O'Connor
Oui. Pour moi, les solutions qui répondront à ces enjeux ne peuvent se trouver que si l'on travaille main dans la main avec les personnes qui développent les modèles, celles qui conçoivent les solutions informatiques, et celles qui travaillent sur les architectures. C'est ce qu'on essaie de mettre en place dans nos projets.
Ce sont des problématiques très verticales, puisqu'elles impliquent beaucoup de cœurs de métier qui doivent dialoguer, comprendre ce que fait l'autre et trouver les solutions les plus efficaces et adéquates.
L'intervieweuse
On va essayer de comprendre ce que vous faites concrètement pour développer des systèmes de hardware plus compatibles avec le développement durable. Il faut agir à tous les niveaux du hardware, les matériaux, l'architecture et les circuits. J'aimerais qu'on parle de quelques innovations à ces différents niveaux, pour montrer qu'il existe des solutions, que ce n'est pas utopique de repenser une IA plus frugale. Commençons par les matériaux. Actuellement, les matériaux utilisés consomment beaucoup d'énergie. Vous proposez de travailler sur des matériaux innovants, les matériaux ferroélectriques. Qu'est-ce que c'est, et surtout qu'est-ce que cela permet ?
Ian O'Connor
Les matériaux ferroélectriques présentent le phénomène de ferroélectricité. On peut les polariser dans un sens ou dans l'autre en appliquant un champ électrique. L'avantage, c'est que lorsqu'on retire ce champ, le matériau reste dans cet état, polarisé vers le haut ou vers le bas.
Cela veut dire qu'on peut revenir à une tension nulle tout en gardant le même état. On a donc une mémorisation des informations dite non volatile, c'est-à-dire qu'on conserve ces informations même si l'on coupe la source d'énergie.
Quand on veut l'utiliser, on réalimente et on lit l'état du matériau, mais entre-temps on peut tout éteindre et conserver les informations. C'est l'inverse des mémoires actuelles, où il faut alimenter en continu les puces de mémorisation.
L'intervieweuse
Donc si on coupe le courant, la mémoire garde les informations.
Ian O'Connor
Elle garde les informations. Cela veut dire qu'on peut tout couper, ne plus rien consommer, puis rallumer et retrouver le même état et les mêmes données, comme si on avait continué à alimenter.
L'intervieweuse
Et ces matériaux ferroélectriques sont-ils déjà utilisés dans l'IA ?
Ian O'Connor
Pas encore. On y travaille. Beaucoup de groupes de recherche travaillent sur ces puces, et des sociétés comme Sony commencent à les utiliser, mais pas dans des produits commerciaux. Cela existe au niveau de la recherche. Ce que cela permet, c'est d'aller vers des solutions de mémorisation plus intéressantes, parce que cela permet aussi de rapprocher le calcul de la mémoire.
Dans les solutions de calcul classiques, il y a une séparation très nette entre les ressources de calcul et les ressources de mémorisation. La mémoire stocke les informations, les programmes et les données. Le processeur, lui, exécute les instructions. Mais à chaque fois qu'on va chercher une instruction, c'est comme si on allait au supermarché chercher quelque chose.
La difficulté, c'est qu'on récupère les instructions une par une. C'est comme faire le trajet juste pour aller chercher un bocal de petits pois, puis refaire l'aller-retour. Les solutions de calcul dans la mémoire permettent de déployer une partie des ressources de calcul directement dans la mémoire.
L'émergence des mémoires non volatiles a facilité cette approche, et cela réduit la consommation, parce que le trajet coûte de l'énergie. En rapprochant les ressources, on réduit ce coût énergétique et cette latence.
L'intervieweuse
Vous abordez là l'architecture de l'IA. On comprend que le matériau et l'architecture sont liés. Actuellement, les systèmes d'IA séparent la mémoire et le calcul, c'est bien ça ?
Ian O'Connor
Oui, et c'est aussi vrai dans les GPU. Ils ont été construits sur ce modèle, avec cette séparation entre la partie calcul et la partie mémoire.
L'intervieweuse
Pour donner une image qui m'a aidée à comprendre cette idée de rapprocher la mémoire du calcul, c'est en fait se rapprocher du fonctionnement du cerveau humain. C'est ce qu'on appelle l'architecture neuromorphique. Dans le cerveau, le calcul et la mémoire sont au même endroit. L'idée, c'est de tout regrouper pour éviter les allers-retours inutiles.
Ian O'Connor
Oui, c'est ça. Le terme neuromorphique signifie qu'on cherche quelque chose qui ressemble à la fonction neuronale, celle du cerveau. Au départ, quand les premiers processeurs ont été construits, il y avait cette séparation entre le cœur de calcul et la mémoire, parce qu'on pensait alors que c'était ainsi que le cerveau fonctionnait.
Or, on sait aujourd'hui que ce n'est pas le cas. Les ressources de calcul et de mémoire sont beaucoup plus mêlées. C'est ce qu'on appelle les architectures neuromorphiques.
L'intervieweuse
Il y a une autre innovation dont j'aimerais parler, l'idée de repenser les circuits. Les IA, comme on vient de l'expliquer, ne sont que des additions de calculs très complexes et de matrices. Aujourd'hui, ces calculs sont faits grâce à l'électricité, qui consomme beaucoup d'énergie. Vous, et les chercheurs en général, proposez de passer non plus par l'électricité, mais par la lumière. C'est ce qu'on appelle le calcul photonique. À mes oreilles novices, faire des calculs par la lumière paraît un peu magique. Qu'est-ce que c'est exactement, et pourquoi est-ce intéressant ?
Ian O'Connor
L'électrique, c'est la voie conventionnelle. La photonique, elle, est plutôt utilisée pour les communications, la fibre optique par exemple. Ce sont des photons qui véhiculent les informations entre les villes et entre les continents. On a remplacé les câbles électriques par les fibres optiques dans les années 80 et 90.
Nous nous sommes posé la question, il y a une dizaine d'années, de savoir si l'on pouvait aussi faire des opérations de calcul avec la photonique. Il s'avère qu'elle est très bien adaptée aux calculs linéaires de type matriciel, parce que le calcul matriciel est lui aussi une opération linéaire.
L'intervieweuse
Et pourquoi est-ce intéressant, énergétiquement, de passer par la lumière plutôt que par l'électricité ?
Ian O'Connor
C'est un grand débat. Sur le cœur de calcul, c'est plus intéressant, puisqu'on peut faire l'ensemble des calculs en même temps, au lieu d'opérations séquentielles comme dans les GPU. C'est donc plus rapide, et on utilise les mêmes informations sur une ligne et une colonne, ce qui rend l'usage plus efficace.
C'est un premier point de gain. En revanche, comme on fait le reste des opérations en électrique, on commence à perdre les gains obtenus avec la photonique, parce que la latence et la consommation augmentent d'un facteur dix. Est-ce intéressant ? C'est encore une question ouverte qu'on essaie de résoudre.
L'intervieweuse
Ce n'est donc pas la solution miracle.
Ian O'Connor
Pas encore.
L'intervieweuse
Peut-être pour bientôt. On a abordé trois innovations développées actuellement dans les laboratoires de Centrale Lyon. J'ai l'impression qu'elles permettent certes des IA plus compatibles avec les enjeux climatiques, mais aussi des IA plus efficaces. Peut-on créer des IA à la fois plus sobres et plus efficaces ?
Ian O'Connor
On peut prendre l'exemple de DeepSeek, qui a utilisé ce qui existait déjà avec ChatGPT pour faire un modèle encore plus petit, mais tout aussi performant. Il y a beaucoup de leviers pour réduire l'empreinte énergétique et l'empreinte mémoire, si l'on travaille vraiment sur l'optimisation de l'ensemble.
Un exemple, la façon de représenter les informations. Les données les plus précises sont codées sur un nombre de chiffres binaires qui peut aller de 32 à 64, voire 128 bits. Or, dans beaucoup de cas, on n'a pas besoin d'une telle précision.
Des travaux ont montré qu'on peut réduire la précision de représentation jusqu'à quatre bits, ce qui est très peu par rapport aux 64 prévus initialement, en visant une application particulière. Mais si on exploite ces leviers de façon permanente, on ne pourra pas utiliser le même moteur pour d'autres applications.
On peut penser aussi aux applications critiques, dans les avions. Quand on déploiera de l'IA dans ce domaine, on sera beaucoup plus réticent à réduire la précision des calculs, parce qu'on cherche une grande fiabilité.
L'intervieweuse
Cela veut dire que les systèmes qu'on utilise sont peut-être trop complexes pour l'usage qu'on en fait. Il faudrait peut-être des systèmes adaptés à chaque usage, donc un plus grand nombre de systèmes. Si 90 % des gens utilisaient des IA plus sobres, cela permettrait de régler le problème.
Ian O'Connor
Est-ce que cela réglerait le problème, je ne sais pas. Mais cela permettrait d'avoir plus de choix qu'aujourd'hui. On pourrait dire qu'utiliser GPT avec ses mille milliards de paramètres, c'est comme utiliser une fusée pour aller de la maison au supermarché. Ce n'est pas quelque chose qu'on voudrait faire.
Avoir le choix de l'accélérateur et du modèle selon la question qu'on se pose, c'est, je pense, la meilleure façon de progresser.
L'intervieweuse
Vous apportez des solutions, cela donne un peu d'espoir. Pourtant, beaucoup remettent tout cela en cause. Un article publié dans Le Monde remet en cause la possibilité d'une IA frugale. J'aimerais vous en lire le tout début. Il commence ainsi, le techno-solutionnisme consistant à faire croire que l'intelligence artificielle permettra d'obtenir suffisamment de gains énergétiques pour rendre le processus durable est un leurre. Qu'en pensez-vous ? L'IA frugale peut-elle apporter de vraies solutions, ou est-ce un leurre ?
Ian O'Connor
Je ne suis pas d'accord avec cette phrase, et en même temps je le suis un peu. Ce qu'on vient de dire, ce sont des solutions qui peuvent venir du monde technique, où l'on peut offrir beaucoup plus de possibilités. Le point clé, c'est une solution adaptable et la plus efficace possible.
La difficulté, c'est qu'on a du mal à modéliser les usages de l'IA et à faire l'adéquation avec le matériel qui est derrière. Je pense que si l'on apporte des solutions au niveau matériel, cela permettra, en guidant les usagers, une meilleure utilisation, plus économe sur le plan énergétique.
La solution se trouve donc aux deux niveaux. Mais pour cela, il faut vraiment travailler sur les usages. Comme on le disait au début, le fait que ce ne soit pas tangible, qu'on ne voie pas la consommation quand on utilise l'IA ou les systèmes numériques, est l'un des problèmes.
Il faut vraiment éduquer la population, pour qu'elle prenne conscience qu'une recherche Google rejette un gramme de CO2 dans l'atmosphère, et que c'est dix fois plus avec l'IA. Rien que cela, il faudrait l'enseigner. Mais je n'ai pas les réponses sur la façon de le faire.
L'intervieweuse
Vous pensez donc que la solution matérielle existe, et que le problème ne réside pas dans la conception matérielle.
Ian O'Connor
Oui, on travaille pour que ces solutions matérielles existent. Il y a encore du travail pour proposer des solutions très flexibles, adaptables selon la consommation souhaitée. Un exemple très simple, on pourrait donner à un usager la possibilité d'utiliser l'IA avec un temps de réponse beaucoup plus long, dix minutes plutôt que dix secondes.
On pourrait alors ralentir le processeur. C'est une technique connue, en ralentissant un processeur on peut diminuer la tension d'alimentation, et donc consommer moins. Ce sont des leviers possibles, qui permettraient de proposer des modes d'utilisation de l'IA plus économes, plus économiques et plus écologiques.
L'intervieweuse
J'ai aussi l'impression que le problème vient des acteurs de l'IA eux-mêmes, parce qu'on a le sentiment que le secteur va plutôt dans l'autre sens. Il y a une vraie course à la puissance, la production de GPU est un enjeu énorme, et des monopoles se mettent en place, avec Nvidia qui produit presque toutes les puces. Pourquoi ne va-t-on pas dans le bon sens aujourd'hui ? Pourquoi les acteurs qui ont le monopole choisissent-ils de ne pas aller vers l'IA frugale, si les solutions existent ?
Ian O'Connor
Je pense qu'on est au début de l'utilisation de l'IA. Rappelez-vous, il y a quelques années, quand ChatGPT est arrivé, c'était l'explosion d'une nouveauté, quelque chose qui a radicalement changé notre perception des systèmes numériques. On a découvert qu'on pouvait poser une question et obtenir une réponse pertinente, dans toutes les langues.
Dans l'usage, on n'est pas freiné par cette puissance de calcul et de réponse. Cela devient une sorte d'oracle. Je pense que la course ralentira quand on commencera à discuter davantage de ces impacts écologiques. On a encore quelques années devant nous avant de vraiment prendre cela en considération, mais cela viendra, j'en suis persuadé.
L'intervieweuse
On est encore dans la phase de curiosité du début. Et ne pensez-vous pas que c'est aussi parce que ce n'est pas leur priorité ? Les géants de l'IA ont-ils en tête les enjeux environnementaux aujourd'hui ?
Ian O'Connor
La compétition, c'est de savoir qui aura le modèle le plus puissant, capable de répondre à toutes les questions avec une précision et une fiabilité maximales. C'est aussi une question de vitesse. L'objectif, c'est la vitesse, pas la réduction de la consommation. C'est la performance qui est privilégiée, pas l'efficacité énergétique.
L'intervieweuse
Et comment fait-on pour changer cela, si ce sont eux qui ont le pouvoir et qui décident que la performance est la priorité numéro un ? Comment fait-on, aujourd'hui, pour faire changer les états d'esprit ?
Ian O'Connor
En faisant des podcasts comme celui-ci. Le problème est connu, parce que le coût économique de l'électricité d'un data center, un gigawatt, n'est pas anodin, c'est un coût financier énorme. Il y aura une prise de conscience, et selon moi elle est déjà là, pour que les gens commencent à réfléchir à la réduction des modèles et à des architectures matérielles plus efficaces, avec des techniques qui sont en train d'émerger.
L'intervieweuse
Peut-être que la solution, c'est aussi de leur tendre une carotte, en disant que les solutions d'IA frugale ne servent pas qu'à baisser les coûts énergétiques, mais permettent aussi des IA plus efficaces, plus puissantes. Est-ce par là qu'il faudrait passer ?
Ian O'Connor
Plus puissantes, je ne sais pas. En revanche, il y a une vraie possibilité de déployer l'IA vers plus d'applications, de façon plus distribuée. On a ce modèle centralisé, le data center, qui concentre l'ensemble des données et des calculs, mais ce n'est pas là que se trouvent les utilisateurs ni les capteurs, ni l'endroit d'où partent les requêtes.
Si l'on peut mettre un peu de calcul là où les données sont générées, c'est intéressant. La difficulté, c'est qu'il n'y a pas autant d'énergie disponible à cet endroit. On est donc contraint de concevoir des solutions d'IA avec peu d'énergie et peu de ressources mémoire. Il y a là un vrai travail pour compacter. Compacter un LLM comme ChatGPT sur un ordinateur embarqué n'est pas encore possible, mais c'est peut-être l'objectif.
L'intervieweuse
Pour les auditeurs, ce dont vous parlez, c'est l'edge computing. Aujourd'hui, à chaque calcul, toutes les informations sont transmises à un data center. L'idée, c'est de mettre un mini data center dans la machine, c'est bien ça ?
Ian O'Connor
Dans le téléphone, par exemple.
L'intervieweuse
Dans le téléphone. Ce sont des solutions déjà mises en place, notamment dans les voitures autonomes, ce qui permet aussi de limiter la latence, c'est bien ça ?
Ian O'Connor
Oui. On a parlé d'applications critiques comme l'avion. La voiture en est une aussi, où l'on a besoin d'une latence de calcul minimale, notamment pour les détecteurs de collision. On ne peut pas envoyer toutes les données captées par la voiture vers le data center en espérant qu'elles reviennent à temps.
On a, je crois, de l'ordre d'une milliseconde pour décider de freiner ou non, selon ce qui est détecté devant le véhicule. Non seulement on mettrait trop de temps à atteindre le data center, mais surtout on n'aurait aucune garantie sur le temps de réponse. Cela pourrait prendre une milliseconde, ou bien beaucoup plus. Cette incertitude n'est pas tolérable pour une application critique. On est donc obligé d'avoir des ressources de calcul embarquées pour analyser et décider.
L'intervieweuse
C'est peut-être la solution de demain à plus grande échelle. Mais si ces solutions existent et ne sont pas encore appliquées, ou ne sont pas les premières priorités des géants de la tech, peut-être que la solution, c'est de mettre en place une gouvernance de l'IA, des régulations. C'est ce que propose le Shift Project. Il existe aujourd'hui des textes de régulation, au sein de l'OCDE ou de l'Europe, mais ils ne sont pas contraignants. C'est ce qu'on appelle de la soft law. Pour vous, faut-il une gouvernance stricte de l'IA frugale pour imposer ces solutions aux acteurs qui décident ?
Ian O'Connor
Si l'on met en place une gouvernance stricte, il est très probable qu'elle soit appliquée dans certains pays et pas dans d'autres. Cela voudrait dire une perte de compétitivité par rapport aux pays qui ne l'appliquent pas. Je pense qu'il faudrait peut-être rester sur de la soft law, mais en exigeant plus de transparence sur la consommation énergétique.
On pourrait avoir des niveaux de consommation énergétique, et aussi d'information sur les matériaux utilisés dans la fabrication des puces. C'est un autre sujet, qu'on n'a pas abordé, mais qui est critique, car tous ces matériaux, on les retrouve en fin de vie des puces.
À mon sens, il serait plus intéressant d'exiger de la transparence et de laisser le consommateur décider. En portant des messages sur l'efficacité énergétique et la soutenabilité de l'IA, on peut influer sur la perception de l'IA par le consommateur, qui pourra choisir en fonction de ce qu'il a envie de soutenir.
L'intervieweuse
Vous pensez donc qu'il faut avoir confiance dans les consommateurs ?
Ian O'Connor
C'est une question difficile. Mais oui, parce que si l'on contraint, on risque de perdre.
L'intervieweuse
Parce qu'on ne peut pas exiger de directives contraignantes à l'échelle internationale, c'est impossible.
Ian O'Connor
Je pense que c'est impossible, malheureusement.
L'intervieweuse
On arrive à la fin de ce podcast, c'était passionnant. J'ai une dernière question, notre question signature. Dans PRISME, nous traitons chaque sujet de trois manières différentes, avec trois approches qui se complètent. Selon vous, pourquoi est-il essentiel de croiser les regards pour comprendre et développer de nouvelles formes d'IA ?
Ian O'Connor
Dans l'IA, on a un impact très vertical, à travers plusieurs cœurs de métier. On part des matériaux, jusqu'aux dispositifs, aux circuits, aux architectures, puis à l'informatique, au logiciel qui s'exécute sur ces architectures, aux données, aux modèles, aux mathématiques, et enfin aux usages. On a besoin de ces regards différents qui se croisent. On a besoin de travailler ensemble, et ces regards croisés sont très importants.
L'intervieweuse
Parfait. On a hâte de retrouver ces différents regards dans les deux prochains épisodes. Merci beaucoup, Ian.
Ian O'Connor
Merci beaucoup.
L'intervieweuse
Des solutions concrètes semblent exister. Matériaux, architecture, circuits de transmission, tout peut être réinventé pour développer des IA plus frugales. On dirait bien que le problème ne se trouve pas vraiment du côté de la recherche, mais plutôt du côté des acteurs de l'IA, qui ne recherchent bien souvent que la performance, au détriment des enjeux écologiques. Et nous aussi, utilisateurs, avons un rôle concret à jouer. Les géants de la tech font la pluie et le beau temps en matière d'IA, mais nous pouvons malgré tout choisir les usages que nous voulons encourager, privilégier des outils plus frugaux et adopter une consommation plus raisonnée. Si, dans l'IA, tout est affaire de data centers, il ne faut pas négliger l'importance du software et des algorithmes. Dans le prochain épisode, je recevrai à mon micro Julien Velcin. Ensemble, nous imaginerons des solutions concrètes pour développer des algorithmes plus sobres et responsables, et trouver peut-être un équilibre entre performance et enjeux climatiques.
Voix de clôture
Un podcast de Centrale Lyon.