L’impact environnemental de l’intelligence artificielle générative
L’entièreté du cycle de vie des systèmes d’intelligence artificielle (SIA) génère des impacts sur l’environnement. Chaque étape de ce cycle contribue à une hausse de la pollution globale, entre autres, par l’émission de gaz à effet de serre (GES), la consommation de ressources naturelles (dont une portion considérable est non renouvelable) et la production d’une surabondance de déchets. Ces dernières années, ce sont les quantités d’eau et d’énergie nécessaires au fonctionnement des SIA qui ont beaucoup retenu l’attention. Par exemple, pour alimenter la croissance de leurs activités Microsoft, Google et Amazon ont signé des contrats d’approvisionnement en énergie nucléaire et maintenu en activité des centrales au charbon. L’annonce récente par le président Trump du projet Stargate totalisant 500 milliards d’investissements pour la construction de centres de données et d’infrastructures liées aux SIA s’inscrit aussi dans cette préoccupante tendance vers la croissance.
L’intense compétition dans le développement et le déploiement de l’IA générative est en partie responsable de cette consommation exponentielle de ressources, et des émissions de GES qui y sont associées. Les populaires ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google), Claude (Anthropic) initialement axés sur la génération de contenus textuels, Midjourney, DALL·E, sur la génération d’images, Fugatto (NVIDIA) sur la génération de musique et récemment des outils comme Sora (OpenAI) et Veo (Google), spécialisés dans la génération de contenus vidéos, ne représentent qu’une petite partie des outils d’IA générative maintenant offerts au grand public, ou sur le point de l’être.
Outre les impacts liés au fonctionnement des SIA (centres de données et autres infrastructures), l’empreinte environnementale des IA génératives est généralement mesurée en deux phases, soit lors de l’entrainement du modèle (et de son ajustement) et lors des inférences. Les inférences comprennent les requêtes des utilisateurs et utilisatrices et la production des réponses.
Voici quelques estimations[1] d’inférences courantes :
- Soumettre une requête à une IA générative pourrait consommer jusqu’à 30 fois plus d’énergie que l’utilisation d’un moteur de recherche classique.
- La production d’un courriel de 100 mots avec GPT-4 consommerait environ 500 millilitres d’eau, selon l’endroit où le modèle est hébergé.
- Générer une seule image grâce à une IA consommerait autant que la recharge complète d’un téléphone intelligent moyen.
Alors qu’il est maintenant établi que l’étape de l’entrainement est très énergivore, il manque encore de travaux permettant d’évaluer avec précision l’ampleur que pourrait représenter la consommation associée aux inférences. Or, la popularité croissante des outils d’IA générative et l’augmentation de la puissance de calcul des nouveaux modèles permettent d’anticiper que l’empreinte environnementale de la phase d’utilisation pourrait rapidement éclipser celle de l’entrainement.
Tous les usages n’ont pas le même poids environnemental
Il existe une importante variabilité dans la quantité d’énergie et de ressources nécessaires à l’entrainement et à l’utilisation de SIA selon le type de modèle utilisé. Entre autres, les modèles généralistes, dont les grands modèles de langage (GML), qui permettent le fonctionnement de la plupart des IA génératives, se distinguent des SIA « traditionnels » qui visent la réalisation d’une tâche spécifique, par exemple la recommandation de contenu sur une plateforme de diffusion en continu.
À la différence de ces derniers, les GML traitent d’énormes ensembles de données et des milliards de paramètres lors de l’analyse des requêtes ou lors de la production de réponses qui peuvent prendre différentes formes (texte, tableau, image, contenu audio, reconnaissance vocale, etc.) Ces opérations exigent une capacité informatique bien plus importante et, ainsi, une consommation supérieure d’énergie et de ressources. Par exemple, la génération d’une image utilise en moyenne 60 fois plus d’énergie que la génération d’un texte (0,047 vs 2,9 kWh), celle-ci utilisant elle-même 23 fois plus d’énergie que la classification d’un texte (0.002 KWh).
Des repères pour orienter l’action
L’impact environnemental de l’IA générative pose des défis majeurs, notamment dans la lutte contre les changements climatiques. Cela exige de réfléchir aux critères qui doivent orienter notre manière de concevoir, d’utiliser et de réguler ces innovations pour garantir leur sobriété, leur soutenabilité et leur contribution au bien commun.
Bien qu’il soit possible d’estimer certains effets environnementaux des IA génératives, l’information sur la consommation énergétique et les ressources naturelles exigées par l’ensemble du cycle de vie de ces modèles est insuffisante. Une plus grande transparence des entreprises et des équipes de recherche est nécessaire pour permettre de mieux comprendre et évaluer l’étendue des impacts environnementaux directs et indirects des SIA, de mener des recherches afin de les éviter ou de les réduire et, ultimement, de permettre la prise de décisions éclairées.
Par exemple, la disponibilité de ces informations faciliterait la réalisation de recherches qui prennent en compte les différentes sources d’énergie utilisées (le bouquet énergétique) ou les périodes de pointes des localités ciblées pour le développement de SIA. Aussi, des informations accessibles pourraient servir à sensibiliser le grand public aux impacts environnementaux associés aux usages d’IA génératives et à encourager l’adoption de pratiques plus soutenables en cohérence avec les exigences de la sobriété numérique. À cet égard, certaines organisations proposent la mise en place d’un système de notation du score énergétique des SIA, inspiré d’écoétiquettes comme EnergyStar. Cela faciliterait la comparaison entre les modèles et aiderait à remettre en question la mentalité du « bigger the better » (la meilleure performance ayant historiquement été obtenue en augmentant la taille des modèles et des jeux de donnée) et inciter plutôt à l’écoconception des SIA.
La priorisation des usages du numérique
En début de semaine, la mise en marché de DeepSeek, un nouveau modèle de génération de contenu textuel, bien moins énergivore, mais aux performances comparables (ou supérieures) à ChatGPT, a secoué le monde de l’IA générative. L’application, gratuite, a rapidement connu une popularité considérable. Si les gains en efficience du modèle peuvent sembler encourageants sur le plan environnemental, les connaissances sur l’effet rebond laissent entendre que l’équation n’est pas si simple.
Bien que des améliorations quant à l’impact environnemental des IA génératives soient possibles, il est fondamental de reconnaître que les pressions posées par la raréfaction des matières premières et la double contrainte carbone imposeront éventuellement des choix difficiles. Ce type de décision fait déjà l’objet de débats dans la sphère publique et politique québécoise, notamment avec l’attribution des blocs d’énergie. C’est face à ces enjeux que la CEST recommande dans son dernier avis (paru à l’automne 2024) d’amorcer une réflexion démocratique sur la priorisation des usages du numérique, laquelle inclurait les IA génératives, afin de s’assurer que nos décisions concernant ces outils soient informées par la science et orientées vers le bien commun. La priorisation des usages implique de réduire, de mieux encadrer, voire d’éliminer les usages du numérique qui entrainent des impacts sociaux ou environnementaux négatifs au profit de ceux qui génèrent des effets positifs, qui seraient alors favorisés ou encouragés.
[1] Les estimations présentées peuvent varier considérablement entre les différents modèles et selon la localisation des serveurs. De plus l’évolution des SIA est rapide et ces résultats s’appuient sur les données disponibles au moment où les différentes recherches ont été effectuées. Les exemples sont présentés pour faciliter la compréhension en imageant avec des métriques connues l’ampleur des ressources associées à des utilisations courantes des IA génératives.