The China Mail - Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts

USD -
AED 3.673007
AFN 63.503205
ALL 82.78735
AMD 368.501999
ANG 1.790403
AOA 917.000493
ARS 1470.999601
AUD 1.446383
AWG 1.80125
AZN 1.70203
BAM 1.718856
BBD 2.018008
BDT 123.091796
BGN 1.69088
BHD 0.377901
BIF 2992.837369
BMD 1
BND 1.297974
BOB 6.938524
BRL 5.203202
BSD 1.001973
BTN 94.864877
BWP 13.624819
BYN 2.814079
BYR 19600
BZD 2.015116
CAD 1.42081
CDF 2265.000143
CHF 0.810235
CLF 0.023173
CLP 912.029887
CNY 6.774797
CNH 6.79765
COP 3428.4
CRC 454.535468
CUC 1
CUP 26.5
CVE 96.906446
CZK 21.2905
DJF 177.720107
DKK 6.5684
DOP 58.644918
DZD 133.636966
EGP 49.7169
ERN 15
ETB 161.535521
EUR 0.87874
FJD 2.251301
FKP 0.754878
GBP 0.75825
GEL 2.644996
GGP 0.754878
GHS 11.246649
GIP 0.754878
GMD 72.999832
GNF 8779.291769
GTQ 7.644241
GYD 209.623413
HKD 7.84115
HNL 26.807458
HRK 6.620995
HTG 131.00145
HUF 312.568505
IDR 17927.1
ILS 2.99632
IMP 0.754878
INR 94.74005
IQD 1312.563167
IRR 1375000.000051
ISK 126.530301
JEP 0.754878
JMD 157.717811
JOD 0.709017
JPY 161.568981
KES 129.410174
KGS 87.450009
KHR 4021.248643
KMF 431.000018
KPW 900.00035
KRW 1534.009705
KWD 0.30898
KYD 0.834996
KZT 487.384102
LAK 22188.337654
LBP 89725.095575
LKR 335.228721
LRD 182.352683
LSL 16.522564
LTL 2.95274
LVL 0.60489
LYD 6.429642
MAD 9.377774
MDL 17.639408
MGA 4185.964758
MKD 54.164854
MMK 2099.387374
MNT 3579.000015
MOP 8.091488
MRU 39.79664
MUR 47.95968
MVR 15.459892
MWK 1737.391847
MXN 17.587719
MYR 4.140503
MZN 63.877447
NAD 16.522564
NGN 1369.919684
NIO 36.867777
NOK 9.796035
NPR 151.78296
NZD 1.764585
OMR 0.384504
PAB 1.001977
PEN 3.39166
PGK 4.394272
PHP 61.449502
PKR 278.668893
PLN 3.76585
PYG 6107.983882
QAR 3.652503
RON 4.610962
RSD 103.180107
RUB 74.499982
RWF 1469.343633
SAR 3.755291
SBD 8.065041
SCR 13.385005
SDG 600.521313
SEK 9.74456
SGD 1.297255
SHP 0.746601
SLE 24.750254
SLL 20969.503664
SOS 572.656446
SRD 37.482986
STD 20697.981008
STN 21.530796
SVC 8.767412
SYP 110.532098
SZL 16.517116
THB 33.269016
TJS 9.293141
TMT 3.51
TND 2.965857
TOP 2.40776
TRY 46.476955
TTD 6.803181
TWD 31.668977
TZS 2625.008027
UAH 44.976754
UGX 3667.442985
UYU 40.189832
UZS 12038.49365
VES 616.865275
VND 26325
VUV 118.758526
WST 2.756325
XAF 576.48558
XAG 0.016191
XAU 0.000242
XCD 2.70255
XCG 1.805774
XDR 0.716966
XOF 576.48558
XPF 104.811706
YER 238.650269
ZAR 16.555802
ZMK 9001.20146
ZMW 17.97425
ZWL 321.999592
  • AEX

    -17.3300

    1065.63

    -1.6%

  • BEL20

    7.4200

    5713.05

    +0.13%

  • PX1

    -59.6400

    8340.71

    -0.71%

  • ISEQ

    -156.2900

    13798.29

    -1.12%

  • OSEBX

    -1.7500

    1944.97

    -0.09%

  • PSI20

    -31.1700

    9136.73

    -0.34%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    80.6600

    4417.44

    +1.86%

  • N150

    -34.2900

    4198.92

    -0.81%

Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts
Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts / Photo: © AFP/Archives

Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts

L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation.

Taille du texte:

Finie, l'ère de "l'intelligence subventionnée" - selon l'expression de Kevin Simback, de l'incubateur Delphi Labs - née avec ChatGPT et la déferlante de l'IA générative.

Pour favoriser l'adoption de cette nouvelle technologie, les grands acteurs du secteur, OpenAI en tête, ont proposé initialement des tarifs très attractifs, au point que leur activité était déficitaire.

"Mais le vent est en train de tourner", prévient Kevin Simback.

Chacun à leur tour, les poids lourds de l'IA ont récemment revu leurs prix pour les ajuster à l'utilisation réelle des capacités informatiques nécessaires pour faire tourner les modèles.

L'avènement des agents IA, des programmes capables d'effectuer des tâches et plus seulement de donner des réponses, a, en outre, fait bondir le recours aux infrastructures informatiques.

Pour une même mission, l'interface peut se démultiplier en plusieurs agents, chacun avec sa feuille de route, le tout assemblé et vérifié par d'autres agents.

A l'arrivée, le nombre de "tokens", unité de référence pour mesurer le résultat produit par l'IA, peut représenter des dizaines de fois celui correspondant à une simple question à ChatGPT.

Le tout s'inscrit dans une période de déséquilibre. Les centres de données et les fabricants de puces ne parviennent pas à suivre le rythme effréné de la demande d'intelligence artificielle, ce qui renchérit l'accès aux infrastructures.

"En particulier chez les développeurs, le coût d'utilisation de l'IA pour la programmation s'est accru de façon exponentielle", observe Mark Barton, de la société d'accompagnement numérique Omniux.

Par extension, pour tous les modèles de référence du marché, "les prix commencent à s'envoler", insiste-t-il.

Face à ce nouveau paradigme, certains questionnent le déploiement à tout crin de l'IA, tels l'enseigne de grande distribution Target, Starbucks ou Uber.

"Dans certains cas, le coût dépasse celui d'un employé au bout d'un mois ou deux parce qu'ils l'utilisent trop", décrit Jack Gold, président du cabinet J.Gold Associates.

- Pas d'IA "sans raison" -

Pourtant sacré, en début d'année, champion du "tokenmaxxing", mouvement qui glorifie la dépense maximale de "tokens" comme mètre étalon de productivité des employés, Meta a récemment mis le hola.

"Personne ne devrait recourir à des outils IA sans raison", a ainsi écrit le responsable technologique du groupe, Andrew Bosworth, dans un mémo interne relayé par le Wall Street Journal.

Mais si le discernement est désormais de mise, la plupart des sociétés cherchent surtout à accéder à une IA moins onéreuse, en recourant à des modèles moins performants que les fleurons du secteur.

Dans ce contexte, la popularité des modèles dits "open weights", téléchargeables gratuitement, est croissante, leur usage ne nécessitant que l'achat de puissance de calcul.

Les entreprises se tournent aussi vers des modèles de plus petite taille, les SLM (small language models) en lieu et place des LLM, qui servent de base à ChatGPT, Claude ou Gemini.

Ces SLM peuvent parfois tourner sur les serveurs locaux ou même directement sur l'ordinateur, une option plus économique car elle évite de payer un fournisseur de capacité à distance (cloud).

Il est aussi possible de scinder une demande unique (prompt) en étapes distinctes pour les confier, à chaque fois, à l'interface adaptée, explique Adrian Balfour, du cabinet de conseil numérique Enverso.

"Quand vous passez par un grand modèle monolithique, vous en aurez à peu près pour 15 dollars le million de +tokens+ alors qu'en prenant des mini-modèles, vous ferez descendre le tout à 5 cents", assure-t-il.

Beaucoup voient dans cette refonte la première étape de la banalisation des modèles, devenus interchangeables sans déperdition.

Dès lors, ce sont les plateformes de sélection et de coordination des modèles et des agents qui prennent de l'importance, selon John Belton, gérant au sein de la société d'investissement Gabelli Funds.

Sur ce créneau, des start-up se battent avec des mastodontes du "cloud" comme Amazon, qui propose déjà de jongler avec une multitude d'IA via sa plateforme Bedrock, mais aussi les géniteurs de l'intelligence artificielle eux-mêmes.

Anthropic dispose ainsi d'une gamme complète de modèles, dont Haiku, l'option la plus économique, à l'instar d'OpenAI et de Google.

John Belton ne voit d'ailleurs pas ces étoiles de l'IA perdre des parts de marché à mesure que les clients cherchent l'efficacité plutôt que la performance.

"Les utilisateurs les plus avancés seront toujours prêts à payer" pour ce qui se fait de mieux, prévoit-il. "Le gâteau ne fait que grossir."

U.Feng--ThChM