The China Mail - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

USD -
AED 3.67298
AFN 69.911879
ALL 88.480839
AMD 387.867986
ANG 1.790204
AOA 916.502891
ARS 1130.479705
AUD 1.560645
AWG 1.8025
AZN 1.699692
BAM 1.760475
BBD 2.01821
BDT 121.44561
BGN 1.76115
BHD 0.376908
BIF 2973.954606
BMD 1
BND 1.304667
BOB 6.906795
BRL 5.669757
BSD 0.999608
BTN 85.262414
BWP 13.645733
BYN 3.271208
BYR 19600
BZD 2.00784
CAD 1.39947
CDF 2870.00025
CHF 0.84212
CLF 0.02462
CLP 944.770206
CNY 7.2033
CNH 7.199895
COP 4225.76
CRC 507.95051
CUC 1
CUP 26.5
CVE 99.254232
CZK 22.454021
DJF 177.997606
DKK 6.71438
DOP 58.725308
DZD 133.799008
EGP 50.460157
ERN 15
ETB 132.91142
EUR 0.90011
FJD 2.27435
FKP 0.758117
GBP 0.75659
GEL 2.744979
GGP 0.758117
GHS 12.97501
GIP 0.758117
GMD 72.185616
GNF 8644.084937
GTQ 7.676855
GYD 208.831209
HKD 7.795191
HNL 25.850215
HRK 6.783602
HTG 130.551477
HUF 364.460852
IDR 16652.234449
ILS 3.576775
IMP 0.758117
INR 85.311651
IQD 1308.750205
IRR 42250.000055
ISK 132.089855
JEP 0.758117
JMD 158.647385
JOD 0.709296
JPY 148.132032
KES 129.273661
KGS 87.449869
KHR 4005.603722
KMF 432.742967
KPW 899.995499
KRW 1424.178899
KWD 0.307561
KYD 0.831723
KZT 510.584696
LAK 21579.899499
LBP 89417.197299
LKR 298.308077
LRD 199.620755
LSL 18.294547
LTL 2.95274
LVL 0.60489
LYD 5.469605
MAD 9.335974
MDL 17.233399
MGA 4478.082969
MKD 55.383519
MMK 2099.484484
MNT 3573.897983
MOP 8.011224
MRU 39.603061
MUR 46.200002
MVR 15.4386
MWK 1730.811193
MXN 19.57697
MYR 4.338498
MZN 63.830001
NAD 18.295948
NGN 1601.759833
NIO 36.742251
NOK 10.41485
NPR 135.656652
NZD 1.697145
OMR 0.384977
PAB 1
PEN 3.646011
PGK 4.106745
PHP 55.812007
PKR 280.971339
PLN 3.826801
PYG 7974.852027
QAR 3.641932
RON 4.595098
RSD 105.588895
RUB 80.500757
RWF 1428.782309
SAR 3.750748
SBD 8.350849
SCR 14.211704
SDG 600.469215
SEK 9.741895
SGD 1.305194
SHP 0.785843
SLE 22.75048
SLL 20969.48728
SOS 570.419531
SRD 36.199503
STD 20697.981008
SVC 8.733172
SYP 13003.313899
SZL 18.292705
THB 33.258002
TJS 10.400007
TMT 3.5
TND 3.037043
TOP 2.40776
TRY 38.77753
TTD 6.77531
TWD 30.47175
TZS 2696.000211
UAH 41.462524
UGX 3652.679524
UYU 41.777225
UZS 12885.066485
VES 92.714987
VND 25957
VUV 119.97318
WST 2.778545
XAF 590.662242
XAG 0.030501
XAU 0.000308
XCD 2.700001
XDR 0.720178
XOF 590.662242
XPF 107.453315
YER 244.710951
ZAR 18.38368
ZMK 9001.202465
ZMW 26.279733
ZWL 321.999592
  • AEX

    0.7400

    922.75

    +0.08%

  • BEL20

    6.6200

    4416.72

    +0.15%

  • PX1

    7.0700

    7857.12

    +0.09%

  • ISEQ

    4.4400

    11105.73

    +0.04%

  • OSEBX

    3.1900

    1523.58

    +0.21%

  • PSI20

    73.2400

    7184.34

    +1.03%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    12.3200

    2579.72

    +0.48%

  • N150

    12.8100

    3569.92

    +0.36%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: © AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

S.Davis--ThChM