The China Mail - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

USD -
AED 3.672501
AFN 68.590587
ALL 83.349791
AMD 381.498727
ANG 1.789783
AOA 917.000069
ARS 1300.499989
AUD 1.556033
AWG 1.80025
AZN 1.6977
BAM 1.677085
BBD 2.011508
BDT 121.343863
BGN 1.676901
BHD 0.377052
BIF 2978.845643
BMD 1
BND 1.28401
BOB 6.901105
BRL 5.485898
BSD 0.998722
BTN 86.903506
BWP 13.427486
BYN 3.356829
BYR 19600
BZD 2.003619
CAD 1.387675
CDF 2872.999976
CHF 0.805165
CLF 0.02461
CLP 965.450033
CNY 7.1762
CNH 7.181235
COP 4026.5
CRC 504.7205
CUC 1
CUP 26.5
CVE 94.551488
CZK 21.03865
DJF 177.844091
DKK 6.40347
DOP 62.124998
DZD 130.084022
EGP 48.62498
ERN 15
ETB 141.789581
EUR 0.857902
FJD 2.2733
FKP 0.74349
GBP 0.742385
GEL 2.694982
GGP 0.74349
GHS 10.935611
GIP 0.74349
GMD 71.999972
GNF 8658.071763
GTQ 7.654842
GYD 208.945369
HKD 7.811715
HNL 26.16812
HRK 6.464694
HTG 130.681964
HUF 339.470504
IDR 16307.95
ILS 3.418565
IMP 0.74349
INR 87.19395
IQD 1308.105883
IRR 42049.999766
ISK 123.019964
JEP 0.74349
JMD 160.008232
JOD 0.709014
JPY 147.557499
KES 129.196211
KGS 87.442302
KHR 4002.778278
KMF 422.497601
KPW 900.00801
KRW 1397.405021
KWD 0.30563
KYD 0.83224
KZT 537.77492
LAK 21614.999404
LBP 89871.033022
LKR 301.237363
LRD 200.241813
LSL 17.669695
LTL 2.95274
LVL 0.60489
LYD 5.41507
MAD 9.019739
MDL 16.793147
MGA 4403.227604
MKD 52.81045
MMK 2098.932841
MNT 3596.07368
MOP 8.039342
MRU 39.389808
MUR 45.810133
MVR 15.401861
MWK 1731.793276
MXN 18.78645
MYR 4.2235
MZN 63.910195
NAD 17.669865
NGN 1537.130085
NIO 36.752159
NOK 10.194185
NPR 139.045953
NZD 1.716281
OMR 0.384501
PAB 0.998722
PEN 3.510034
PGK 4.143499
PHP 57.049034
PKR 283.387527
PLN 3.64799
PYG 7216.662808
QAR 3.630883
RON 4.340402
RSD 100.525976
RUB 80.548992
RWF 1445.647793
SAR 3.752955
SBD 8.220372
SCR 14.756019
SDG 600.513363
SEK 9.58233
SGD 1.286395
SHP 0.785843
SLE 23.300081
SLL 20969.49797
SOS 570.747477
SRD 37.819021
STD 20697.981008
STN 21.008493
SVC 8.738713
SYP 13001.955997
SZL 17.66997
THB 32.590129
TJS 9.328068
TMT 3.5
TND 2.87899
TOP 2.342095
TRY 40.93957
TTD 6.775563
TWD 30.496988
TZS 2490.885013
UAH 41.318224
UGX 3560.311785
UYU 40.11336
UZS 12500.000253
VES 137.956902
VND 26430
VUV 119.91017
WST 2.707396
XAF 562.47867
XAG 0.026474
XAU 0.000299
XCD 2.70255
XCG 1.799964
XDR 0.699543
XOF 562.000226
XPF 102.749917
YER 240.201353
ZAR 17.72655
ZMK 9001.195873
ZMW 23.31524
ZWL 321.999592
  • AEX

    -2.5400

    906.15

    -0.28%

  • BEL20

    -14.9400

    4803.93

    -0.31%

  • PX1

    -55.8100

    7917.04

    -0.7%

  • ISEQ

    -82.9000

    11593.58

    -0.71%

  • OSEBX

    10.6900

    1655.52

    +0.65%

  • PSI20

    -20.7600

    7965.61

    -0.26%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    13.1700

    3147.9

    +0.42%

  • N150

    -8.6500

    3752.63

    -0.23%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: © AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

S.Davis--ThChM