The China Mail - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

USD -
AED 3.673055
AFN 65.500846
ALL 83.299581
AMD 382.280162
ANG 1.790055
AOA 916.999637
ARS 1407.999707
AUD 1.531476
AWG 1.8
AZN 1.702967
BAM 1.684198
BBD 2.013055
BDT 122.136156
BGN 1.68061
BHD 0.376987
BIF 2945
BMD 1
BND 1.300529
BOB 6.931234
BRL 5.296399
BSD 0.999466
BTN 88.614561
BWP 14.187976
BYN 3.409862
BYR 19600
BZD 2.010135
CAD 1.403065
CDF 2137.499154
CHF 0.793202
CLF 0.023703
CLP 929.88038
CNY 7.11275
CNH 7.09788
COP 3747.5
CRC 502.05818
CUC 1
CUP 26.5
CVE 95.37503
CZK 20.786103
DJF 177.720075
DKK 6.419803
DOP 64.397801
DZD 130.192986
EGP 47.190197
ERN 15
ETB 153.604567
EUR 0.85972
FJD 2.277975
FKP 0.76162
GBP 0.75832
GEL 2.697209
GGP 0.76162
GHS 10.950268
GIP 0.76162
GMD 72.999935
GNF 8684.999762
GTQ 7.66177
GYD 209.09956
HKD 7.771365
HNL 26.310445
HRK 6.476699
HTG 130.836534
HUF 330.442506
IDR 16726.45
ILS 3.22305
IMP 0.76162
INR 88.81775
IQD 1310
IRR 42112.516238
ISK 126.38985
JEP 0.76162
JMD 160.37683
JOD 0.709036
JPY 154.583994
KES 129.250121
KGS 87.449721
KHR 4019.999852
KMF 425.000172
KPW 900.002739
KRW 1470.770319
KWD 0.30666
KYD 0.832885
KZT 522.657205
LAK 21695.000207
LBP 89549.999563
LKR 305.549336
LRD 181.999704
LSL 17.08008
LTL 2.95274
LVL 0.60489
LYD 5.459973
MAD 9.2825
MDL 16.821311
MGA 4499.999878
MKD 52.985322
MMK 2099.574422
MNT 3579.076518
MOP 8.000499
MRU 39.850052
MUR 45.860175
MVR 15.405002
MWK 1736.000307
MXN 18.31659
MYR 4.129017
MZN 63.95959
NAD 17.079844
NGN 1442.080301
NIO 36.770096
NOK 10.02392
NPR 141.783641
NZD 1.768795
OMR 0.384501
PAB 0.999427
PEN 3.369006
PGK 4.119769
PHP 58.904979
PKR 280.750138
PLN 3.636057
PYG 7040.597969
QAR 3.640904
RON 4.371496
RSD 100.742984
RUB 80.698614
RWF 1450
SAR 3.749903
SBD 8.237372
SCR 15.116449
SDG 600.50229
SEK 9.40741
SGD 1.300835
SHP 0.750259
SLE 23.374964
SLL 20969.498139
SOS 571.503947
SRD 38.588965
STD 20697.981008
STN 21.45
SVC 8.745635
SYP 11056.921193
SZL 17.079966
THB 32.330231
TJS 9.254993
TMT 3.5
TND 2.952498
TOP 2.40776
TRY 42.251397
TTD 6.757548
TWD 31.119797
TZS 2439.99992
UAH 42.0333
UGX 3658.079766
UYU 39.741144
UZS 12004.999822
VES 233.26555
VND 26330
VUV 122.187972
WST 2.81293
XAF 564.864178
XAG 0.019047
XAU 0.000239
XCD 2.70255
XCG 1.801381
XDR 0.704774
XOF 564.999911
XPF 103.249921
YER 238.503071
ZAR 17.052395
ZMK 9001.195814
ZMW 22.412628
ZWL 321.999592
  • AEX

    -6.9700

    961.51

    -0.72%

  • BEL20

    -40.1800

    5046.3

    -0.79%

  • PX1

    -9.0700

    8232.49

    -0.11%

  • ISEQ

    -31.4200

    12534.6

    -0.25%

  • OSEBX

    1.3000

    1623.58

    +0.08%

  • PSI20

    21.5600

    8315.49

    +0.26%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -60.5200

    4231.81

    -1.41%

  • N150

    0.7400

    3709.6

    +0.02%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: © AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

S.Davis--ThChM