The China Mail - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.672504
AFN 63.503991
ALL 83.192586
AMD 375.730804
ANG 1.790083
AOA 917.000367
ARS 1385.503978
AUD 1.450747
AWG 1.8
AZN 1.70397
BAM 1.693993
BBD 2.007535
BDT 122.298731
BGN 1.709309
BHD 0.376597
BIF 2960.807241
BMD 1
BND 1.28353
BOB 6.91265
BRL 5.255304
BSD 0.996752
BTN 94.473171
BWP 13.741284
BYN 2.966957
BYR 19600
BZD 2.004591
CAD 1.38985
CDF 2282.50392
CHF 0.795017
CLF 0.023433
CLP 925.260396
CNY 6.91185
CNH 6.92017
COP 3662.985579
CRC 462.864319
CUC 1
CUP 26.5
CVE 95.504742
CZK 21.309304
DJF 177.489065
DKK 6.492704
DOP 59.330475
DZD 133.010264
EGP 52.642155
ERN 15
ETB 154.083756
EUR 0.866104
FJD 2.257404
FKP 0.75231
GBP 0.750441
GEL 2.680391
GGP 0.75231
GHS 10.921138
GIP 0.75231
GMD 73.503851
GNF 8739.335672
GTQ 7.62808
GYD 208.64406
HKD 7.82615
HNL 26.46399
HRK 6.545204
HTG 130.656966
HUF 338.020388
IDR 16990.8
ILS 3.13762
IMP 0.75231
INR 94.850204
IQD 1305.703521
IRR 1313250.000352
ISK 124.760386
JEP 0.75231
JMD 156.892296
JOD 0.70904
JPY 160.28704
KES 129.470356
KGS 87.450384
KHR 3992.031527
KMF 428.00035
KPW 899.886996
KRW 1508.00035
KWD 0.30791
KYD 0.830627
KZT 481.867394
LAK 21678.576069
LBP 89256.247023
LKR 313.975142
LRD 182.893768
LSL 17.115586
LTL 2.95274
LVL 0.60489
LYD 6.362652
MAD 9.315751
MDL 17.507254
MGA 4153.999394
MKD 53.388766
MMK 2102.490525
MNT 3571.507434
MOP 8.042181
MRU 39.797324
MUR 46.770378
MVR 15.450378
MWK 1728.292408
MXN 18.122104
MYR 3.924039
MZN 63.950377
NAD 17.115586
NGN 1383.460377
NIO 36.680958
NOK 9.70286
NPR 151.156728
NZD 1.745963
OMR 0.38408
PAB 0.996752
PEN 3.472089
PGK 4.307306
PHP 60.550375
PKR 278.184401
PLN 3.72275
PYG 6516.824737
QAR 3.634057
RON 4.427304
RSD 101.684639
RUB 81.295743
RWF 1455.545451
SAR 3.752751
SBD 8.042037
SCR 15.03876
SDG 601.000339
SEK 9.47367
SGD 1.292704
SHP 0.750259
SLE 24.550371
SLL 20969.510825
SOS 569.659175
SRD 37.601038
STD 20697.981008
STN 21.220389
SVC 8.721147
SYP 111.824334
SZL 17.114027
THB 32.495038
TJS 9.523624
TMT 3.5
TND 2.938634
TOP 2.40776
TRY 44.440368
TTD 6.772336
TWD 32.044404
TZS 2571.564679
UAH 43.689489
UGX 3713.134988
UYU 40.344723
UZS 12155.385215
VES 467.928355
VND 26337.5
VUV 119.756335
WST 2.77551
XAF 568.149495
XAG 0.014291
XAU 0.000222
XCD 2.70255
XCG 1.796371
XDR 0.706596
XOF 568.149495
XPF 103.295656
YER 238.603589
ZAR 17.12001
ZMK 9001.203584
ZMW 18.763154
ZWL 321.999592
  • AEX

    -10.5800

    960.22

    -1.09%

  • BEL20

    -21.0300

    4985.22

    -0.42%

  • PX1

    -67.6000

    7701.95

    -0.87%

  • ISEQ

    -51.7200

    11975.33

    -0.43%

  • OSEBX

    -6.5600

    1981.56

    -0.33%

  • PSI20

    -115.1700

    8882.11

    -1.28%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -13.4000

    3607.49

    -0.37%

  • N150

    -43.9600

    3778.5

    -1.15%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

F.Jackson--ThChM