The China Mail - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.672981
AFN 62.999984
ALL 82.597888
AMD 368.060083
ANG 1.790403
AOA 916.999878
ARS 1481.256531
AUD 1.451358
AWG 1.80125
AZN 1.68207
BAM 1.71493
BBD 2.014108
BDT 123.249054
BGN 1.69088
BHD 0.377034
BIF 2975.014577
BMD 1
BND 1.293507
BOB 6.925154
BRL 5.189102
BSD 1.000039
BTN 94.490039
BWP 13.589892
BYN 2.900133
BYR 19600
BZD 2.011197
CAD 1.419815
CDF 2267.504195
CHF 0.807303
CLF 0.023428
CLP 922.060241
CNY 6.79815
CNH 6.79833
COP 3447.03
CRC 453.586914
CUC 1
CUP 26.5
CVE 96.684671
CZK 21.2308
DJF 177.720253
DKK 6.541155
DOP 59.466972
DZD 133.187486
EGP 49.201402
ERN 15
ETB 161.218522
EUR 0.87515
FJD 2.24725
FKP 0.757857
GBP 0.754305
GEL 2.644967
GGP 0.757857
GHS 11.31015
GIP 0.757857
GMD 73.000242
GNF 8766.638023
GTQ 7.629344
GYD 209.175084
HKD 7.841989
HNL 26.761891
HRK 6.593901
HTG 130.701074
HUF 309.838968
IDR 17868.95
ILS 2.98755
IMP 0.757857
INR 94.542202
IQD 1309.991977
IRR 1375250.000138
ISK 126.029814
JEP 0.757857
JMD 157.463469
JOD 0.709012
JPY 161.9355
KES 129.501624
KGS 87.45008
KHR 4021.166805
KMF 434.000271
KPW 900.00035
KRW 1541.080284
KWD 0.30956
KYD 0.833333
KZT 485.532407
LAK 22428.570802
LBP 89548.611111
LKR 336.248811
LRD 181.993547
LSL 16.430491
LTL 2.95274
LVL 0.604889
LYD 6.424601
MAD 9.371084
MDL 17.675014
MGA 4255.281837
MKD 53.944432
MMK 2099.649649
MNT 3579.92745
MOP 8.078178
MRU 39.910387
MUR 47.240213
MVR 15.450138
MWK 1734.006734
MXN 17.483585
MYR 4.071199
MZN 63.897811
NAD 16.430635
NGN 1381.869793
NIO 36.800779
NOK 9.918205
NPR 151.185701
NZD 1.769045
OMR 0.384495
PAB 1.000018
PEN 3.414923
PGK 4.390353
PHP 61.197085
PKR 278.074382
PLN 3.75255
PYG 6089.674735
QAR 3.645212
RON 4.588027
RSD 102.697996
RUB 76.998674
RWF 1467.978395
SAR 3.756538
SBD 8.051953
SCR 13.537737
SDG 599.999621
SEK 9.707925
SGD 1.292301
SHP 0.746601
SLE 24.798647
SLL 20969.503664
SOS 571.521265
SRD 37.494501
STD 20697.981008
STN 21.482654
SVC 8.749978
SYP 110.532098
SZL 16.426633
THB 33.25504
TJS 9.269869
TMT 3.5
TND 2.962063
TOP 2.40776
TRY 46.637499
TTD 6.798104
TWD 31.850497
TZS 2625.002971
UAH 44.880508
UGX 3665.2038
UYU 40.238326
UZS 12052.207233
VES 620.752985
VND 26290
VUV 119.179282
WST 2.780883
XAF 575.16627
XAG 0.017174
XAU 0.000249
XCD 2.70255
XCG 1.802247
XDR 0.716371
XOF 575.168792
XPF 104.571381
YER 238.625034
ZAR 16.408991
ZMK 9001.199474
ZMW 18.104658
ZWL 321.999592
  • AEX

    4.5600

    1065.34

    +0.43%

  • BEL20

    -20.6600

    5719.28

    -0.36%

  • PX1

    -17.6100

    8367.33

    -0.21%

  • ISEQ

    -131.0200

    13807.63

    -0.94%

  • OSEBX

    5.8900

    1906.43

    +0.31%

  • PSI20

    23.7500

    9159.49

    +0.26%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    1.7100

    4288.95

    +0.04%

  • N150

    -21.5800

    4127.8

    -0.52%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

F.Jackson--ThChM