The China Mail - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.673042
AFN 71.007121
ALL 87.177673
AMD 389.933212
ANG 1.80229
AOA 917.000367
ARS 1172.024415
AUD 1.55135
AWG 1.8
AZN 1.70397
BAM 1.730107
BBD 2.023884
BDT 121.783361
BGN 1.730107
BHD 0.377903
BIF 2981.556018
BMD 1
BND 1.300632
BOB 6.926445
BRL 5.656604
BSD 1.002344
BTN 84.711398
BWP 13.647662
BYN 3.280375
BYR 19600
BZD 2.013446
CAD 1.38245
CDF 2871.000362
CHF 0.826578
CLF 0.024656
CLP 949.55991
CNY 7.271604
CNH 7.21136
COP 4268.654076
CRC 506.877792
CUC 1
CUP 26.5
CVE 97.540802
CZK 22.046504
DJF 178.495289
DKK 6.604904
DOP 58.870361
DZD 132.406564
EGP 50.738202
ERN 15
ETB 134.130833
EUR 0.88485
FJD 2.255904
FKP 0.752955
GBP 0.753352
GEL 2.740391
GGP 0.752955
GHS 14.082887
GIP 0.752955
GMD 71.503851
GNF 8682.383122
GTQ 7.719935
GYD 210.323323
HKD 7.750804
HNL 26.031227
HRK 6.667404
HTG 130.824008
HUF 357.970388
IDR 16466.95
ILS 3.587704
IMP 0.752955
INR 84.526504
IQD 1313.105401
IRR 42112.503816
ISK 129.310386
JEP 0.752955
JMD 158.989783
JOD 0.709204
JPY 144.935504
KES 129.656332
KGS 87.450384
KHR 4016.099783
KMF 434.503794
KPW 899.925072
KRW 1399.903789
KWD 0.30664
KYD 0.835331
KZT 517.838029
LAK 21675.438984
LBP 89812.021761
LKR 300.154806
LRD 200.477686
LSL 18.451855
LTL 2.95274
LVL 0.60489
LYD 5.473042
MAD 9.29444
MDL 17.240922
MGA 4552.16949
MKD 54.429652
MMK 2099.212117
MNT 3573.439014
MOP 8.002742
MRU 39.924809
MUR 45.330378
MVR 15.410378
MWK 1738.068911
MXN 19.580504
MYR 4.261504
MZN 64.000344
NAD 18.451855
NGN 1603.710377
NIO 36.887965
NOK 10.416604
NPR 135.53806
NZD 1.681945
OMR 0.385039
PAB 1.002344
PEN 3.674908
PGK 4.155867
PHP 55.510375
PKR 281.664912
PLN 3.784964
PYG 8019.815118
QAR 3.657835
RON 4.405604
RSD 103.675527
RUB 82.699014
RWF 1414.74634
SAR 3.750083
SBD 8.340429
SCR 14.218038
SDG 600.503676
SEK 9.654604
SGD 1.299704
SHP 0.785843
SLE 22.790371
SLL 20969.483762
SOS 572.869211
SRD 36.825038
STD 20697.981008
SVC 8.770843
SYP 13001.036716
SZL 18.443982
THB 33.085038
TJS 10.374453
TMT 3.5
TND 3.00721
TOP 2.342104
TRY 38.461804
TTD 6.797293
TWD 30.719304
TZS 2699.367509
UAH 41.850767
UGX 3671.989031
UYU 42.062895
UZS 12930.249016
VES 86.73797
VND 26005
VUV 121.147592
WST 2.778342
XAF 580.261843
XAG 0.031223
XAU 0.000309
XCD 2.70255
XDR 0.72166
XOF 580.261843
XPF 105.497811
YER 244.650363
ZAR 18.393804
ZMK 9001.203587
ZMW 27.820779
ZWL 321.999592
  • AEX

    19.7500

    897.63

    +2.25%

  • BEL20

    63.7900

    4493.31

    +1.44%

  • PX1

    176.9300

    7770.48

    +2.33%

  • ISEQ

    304.9700

    10678.12

    +2.94%

  • OSEBX

    23.0500

    1510.15

    +1.55%

  • PSI20

    -26.5700

    6965.57

    -0.38%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    38.5300

    2914.04

    +1.34%

  • N150

    53.1500

    3460.15

    +1.56%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

F.Jackson--ThChM