The China Mail - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.672506
AFN 61.999578
ALL 81.576868
AMD 368.676191
ANG 1.79046
AOA 917.999571
ARS 1391.98214
AUD 1.38112
AWG 1.80125
AZN 1.696392
BAM 1.670681
BBD 2.014496
BDT 122.776371
BGN 1.66992
BHD 0.377215
BIF 2977.794672
BMD 1
BND 1.273528
BOB 6.911397
BRL 5.000242
BSD 1.000201
BTN 95.835344
BWP 14.087599
BYN 2.794335
BYR 19600
BZD 2.011549
CAD 1.372395
CDF 2241.000242
CHF 0.781902
CLF 0.022566
CLP 888.096786
CNY 6.79095
CNH 6.78277
COP 3793.17
CRC 454.512452
CUC 1
CUP 26.5
CVE 94.185227
CZK 20.76615
DJF 178.103898
DKK 6.38558
DOP 59.282798
DZD 132.521607
EGP 52.906395
ERN 15
ETB 156.163199
EUR 0.85452
FJD 2.1873
FKP 0.739691
GBP 0.74025
GEL 2.679887
GGP 0.739691
GHS 11.356696
GIP 0.739691
GMD 72.999828
GNF 8770.041599
GTQ 7.630738
GYD 209.246802
HKD 7.83311
HNL 26.599525
HRK 6.434697
HTG 130.972363
HUF 305.432018
IDR 17533.15
ILS 2.905245
IMP 0.739691
INR 95.73275
IQD 1310.201083
IRR 1313000.000423
ISK 122.720148
JEP 0.739691
JMD 158.141561
JOD 0.709005
JPY 157.943014
KES 129.310249
KGS 87.449882
KHR 4013.155085
KMF 420.999987
KPW 899.97066
KRW 1491.795007
KWD 0.30823
KYD 0.833543
KZT 473.448852
LAK 21923.91634
LBP 89565.336238
LKR 325.320759
LRD 183.032721
LSL 16.418345
LTL 2.95274
LVL 0.60489
LYD 6.348556
MAD 9.176212
MDL 17.192645
MGA 4189.000457
MKD 52.672503
MMK 2099.865061
MNT 3580.130218
MOP 8.069362
MRU 39.968052
MUR 46.882409
MVR 15.410131
MWK 1733.971717
MXN 17.198945
MYR 3.931501
MZN 63.898113
NAD 16.418345
NGN 1370.829901
NIO 36.808139
NOK 9.22733
NPR 153.332792
NZD 1.68627
OMR 0.384485
PAB 1.000184
PEN 3.418655
PGK 4.357259
PHP 61.522501
PKR 278.576188
PLN 3.62135
PYG 6094.852476
QAR 3.645884
RON 4.448098
RSD 100.306976
RUB 73.152172
RWF 1462.916693
SAR 3.759074
SBD 8.032258
SCR 13.749792
SDG 600.497735
SEK 9.32679
SGD 1.273385
SHP 0.746601
SLE 24.595264
SLL 20969.502105
SOS 571.616491
SRD 37.193987
STD 20697.981008
STN 20.928276
SVC 8.751249
SYP 110.528733
SZL 16.40606
THB 32.320309
TJS 9.346574
TMT 3.51
TND 2.914168
TOP 2.40776
TRY 45.434801
TTD 6.790867
TWD 31.526501
TZS 2601.397339
UAH 43.968225
UGX 3740.52909
UYU 39.831211
UZS 11992.073051
VES 508.06467
VND 26345
VUV 118.077659
WST 2.708521
XAF 560.318959
XAG 0.011509
XAU 0.000213
XCD 2.70255
XCG 1.802565
XDR 0.694969
XOF 560.316565
XPF 101.873721
YER 238.624977
ZAR 16.4075
ZMK 9001.195805
ZMW 18.82781
ZWL 321.999592
  • AEX

    9.5000

    1019.66

    +0.94%

  • BEL20

    15.9700

    5524.42

    +0.29%

  • PX1

    68.0700

    8075.72

    +0.85%

  • ISEQ

    41.3600

    12573.61

    +0.33%

  • OSEBX

    1.5900

    1985.91

    +0.08%

  • PSI20

    46.2700

    9119.04

    +0.51%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -21.8500

    4101.58

    -0.53%

  • N150

    25.2100

    4227.59

    +0.6%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

F.Jackson--ThChM