The China Mail - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.673009
AFN 69.50195
ALL 83.649622
AMD 383.809799
ANG 1.789699
AOA 916.999704
ARS 1316.77823
AUD 1.530805
AWG 1.8
AZN 1.705966
BAM 1.6848
BBD 2.019382
BDT 121.643623
BGN 1.675245
BHD 0.377027
BIF 2950
BMD 1
BND 1.286899
BOB 6.911762
BRL 5.392039
BSD 1.000129
BTN 87.680214
BWP 13.465142
BYN 3.30176
BYR 19600
BZD 2.009089
CAD 1.37673
CDF 2889.999703
CHF 0.807241
CLF 0.024372
CLP 955.649648
CNY 7.179203
CNH 7.184255
COP 4019.65
CRC 505.955073
CUC 1
CUP 26.5
CVE 94.849691
CZK 20.947975
DJF 177.719953
DKK 6.391095
DOP 61.42501
DZD 129.867194
EGP 48.4511
ERN 15
ETB 139.549762
EUR 0.85641
FJD 2.251297
FKP 0.745486
GBP 0.740255
GEL 2.695011
GGP 0.745486
GHS 10.524978
GIP 0.745486
GMD 72.50092
GNF 8674.999953
GTQ 7.673687
GYD 209.256747
HKD 7.850085
HNL 26.350123
HRK 6.453098
HTG 131.12791
HUF 338.636051
IDR 16249.5
ILS 3.41913
IMP 0.745486
INR 87.59555
IQD 1310
IRR 42124.999697
ISK 122.640234
JEP 0.745486
JMD 159.986217
JOD 0.709026
JPY 147.730491
KES 129.499323
KGS 87.350127
KHR 4006.999968
KMF 421.498872
KPW 900.034015
KRW 1383.839879
KWD 0.30515
KYD 0.833495
KZT 540.97478
LAK 21600.000179
LBP 89550.000141
LKR 301.141405
LRD 201.50636
LSL 17.669649
LTL 2.95274
LVL 0.60489
LYD 5.424987
MAD 9.059496
MDL 16.79826
MGA 4435.000164
MKD 53.012878
MMK 2098.920925
MNT 3594.03125
MOP 8.087355
MRU 39.940255
MUR 45.50212
MVR 15.397068
MWK 1736.50232
MXN 18.57335
MYR 4.230253
MZN 63.960304
NAD 17.670237
NGN 1537.398196
NIO 36.749613
NOK 10.219345
NPR 140.279106
NZD 1.67849
OMR 0.384495
PAB 1.000194
PEN 3.529018
PGK 4.147403
PHP 56.842033
PKR 284.000062
PLN 3.643425
PYG 7491.062583
QAR 3.640504
RON 4.335101
RSD 100.311735
RUB 79.649369
RWF 1444
SAR 3.752999
SBD 8.230592
SCR 14.173667
SDG 600.469553
SEK 9.54263
SGD 1.282595
SHP 0.785843
SLE 23.195189
SLL 20969.503947
SOS 571.494136
SRD 37.4185
STD 20697.981008
STN 21.35
SVC 8.751346
SYP 13002.086727
SZL 17.670469
THB 32.409766
TJS 9.351942
TMT 3.51
TND 2.878501
TOP 2.3421
TRY 40.738057
TTD 6.786845
TWD 29.914977
TZS 2534.999864
UAH 41.497782
UGX 3560.322178
UYU 39.944868
UZS 12624.000171
VES 132.75255
VND 26270
VUV 119.26542
WST 2.657465
XAF 565.102625
XAG 0.026359
XAU 0.000299
XCD 2.70255
XCG 1.802472
XDR 0.702337
XOF 562.512179
XPF 102.597777
YER 240.274965
ZAR 17.581345
ZMK 9001.198539
ZMW 23.079408
ZWL 321.999592
  • AEX

    0.9800

    895.11

    +0.11%

  • BEL20

    -1.8900

    4724.63

    -0.04%

  • PX1

    54.6600

    7753.42

    +0.71%

  • ISEQ

    85.5900

    11497.68

    +0.75%

  • OSEBX

    11.7700

    1623.67

    +0.73%

  • PSI20

    10.0700

    7754.94

    +0.13%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -4.6300

    3079.22

    -0.15%

  • N150

    12.9400

    3709.11

    +0.35%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

F.Jackson--ThChM