The China Mail - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.672502
AFN 64.999742
ALL 81.644561
AMD 376.141087
ANG 1.79008
AOA 916.999857
ARS 1431.814101
AUD 1.420313
AWG 1.8025
AZN 1.701514
BAM 1.653884
BBD 2.008101
BDT 121.931419
BGN 1.67937
BHD 0.377009
BIF 2954.631939
BMD 1
BND 1.269629
BOB 6.889437
BRL 5.208197
BSD 0.996985
BTN 90.310223
BWP 13.199274
BYN 2.864282
BYR 19600
BZD 2.005133
CAD 1.362925
CDF 2199.999814
CHF 0.771034
CLF 0.021682
CLP 856.101971
CNY 6.93895
CNH 6.92092
COP 3687.3
CRC 494.264586
CUC 1
CUP 26.5
CVE 93.244597
CZK 20.396903
DJF 177.53856
DKK 6.290765
DOP 62.922545
DZD 129.560437
EGP 46.913699
ERN 15
ETB 154.992326
EUR 0.842285
FJD 2.19785
FKP 0.735168
GBP 0.733175
GEL 2.695001
GGP 0.735168
GHS 10.95697
GIP 0.735168
GMD 73.000292
GNF 8751.427001
GTQ 7.647131
GYD 208.594249
HKD 7.815605
HNL 26.335973
HRK 6.347027
HTG 130.607585
HUF 317.655962
IDR 16820
ILS 3.10133
IMP 0.735168
INR 90.704953
IQD 1306.09242
IRR 42125.000158
ISK 122.129721
JEP 0.735168
JMD 156.042163
JOD 0.708984
JPY 156.410502
KES 129.000176
KGS 87.4497
KHR 4023.50852
KMF 419.000156
KPW 899.993603
KRW 1462.869981
KWD 0.30723
KYD 0.830842
KZT 493.296182
LAK 21424.79631
LBP 89285.155573
LKR 308.45077
LRD 187.436313
LSL 16.084528
LTL 2.95274
LVL 0.60489
LYD 6.313395
MAD 9.152964
MDL 16.998643
MGA 4425.972357
MKD 51.934321
MMK 2099.674626
MNT 3566.287566
MOP 8.023357
MRU 39.421935
MUR 45.979759
MVR 15.449848
MWK 1728.784464
MXN 17.238375
MYR 3.934498
MZN 63.750242
NAD 16.084936
NGN 1361.820298
NIO 36.691895
NOK 9.63249
NPR 144.492692
NZD 1.660175
OMR 0.384497
PAB 0.997011
PEN 3.354658
PGK 4.275524
PHP 58.478961
PKR 278.785014
PLN 3.54845
PYG 6587.403599
QAR 3.634057
RON 4.288696
RSD 98.868041
RUB 77.499
RWF 1455.142001
SAR 3.75029
SBD 8.058149
SCR 14.635215
SDG 601.50203
SEK 8.989175
SGD 1.26869
SHP 0.750259
SLE 24.449957
SLL 20969.499267
SOS 568.763662
SRD 37.817988
STD 20697.981008
STN 20.718028
SVC 8.723632
SYP 11059.574895
SZL 16.081146
THB 31.19801
TJS 9.342049
TMT 3.505
TND 2.891585
TOP 2.40776
TRY 43.592802
TTD 6.751597
TWD 31.579019
TZS 2581.09701
UAH 42.823946
UGX 3547.463711
UYU 38.535857
UZS 12243.189419
VES 377.985125
VND 25910
VUV 119.675943
WST 2.73072
XAF 554.690017
XAG 0.012417
XAU 0.000199
XCD 2.70255
XCG 1.796902
XDR 0.689856
XOF 554.690017
XPF 100.851138
YER 238.397724
ZAR 16.01765
ZMK 9001.197378
ZMW 18.568958
ZWL 321.999592
  • AEX

    -0.7000

    994.69

    -0.07%

  • BEL20

    9.9300

    5527.19

    +0.18%

  • PX1

    14.0700

    8288.31

    +0.17%

  • ISEQ

    101.0500

    13396.65

    +0.76%

  • OSEBX

    9.0800

    1825.14

    +0.5%

  • PSI20

    9.7800

    8900.17

    +0.11%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -84.1400

    4000.2

    -2.06%

  • N150

    27.2700

    4037.96

    +0.68%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

F.Jackson--ThChM