The China Mail - Pour grandir, l'IA générative se tourne vers les livres

USD -
AED 3.672497
AFN 65.476658
ALL 83.300435
AMD 382.280324
ANG 1.790055
AOA 917.000338
ARS 1407.957703
AUD 1.535898
AWG 1.8
AZN 1.703248
BAM 1.684198
BBD 2.013055
BDT 122.136156
BGN 1.683695
BHD 0.377061
BIF 2944.440385
BMD 1
BND 1.298153
BOB 6.931234
BRL 5.3143
BSD 0.999466
BTN 88.614561
BWP 14.187976
BYN 3.409862
BYR 19600
BZD 2.010135
CAD 1.40392
CDF 2137.500188
CHF 0.790715
CLF 0.023702
CLP 929.830194
CNY 7.11275
CNH 7.09782
COP 3745.98
CRC 502.05818
CUC 1
CUP 26.5
CVE 95.374983
CZK 20.805503
DJF 177.719815
DKK 6.42426
DOP 64.394136
DZD 130.265967
EGP 47.190897
ERN 15
ETB 153.599323
EUR 0.86023
FJD 2.278983
FKP 0.757017
GBP 0.760755
GEL 2.700507
GGP 0.757017
GHS 10.949779
GIP 0.757017
GMD 72.999716
GNF 8684.99959
GTQ 7.66177
GYD 209.09956
HKD 7.77325
HNL 26.310228
HRK 6.482902
HTG 130.597544
HUF 330.946018
IDR 16726.8
ILS 3.247105
IMP 0.757017
INR 88.71155
IQD 1310
IRR 42112.486604
ISK 126.29938
JEP 0.757017
JMD 160.37683
JOD 0.709013
JPY 154.542982
KES 129.350205
KGS 87.450162
KHR 3998.813765
KMF 425.000127
KPW 900.02171
KRW 1458.309872
KWD 0.30674
KYD 0.832885
KZT 522.657205
LAK 21694.99964
LBP 89171.810368
LKR 305.549336
LRD 182.000099
LSL 17.080069
LTL 2.95274
LVL 0.60489
LYD 5.460109
MAD 9.282499
MDL 16.821311
MGA 4499.99986
MKD 52.861525
MMK 2099.568332
MNT 3578.06314
MOP 8.000499
MRU 39.849864
MUR 45.649881
MVR 15.40497
MWK 1735.999932
MXN 18.37284
MYR 4.132501
MZN 63.959778
NAD 17.079803
NGN 1442.029986
NIO 36.770365
NOK 10.098797
NPR 141.783641
NZD 1.760365
OMR 0.384496
PAB 0.999427
PEN 3.369051
PGK 4.119604
PHP 59.120054
PKR 280.749991
PLN 3.642037
PYG 7040.597969
QAR 3.640903
RON 4.374695
RSD 100.796969
RUB 80.925379
RWF 1450
SAR 3.750043
SBD 8.237372
SCR 13.886917
SDG 601.499001
SEK 9.463005
SGD 1.30179
SHP 0.750259
SLE 23.375025
SLL 20969.498139
SOS 571.497823
SRD 38.589012
STD 20697.981008
STN 21.45
SVC 8.745635
SYP 11058.869089
SZL 17.079909
THB 32.450972
TJS 9.254993
TMT 3.5
TND 2.952498
TOP 2.40776
TRY 42.329902
TTD 6.757548
TWD 31.181985
TZS 2449.999921
UAH 42.0333
UGX 3658.079766
UYU 39.741144
UZS 12004.999839
VES 233.26555
VND 26350
VUV 121.860911
WST 2.809778
XAF 564.864178
XAG 0.019279
XAU 0.000242
XCD 2.70255
XCG 1.801381
XDR 0.704774
XOF 564.999617
XPF 103.250166
YER 238.483762
ZAR 17.1366
ZMK 9001.188498
ZMW 22.412628
ZWL 321.999592
  • AEX

    -19.6200

    941.92

    -2.04%

  • BEL20

    -72.6700

    4973.79

    -1.44%

  • PX1

    -125.9600

    8106.7

    -1.53%

  • ISEQ

    -250.6600

    12282.41

    -2%

  • OSEBX

    -17.7000

    1605.96

    -1.09%

  • PSI20

    -118.9100

    8196.4

    -1.43%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -60.5200

    4231.81

    -1.41%

  • N150

    -62.6900

    3646.99

    -1.69%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: © AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

A.Zhang--ThChM