The China Mail - IA generativa recorre a livros para crescer

USD -
AED 3.672504
AFN 64.000368
ALL 82.087167
AMD 368.450607
ANG 1.790403
AOA 918.000367
ARS 1428.330353
AUD 1.418842
AWG 1.801525
AZN 1.70397
BAM 1.689603
BBD 2.013822
BDT 122.983888
BGN 1.69088
BHD 0.37683
BIF 2970.152477
BMD 1
BND 1.283746
BOB 6.909421
BRL 5.061504
BSD 0.99987
BTN 95.052482
BWP 13.460326
BYN 2.766446
BYR 19600
BZD 2.010971
CAD 1.39945
CDF 2295.000362
CHF 0.796927
CLF 0.022916
CLP 904.902596
CNY 6.771504
CNH 6.76346
COP 3492.894475
CRC 454.839964
CUC 1
CUP 26.5
CVE 95.257224
CZK 20.874704
DJF 178.057103
DKK 6.461104
DOP 58.710207
DZD 133.120816
EGP 51.846573
ERN 15
ETB 157.556391
EUR 0.863904
FJD 2.215904
FKP 0.745521
GBP 0.748195
GEL 2.65504
GGP 0.745521
GHS 11.098441
GIP 0.745521
GMD 73.000355
GNF 8759.016889
GTQ 7.622133
GYD 209.191828
HKD 7.83605
HNL 26.736642
HRK 6.513804
HTG 130.733014
HUF 304.250388
IDR 17779.3
ILS 2.92082
IMP 0.745521
INR 95.110504
IQD 1309.835428
IRR 1375877.503816
ISK 124.650386
JEP 0.745521
JMD 158.489914
JOD 0.70904
JPY 160.22504
KES 129.480368
KGS 87.450384
KHR 4017.105093
KMF 426.00035
KPW 900.00035
KRW 1518.020383
KWD 0.30848
KYD 0.833312
KZT 488.937843
LAK 22017.191482
LBP 89543.518639
LKR 335.207982
LRD 181.97918
LSL 16.286467
LTL 2.95274
LVL 0.60489
LYD 6.372943
MAD 9.260766
MDL 17.462745
MGA 4172.605935
MKD 53.254719
MMK 2099.254457
MNT 3578.100965
MOP 8.070062
MRU 39.65617
MUR 47.250378
MVR 15.460378
MWK 1733.834392
MXN 17.222904
MYR 4.057604
MZN 63.903729
NAD 16.286467
NGN 1360.503725
NIO 36.793227
NOK 9.513504
NPR 152.084143
NZD 1.715119
OMR 0.384251
PAB 0.99987
PEN 3.400458
PGK 4.378213
PHP 60.771038
PKR 278.191957
PLN 3.66995
PYG 6122.413719
QAR 3.65522
RON 4.526104
RSD 101.386549
RUB 72.4589
RWF 1468.359898
SAR 3.753804
SBD 8.045573
SCR 14.065224
SDG 600.503676
SEK 9.47869
SGD 1.284504
SHP 0.746601
SLE 24.650371
SLL 20969.503664
SOS 571.465595
SRD 37.509504
STD 20697.981008
STN 21.165392
SVC 8.74865
SYP 110.532098
SZL 16.273163
THB 32.873038
TJS 9.318906
TMT 3.51
TND 2.933437
TOP 2.40776
TRY 46.232504
TTD 6.791931
TWD 31.621504
TZS 2624.681439
UAH 44.803507
UGX 3749.298086
UYU 40.387024
UZS 11975.292644
VES 581.95784
VND 26310
VUV 119.415431
WST 2.743477
XAF 566.677033
XAG 0.014699
XAU 0.000237
XCD 2.70255
XCG 1.801996
XDR 0.704764
XOF 566.677033
XPF 103.027947
YER 238.603589
ZAR 16.31128
ZMK 9001.203584
ZMW 17.467928
ZWL 321.999592
IA generativa recorre a livros para crescer
IA generativa recorre a livros para crescer / foto: © AFP

IA generativa recorre a livros para crescer

Para expandir o negócio dos direitos autorais, o mundo editorial começa a assinar contratos com empresas de tecnologia para permitir que os seus livros alimentem as necessidades crescentes da inteligência artificial generativa.

Tamanho do texto:

A grande editora americana HarperCollins acaba de propor a alguns dos seus autores um contrato com uma sociedade de inteligência artificial para que esta possa usar os seus livros para treinar o seu modelo de IA generativa.

Em um e-mail consultado pela AFP, a empresa tecnológica, cuja identidade é confidencial, propõe 2.500 dólares (14.530 reais) por cada livro selecionado para treinar o seu modelo de linguagem durante um período de três anos.

Para produzir todos os tipos de conteúdo, esta tecnologia precisa ser alimentada continuamente com uma grande quantidade de dados.

Contactada pela AFP, a editora confirmou a operação.

"A HarperCollins fechou um acordo com uma empresa de tecnologia de inteligência artificial para autorizar o uso limitado de determinados títulos (…) para treinar modelos de IA, a fim de melhorar sua qualidade e desempenho", escreveu.

A editora especificou que o acordo "limita claramente a produção de modelos que respeitem os direitos autorais".

A oferta gerou opiniões divergentes no setor e escritores como o americano Daniel Kibblesmith rejeitaram-na categoricamente.

"Provavelmente faria isso por um bilhão de dólares. Faria isso por uma quantia de dinheiro que não me obrigaria a trabalhar mais, porque esse é o objetivo final desta tecnologia", publicou na rede social Bluesky.

- Novos materiais -

A HarperCollins é um dos maiores atores do setor a dar esse passo, mas não o primeiro.

A editora americana de livros científicos Wiley deu acesso "ao conteúdo de livros acadêmicos e profissionais publicados para uso específico na formação desses modelos por 23 milhões de dólares (133 milhões de reais) a uma grande empresa de tecnologia", disse a companhia em março durante a apresentação de seus resultados financeiros.

Este tipo de colaboração evidencia os problemas ligados ao desenvolvimento da inteligência artificial generativa, treinada com enormes quantidades de dados recolhidos na Internet, o que pode resultar em possíveis violações de direitos autorais.

Para Giada Pistilli, chefe de ética da Hugging Face, plataforma franco-americana de IA de acesso livre, o anúncio é um avanço, porque o conteúdo dos livros passa a ser monetizado. Mas lamenta a margem de negociação limitada para os autores.

"O que veremos é um mecanismo de acordos bilaterais entre empresas de novas tecnologias e editoras ou proprietários de direitos autorais, quando na minha opinião seria necessário um diálogo mais amplo para incluir todas as partes envolvidas", afirma.

"Viemos de muito longe", comenta Julien Chouraqui, diretor jurídico do sindicato editorial francês SNE. "É um progresso: o fato de haver um acordo significa que houve um diálogo e uma vontade de alcançar um equilíbrio no uso de dados de origem que estão protegidos por direitos autorais e que vão gerar valor", afirma.

Os editores de imprensa também estão se organizando para enfrentar esse problema. No final de 2023, o jornal americano The New York Times processou a OpenAI, criadora do programa ChatGPT, e a Microsoft, sua principal investidora, por violação de direitos autorais.

Outros veículos de comunicação optaram por fechar acordos com esta empresa pioneira em IA.

As empresas de tecnologia podem não ter outra opção senão investir a fundo para melhorar os seus produtos, já que suas bases de dados e materiais para treinar os seus modelos estão esgotando.

A imprensa americana publicou recentemente que os novos modelos em desenvolvimento dão sinais de ter atingido o seu limite, especialmente no Google, Anthropic e OpenAI.

"Na Internet, você coleta material lícito e ilícito e muito conteúdo pirateado. Isso implica um problema jurídico. Sem esquecer o problema da qualidade dos dados", afirma Julien Chouraqui, do SNE.

"Para que o desenvolvimento de um mercado seja alcançado sobre uma base virtuosa, todos os atores devem estar envolvidos", destaca.

I.Ko--ThChM