The China Mail - La diversidad del español, enloquecedora para la inteligencia artificial

USD -
AED 3.672499
AFN 68.259794
ALL 83.120057
AMD 382.235819
ANG 1.789783
AOA 917.000215
ARS 1298.484397
AUD 1.534295
AWG 1.80075
AZN 1.695316
BAM 1.671303
BBD 2.016262
BDT 121.326577
BGN 1.671134
BHD 0.376994
BIF 2977.948874
BMD 1
BND 1.280341
BOB 6.900382
BRL 5.407104
BSD 0.998603
BTN 87.334595
BWP 13.363982
BYN 3.331382
BYR 19600
BZD 2.005836
CAD 1.38042
CDF 2895.000227
CHF 0.805972
CLF 0.024576
CLP 964.063464
CNY 7.182099
CNH 7.183135
COP 4031.01
CRC 504.599504
CUC 1
CUP 26.5
CVE 94.225872
CZK 20.903502
DJF 177.82753
DKK 6.375935
DOP 61.466287
DZD 129.654672
EGP 48.329591
ERN 15
ETB 140.642606
EUR 0.854304
FJD 2.2538
FKP 0.737572
GBP 0.737445
GEL 2.68994
GGP 0.737572
GHS 10.834715
GIP 0.737572
GMD 72.497294
GNF 8658.090042
GTQ 7.659244
GYD 208.841073
HKD 7.82647
HNL 26.140049
HRK 6.4363
HTG 130.666063
HUF 337.143505
IDR 16187.15
ILS 3.387505
IMP 0.737572
INR 87.3964
IQD 1308.113328
IRR 42112.502679
ISK 122.339779
JEP 0.737572
JMD 159.788419
JOD 0.708996
JPY 147.363497
KES 129.203315
KGS 87.378803
KHR 4000.051272
KMF 420.509134
KPW 900
KRW 1384.510099
KWD 0.30546
KYD 0.832141
KZT 540.925541
LAK 21613.699871
LBP 89423.919127
LKR 300.572107
LRD 200.216196
LSL 17.560982
LTL 2.952741
LVL 0.60489
LYD 5.400625
MAD 8.996133
MDL 16.651499
MGA 4442.697407
MKD 52.572
MMK 2099.006724
MNT 3595.738654
MOP 8.047443
MRU 39.944114
MUR 45.479878
MVR 15.410003
MWK 1731.532555
MXN 18.73915
MYR 4.221065
MZN 63.890077
NAD 17.560832
NGN 1530.104375
NIO 36.744756
NOK 10.19582
NPR 139.735181
NZD 1.68417
OMR 0.384487
PAB 0.998611
PEN 3.559456
PGK 4.154721
PHP 57.058998
PKR 283.315573
PLN 3.635641
PYG 7313.061052
QAR 3.640768
RON 4.327202
RSD 100.090178
RUB 79.707823
RWF 1445.948891
SAR 3.752537
SBD 8.223773
SCR 14.743291
SDG 600.498055
SEK 9.55348
SGD 1.282035
SHP 0.785843
SLE 23.298647
SLL 20969.49797
SOS 570.654612
SRD 37.559969
STD 20697.981008
STN 20.935966
SVC 8.737561
SYP 13001.739664
SZL 17.555448
THB 32.459813
TJS 9.31189
TMT 3.51
TND 2.918511
TOP 2.342099
TRY 40.900995
TTD 6.775562
TWD 29.974986
TZS 2606.768023
UAH 41.215055
UGX 3554.887115
UYU 39.949753
UZS 12564.143099
VES 135.47035
VND 26285
VUV 119.151671
WST 2.766277
XAF 560.534423
XAG 0.026266
XAU 0.000299
XCD 2.70255
XCG 1.799724
XDR 0.697125
XOF 560.534423
XPF 101.911155
YER 240.274966
ZAR 17.59053
ZMK 9001.199569
ZMW 23.14236
ZWL 321.999592
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: © AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

A.Sun--ThChM