The China Mail - La diversidad del español, enloquecedora para la inteligencia artificial

USD -
AED 3.672504
AFN 66.344071
ALL 83.58702
AMD 382.869053
ANG 1.789982
AOA 917.000367
ARS 1405.057166
AUD 1.540832
AWG 1.805
AZN 1.70397
BAM 1.691481
BBD 2.013336
BDT 122.007014
BGN 1.69079
BHD 0.374011
BIF 2943.839757
BMD 1
BND 1.3018
BOB 6.91701
BRL 5.332404
BSD 0.999615
BTN 88.59887
BWP 13.420625
BYN 3.406804
BYR 19600
BZD 2.010326
CAD 1.40485
CDF 2150.000362
CHF 0.80538
CLF 0.024066
CLP 944.120396
CNY 7.11935
CNH 7.12515
COP 3780
CRC 501.883251
CUC 1
CUP 26.5
CVE 95.363087
CZK 21.009504
DJF 177.720393
DKK 6.457204
DOP 64.223754
DZD 129.411663
EGP 46.950698
ERN 15
ETB 154.306137
EUR 0.86435
FJD 2.28425
FKP 0.759642
GBP 0.759936
GEL 2.70504
GGP 0.759642
GHS 10.930743
GIP 0.759642
GMD 73.000355
GNF 8677.076622
GTQ 7.659909
GYD 209.133877
HKD 7.77703
HNL 26.282902
HRK 6.514104
HTG 133.048509
HUF 332.660388
IDR 16685.5
ILS 3.24758
IMP 0.759642
INR 88.639504
IQD 1309.474904
IRR 42100.000352
ISK 126.580386
JEP 0.759642
JMD 160.439
JOD 0.70904
JPY 153.43504
KES 129.203801
KGS 87.450384
KHR 4023.264362
KMF 421.00035
KPW 899.998686
KRW 1455.990383
KWD 0.306904
KYD 0.83302
KZT 524.767675
LAK 21703.220673
LBP 89512.834262
LKR 304.684561
LRD 182.526573
LSL 17.315523
LTL 2.95274
LVL 0.60489
LYD 5.458091
MAD 9.265955
MDL 17.042585
MGA 4492.856402
MKD 53.206947
MMK 2099.464216
MNT 3582.836755
MOP 8.007472
MRU 39.595594
MUR 45.910378
MVR 15.405039
MWK 1733.369658
MXN 18.44605
MYR 4.176039
MZN 63.950377
NAD 17.315148
NGN 1436.000344
NIO 36.782862
NOK 10.153804
NPR 141.758018
NZD 1.777162
OMR 0.38142
PAB 0.999671
PEN 3.37342
PGK 4.220486
PHP 58.805504
PKR 282.656184
PLN 3.665615
PYG 7072.77311
QAR 3.643196
RON 4.398804
RSD 102.170373
RUB 80.869377
RWF 1452.42265
SAR 3.750713
SBD 8.230592
SCR 13.652393
SDG 600.503676
SEK 9.528504
SGD 1.301038
SHP 0.750259
SLE 23.203667
SLL 20969.499529
SOS 571.228422
SRD 38.599038
STD 20697.981008
STN 21.189281
SVC 8.746265
SYP 11056.879504
SZL 17.321588
THB 32.395038
TJS 9.226139
TMT 3.51
TND 2.954772
TOP 2.342104
TRY 42.211304
TTD 6.77604
TWD 30.981804
TZS 2455.000335
UAH 41.915651
UGX 3498.408635
UYU 39.809213
UZS 12055.19496
VES 228.194038
VND 26310
VUV 122.189231
WST 2.820904
XAF 567.301896
XAG 0.020684
XAU 0.00025
XCD 2.70255
XCG 1.801521
XDR 0.707015
XOF 567.306803
XPF 103.14423
YER 238.503589
ZAR 17.29905
ZMK 9001.203584
ZMW 22.615629
ZWL 321.999592
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: © AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

A.Sun--ThChM