ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

The China Mail - ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

Beijing -1°C

USD -

AED 3.6725

AFN 64.476319

ALL 81.33475

AMD 376.94028

ANG 1.790415

AOA 917.000131

ARS 1396.011796

AUD 1.415408

AWG 1.8025

AZN 1.699896

BAM 1.64926

BBD 2.014277

BDT 122.307345

BGN 1.648974

BHD 0.377047

BIF 2950.229373

BMD 1

BND 1.264067

BOB 6.911004

BRL 5.240196

BSD 1.000055

BTN 90.587789

BWP 13.189806

BYN 2.866094

BYR 19600

BZD 2.011317

CAD 1.36116

CDF 2239.99957

CHF 0.76844

CLF 0.021831

CLP 861.920175

CNY 6.90065

CNH 6.90266

COP 3668.73

CRC 485.052916

CUC 1

CUP 26.5

CVE 92.982759

CZK 20.455049

DJF 178.092242

DKK 6.29619

DOP 62.299727

DZD 129.65702

EGP 46.841753

ERN 15

ETB 155.749963

EUR 0.84269

FJD 2.19355

FKP 0.733683

GBP 0.733335

GEL 2.690286

GGP 0.733683

GHS 11.006165

GIP 0.733683

GMD 73.493717

GNF 8777.558997

GTQ 7.67035

GYD 209.236037

HKD 7.817097

HNL 26.422572

HRK 6.352402

HTG 131.126252

HUF 319.331501

IDR 16828

ILS 3.08854

IMP 0.733683

INR 90.6003

IQD 1310.081964

IRR 42125.000158

ISK 122.190016

JEP 0.733683

JMD 156.510227

JOD 0.709003

JPY 153.012015

KES 128.999691

KGS 87.450011

KHR 4022.414207

KMF 416.000239

KPW 899.945229

KRW 1443.539974

KWD 0.30663

KYD 0.833418

KZT 494.893958

LAK 21461.579977

LBP 89559.702814

LKR 309.225755

LRD 186.464834

LSL 16.050478

LTL 2.95274

LVL 0.60489

LYD 6.305102

MAD 9.144464

MDL 16.981212

MGA 4374.957836

MKD 51.966174

MMK 2099.574581

MNT 3581.569872

MOP 8.053972

MRU 39.856982

MUR 45.895018

MVR 15.450136

MWK 1734.202515

MXN 17.186955

MYR 3.907503

MZN 63.8971

NAD 16.050478

NGN 1355.230128

NIO 36.800142

NOK 9.49049

NPR 144.93218

NZD 1.656985

OMR 0.384534

PAB 1.000148

PEN 3.355188

PGK 4.293069

PHP 57.888992

PKR 279.69946

PLN 3.549205

PYG 6558.925341

QAR 3.644697

RON 4.2938

RSD 98.941045

RUB 76.586287

RWF 1460.062066

SAR 3.750195

SBD 8.038668

SCR 13.56195

SDG 601.497214

SEK 8.91673

SGD 1.262615

SHP 0.750259

SLE 24.449754

SLL 20969.501164

SOS 571.059944

SRD 37.754034

STD 20697.981008

STN 20.660547

SVC 8.750574

SYP 11059.574895

SZL 16.047358

THB 31.039901

TJS 9.435908

TMT 3.51

TND 2.88338

TOP 2.40776

TRY 43.739797

TTD 6.78838

TWD 31.407497

TZS 2600.000079

UAH 43.128434

UGX 3540.03196

UYU 38.554298

UZS 12290.606435

VES 389.80653

VND 25970

VUV 119.325081

WST 2.701986

XAF 553.151102

XAG 0.012772

XAU 0.0002

XCD 2.70255

XCG 1.802336

XDR 0.687473

XOF 553.146437

XPF 100.56794

YER 238.324973

ZAR 15.962498

ZMK 9001.195114

ZMW 18.176912

ZWL 321.999592

ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

ECONOMIA 06.06.2024

Os grandes modelos de linguagem (LLM, na sigla em inglês), como o ChatGPT, um dos sistemas de inteligência artificial (IA) mais populares do mundo, ainda seguem tendo dificuldades para raciocinar usando a lógica e cometem erros frequentes, de acordo com um estudo.

Tamanho do texto:

Estes robôs conversacionais refletem os preconceitos de gênero, éticos e morais dos humanos presentes nos textos dos quais se alimentam, recorda o estudo publicado na quarta-feira (5) na revista Open Science da Royal Society britânica.

Mas eles também refletem estes preconceitos nos testes de raciocínio?, questionou Olivia Macmillan-Scott, doutoranda do departamento de Ciências da Computação da University College de Londres (UCL).

O resultado da pesquisa é que os LLM mostram "um raciocínio muitas vezes irracional, mas de uma forma diferente da dos humanos", explica a pesquisadora à AFP.

Sob a supervisão de Mirco Musolesi, professor e diretor do Machine Intelligence Lab da UCL, Macmillan-Scott apresentou sete modelos de linguagem — duas versões do ChatGPT (3.5 e 4), da OpenAI, Bard, do Google, Claude 2, da Anthropic, e três versões de LLaMA, da Meta — a uma série de testes psicológicos desenvolvidos para humanos.

Como esta tecnologia aborda o preconceito que leva a privilegiar soluções com um maior número de elementos, em detrimento daquelas com uma proporção adequada?

Um exemplo: se tivermos uma urna com nove bolinhas brancas e uma vermelha e outra urna com 92 bolinhas brancas e 8 vermelhas, qual devemos escolher para ter a melhor chance de obter uma bolinha vermelha?

A resposta correta é a primeira urna, visto que há 10% de possibilidades frente a 8% da segunda opção.

As respostas dos modelos de linguagem foram muito inconsistentes. Alguns responderam corretamente ao mesmo teste seis em cada dez vezes. Outros apenas duas em cada dez, embora o teste não tenha mudado. "Cada vez obtemos uma resposta diferente", diz a pesquisadora.

Os LLM "podem ser bons para resolver uma equação matemática complicada, mas logo te dizem que 7 mais 3 é igual a 12", constatou.

- "Não tenho muita certeza" -

Estes modelos "não falham nestas tarefas da mesma forma que um humano", afirma o estudo. É o que Musolesi chama de "erros de máquina".

"Existe uma forma de raciocínio lógico que é potencialmente correta se a considerarmos por etapas, mas que é errada tomada como um todo", ressalta.

A máquina funciona com "uma espécie de pensamento linear", diz o professor, e cita o modelo Bard (atual Gemini), capaz de realizar corretamente as diferentes fases de uma tarefa, mas que obtém um resultado final incorreto por não ter uma visão geral.

Sobre esta questão, o professor de ciências da computação Maxime Amblard, da University of Lorraine, na França, recorda que os LLM, como todas as inteligências artificiais generativas, não funcionam como os humanos".

Os humanos são "máquinas capazes de criar significado", o que as máquinas não conseguem, explica à AFP.

Existem diferenças entre os diferentes modelos de linguagem e em geral, o GPT-4, sem ser infalível, obteve resultados melhores que os demais.

Macmillan-Scott suspeita que os modelos "fechados", cujo código operacional permanece secreto, "incorporam mecanismos em segundo plano" para responder a questões matemáticas.

De toda forma, neste momento é impensável confiar uma decisão importante a um LLM. Segundo o professor Musolesi, eles deveriam ser treinados para responder "não tenho muita certeza" quando necessário.

E.Choi--ThChM

The China Mail - ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

Apresentou

Hollywood acusa IA chinesa Seedance de infração em larga escala dos direitos autorais

Escritor holandês Cees Nooteboom morre aos 92 anos

Governo Trump encerra operação contra imigrantes em Minnesota

Governo Trump encerra operação especial contra imigrantes em Minnesota