Основна тема
Црно/бијела тема
Инверзна тема
MNE Play
MNE Play

Подешавaња

Умањи / Увећај

Изаберите тему

Основна тема
Црно/бијела тема
Инверзна тема

Hana Fuks  [ DW ]

12. 08. 2025. 07:11

Veštačka inteligencija: rešava sudoku, ali ne ume da objasni kako

Ovo nije robot

Sudoku se smatra vežbom za mozak. Uz malo strpljenja i logičkim razmišljanjem - obično može rešiti. Ali šta se dešava kada se isti zadatak postavi veštačkoj inteligenciji (VI)? Upravo to su istražili naučnici sa Univerziteta Kolorado u Bolderu, SAD - sa prilično iznenađujućim rezultatom.

Neki VI-modeli, takozvani veliki jezički modeli (LLM), mogli su da reše jednostavne sudoku zaadatke. Međutim, čak i najbolji među njima davali su nejasna, netačna ili apsurdna objašnjenja o tome kako su došli do rešenja.

Sudoku

2300 sudokua, mnogo grešaka

Za eksperiment, tim je kreirao oko 2300 sudoku zagonetki u pojednostavljenom 6x6 formatu. Testirano je nekoliko VI-modela, uključujući ChatGPT-o1-preview, koji je tada bio jedan od najnaprednijih sistema.

Dok je o1 tačno rešio oko 65 procenata sudoku zagonetki, drugi modeli su bili ispod jednog procenta.

Vremenska prognoza umesto puta do rešenja

Ali pravi problem se pokazao u sledećem koraku: kada je trebalo da VI-modeli objasne svoj put do rešenja.

„Ponekad su VI objašnjenja izmišljala činjenice", kaže Ašutoš Trivedi, koautor studije i vanredni profesor informatike na CU Bolderu. Ili nisu videli očigledna objašnjenja: „Tako je odgovor recimo bio: 'Ovde ne može stajati dvojka, jer u istom redu već postoji dvojka', ali to nije bio slučaj."

U posebno upečatljivom primeru, VI je iz nepoznatih razloga odgovorio vremenskom prognozom.

„U tom trenutku VI je potpuno poludela i bila zbunjena", kaže koautor studije Fabio Somenzi.

Tačan rezultat nije isto što i razumevanje

Mogli bismo reći: glavno da je rezultat tačan. Ali za istraživače, to je prejednostavan pogled.

„Kod određenih vrsta sudokua, većina LLM-ova je i dalje neadekvatna, posebno kada je reč o stvaranju objašnjenja koja su na bilo koji način korisna ljudima", kaže Marija Pačeko, koautorka studije i docentkinja na odseku za informatiku. „Zašto je došla do tog rešenja? Koji su koraci koje treba preduzeti da bi se do njega stiglo?"

Svoje rezultate tim je predstavio na stručnoj konferenciji ACL 2025. Rad je takođe objavljen u časopisu Findings of the Association for Computational Linguistics.

Razmišljanje ili pogađanje?

Cilj studije nije bio da diskredituje VI, već da otkrije kako veliki jezički modeli (LLM) zapravo „razmišljaju".

Sudoku je služio kao test, „mikrokosmos za mašinsko odlučivanje", kako ga naziva Somenzi, profesor na Fakultetu za elektrotehniku, računarstvo i energetiku.

„Ako dozvolite veštačkoj inteligenciji da vam izradi poresku prijavu, želećete da poreskoj upravi možete objasniti zašto je veštačka inteligencija napisala to što je napisala."

Centralno otkriće eksperimenta glasi: LLM-ovi uglavnom ne rešavaju sudoku kroz sistematsko razmišljanje zasnovano na pravilima, već kroz statističko pogađanje.

To je takođe zbog njihovog načina funkcionisanja: tokom razvoja ChatGPT-a, na primer, programeri su najpre hranili VI gotovo svim što je ikada napisano na internetu: u blogovima, društvenim mrežama, naučnim bazama podataka ili informativnim portalima.

Njihov zadatak je da predvide najverojatniju sledeću reč u rečenici, a ne da logički prodru u problem. „Ono što oni rade je u suštini predviđanje sledeće reči", kaže Pačeko. Statistički gledano.

Aplikacije veštačke inteligencije

Sledeći korak

Pačeko, Somenzi i njihov tim se nadaju da će razviti sopstveni VI sistem koji može sve - rešavati složene zagonetke i objasniti kako to radi. Za to počinju sa drugom vrstom zagonetke pod imenom Hitori, koja kao i sudoku, sadrži mrežu brojeva.

Pri tome se takođe oslanjaju na novi pristup: takozvanu neurosimboličku VI, koja je još uvek u ranoj fazi razvoja. Cilj je kombinovati memoriju LLM-a sa sposobnošću ljudskog mozga da razmišlja logično.

„Ljudi govore o rastućim sposobnostima veštačke inteligencije koja može rešavati stvari koje ne biste očekivali", kaže Pačeko. „Istovremeno, nije iznenađujuće da su i dalje loši u mnogim zadacima."

DW

Пратите нас на

Најновије

Најчитаније