Izašao novi GPT koji ozbiljno razmišlja

GPT-401 dostupan je pretplatnicima premium verzije Chat GPT-ja u izborniku modela u preview verziji.

20.09.2024
0
8621

OpenAI je nedavno objavio da je razvio novi model AI-ja, GPT-401, ili kraće 01 koji simulira ljudsku sposobnost za "dublje" razmišljanje prije donošenja odgovora, što ga čini idealnim za rješavanje složenih zadataka.

Visoka točnost od 83% na Olimpijadi

Američka kompanija tvrdi da novi model može duže, u uzastopnim, sustavnim koracima promišljati složene zadatke te rješavati teže probleme iz znanosti, matematike i kodiranja nego što su to mogli raniji modeli.

U testiranjima koja je proveo OpenAI, ovaj je model postigao točnost od 83% u rješavanju zadataka s Olimpijade iz matematike, čime je daleko nadmašio GPT-4, koji je postigao samo 13% točnosti.

Kompanija također tvrdi da je postigao izvanredne rezultate u kodiranju kojima se plasirao u 89. percentil u natjecanjima poput Codeforcesa te da bi po svojim rezultatima bio među 500 najboljih srednjoškolaca na Američkoj matematičkoj olimpijadi, koja obuhvaća geometriju, teoriju brojeva i druge matematičke teme.

Model je također obučen za odgovaranje na pitanja na doktorskoj razini iz područja kao što su astrofizika i organska kemija. Na doktorskoj razini točnost mu je bila 78%, u usporedbi sa 69.7% kod ljudi te 56.1% kod modela GPT-4a.

GPT-401 dostupan je pretplatnicima premium verzije Chat GPT-ja u izborniku modela u preview verziji.

Za neku ozbiljniju ocjenu novog modela trebat će pričekati da prođe kroz ruke i testiranja ozbiljnih znanstvenika i kodera.

Povećana sigurnost

Kao jedna od prednosti novog modela navodi se i njegova sposobnost da kroz novi pristup sigurnosnim pravilima bolje prepoznaje pokušaje zloupotrebe, čime se značajno povećava njegova otpornost na tzv. “jailbreaking”.

To znači da bi GPT-401 trebao biti značajno otporniji na tehnike koje korisnici znaju primjenjivati kako bi zaobišli ograničenja sigurnosnih mjera modela, kako bi AI-ju omogućili da odgovara na upite ili izvodi radnje koje su njegovi tvorci namjerno onemogućili ili zabranili.

Sporost i visoka cijena

Ipak, nisu svi oduševljeni sposobnostima novog modela.

Kompanija sama priznaje da mu, iako je moćan za kompleksne zadatke, još uvijek nedostaju određene ključne funkcije koje su korisne u svakodnevnom radu, poput pretraživanja interneta i upravljanja datotekama.

Brojni kritičari ističu da ih smeta njegova sporost te visoka cijena koja je rezultat dužeg i dubljeg promišljanja.

Primjerice, u slučaju GPT-40 cijena za obradu ulaznih tokena iznosi oko 2.5 USD za milijun tokena, dok je cijena za izlazne tokene 10 USD za milijun tokena.

GPT-401 (o1-preview) je značajno skuplji - cijena ulaznih tokena je 15 USD za milijun tokena, dok izlazni tokeni koštaju 60 USD za milijun tokena.

Verzija GPT-401 Mini (o1-mini) je povoljnija s cijenom od 3 USD za milijun ulaznih tokena i 12 USD za milijun izlaznih tokena.

Kritike na forumu

Neki korisnici koji su ga testirali, ocijenili su na forumu OpenAI zajednice da im je lošiji od modela 40.

„U mom testiranju, O1 je bio lošiji. Dao je tri pogrešna prijedloga za zadatak programiranja koji bi 4o ispravno riješio. Čini se da je 'razmišljanje' samo više slojeva političkog filtriranja, što ga čini beskorisnim za učenje povijesti. Na testu o 'osobnim pitanjima' samo je rekao 'potraži pomoć'. Također nije htio odglumiti lik. Molim vas, nemojte isključivati 4o u korist ovog“, poručio je jedan.

No jedan drugi korisnik istaknuo je da ne razumije niti se slaže s takvim brzopletim opisima o1.

„Intenzivno testiram o1 već dva dana. Izuzetno je moćan u svom autoregresivnom konceptualnom procesu. Bit će potrebno najmanje 100 složenih dijaloga kako bi se u potpunosti procijenile njegove mogućnosti i ograničenja“, poručio je.

Koristan za neke, ali ne za sve

Dakle, mogli bismo zaključiti da je za uobičajene scenarije i većinu korisnika GPT-4 za sada i dalje bolja opcija zbog šire primjene i pristupačnosti.

Ipak, treba imati na umu da je ovo tek prvi korak u razvoju cijele nove serije modela, što znači da treba pričekati da se vidi što će se dalje zbivati - hoće li se GPT-401 obogatiti svim funkcijama koje ima i 40, hoće li postojati različite verzije za različite korisnike te hoće li jeftiniji mini modeli dobro ispunjavati određene partikularne potrebe. Bit će svakako zanimljivo pratiti u kojem smjeru će se serija novih modela razvijati.

Nenad Jarić Dauenhauer

umjetna inteligencija