ChatGPT V4 topper baren, SAT-er og kan identifisere utnyttelser i ETH-kontrakter

GPT-4, den nyeste versjonen av Artificial Intelligence (AI) chatbot, ChatGPT, kan bestå videregående skoleprøver og jusskoleeksamener med poengrangering i 90. persentilen og har nye behandlingsmuligheter som ikke var mulig med den tidligere versjonen.

Tallene fra GPT-4s testresultater ble delt 14. mars av skaperen OpenAI, og avslørte at den også kan konvertere bilde-, lyd- og videoinnganger til tekst i tillegg til å håndtere "mye mer nyanserte instruksjoner" mer kreativt og pålitelig.

"Den består en simulert bar-eksamen med en poengsum rundt de 10 % av testtakerne," la OpenAI til. "Derimot var poengsummen til GPT-3.5 rundt de nederste 10 %."

Tallene viser at GPT-4 oppnådde en poengsum på 163 i den 88. persentilen på LSAT-eksamenen - testen collegestudenter må bestå i USA for å bli tatt opp på jusstudiet.

Eksamensresultater for GPT-4 og GPT-3.5 på en rekke nyere amerikanske eksamener. Kilde: OpenAI

GPT4s poengsum vil sette den i en god posisjon for å bli tatt opp på en topp 20 jusskole, og er bare noen få merker mindre enn de rapporterte poengsummene som trengs for aksept til prestisjetunge skoler som Harvard, Stanford, Princeton eller Yale.

Den tidligere versjonen av ChatGPT scoret bare 149 på LSAT-en, og plasserte den blant de nederste 40 %.

GPT-4 fikk også 298 av 400 i Uniform Bar Exam - en test utført av nylig uteksaminerte jusstudenter som tillater dem å praktisere som advokat i enhver amerikansk jurisdiksjon.

UBE-poengskår måtte bli tatt opp for å praktisere jus i hver amerikansk jurisdiksjon. Kilde: Nasjonal konferanse for advokatfullmektig

Den gamle versjonen av ChatGPT slet i denne testen, og endte blant de nederste 10 % med en poengsum på 213 av 400.

Når det gjelder SAT Evidence-Based Reading & Writing og SAT Math-eksamener tatt av amerikanske high school-studenter for å måle deres collegeberedskap, scoret GPT-4 i henholdsvis 93. og 89. persentil.

GPT-4 utmerket seg også i de "harde" vitenskapene, og postet langt over gjennomsnittlig prosentilpoengscore i AP Biology (85-100%), Kjemi (71-88%) og Fysikk 2 (66-84%).

Eksamensresultater for GPT-4 og GPT-3.5 på en rekke nylige amerikanske eksamener. Kilde: OpenAI.

Imidlertid var AP Calculus-poengsummen ganske gjennomsnittlig, rangert i 43r til 59. persentilen.

Et annet område der GPT-4 manglet var i eksamener i engelsk litteratur, og postet poeng i 8. til 44. persentil over to separate tester.

OpenAI sa at GPT-4 og GPT-3.5 tok disse testene fra praksiseksamenene 2022-2023, og at "ingen spesifikk opplæring" ble tatt av språkbehandlingsverktøyene:

"Vi trente ikke spesielt for disse eksamenene. Et mindretall av problemene i eksamen ble sett av modellen under opplæringen, men vi mener resultatene er representative.»

Resultatene førte til frykt også i Twitter-samfunnet.

Relatert: Hvordan vil ChatGPT påvirke Web3-området? Bransjen svarer

Nick Almond, grunnleggeren av FactoryDAO fortalte hans 14,300 14 Twitter-følgere 4. mars at GPTXNUMX kommer til å "skremme folk" og det vil "kollapse" det globale utdanningssystemet.

Tidligere Coinbase-direktør, Conor Grogan, sa at han la inn en live Ethereum-smartkontrakt i GPT-4 og pekte umiddelbart på flere "sikkerhetssårbarheter" og skisserte hvordan koden kan utnyttes:

Tidligere smarte kontraktrevisjoner på ChatGPT fant at den første versjonen også var i stand til å oppdage kodefeil i en rimelig grad også.

Rowan Cheung, grunnleggeren av AI-nyhetsbrevet "The Rundown" delte en video av GPT som transkriberer en håndtegnet falsk nettside på et stykke papir til kode.