Hvordan bruke ChatGPT 4.0

OpenAI nylig utgitt ChatGPT-4, den nyeste versjonen av ChatGPT, språkverktøyet Artificial Intelligence (AI) som har skapt mye blest i teknologibransjen. Den nyeste språkmodellen har en større informasjonsdatabase, som gjør at den kan gi mer nøyaktig informasjon og skrive kode på alle store programmeringsspråk.

Ifølge til OpenAI-sjef Sam Altman er ChatGPT-4 mer kreativ enn tidligere modeller, hallusinerer betydelig mindre og er mindre partisk.

GPT er en forkortelse for generative pre-trained transformer, som er en type nevrale nettverk med store språkmodeller (LLM) som kan svare på spørsmål, oppsummere tekst og til og med generere kodelinjer. Dyplæring er en teknikk som brukes av store språkmodeller for å produsere tekst som ser ut til å være produsert av et menneske.

For de som er nye til ChatGPT, er det beste stedet å begynne chat.openai.com. Registrer deg for en gratis konto for å få tilgang til GPT-3. For å bruke GPT-4 må brukere abonnere på ChatGPT Plus, et månedlig abonnement på $20 som gir premium tilgang til tjenesten. I skrivende stund hadde GPT-4 en fire-timers meldingsgrense på 100 meldinger.

Som en del av sin forskning, OpenAI publisert et rapportkort av GPT-4 om hvordan det gikk på eksamen i ulike fag.

Kilde: OpenAI

GPT-4 fikk en poengsum på 163 i den 88. persentilen på LSAT-eksamenen, som kreves for opptak til jusskoler i USA. Den fikk også 298/400 på Uniform Bar Exam, en test tatt av nyutdannede jusstudenter som tillater dem til å praktisere som advokat i enhver amerikansk jurisdiksjon.

GPT-4 scoret i 93. og 89. persentilene på henholdsvis SAT Evidence-Based Reading & Writing og SAT Math-eksamener, som videregående skoleelever tar i USA for å vurdere deres høyskoleberedskap.

GPT-4 presterte også godt i vitenskapene, og scoret godt over gjennomsnittlige persentiler i AP Biology (85-100%), Kjemi (71-88%) og Fysikk 2 (66-84%). Et annet område hvor GPT-4 kom til kort var engelsk litteratur, som skårer i 8. til 44. persentil over to separate tester.

ChatGPT kan kvalifisere for en Top Law School, men kan det hjelpe meg med en engelsk test?

GPT-4s poengsum vil kvalifisere den for opptak til en topp 20 jussskole og er bare noen få poeng under de rapporterte poengsummene som kreves for aksept til prestisjetunge skoler som Harvard, Stanford, Princeton eller Yale.

Det vi har prøvd å gjøre er å stille chatbot-spørsmål knyttet til forskjellige emner og vurdere hvor pålitelig den er.

Uniform Bar Examination (UBE) er et høykvalitets, enhetlig batteri av lovrelaterte tester som administreres samtidig i alle jurisdiksjonene som har tatt i bruk UBE. GPT-4 har en misunnelsesverdig UBE-score på 298/400.

Klassifiseringen av kryptovalutaer som verdipapirer eller råvarer er fortsatt et stridstema innenfor den juridiske sfæren til USA. I tillegg har både Securities and Exchange Commission (SEC) og Commodity Futures Trading Commission (CFTC) ført en kamp mot hverandre om regulering av kryptovalutaer.

Vi bestemte oss for å be GPT-4 om sin juridiske mening om problemet. Selv om den korrekt identifiserer SEC som gjenkjenner innledende mynttilbud (ICOs) som verdipapirer og CFTC klassifiserer Bitcoin og andre kryptovalutaer som varer, ga den svært gamle sitater som dateres tilbake til 2017-18.

Vi ba deretter GPT-4 om å kaste lys over det siste standpunktet til begge disse reguleringsorganene i 2023. Selv om det ga detaljer om begge disse organene som tok håndhevelsestiltak, ga det ikke veldig solid juridisk råd til oss. Dets sitater var imidlertid nærmere 2021-22.

Vurdere forståelsesevner

Deretter bestemte vi oss for å teste forståelsesferdighetene til chatboten. SAT-bevisbasert lese- og skrivepoengsum til GPT-4 er 710/800.

Vi matet verktøyet informasjon om Kina som utfordrer amerikansk dominans i verdensøkonomien. Vi listet deretter opp fire alternativer, som alle begynte med samme premiss, men som senere var forskjellige i betydning. Vi spurte deretter GPT-4 hvilket alternativ som best oppsummerer passasjen.

Det ga ganske vellykket det riktige svaret. Vi antar at verktøyet er dyktig til å forstå informasjon, bortsett fra når det er komplekst og nyansert (Som vi så i forrige tilfelle av dets juridiske mening om kryptovalutaer).

SAT Math-poengsummen til GPT-4 er 710 / 800 og vi kunne ikke motstå å stille det et vanskelig spørsmål som om vi gikk på videregående.

Vi ga den med en ligning som har høyde som funksjon av alder og spurte hvor mye dette barnets høyde vil øke hvert år.

GPT-4 er flink til å gjenkjenne høyde som en funksjon av alder og plager ikke lenger. Det gir riktig svar at guttens høyde øker med tre tommer hvert år.

Det er imidlertid ikke så vanskelig å lure chatboten til å gi feil svar. En bruker hadde tidligere lurt, over et par dager, en tidligere versjon av ChatGPT til å tro at 2+2=5. Først genererte chatboten det riktige svaret. Imidlertid endret responsen seg over tid da brukeren fikk den til å tro at den var feil hele tiden.

Vet den hvordan Europa påvirket en indisk kunstner fra det 20. århundre?

ChatGPT-4 har en utmerket AP Art History-score på 5, dvs. den er ekstremt godt kvalifisert når det kommer til kunsthistorie.

Vi spurte chatboten om Europas innflytelse på maleriene til den indiske kunstneren Amrita Shergil fra 20-tallet innenfor rammen av indisk kunsthistorie.

Responsen var utmerket ved at den anerkjenner innflytelsen fra europeiske kunstbevegelser som realisme, impresjonisme og postimpresjonisme, men nevner ikke renessansen.

Et rudimentært AI-verktøy ville også ha listet renessansen, fordi europeisk kunst ofte er stort sett likestilt med renessansen, og den har en tendens til å overskygge andre moderne bevegelser.

Vi tenkte å forvirre ChatGPT-4 litt og spurte om det var sikkert at renessansen ikke påvirket Shergills arbeid. Verktøyet ga igjen det korrekte svaret at det er lite bevis på at renessansen spilte en betydelig rolle i utformingen av hennes kunstneriske stil.

Vi var heller ikke sikre på om verktøyet ville være i stand til å hente pålitelig kunnskap om en indisk kunstner på grunn av den angivelig eurosentriske naturen til mange AI-verktøy.

Men når det gjelder kunsthistorie, ga det veldig gode svar.

Stiller spørsmål ved historiske klager

Når det gjelder AP US Government og AP US History, scorer GPT-4 5, noe som betyr at den har en utmerket forståelse av slike problemer.

Vi bestemte oss for å stille et spørsmål om interneringen av japansk-amerikanere av den amerikanske regjeringen under andre verdenskrig. Siden dette fortsatt er et sensitivt tema i amerikanske sinn, var vi bekymret for omfanget av informasjon verktøyet ville gi.

GPT-4 kalte ikke bare fremmedfrykt, anti-asiatisk rasisme, krigshysteri, og politisk opportunisme ansvarlig for handlingen, men kalte den også "et klart brudd på deres konstitusjonelle rettigheter".

Kan den tilby løsninger på krigen mellom Russland og Ukraina?

Tidligere indisk diplomat og bestselgerforfatter Vikas Swarup spurte en tidligere versjon av ChatGPT for å komme med en meklingsplan for Russland-Ukraina-krigen.

Verktøyet foreslo ikke bare våpenhvile og forhandlinger, men anbefalte også at Ukraina skulle desentralisere makten til regioner der russisktalende befolkninger bor. I tillegg ba den Ukraina om å samarbeide med Russland for beskyttelse av de kulturelle rettighetene til folk som bor i Ukraina.

Dette er en linje tatt av ChatGPT som knapt foreslås av noen amerikansk diplomat eller politisk tenketank. Det betyr at den også ser etter andre meninger enn de som tilbys av det ordinære etablissementet.

ChatGPT ser ikke ut som en litterær nerd

Vi har observert at verktøyet skriver godt strukturerte engelske setninger, spesielt siden det er betydelig bedre kjent med romantikk og germanske språk. Likevel ble vi overrasket over å finne ut at den scoret dårlig både i AP English Language and Composition og AP English Literature and Composition. GPT-4 har en poengsum på 2 på begge disse testene.

Vi bestemte oss for å teste chatbotens litterære legitimasjon og spurte hva den syntes om observasjonene til den irske poeten William Butler Yeats fra 20-tallet angående alder og død i diktet hans «Sailing to Byzantium».

"Som en AI-språkmodell har jeg ikke personlig tro eller følelser," lyder svaret, men så gir det en analyse av diktet likevel.

Det fremhever kontrasten mellom den timelige naturens verden og den evige åndelighetens verden i diktet. Videre fremhever det menneskets ønske om evig liv og transcendens.

I hovedsak gir verktøyet en standardisert tolkning av diktet. Observasjonene er arkivobservasjoner fra en videregående elev som har lest et dikt og et par kritiske essays. Det kaster ikke noe nytt lys, men kanskje er det for store forventninger foreløpig.

Et leketøy eller et verktøy?

Den amerikanske forfatteren og videospilldesigneren Ian Bogost har bedt brukere om å behandle ChatGPT som et leketøy, ikke et verktøy. Bogost publiserte en teknologi essay med tittelen "ChatGPT Is Dumber Than You Think" i desember 2022, en der han hevdet at entusiasmen for ChatGPT-modellen er feilplassert.

Vent, Bogost la ikke frem dette argumentet. Faktisk ble dette svaret generert av ChatGPT selv da Bogosts venn ba verktøyet om å lage en kritikk av entusiasme for ChatGPT i stil med Ian Bogost.

Det Bogost imidlertid synes er frustrerende, er at ChatGPT skriver et standard essay med fem avsnitt i high school-stil. Tonen forblir formelisk i struktur, stil og innhold, selv om teksten ser ut til å være flytende og overbevisende.

Bogost skrev i essayet, "Men ChatGPT er ikke et skritt på veien til en kunstig generell intelligens som forstår all menneskelig kunnskap og tekster; det er bare et instrument for å leke med all den kunnskapen og alle de tekstene.»

Den amerikanske forfatteren og spaltisten John Warner menerd at det faktum at vi frykter at ChatGPT kan bli et jukseverktøy blant elever på videregående skole bør minne oss på hvor mye vi har falt i forhold til våre forventninger til elevenes skriveferdigheter.

ChatGPT skriver et standard essay med fem avsnitt i high school-stil. Dette er et format som gjennom årene bare har begrenset den kritiske tenkningen til de fleste av studentene, skrev Warner. Ikke at slike verktøy kan produsere informasjon på overflaten om et hvilket som helst emne i løpet av få sekunder, men studentene vil til slutt bli tvunget til å tenke selv.

"GPT3 er en tull. Den aner ikke hva den sier. Den forstår syntaks, ikke innhold. Det er ikke å tenke på måten mennesker tenker når de skriver. Mange elever får gode karakterer ved å bli dyktige bullshitters, og sende informasjon tilbake til læreren, la Warner til.

AI-fokusert Projects-rally, takket være GPTs popularitet

Ifølge CoinMarketCap, har markedsverdien til AI-fokuserte blokkjedeprosjekter vokst til mer enn 5.48 milliarder dollar på listene.

Blant de mest vellykkede tokenene er The Graph (GRT), SingularityNET (AGIX), Render Token (RNDR), Fetch.ai (FET) og Oasis Network (ROSE). Nesten alle disse tokenene har registrert tosifrede prisstigninger de siste syv dagene.

Kilde: https://ambcrypto.com/how-to-use-chatgpt-4-0/

ChatGPT kan kvalifisere for en Top Law School, men kan det hjelpe meg med en engelsk test?

Vurdere forståelsesevner

Vet den hvordan Europa påvirket en indisk kunstner fra det 20. århundre?

Stiller spørsmål ved historiske klager

ChatGPT ser ikke ut som en litterær nerd

Et leketøy eller et verktøy?

AI-fokusert Projects-rally, takket være GPTs popularitet