Hopp til hovedinnhold

Hva er generativ kunstig intelligens (GPT)?

Logo letter
Evelon AS
Jon-Alfred Smith
Bilde av en robot finger og en menneskelig finger som rører hverandre

Kunstig intelligens (KI) er vår tids definerende teknologi. Hensikten er å skape systemer som kan utføre oppgaver som normalt krever menneskelig intelligens.

Feltet er bredt og omfatter underkategorier som maskinlæring, robotikk, ekspertsystemer og kunstig syn. Gjennombrudd innen naturlig språkbehandling har i den senere tid vakt oppsikt, med en arkitektur som er basert på store språkmodeller og generativ KI. Det mest kjente produktet er ChatGPT fra OpenAI. Microsoft benytter tilsvarende modelleri sin serie annenpiloter eller digitale assistenter, somMicrosoft 365 Copilot, Security Copilot og Copilot for Edge. Her ser vi nærmere på generativ KI basert på disse verktøyene– hvordan den fungerer, og hvilken nytte du kan ha av den. Andre aktører, som Google, Adobe og Nvidia, er ikke tatt med.

Kortfattet om kunstig intelligens

Den form for KI vi har i dag, karakteriseres som svak eller smal, utformet for å for å utføre et begrenset sett med målrettede aktiviteter. Det kan den ofte bedre og raskere enn vi. En hypotetisk type KI med en generell menneskelignende evne til å forstå, lære og anvende kunnskap er ikke virkeliggjort ennå.

Kunstig intelligens kan håndtere oppgaver som språkforståelse, læring, resonnering, problemløsning og persepsjon. Den opererer i skjæringspunktet mellom maskin og menneske. KI kan inndeles i:

Maskinlæring (ML) fokuserer på å utvikle algoritmer som gir datamaskiner evnen til å lære av og gjøre forutsigelser eller beslutninger basert på data. Maskinlæring inkluderer underfelt som dyplæring, der det benyttes nevrale nettverk med mange lag.

Naturlig språkbehandling (NLP) har evnen til å tolke, forstå og interagere med menneskelig språk på en meningsfull måte.Blant annet anvendes den i chatbots, maskinoversettelse og talegjenkjenning.

Robotikk kombinerer KI med maskinvare og er opptatt av å utvikle maskiner (roboter) som kan interagere med den fysiske verden.

Ekspertsystemer simulerer beslutningstakingen til en menneskelig ekspert innen spesialiserte domener, som medisinsk diagnose eller aksjehandel.

Kunstig syn gjør det mulig for maskiner å «se» og tolke visuell informasjon i den fysiske verden, anvendt i teknologier som ansiktsgjenkjenning og bildeklassifisering.

GPT i et nøtteskall

GPT-4 er for tiden OpenAIs mest avanserte system, som gir sikrere og mer fornuftige svar. GPT står for Generative Pre-trained Transformer og er en type kunstig intelligens som anvendes for naturlig forståelse og generering av språk. Den er basert på transformer-arkitekturen som forskere ved Google introduserte i en artikkel med tittelen Attention Is All You Need i 2017. Viktige kjennetegn er omfang (stor skala), treningsmetode og vidt spekter av bruksområder.

en grønn bakgrunn hvor det står GPT-4

Det generative i GPT refererer til at modellen kan frembringe tekst som følger mønstre og regler for menneskelig språk. Med utgangspunkt i et tekststykke er den i stand til å bestemme hvilken tekst som med en høy grad av sannsynlighet følger (predikasjon). Sånn skaper modellen sammenhengende og kontekstuelt meningsfulle setninger. 

I forhåndstrent ligger en opplæringsprosess som foregår i to trinn. Først trenes modellen opp på gigantiske mengder med tekstdata. På dette stadiet lærer den strukturer, regler og nyanser i språket. I annen fase finjusteres modellen og videreutdannes på et mindre, spesifikt datasett tilpasset bestemte oppgaver. Under opplæringen etableres det en voldsom kunnskapsbase.

Kjernearkitekturen i GPT er transformeren, som bruker flere lag med oppmerksomhetsmekanismer for å få tak i konteksten til ord i en setning og sammenhengenmellom setninger. Som det er nevnt ovenfor: Oppmerksomhet er alt du trenger! Operasjonene foretas parallelt for å gripe betydningsbærende ord, uttrykk og ytringer sammen med konteksten de inngår i, samt større tekstblokker. Mekanismene blir på den måten ytterst velegnet for språkoppgaver.

Store språkmodeller

GPT benytter store språkmodeller (LLM), en type maskinlæring med fokus på å håndtere og generere menneskelignende tekst. Modellene er utformet for å forstå språkmønstre og strukturer basert på de enorme datasettene de er trent på. Størrelse og kompleksitet gjør at de er eksepsjonelt gode til å forstå kontekst og knytte sammenhenger som gir mening.

bilde av et tre hvor det står mange ord som forsklarer kunstig intelligens

Kildene for dataeneer nær sagt store deler av Internett: Wikipedia, bøker, artikler, vitenskapelige avhandlinger, teknisk dokumentasjon osv.Viktig er at man under innsamlingen av tekstdata følger reglene for ansvarlig KI, som å unngå hatytringer og rasistiske eller diskriminerende synspunkter. Modellene lærer seg på denne måten ulike språkmønstre og -stiler. Det som gjør disse modellene «store», er antallet parametere de inneholder, som er på flere hundre milliarder.

Dyplæring med nevrale nettverk

Store språkmodeller gjør bruk av kunstige nevrale nett med flere lag, som er en grov forenkling av de biologiske nettverkene i hjernen, ofte kombinert med transformer-arkitekturen. Hvert lag øker beregningskraften og lærer en annen måte å forstå og tolkeinformasjon på, som en abstraksjon av det lavere laget. Ved mønstergjenkjenning oppfatter de første lagene enkle former, mens de siste identifiserer konkrete figurer.

Dyplæring forutsetter disse flerlagsnettene – derav betegnelsen «dyp». Det er på den måten store språkmodeller tilegner seg en forståelse av komplekse mønstre og strukturer. Samtidig gir dyplæring muligheten til automatisk å lære nye ting og dra nytte av erfaring uten å være eksplisitt programmert. Opplæringen innebærer å mate inndataene gjennom flere lag av det nevrale nettverket, så modellen kan lære statistiske egenskaperi språket. Under forhåndstreningen kan modellen forutsi neste ord i en setning og bli bedre over tid ettersom den justerer sine interne parametere for å minske prediksjonsfeil. 

ChatGPT i praksis

Bilde av en chat i applikasjonen chatGPT

MacGPT er en enkel app for macOS som gir rask tilgang til ChatGPT. Hva kan du så gjøre med ChatGPT?

La oss spørre den kunstige intelligensen selv (og regenerere svaret i skjermbildet):

Stille spørsmål: Jeg kan besvare spørsmål om et bredt spekter av emner, fra vitenskap og teknologi til historie og populærkultur.

Læring og undervisning: Jeg kan forklare kompliserte konsepter, hjelpe med lekser og gi informasjon om mange emner.

Språkoversettelse: Jeg kan oversette mellom flere språk, selv om jeg kanskje ikke alltid er like nøyaktig som dedikerte oversettelsestjenester.

Tekstforfatter: Jeg kan hjelpe med å skrive tekster, artikler, brev, dikt og annen skriftlig kommunikasjon.

Programmeringshjelp: Jeg kan gi kodeeksempler, feilsøkingstips og forklaringer på programmeringskonsepter.

Spill og underholdning: Du kan spille tekstbaserte spill med meg, eller jeg kan fortelle deg vitser og interessante fakta.

Innspill på ideer: Hvis du har en idé og ønsker en annen mening, kan jeg gi tilbakemeldinger eller forslag.

Analyse av bilder: Med bildeinndatafunksjonen kan jeg beskrive bilder, identifisere objekter på dem og gi relevant informasjon basert på bildet.

Konversasjonspartner: Jeg kan også bare snakke med deg om hva som helst du har lyst til, enten du ønsker selskap eller ønsker å diskutere et bestemt tema.

Mulighetene er nær sagt ubegrensede. ChatGPTer ikke perfekt og kan ta feil. Det er alltid en god idé å kryssjekke opplysninger, spesielt for viktige beslutninger.

Microsoft 365 Copilot

Microsoft 365 Copilotbenytter data som er lagret i Exchange Online, Teams, SharePoint Online og OneDrive for Business. Målet er å gjøre mer effektiv bruk av informasjon som allerede er tilgjengelig. Det omfatter å sørge for bedre utdata (mer konsist, bedre skrevet, oppsummert) og unytte funksjoner i apper som folk er mindre kjent med. Du får en grundig gjennomgang i innlegget:

Microsoft 365 Copilot – Din KI-baserte digitale assistent

Microsoft Security Copilot

Til grunn for Security Copilot ligger tre prinsipper. Den forenkler kompleksitet ved å levere kritisk steg-for-steg veiledning og kontekst gjennom en naturlig språkbasert etterforskningsopplevelse som akselererer undersøkelse og respons på hendelser. Security Copilot fanger opp det andre går glipp av, som støy og svake signaler angripere gjemmer seg bak for ikke å bli oppdaget. Den griper tak i talentgapet, en skrikende mangel på sikkerhetseksperter ved å tilføre virksomheter ekspertise og lære opp IT-folk. Flere opplysninger finner du i bloggen:

Microsoft Security Copilot – Paradigmeskifte i sikkerhet

Copilot for Edge– Bing din KI-drevne kopilot

bilde av en nettleser

Microsofts søkemotor Bing er integrert i Edge. I nettleseren lar en annenpilot deg oppsummere siden du for øyeblikket surfer på eller generere nytt innhold.

bilde av søkeresultater når du bruker bing kopilot

Microsoft Bing-søkemotoren har en kopilot som søker ved å generere naturlig språksvar på spørsmål basert på kontekst i stedet for bare søkeresultater på indekserte sider. Returnert resultat er et sammendrag generert ved hjelp av kunstig intelligens basert på flere kilder på nettet. Hvis du vil vise den opprinnelige kildeinformasjonen, bruker du koblingene under Mer informasjon. Dette er betydelig bedre enn å få forslag til koblinger, der mange er ubrukelige. Bing er lenge blitt skjelt ut for å stå for Bing is not Google, et rekursivt Unix-akronym. Nå får man mer oversiktlige utdata ved å «binge» enn ved å «google».

Avsluttende ord

Disse kunstige intelligensene kjører på ekstremt store nevrale nettverk i Azure. De er fôret og trent opp med gigantiske tekstmengder fra Internett. De etablerer semantiske korrelasjonerog opererer med statistiske sannsynligheter for å produsere meningsfulle svar. Er dette virkelig intelligens og en dypere forståelse, sånn som vi vanligvis oppfatter det? Antakelig ikke. På den annen side vet vi ikke nok om menneskehjernen. Hvis den var enkel å forstå, ville vi være så enkle at vi ikke klarte å forstå den. 

La oss i stedet gi en definisjon avintelligens som inkluderer mennesker, dyr og maskiner: En agents evne til å oppfatte et miljø og velge handlinger som øker sjansene for å nå et mål. En ungdom (agent) har mattetentamen (miljø), forstår oppgaveteksten (oppfattelse) og løser oppgaver (handling) for å stå (mål). En mus er i en labyrint. Målet er å komme seg ut og spise en ostebit. Oppfattelsen er å se og trekke slutninger. Handlingen er å navigere seg gjennom en floke av veier og passasjer.

Med tanke pågenerativ KI, er den kunstige intelligensen agenten. Miljøet er grensesnittet mellom bruker og KI-system. Målet er å gi et svar med mening. Oppfattelsen er å forstå brukerforespørselen. Handlingen er å sette sammen informasjon. I denne forstand har vi å gjøre med maskiner som tenker. Og velanvendt kan vi ha stor nytte av generativ KI.

Publisert: . Oppdatert: .

Vi hjelper gjerne til med å finne den beste løsningen for din bedrift

Ta kontakt med oss for en uforpliktende prat!