Norsk språkteknologi og NorGPT – Bokmål, nynorsk og norske AI-ressurser i AI-æraen

Nøkkelpunkter

NorGPT-23B — Norges største språkmodell med 23 milliarder parametere, trent på over 30 milliarder norske ord (NTNU NorLLM-prosjektet).
345 % ROI og €2,79 millioner i besparelser for multinasjonale organisasjoner som investerer i språk-AI (Forrester TEI-studie / DeepL).
60 % av alle NLP-brukstilfeller vil drives av foundation models innen 2027, opp fra under 5 % i 2021 (Gartner).

Innledning: Norsk som «andreklasses språk»?

Mens globale giganter som ChatGPT og Gemini dominerer med engelsk som standardspråk, risikerer norsk å bli et «andreklasses språk» i AI-æraen. Ifølge Språkrådet kan bruk av utenlandske AI-verktøy føre til at norsk språk blir mer ensrettet, med tap av dialektvariasjon og rik normvariasjon.

«NorGPT-23B er den største norske språkmodellen noensinne, trent på over 30 milliarder norske ord – en kritisk ressurs for å bevare norsk språk i kunstig intelligens.»
— NTNU NorLLM-prosjektet

Likevel har Norge de siste årene etablert et imponerende økosystem for norsk språkteknologi – fra Nasjonalbibliotekets NorGPT og Språkrådets strategiarbeid, til NORA.ais forskning på norsk NLP. For norske bedrifter og offentlig sektor betyr dette et kritisk valg: bruke engelskspråklige AI-verktøy, eller investere i norsk språkteknologi som bevarer språket vårt samtidig som det gir konkret forretningsverdi.

Nøkkelfakta: Norsk språkteknologi i tall

Indikator	Tall	Kilde
Største norske språkmodell (NorGPT-23B)	23 mrd parametere, >30 mrd norske ord	NTNU NorLLM
Nye åpne norske språkmodeller	3 (BLOOM/Mistral-baserte)	NORA.ai
NLP drevet av foundation models innen 2027	60 % (opp fra <5 % i 2021)	Gartner
ROI for språk-AI (multinasjonale)	345 %, €2,79 M besparelser	Forrester / DeepL
Regjeringens støtte til norsk KI	45 millioner kroner (2025)	Regjeringen / Nasjonalbiblioteket
Globalt NLP-marked (2023–2028)	Fra $18,9 mrd til $68,1 mrd (29,3 % CAGR)	MarketsandMarkets
Økonomisk potensial for generativ AI	Opptil $7,9 billioner årlig	McKinsey

Hva er norsk språkteknologi, og hvorfor er NorGPT viktig?

Norsk språkteknologi refererer til kunstig intelligens som forstår, bearbeider og genererer norsk språk – både bokmål og nynorsk. Dette inkluderer alt fra tale-til-tekst og automatisk oversettelse til avanserte språkmodeller som NorGPT som kan skrive sammenhengende tekster, svare på spørsmål og analysere dokumenter på norsk.

NorGPT er Norges svar på ChatGPT – en familie av store språkmodeller spesialtrent på norsk språk, utviklet gjennom samarbeid mellom Nasjonalbiblioteket, NTNUs NorwAI-senter, UiO og NORA.ai-konsortiet.

Fire grunner til at norsk språkteknologi er kritisk

Bevaring av språklig mangfold — engelskspråklige AI-modeller favoriserer de mest frekvente ordformene, noe som kan føre til at norsk språk blir mer ensrettet og mister rik normvariasjon og dialektvariasjon (Språkrådet).
Kompetitiv fordel for norske bedrifter — norske AI-modeller som forstår norske forretningsuttrykk, juridiske termer og bransjespesifikk terminologi gir bedre resultater enn generiske engelskspråklige modeller, spesielt i finans, helse, jus og offentlig forvaltning.
Datasikkerhet og suverenitet — norske språkmodeller trenes på norske data i norsk infrastruktur, med bedre kontroll over datasikkerhet og personvern enn utenlandske tjenester.
Økonomisk verdiskapning — ifølge Forrester kan språk-AI gi opptil 345 % ROI gjennom effektivisering av kundeservice, dokumentbehandling, oversettelse og innholdsproduksjon.

Norske caser: Fra Nasjonalbiblioteket til NORA.ai

Nasjonalbibliotekets NorGPT og norske språkressurser

Nasjonalbiblioteket har fått et nasjonalt mandat for å utvikle og tilgjengeliggjøre norske språkmodeller:

«Vi har fått i oppgave å levere språkmodeller som skal ivareta norsk språk og norsk kunnskap til bruk i både forvaltning og næringslivet.»
— Nasjonalbibliotekar Sira Myhre (Digital Norway)

NorGPT-23B — 23 milliarder parametere, trent på over 30 milliarder norske ord
NB-GPT-J-6B — 6 milliarder parametere, finjustert for norsk
AI-lab ved NB — tilbyr modeller for tale-til-tekst som forstår norske dialekter bedre enn internasjonale alternativer
Åpne datasett — digitaliserte bøker, aviser, tidsskrifter og arkivmateriale som treningsdata

I september 2025 kunngjorde regjeringen en avtale om å styrke norsk kunstig intelligens med 45 millioner kroner, med spesielt fokus på språkteknologi og tilgjengeliggjøring av norske språkdata (Regjeringen).

Språkrådet om norsk i AI-teknologi

Språkrådet har et aktivt engasjement for å sikre at norsk språk ivaretas i AI-utviklingen:

Strategi for KI — levert innspill til regjeringens AI-strategi med vekt på tilgjengeliggjøring av språkdata og normering (Regjeringen – Språkrådets innspill)
Praktiske råd — Språkrådet påpeker at engelskspråklige AI-verktøy som ChatGPT ofte velger de mest frekvente ordformene og kan føre til at norsk språk blir mer ensrettet

«Den teknologiske utviklinga har stor innvirkning på livet vårt. Fagspråket er det viktigste utviklingslaboratoriet for norsk språk, og det er viktig å arbeide systematisk med å styrke også denne delen av språket vårt.»
— Åse Wetås, direktør i Språkrådet

NORA.ai — norsk NLP-forskning

NORA (Norwegian Artificial Intelligence Research Consortium) samler norske universiteter og forskningssentre for å utvikle norsk AI-kompetanse:

NORA.LLM-initiativet — partnere: UiO, Nasjonalbiblioteket, Sigma2. Mål: utvikle åpne norske språkmodeller basert på BLOOM og Mistral-arkitekturer. Lansert tre nye åpne norske språkmodeller i 2024–2025 (NORA.ai – NORA.LLM).
NorwAI (NTNU) — norsk forskningssenter for AI-innovasjon som utvikler generative språkmodeller for norsk samfunnsnytte
Tverrfaglig samarbeid — kombinerer lingvistikk, informatikk og domenekspertise for å utvikle språkteknologi som forstår norske realiteter

Sammenligning av norske språkmodeller

Modell	Utvikler	Parametere	Treningsdata	Lisens
NorGPT-23B	NTNU NorwAI	23 mrd	>30 mrd norske ord	Åpen
NB-GPT-J-6B	Nasjonalbiblioteket	6 mrd	Norsk finjustering av GPT-J	Åpen
NORA.LLM	UiO / Nasjonalbiblioteket	Varierende	BLOOM/Mistral + norske data	Åpen
NorMistral-11B	NORA.ai	11 mrd	Mistral + norsk finjustering	Åpen
NB-T5 for tale	Nasjonalbiblioteket	220 M	Norsk tale, dialekter	Åpen

Nøkkelobservasjon: Alle større norske språkmodeller har åpen kildekode – i motsetning til mange kommersielle internasjonale modeller. Utviklingen skjer gjennom tett samarbeid mellom forskningsinstitusjoner, Nasjonalbiblioteket og bransje.

Viktigheten av å bevare norsk språk i AI-æraen

Konsekvenser av å ikke handle

Språktap — norsk kan bli et «andreklasses språk» i AI-systemer
Avhengighet — norske brukere blir avhengige av utenlandske tjenester med begrenset forståelse for norsk kontekst
Økonomisk tap — norske bedrifter mister konkurransefortrinn som kunne oppnås med skreddersydde norske AI-verktøy
Demokratisk utfordring — offentlig forvaltning blir avhengig av utenlandsk teknologi som ikke forstår norsk juridisk og administrativt språk

Praktisk implementering: 5-stegs veikart

Steg 1: Kartlegg språkbehov og brukstilfeller

Dokumentbehandling: kontrakter, rapporter, e-post, kundekommunikasjon
Kundeservice: chatboter, automatiske svar, spørsmålsbaserte systemer
Innholdsproduksjon: markedsføringstekster, nettsideinnhold, sosiale medier
Analyse og innsikt: sentimentanalyse, temaekstraksjon, trendgjenkjenning

Steg 2: Vurder bygg-eller-kjøp

Bruk eksisterende modeller — NorGPT, NB-GPT-J-6B, NORA.LLM via API eller lokal installasjon
Finjuster for din bransje — trene eksisterende modeller på ditt eget datamateriale
Utvikle fra scratch — bare nødvendig for svært spesialiserte behov med unike datakilder

Steg 3: Test med pilotprosjekter

Start lite: én avdeling, én prosess, ett dokumenttype
Mål nøye: tidsbesparelser, kvalitetsforbedringer, kundetilfredshet
Iterer raskt: juster basert på tilbakemeldinger og resultater

Steg 4: Integrer i eksisterende systemer

API-integrasjon: koble språkmodeller til CRM, ERP, CMS, kundeservicesystemer
Lokal eller sky: vurder datasikkerhet, ytelse og kostnad for deployering
Opplæring: sikre at ansatte forstår og kan bruke verktøyene effektivt

Steg 5: Etabler kontinuerlig forbedring

Datainnsamling: samle anonymiserte bruksdata for å forbedre modellene
Oppdateringer: holde seg ajour med nye versjoner og forbedringer
Måling og rapportering: dokumentere forretningsverdi og ROI

Utfordringer og løsninger

Utfordring	Problem	Løsning
Begrenset treningsdata	Norsk har ~5 M morsmålstalende vs. 1,5 mrd for engelsk	Flerspråklige modeller, transfer learning, syntetiske data, kvalitet over kvantitet
Dialektvariasjon	Mange dialekter og stor språklig variasjon	Spesialtrente modeller, transkribert tale fra hele landet, lingvistsamarbeid
Bokmål vs. nynorsk	To offisielle skriftspråk med ulike normer	Modeller trent på begge varianter, klar merking, tilpasning til brukerpreferanser
Kommersialisering	Åpne modeller vanskelig å finansiere langsiktig	Offentlig-private partnerskap, lisensmodeller, forskningsrådsstøtte
Internasjonal konkurranse	Google, Microsoft, OpenAI har enorme ressurser	Fokus på nisjer der norsk kontekst gir fortrinn, nordisk samarbeid

Fremtidsutsikter: 5 trender for norsk språkteknologi

Multimodale norske modeller — fremtidige modeller vil kombinere tekst, tale, bilde og video på norsk, med fokus på norsk kultur og kontekst.
Personlige språkassistenter på norsk — AI-assistenter som forstår norske dialekter og tilpasser seg brukerens kommunikasjonsstil.
Sanntidsoversettelse — høy kvalitet til og fra norsk, med bevaring av kulturelle og kontekstuelle nyanser.
Domenespesifikke norske modeller — spesialtrent for jus, medisin, finans og teknologi med norsk fagterminologi.
Nordisk samarbeid — tettere samarbeid mellom Norge, Sverige, Danmark, Island og Finland for felles ressurser og motvekt mot engelskspråklig dominans.

Ofte stilte spørsmål

Hva er NorGPT, og hvordan skiller det seg fra ChatGPT?

NorGPT er en familie av store språkmodeller spesialtrent på norsk språk, utviklet av norske forskningsinstitusjoner. Mens ChatGPT primært er trent på engelsk, er NorGPT optimalisert for norsk språk, norsk kultur og norske bruksområder. NorGPT-23B har 23 milliarder parametere og er trent på over 30 milliarder norske ord.

Hvorfor trenger vi norske språkmodeller?

Engelskspråklige modeller forstår ikke norske dialekter godt, kjenner ikke norske realiteter og institusjoner, og kan føre til språklig ensretting. Norske modeller gir bedre resultater for norske tekster, forstår norsk juridisk og administrativt språk, og bidrar til å bevare det norske språket.

Hvordan kan bedrifter bruke NorGPT?

Automatisk dokumentanalyse og -sammendrag, kundeservice-chatboter på norsk, generering av markedsføringstekster, oversettelse, analyse av kundetilbakemeldinger og mye mer. Modellene kan integreres via API eller kjøres lokalt.

Hva koster det?

De fleste norske språkmodeller er åpne og gratis for forskning og utvikling. For kommersiell bruk kan det være lisensavtaler eller API-avgifter, men kostnadene er generelt lavere enn for kommersielle internasjonale tjenester.

Er norske modeller like gode som internasjonale?

På norsk er norske modeller ofte bedre fordi de er spesialtrente. For generelle oppgaver på engelsk kan internasjonale modeller fortsatt være sterkere, men gapet minsker raskt. For norske bedrifter som primært opererer på norsk er norske modeller vanligvis det beste valget.

Kan norske modeller håndtere både bokmål og nynorsk?

Ja, de fleste er trent på begge målformer og kan forstå og generere tekst på begge varianter. Noen modeller kan også håndtere dialektale varianter og samisk.

Vår hjelp i praksis

Vil dere utforske norsk språkteknologi for deres virksomhet? Vi hjelper med alt fra kartlegging av språkbehov til integrasjon av norske AI-modeller – med fokus på målbar forretningsverdi og bevaring av norsk språk. Book en uforpliktende samtale for å se hvordan NorGPT og norsk språk-AI kan styrke deres drift.