13 min

    Norsk språkteknologi og NorGPT – Bokmål, nynorsk og norske AI-ressurser i AI-æraen

    NorGPT-23B er Norges største språkmodell med 23 milliarder parametere. Språk-AI kan gi opptil 345 % ROI. Slik bruker norske bedrifter og offentlig sektor norsk språkteknologi for bedre resultater og språkbevaring.

    SpråkteknologiNorGPTAI-strategi
    Norsk språkteknologi og NorGPT – Bokmål, nynorsk og norske AI-ressurser i AI-æraen

    Nøkkelpunkter

    • NorGPT-23B — Norges største språkmodell med 23 milliarder parametere, trent på over 30 milliarder norske ord (NTNU NorLLM-prosjektet).
    • 345 % ROI og €2,79 millioner i besparelser for multinasjonale organisasjoner som investerer i språk-AI (Forrester TEI-studie / DeepL).
    • 60 % av alle NLP-brukstilfeller vil drives av foundation models innen 2027, opp fra under 5 % i 2021 (Gartner).

    Innledning: Norsk som «andreklasses språk»?

    Mens globale giganter som ChatGPT og Gemini dominerer med engelsk som standardspråk, risikerer norsk å bli et «andreklasses språk» i AI-æraen. Ifølge Språkrådet kan bruk av utenlandske AI-verktøy føre til at norsk språk blir mer ensrettet, med tap av dialektvariasjon og rik normvariasjon.

    «NorGPT-23B er den største norske språkmodellen noensinne, trent på over 30 milliarder norske ord – en kritisk ressurs for å bevare norsk språk i kunstig intelligens.»
    NTNU NorLLM-prosjektet

    Likevel har Norge de siste årene etablert et imponerende økosystem for norsk språkteknologi – fra Nasjonalbibliotekets NorGPT og Språkrådets strategiarbeid, til NORA.ais forskning på norsk NLP. For norske bedrifter og offentlig sektor betyr dette et kritisk valg: bruke engelskspråklige AI-verktøy, eller investere i norsk språkteknologi som bevarer språket vårt samtidig som det gir konkret forretningsverdi.

    Nøkkelfakta: Norsk språkteknologi i tall

    IndikatorTallKilde
    Største norske språkmodell (NorGPT-23B)23 mrd parametere, >30 mrd norske ordNTNU NorLLM
    Nye åpne norske språkmodeller3 (BLOOM/Mistral-baserte)NORA.ai
    NLP drevet av foundation models innen 202760 % (opp fra <5 % i 2021)Gartner
    ROI for språk-AI (multinasjonale)345 %, €2,79 M besparelserForrester / DeepL
    Regjeringens støtte til norsk KI45 millioner kroner (2025)Regjeringen / Nasjonalbiblioteket
    Globalt NLP-marked (2023–2028)Fra $18,9 mrd til $68,1 mrd (29,3 % CAGR)MarketsandMarkets
    Økonomisk potensial for generativ AIOpptil $7,9 billioner årligMcKinsey

    Hva er norsk språkteknologi, og hvorfor er NorGPT viktig?

    Norsk språkteknologi refererer til kunstig intelligens som forstår, bearbeider og genererer norsk språk – både bokmål og nynorsk. Dette inkluderer alt fra tale-til-tekst og automatisk oversettelse til avanserte språkmodeller som NorGPT som kan skrive sammenhengende tekster, svare på spørsmål og analysere dokumenter på norsk.

    NorGPT er Norges svar på ChatGPT – en familie av store språkmodeller spesialtrent på norsk språk, utviklet gjennom samarbeid mellom Nasjonalbiblioteket, NTNUs NorwAI-senter, UiO og NORA.ai-konsortiet.

    Fire grunner til at norsk språkteknologi er kritisk

    1. Bevaring av språklig mangfold — engelskspråklige AI-modeller favoriserer de mest frekvente ordformene, noe som kan føre til at norsk språk blir mer ensrettet og mister rik normvariasjon og dialektvariasjon (Språkrådet).
    2. Kompetitiv fordel for norske bedrifter — norske AI-modeller som forstår norske forretningsuttrykk, juridiske termer og bransjespesifikk terminologi gir bedre resultater enn generiske engelskspråklige modeller, spesielt i finans, helse, jus og offentlig forvaltning.
    3. Datasikkerhet og suverenitet — norske språkmodeller trenes på norske data i norsk infrastruktur, med bedre kontroll over datasikkerhet og personvern enn utenlandske tjenester.
    4. Økonomisk verdiskapning — ifølge Forrester kan språk-AI gi opptil 345 % ROI gjennom effektivisering av kundeservice, dokumentbehandling, oversettelse og innholdsproduksjon.

    Norske caser: Fra Nasjonalbiblioteket til NORA.ai

    Nasjonalbibliotekets NorGPT og norske språkressurser

    Nasjonalbiblioteket har fått et nasjonalt mandat for å utvikle og tilgjengeliggjøre norske språkmodeller:

    «Vi har fått i oppgave å levere språkmodeller som skal ivareta norsk språk og norsk kunnskap til bruk i både forvaltning og næringslivet.»
    — Nasjonalbibliotekar Sira Myhre (Digital Norway)
    • NorGPT-23B — 23 milliarder parametere, trent på over 30 milliarder norske ord
    • NB-GPT-J-6B — 6 milliarder parametere, finjustert for norsk
    • AI-lab ved NB — tilbyr modeller for tale-til-tekst som forstår norske dialekter bedre enn internasjonale alternativer
    • Åpne datasett — digitaliserte bøker, aviser, tidsskrifter og arkivmateriale som treningsdata

    I september 2025 kunngjorde regjeringen en avtale om å styrke norsk kunstig intelligens med 45 millioner kroner, med spesielt fokus på språkteknologi og tilgjengeliggjøring av norske språkdata (Regjeringen).

    Språkrådet om norsk i AI-teknologi

    Språkrådet har et aktivt engasjement for å sikre at norsk språk ivaretas i AI-utviklingen:

    • Strategi for KI — levert innspill til regjeringens AI-strategi med vekt på tilgjengeliggjøring av språkdata og normering (Regjeringen – Språkrådets innspill)
    • Praktiske råd — Språkrådet påpeker at engelskspråklige AI-verktøy som ChatGPT ofte velger de mest frekvente ordformene og kan føre til at norsk språk blir mer ensrettet
    «Den teknologiske utviklinga har stor innvirkning på livet vårt. Fagspråket er det viktigste utviklingslaboratoriet for norsk språk, og det er viktig å arbeide systematisk med å styrke også denne delen av språket vårt.»
    — Åse Wetås, direktør i Språkrådet

    NORA.ai — norsk NLP-forskning

    NORA (Norwegian Artificial Intelligence Research Consortium) samler norske universiteter og forskningssentre for å utvikle norsk AI-kompetanse:

    • NORA.LLM-initiativet — partnere: UiO, Nasjonalbiblioteket, Sigma2. Mål: utvikle åpne norske språkmodeller basert på BLOOM og Mistral-arkitekturer. Lansert tre nye åpne norske språkmodeller i 2024–2025 (NORA.ai – NORA.LLM).
    • NorwAI (NTNU) — norsk forskningssenter for AI-innovasjon som utvikler generative språkmodeller for norsk samfunnsnytte
    • Tverrfaglig samarbeid — kombinerer lingvistikk, informatikk og domenekspertise for å utvikle språkteknologi som forstår norske realiteter

    Sammenligning av norske språkmodeller

    ModellUtviklerParametereTreningsdataLisens
    NorGPT-23BNTNU NorwAI23 mrd>30 mrd norske ordÅpen
    NB-GPT-J-6BNasjonalbiblioteket6 mrdNorsk finjustering av GPT-JÅpen
    NORA.LLMUiO / NasjonalbiblioteketVarierendeBLOOM/Mistral + norske dataÅpen
    NorMistral-11BNORA.ai11 mrdMistral + norsk finjusteringÅpen
    NB-T5 for taleNasjonalbiblioteket220 MNorsk tale, dialekterÅpen

    Nøkkelobservasjon: Alle større norske språkmodeller har åpen kildekode – i motsetning til mange kommersielle internasjonale modeller. Utviklingen skjer gjennom tett samarbeid mellom forskningsinstitusjoner, Nasjonalbiblioteket og bransje.

    Viktigheten av å bevare norsk språk i AI-æraen

    Konsekvenser av å ikke handle

    • Språktap — norsk kan bli et «andreklasses språk» i AI-systemer
    • Avhengighet — norske brukere blir avhengige av utenlandske tjenester med begrenset forståelse for norsk kontekst
    • Økonomisk tap — norske bedrifter mister konkurransefortrinn som kunne oppnås med skreddersydde norske AI-verktøy
    • Demokratisk utfordring — offentlig forvaltning blir avhengig av utenlandsk teknologi som ikke forstår norsk juridisk og administrativt språk

    Praktisk implementering: 5-stegs veikart

    Steg 1: Kartlegg språkbehov og brukstilfeller

    • Dokumentbehandling: kontrakter, rapporter, e-post, kundekommunikasjon
    • Kundeservice: chatboter, automatiske svar, spørsmålsbaserte systemer
    • Innholdsproduksjon: markedsføringstekster, nettsideinnhold, sosiale medier
    • Analyse og innsikt: sentimentanalyse, temaekstraksjon, trendgjenkjenning

    Steg 2: Vurder bygg-eller-kjøp

    • Bruk eksisterende modeller — NorGPT, NB-GPT-J-6B, NORA.LLM via API eller lokal installasjon
    • Finjuster for din bransje — trene eksisterende modeller på ditt eget datamateriale
    • Utvikle fra scratch — bare nødvendig for svært spesialiserte behov med unike datakilder

    Steg 3: Test med pilotprosjekter

    • Start lite: én avdeling, én prosess, ett dokumenttype
    • Mål nøye: tidsbesparelser, kvalitetsforbedringer, kundetilfredshet
    • Iterer raskt: juster basert på tilbakemeldinger og resultater

    Steg 4: Integrer i eksisterende systemer

    • API-integrasjon: koble språkmodeller til CRM, ERP, CMS, kundeservicesystemer
    • Lokal eller sky: vurder datasikkerhet, ytelse og kostnad for deployering
    • Opplæring: sikre at ansatte forstår og kan bruke verktøyene effektivt

    Steg 5: Etabler kontinuerlig forbedring

    • Datainnsamling: samle anonymiserte bruksdata for å forbedre modellene
    • Oppdateringer: holde seg ajour med nye versjoner og forbedringer
    • Måling og rapportering: dokumentere forretningsverdi og ROI

    Utfordringer og løsninger

    UtfordringProblemLøsning
    Begrenset treningsdataNorsk har ~5 M morsmålstalende vs. 1,5 mrd for engelskFlerspråklige modeller, transfer learning, syntetiske data, kvalitet over kvantitet
    DialektvariasjonMange dialekter og stor språklig variasjonSpesialtrente modeller, transkribert tale fra hele landet, lingvistsamarbeid
    Bokmål vs. nynorskTo offisielle skriftspråk med ulike normerModeller trent på begge varianter, klar merking, tilpasning til brukerpreferanser
    KommersialiseringÅpne modeller vanskelig å finansiere langsiktigOffentlig-private partnerskap, lisensmodeller, forskningsrådsstøtte
    Internasjonal konkurranseGoogle, Microsoft, OpenAI har enorme ressurserFokus på nisjer der norsk kontekst gir fortrinn, nordisk samarbeid

    Fremtidsutsikter: 5 trender for norsk språkteknologi

    1. Multimodale norske modeller — fremtidige modeller vil kombinere tekst, tale, bilde og video på norsk, med fokus på norsk kultur og kontekst.
    2. Personlige språkassistenter på norsk — AI-assistenter som forstår norske dialekter og tilpasser seg brukerens kommunikasjonsstil.
    3. Sanntidsoversettelse — høy kvalitet til og fra norsk, med bevaring av kulturelle og kontekstuelle nyanser.
    4. Domenespesifikke norske modeller — spesialtrent for jus, medisin, finans og teknologi med norsk fagterminologi.
    5. Nordisk samarbeid — tettere samarbeid mellom Norge, Sverige, Danmark, Island og Finland for felles ressurser og motvekt mot engelskspråklig dominans.

    Ofte stilte spørsmål

    Hva er NorGPT, og hvordan skiller det seg fra ChatGPT?

    NorGPT er en familie av store språkmodeller spesialtrent på norsk språk, utviklet av norske forskningsinstitusjoner. Mens ChatGPT primært er trent på engelsk, er NorGPT optimalisert for norsk språk, norsk kultur og norske bruksområder. NorGPT-23B har 23 milliarder parametere og er trent på over 30 milliarder norske ord.

    Hvorfor trenger vi norske språkmodeller?

    Engelskspråklige modeller forstår ikke norske dialekter godt, kjenner ikke norske realiteter og institusjoner, og kan føre til språklig ensretting. Norske modeller gir bedre resultater for norske tekster, forstår norsk juridisk og administrativt språk, og bidrar til å bevare det norske språket.

    Hvordan kan bedrifter bruke NorGPT?

    Automatisk dokumentanalyse og -sammendrag, kundeservice-chatboter på norsk, generering av markedsføringstekster, oversettelse, analyse av kundetilbakemeldinger og mye mer. Modellene kan integreres via API eller kjøres lokalt.

    Hva koster det?

    De fleste norske språkmodeller er åpne og gratis for forskning og utvikling. For kommersiell bruk kan det være lisensavtaler eller API-avgifter, men kostnadene er generelt lavere enn for kommersielle internasjonale tjenester.

    Er norske modeller like gode som internasjonale?

    På norsk er norske modeller ofte bedre fordi de er spesialtrente. For generelle oppgaver på engelsk kan internasjonale modeller fortsatt være sterkere, men gapet minsker raskt. For norske bedrifter som primært opererer på norsk er norske modeller vanligvis det beste valget.

    Kan norske modeller håndtere både bokmål og nynorsk?

    Ja, de fleste er trent på begge målformer og kan forstå og generere tekst på begge varianter. Noen modeller kan også håndtere dialektale varianter og samisk.


    Vår hjelp i praksis

    Vil dere utforske norsk språkteknologi for deres virksomhet? Vi hjelper med alt fra kartlegging av språkbehov til integrasjon av norske AI-modeller – med fokus på målbar forretningsverdi og bevaring av norsk språk. Book en uforpliktende samtale for å se hvordan NorGPT og norsk språk-AI kan styrke deres drift.

    A

    Alura

    Praktisk kunnskap om AI-automatisering og effektivisering for norske bedrifter.