Diagnostikk og teknikk
Kronikk: Kunstig intelligens – løsningen på alle våre problemer? Et reisebrev fra Edinburgh
Eivind Storaas, Ph.d.-stipendiat implementeringsvitenskap og e-helse, assisterende avdelingsleder, Avdeling for kreftbehandling, OUS

AI-løsninger har de siste årene vært fremme i mediebildet og nå kommer også forskningen på bruken av disse løsningene i helsetjenesten. Som all annen teknologi i helsevesenet møter AI utfordringer knyttet til kompleksitet og spesifisitet. I denne kronikken vil jeg kort redegjøre for dagens status med onkologiske øyne formet av et ledende forskningsmiljø på helseteknologi ved University of Edinburgh.
Kort fortalt, hva er det for noe?
Kunstig intelligens (AI, artificial intelligence, eller KI) er et bredt begrep som dekker en rekke teknologier. Det vi mennesker egentlig tenker på som kunstig intelligens, «artificial general intelligence», finnes ikke. For enkelthets skyld vil jeg i denne kronikken bruke «AI» om disse løsningene som helhet, selv om mye klassifiseres bedre som maskinlæring, algoritmer og språkmodeller.
Makrobildet: Europa ligger bak.
De fleste AI-løsninger er bygget på en åpen plattform som OpenAI, Google Gemini og Microsoft Copilot. Felles for alle de ledende løsningene er at de ikke er europeiske. Dermed åpnes for problemstillinger innen datasikkerhet og jus, for eksempel hvor trygge serverne er og hvordan modellene påvirkes av vertslandets lovgivning. Det pågår en kraftsamling ledet av Tyskland i å bygge EuroStack, en europeisk OpenAI-løsning. I Norge har universitetene gått sammen om Keenious, et referanseverktøy, og ved Universitetet i Oslo har forskere tilgang til en GPT-løsning på en trygg server. Denne ligger som regel noen måneder bak siste versjon av ChatGPT.
Et alternativ til de åpne løsningene er å lage seg interne rom som en språkmodell så arbeider med, forkortet til «RAGs» på teknolog-språket. Dette er altså lukkede «rom» med dokumenter en institusjon selv legger inn, som språkmodellen så jobber med basert på sin opptrening og de aktuelle dokumentene. Man kan tenke seg at en «RAG» for alle e-håndboks-dokumenter i et sykehus kunne vært nyttig. Andre nyttige bruksområdet for en «RAG» kunne være å samle alle dataene for en forskningsgruppe, eller å samle alle Norges studieprotokoller for raskt å kunne finne aktuelle studier for en pasient.
Halamka et al. [1] skriver i sin ikke enda utgitte bok «Transform – the Mayo Clinic Platform and The Digital Future of Health» edruelig om fordeler og utfordringer med den raske digitale utviklingen. Det pekes på det store potensialet i AI, men også den foreløpig nokså begrensede faglige bruken (min tolkning).
Implementeringsutfordringene
Det er anslått at om lag 85 % av AI-prosjekter feiler [2]. Det er sannsynlig at trenden er lik i helsevesenet. Historien i sykehus er ofte at man innfører en løsning for gratis pilotering i ett år, klinikerne er fornøyde, men løsningen tas ikke inn videre i klinisk drift. Det beskrives en økende uro hos AI-leverandører for om markedet virkelig er der [3].
Årsaken til dette kan man foreløpig bare spekulere i. Noe kan ligge i kvaliteten på selve løsningen og i den høye spesifisiteten i ulike deler av helsevesenet. Men noe av årsaken ligger nok også i helsevesenets IKT-struktur som helhet. AI-løsninger må innlemmes teknologisk, organisatorisk og i arbeidsrutiner på lik linje med andre IKT-verktøy. Man får ikke økt effektivitet eller bedre kvalitet på pasientbehandlingen kun av å anskaffe et nytt IKT-verktøy. Teknologien og infrastrukturen som nye løsninger skal inn i er nemlig ikke designet fra bunn av, men bygget lag på lag gjennom utviklingens gang. I tillegg kommer organisatoriske elementer i en kompleks helsetjeneste. La meg gi et eksempel. Et selskap presenterer et flott nytt AI-verktøy for analyse av biopsier. I tillegg til å gi en prognostisk verdi sies det at den kutter analysetiden med hele fire timer. Det gis flotte presentasjoner til ledergruppen på sykehuset og ordene «revolusjon» og «fremtidens løsning» brukes hyppig. Men ved å vurdere helheten ser vi fort problemet. For hva om biopsimaterialet først må transporteres fra A til B? Og hva om en satsning på bedrede vilkår for transporttjenesten gjør at de kan kjøre hele uken, tiltak på laben gjør at de kan få preparatene i løsning før helgen, og at man dermed kan kutte den totale svartiden med for eksempel fire dager til en brøkdel av kostnaden for den aktuelle AI-løsningen?
Eksempelet mitt viser også utfordringene med investeringer. Den enkle (vanskelige) måten å få handlingsrom i helsevesenet på er å ta ned bemanning. Men hvilke institusjoner ønsker å gjøre spesialistmiljøet sitt mindre sterkt om man ikke absolutt må? Høyspesialisert kompetanse er svært verdifullt. Drift, forskning og utdanning skal gjennomføres og ferier avvikles. Og som i dette eksempelet med en AI-løsning for biopsier: Det må uansett være en til to spesialister som signerer ut en kreftdiagnose. Da kan det kanskje være mer fristende å se på løsninger i kjeden frem til et biopsisvar, og ikke bare de mulig sparte timene ved bruk av AI i enden av den. Jeg har løftet frem dette eksempelet til entusiastiske AI-tilhengere, uten at noen kan gi meg et godt svar.
Jeg tviler derfor på om smale AI-løsninger som løser et enkelt problem som spesialister vanligvis løser vil bli tatt inn bredden av vår komplekse kliniske hverdag. Innen radiologisk bildebeskrivelse er det mer nyansert, dog vet alle onkologer hvor vanskelig radiologi kan være. Og noen (les: et menneske) vil alltid måtte gå god for og signere ut svaret til slutt. Flyene vi flyr har kunnet lette og lande siden 1990-tallet, det finnes fremdeles piloter. I Vestre Viken har man forsket på AI-analyser av brudd i akuttmottak. Overraskende nok gav det ingen tidsbesparelse for radiologer, men sparte titusenvis av ventetimer for pasientene. Dette viser hvordan nye AI-verktøy inngår i den helheten som er helsetjenesten vår, og hvor nytten kommer er ikke alltid gitt på forhånd.
Unntaket er språkmodellene. Dette ble bekreftet av miljøet ved digital helsetjenesteforskning i Edinburgh som jeg besøkte i tre måneder i vår. Takk til NOF for reisestipendet! Forskerne der har blant annet evaluert den nasjonale AI-laben i NHS (National Health Service) og var svært interessert i hvor godt språkmodellene ble mottatt av klinikere. Hvor innføring av ny IKT-verktøy vanligvis ble møtt av motstand og skepsis, var historien for språkmodellene tvert om. Samtidig sa disse forskerne at «Vi er alle i en læringsfase nå», og helhetlige evalueringer er nødvendige for å tilgjengeliggjøre erfaringer.
En språkmodell er som regel trent på millioner, noen ganger milliarder, «ekte» tekstkilder og anslår med sannsynlighet i et nettverk av «noder» hva som er neste ord. Den gjetter med andre ord. Noen ganger lyver den, eller «hallusinerer» som teknologene liker å kalle det. Jeg vil anbefale alle onkologer å be ChatGPT 5.0 om å oppsummere et fagfelt man selv er høykompetent i. Man vil fort se at nyansene glipper. Den er ikke intelligent som sådan, den oppsummerer tilgjengelig tekst. Pasientene våre kommer til å gjøre det samme og utfordre oss i konsultasjonene våre. Det kreves god fagkompetanse for å imøtekomme bekymringer eller innspill som pasientene får fra disse språkmodellene.
ChatGPT 5.0 er litt bedre enn den forrige versjonen, 4.5, men fremdeles ikke pålitelig i kontekst av å utøve medisin eller fag mener jeg. Mange forskere beskriver hvordan referanser eller forfattere, eller begge deler, plutselig er diktet opp når de spør om en litteraturliste eller et saksfelt. ChatGPT er også koblet til det åpne internett og blir utfordret av mengden ikke-menneskelig generert tekst som internett mer eller mindre flyter over av. Et anslag er at nærmere 90 % av alt innhold på nettet i løpet av kort tid vil være generert eller prosessert av maskinmodeller.
ChatGPT er i all hovedsak ikke en søkemotor, men et tekstverktøy. Best brukes den til å endre eksisterende tekst, for eksempel et brev eller en informasjonstekst. Det er svært viktig at man gir den et godt «prompt» eller instruks om hvordan du vil ha teksten behandlet. En professor i Norge har pålagt sine stipendiater til å få utkast til kappen sin i GTP. Dette er et eksempel som bruker disse språkmodellene til hva de faktisk er gode til; å arbeide med eksisterende tekst for noen som har svært god kjennskap til hva teksten handler om. Noen AI-løsninger til klinisk bruk transkriberer først tale til tekst, for så å utsette teksten for det trente materialet for å kondensere og summere den til ønsket grad. I Norge har primærhelsetjenesten tatt disse kliniske løsningene i bruk. Enkelt fortalt vil løsningene lytte til konsultasjonen før den produserer et sammendrag. Dette er formulert anonymt i en nettleser og limes direkte inn i journalen. Andre språkmodeller kan enkelt brukes i nettleser eller app for å generere brev eller henvisninger. Hvordan det står til med informasjonssikkerheten til pasientene oppi dette er jeg usikker på, men jeg antar det er vurdert.
På sykehus er det meg bekjent kun pilotering av slike løsninger. Teknologien for å lese journal for å autogenere sammendrag til epikriser og henvisninger finnes. Jeg tror flere av disse løsningene vil komme inn i vår hverdag. Disse vil integreres i journalsystemet etter hvert som juristene blir enige med seg selv om beskyttelse av pasientdataene. Totalt sett vil nok dette gi oss en enklere hverdag i møtet med den informasjonsflommen som er moderne medisin.
AI i stråleterapi – et før og etter?
Jeg har sannsynligvis snart tegnet mitt siste risiko-organ, (organ at risk, OAR). RaySearch sitt seminar i juni 2025 om AI-løsninger som auto-genererer både OAR og feltplanlegging med optimalisering, var imponerende. Eksempelvis skapte den 129 OAR i toraks på 40 sekunder. Ikke visste jeg det var så mange OAR i toraks.
Noen elektive felt ble også presentert. På planlegging og feltoptimalisering viste RaySearch hvordan tre til fire timers arbeid nå ble gjort på ett til tre minutter. Disse løsningene må teknisk og organisatorisk tilpasses lokale forutsetninger ved hvert strålesenter, et arbeid som er i gang ved OUS. RaySearch anbefaler også plan for både validering og evaluering per senter. Evalueringen av et strålesenter i NHS viste at uten en helhetlig tilnærming til pasientforløpet ga ikke autogenererte felt mer effektive forløp for pasientene. Markedssjefen i RaySearch anga også i seminaret at autogenererte tumorvolum var for komplisert for AI i overskuelig fremtid. Skal man inkorporere tumorbiologi, strålefysikk, evidens (og svakheter ved den), pasientens sykdomshistorie, antatt toleranse og preferanser, pasientlogistikk, tilgjengelighet på maskin, og ikke minst behandlingsintensjon, ja, så blir mangel på gode data inn i AI-modellene skrikende åpenbart. For som min klinikkleder Sigbjørn Smeland sa i et møte med brukerorganisasjonen her på Radiumhospitalet: «AI er ikke behandling». RaySearch planlegger å rulle ut «OAR Hippocampus» på et tidspunkt i fremtiden. Jeg håper at den onkologen som skal behandle meg, skulle jeg mot all formodning bli pasient og trenge det, har god kompetanse fra før av når vedkommende signerer ut et slikt autogenerert volum.
En fersk MIT-studie [4] viste tydelig hva som skjer med menneskehjernen når vi får mer hjelp enn vi trenger. Deltakerne ble delt i tre grupper hvorav en kun brukte analoge metoder for å skrive essays, en gruppe brukte Google og en gruppe brukte siste versjon av ChatGPT. Gruppen som brukte ChatGPT hadde på bare fire måneder dårligere formuleringsevne enn gruppen som skrev analogt, synlig på funksjonelle MR-serier. En like interessant studie ved OUS [5] viste at kompetanse hos endoskopører raskt falt etter innføringen av et AI-støtteverktøy.
Utfordringen blir altså å sikre kompetanse både i drift og ikke minst i utdanningen av fremtidens stråleonkologer. Alle AI-genererte OAR vil måtte sees over av kyndige øyne, også i fremtiden. Dagens stråleonkologer har vært med på hele utviklingen fra direkteinnstilling av kappefelt til pustestyrt behandling og nå AI. Selv var jeg heldig som fikk med meg direkteinnstilling på apparat da jeg var LIS, hvor jeg forsøkte å påvirke noen lymfomer i hud. Jeg vet ikke hvor bra det ble, men det gav meg en forståelse av hva det egentlig handler om, og hvordan de fine linjene når jeg tegner på PC-stasjonene til syvende og sist er plater som påvirker strålens utgangspunkt i maskinarmen. LIS som begynner i onkologien i dag vil ikke nødvendigvis få slike forutsetninger i den kliniske tjenesten. En utdanningsstrategi med bred faglig tilslutning vil bli avgjørende for å sikre at fremtidens stråleonkologer får nødvendige forutsetninger og kompetanse.
Avslutning
Oppsummert har AI-løsninger potensiale for å forbedre hverdagen til oss onkologer. Ved helhetlig tilnærming i innføringen kan nytte som økt effektivitet og kvalitet i behandlingen skapes, men dette kommer ikke nødvendigvis av seg selv. Jeg har ikke gått inn på AI i forskningen her, men kort fortalt tror jeg det er en revolusjon på gang, og at korrekt og etterprøvbar bruk blir helt vesentlig.
Onkologien kommer ikke nødvendigvis til å bli enklere i møtet med AI, kanskje tvert om, og kompetanse innen AI-løsninger vil være nødvendig for oss onkologer i fremtiden.
Referanser:
- Halamka, bok, ikke utgitt: «Transform – the Mayo Clinic Platform and The Digital Future of Health.
- Standford university, AI index report 2025
- Sandra Gillner, “We`re implementing AI now, so why not ask us what to do? How AI providers perceive and navigate the spread of diagnostic AI in complex healthcare systems”, Social Science and medicine 2024
- Kosmyna et al, MIT, “Your brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI assistand for Essay writing task”, British journal of General Practice. 2025.
- Budzyn et al, “Endoscopist deskilling risk after exposure to artificial intelligence in colonskopy: a multicentre, observational study”. Lancet Gastroenteral Hepatology 2025.