Det är drygt ett år sedan vi skaffade vår smarta högtalare. En produkt som ser ut som en blomkruka, med den skillnaden att vi kan prata med den. Ibland ber vi den kolla väderprognosen, ibland starta en timer. Vi använder den för att spela musik, styra belysningen hemma och kolla upp fakta. Den har blivit en naturlig del av vår vardag och sedan oktober 2018 talar den dessutom svenska.
Vår högtalare är ett exempel på en AI-lösning, det vill säga en produkt eller tjänst som använder sig av artificiell intelligens (AI). AI har under åren blivit ett allt vanligare inslag i organisationers strategiarbete, i samhällsdebatten och vid kaffeborden. Många kopplar kanske i första hand AI till science fiction, avancerade robotar och skrämmande framtidsscenarier, men vi möter redan AI-lösningar som en naturlig – och relativt osynlig – del i vardagen, till exempel då vi gör en bildsökning på Google, erbjuds rekommendationer på Netflix eller kommunicerar med en chattbott. I alla dessa fall bygger de underliggande lösningarna delvis på någon typ av AI-teknologi.
Vad är AI?
AI kan definieras på många sätt, exempelvis beskrivs AI av EU som system som uppvisar intelligent beteende genom att analysera kontexten och utföra handlingar – med viss grad av självständighet – för att uppnå specifika mål. Vad innebär detta då rent konkret?
Dagens AI-lösningar är exempel på svag AI (ANI, artificial narrow intelligence), dvs. lösningar som fokuserar på en given, ofta rätt snäv, uppgift. De uppvisar intelligent beteende inom en given kontext för att nå ett specifikt mål – de kan till exempel rekommendera film eller musik, kategorisera bilder, eller svara på frågor inom ett givet område. Vi är långt ifrån bred AI, eller AGI (artificial general intelligence), dvs. generella lösningar som likt oss människor kan hantera olika typer av problem och uppgifter.
Man brukar säga att en AI-lösning endast är så bra som de data som den tränats på.
För att lösningarna ska kunna uppvisa intelligent beteende, behöver de tränas på stora mängder data. För att exempelvis Googles bildsökning ska kunna känna igen en katt, behöver den tränas med många kattbilder. Ju fler och bättre bilder, desto säkrare kan lösningen avgöra om en godtycklig bild visar en katt eller inte. Stora mängder data är dock inte tillräckligt, de måste också dessutom vara representativa. Om vi försöker lära Googles bildsökning känna igen en katt genom att träna den på bilder med en katt som sitter på en trädgren, kommer systemet att lära sig att en katt alltid hör ihop med en gren.
Man brukar säga att en AI-lösning endast är så bra som de data som den tränats på. Om lösningen tränas på icke-representativa eller fördomsfulla data, kommer lösningen att ge icke-representativa resultat och bete sig fördomsfullt. Vi har sett många exempel på denna typ av biasproblematik. Exempelvis har lösningar som tränats på ljushyade ansikten inte känt igen konturerna av ett mörkare ansikte medan rekryteringssystem som tränats på gamla arbetstagardata sållat bort kvinnor då de flesta tidigare anställda varit män.
AI och språk
Tillbaka till vår smarta högtalare. Då den lanserades i maj 2016 kunde den endast kommunicera på engelska, medan stödet för ytterligare språk utökats kontinuerligt och sedan oktober 2018 fungerar den som sagt även på svenska. Eftersom språk är nyckeln till kommunikation, kunskap och information, oberoende av om det handlar om att diskutera med en tjänsteman i ett kontor, att logga in på en digital portal på nätet eller att tala med en röststyrd högtalare, avgör tillgången till stöd för det egna språket – eller ett språk man förstår – hur användbar en lösning är på individnivå.
Att inte kunna interagera med en smart högtalare upplevs knappast lika begränsande som om vi på grund av språk inte kan sköta vardagliga ärenden i ett kontor eller på nätet. En av målsättningarna inom ett av AI:s delområden – språkteknologi – är därför att bygga lösningar som kan öka tillgängligheten och överbrygga språkbarriärer. Inom språkteknologi utvecklar man system för att hantera naturligt språk (NLP, natural language processing), och används i en mängd sammanhang och tillämpningsområden. Till exempel kan maskinöversättning användas för automatisk översättning av text eller tal, medan talteknologi (taligenkänning och talsyntes) möjliggör bland annat röststyrning, uppläsning av digitala texter, automatisk direkttextning och transkribering.
AI-lösningar som stöd för det svenska i Finland
Att utveckla språkteknologiska lösningar är resurskrävande och de stora aktörerna har ofta kommersiella intressen, varför utvecklingen i första hand sker på engelska och andra världsspråk. Lösningar för mindre språk är sällan vinstbringande, varvid ansvaret för att anpassa systemen till nationella minoritetsspråk landar hos minoriteterna själva.
Stora AI-satsningar har gjorts i Finland under de senaste åren, men språk har inte spelat någon betydande roll i arbetet. I takt med att AI-lösningar blir aktuella inom den offentliga sektorn och i form av tjänster som alla förväntas använda, aktualiseras även frågan om språk eftersom lösningarna bör vara tillgängliga på både finska och svenska. Medan teknologin i sig är språkoberoende, finns det många faktorer som talar för vikten av att lösningar som ska bli flerspråkiga planeras och tas fram som sådana redan från början.
Om man lärt sig använda ett system på ett språk, vad är sannolikheten för att man efter ett år eller två ändrar sina rutiner för att använda systemet på ett annat språk?
En av orsakerna är ekonomisk – fler språk kräver större resurser och det är viktigt att man budgeterar för detta i ett tidigt skede. En annan orsak är mångfald; studier betonar vikten av att beakta många perspektiv och behov redan då man planerar ett system för att det ska bli så inkluderande och användbart som möjligt. Det blir ofta dyrare att ändra en existerande lösning än att ta in funktionaliteten i utvecklingsfasen. Slutligen finns det också en praktisk orsak till att alla språk borde beaktas i ett tidigt skede: om man lärt sig använda ett system på ett språk, vad är sannolikheten för att man efter ett år eller två ändrar sina rutiner för att använda systemet på ett annat språk?
Om vi aldrig trycker på den svenska flaggan i självbetjäningskassan, skickar vi inga signaler till butikskedjan om att den svenska tjänsten behövs.
Tjänster inom den offentliga sektorn bör vara tvåspråkiga, men inom den privata sektorn finns inga officiella krav på flerspråkiga lösningar. I dessa situationer är det allas ansvar som användare att visa på behovet. Om vi aldrig trycker på den svenska flaggan i självbetjäningskassan, skickar vi inga signaler till butikskedjan om att den svenska tjänsten behövs. Om de lösningar som finns inte används, kan vi inte förvänta oss att de kommer utvecklas – eller ens finnas tillgängliga – framöver.
Att träna språkteknologiska lösningar
AI-lösningar lär sig språk på två huvudsakliga sätt: regelbaserade metoder bygger på lexikon och grammatik, ungefär som då vi lär oss ett nytt språk, medan statistiska metoder automatiskt bygger kunskap om språk baserat på stora mängder exempel, ungefär som då vi som barn lär oss vårt modersmål. För att ta fram bra språkteknologiska lösningar behövs därför två typer av material: lexikon, ordlistor och korpusar samt tillgång till stora mängder språk i digital form.
För att kunna tolka naturligt språk, oberoende av om det är tal eller text, behöver lösningen analysera både syntax (grammatik) och semantik (innebörd). Det senare är klart det svårare, eftersom det kräver en viss förståelse för kontexten och ordens betydelse i den givna kontexten. Lexikon, ordlistor och korpusar behöver därför annoteras med information om till exempel struktur, relationer och betydelse. Resurserna sparas i språkdatabaser som gör data tillgängliga för språkteknologisk forskning och utveckling. Här har vi mycket att vinna på ett samarbete med Sverige, där man upprätthåller stora språkbanker och har en aktiv språkteknologisk forskning.
Målsättningen är att bygga tvåspråkiga system för situationer specifika för Finland.
Precis som för alla andra AI-lösningar är det viktigt att de data som används för att träna språkteknologiska tillämpningar är representativa. Om vi skapar finlandssvenska lösningar baserade på sverigesvenskt tal, kommer lösningarna inte att motsvara den svenska vi använder. Detsamma gäller om vi endast tränar lösningarna på finlandssvenska texter från 1700-talet. Kultur och sammanhang är viktiga faktorer då man bygger AI-lösningar, och trots fördelarna kopplade till samarbete med Sverige är den finländska kontexten också viktig; målsättningen är inte att bygga finlandssvenska särlösningar utan tvåspråkiga system för situationer specifika för Finland.
Inte bara teknik
Att planera, fatta beslut om och ta fram en AI-lösning som är användbar och tillgänglig för så många som möjligt förutsätter insyn i teknologins möjligheter, förståelse för den givna kulturen och kontexten samt en viss nivå av beställarkompetens. Tekniskt kunnande behövs för att man ska kunna veta vad som är möjligt, vad som krävs för att förverkliga en idé samt för att kunna uppskatta konsekvenserna av olika designbeslut. Om man å andra sidan saknar förståelse för kulturen eller de givna behoven är det svårt att skapa relevanta lösningar. Likaså är det viktigt med beställarkompetens, dvs. förståelse för vad man vill ha samt förmåga att kommunicera detta på ett så entydigt sätt som möjligt, för att öka chansen att det system som utvecklas motsvarar behoven.
Tekniskt kunnande behövs för att man ska kunna veta vad som är möjligt.
Medan frågor kring teknik traditionellt har ansetts relevanta för ingenjörer och andra teknikintresserade, ses digital kompetens i dag som en del av allmänbildningen. Digitaliseringen diskuteras allt oftare i termer av samhällsutveckling, inte enbart teknikutveckling. Detsamma gäller även för AI, som kan verka vara ett tekniskt område, men för att skapa representativa, relevanta och användbara lösningar räcker det tekniska kunnandet inte till. Planerings- och utvecklingsarbetet behöver ses som en tvärvetenskaplig ansats, som engagerar en mångfald av personer med olika specialområden.
Digitaliseringen diskuteras allt oftare i termer av samhällsutveckling.
Hur kan man då som användare bidra till AI-utvecklingen? Ett enkelt sätt är att använda AI-lösningar även om de inte ännu är särskilt användbara – ju fler språkliga interaktioner till exempel en chattbott tar del av, desto bättre blir den på att tolka och förstå det som sägs eller skrivs. Vår smarta högtalare förstår mycket, men absolut inte allt jag säger på svenska. Talar jag min österbottniska dialekt förstår den ännu mindre. Men jag försöker leva som jag lär och formulerar om det jag vill säga för att hjälpa den förstå. Och förr eller senare brukar det lyckas.