Microsofts AI allt bättre på att förstå vad som sägs

Microsoft har länge jobbat med att utveckla AI som kan förstå vad som sägs i en konversation. I deras senaste försök uppvisades en felmarginal på endast 5,1 % – det lägsta som någonsin uppmätts i branschen.
Enligt Xuedong Huang, tekniker på Microsoft, är det en ny milstolpe i utvecklandet av språkförståelse hos datorer. Det tidigare rekordet låg på 5,9 %, något som nu är slaget. Testet använder sig av Switchboard, inspelade telefonsamtal där två främlingar pratar om ämnen såsom sport och politik. Testet har länge använts av forskare för att mäta hur väl datorer kan förstå vanliga konversationer.
Microsofts framgångar menar Huang beror på att de utvecklat ett nytt sätt för deras AI att analysera konversationer. Istället för att lyssna efter varje ord, försöker datorn läsa hela konversationen för att kunna förutspå vilka ord som kommer härnäst. Det gör att konversationen inte bara blir en samling ord, utan får ett sammanhang. Enligt Huang gör det att AI:n kan anpassa sig efter såväl ämnet som kontexten i konversationen.
Trots de stora framgångarna finns det mycket arbete kvar menar han. Att få en AI att kunna läsa av konversationer i bullriga miljöer, samt anpassa sig efter dialekter och olika talstilar är fortfarande något som är svårt. Dessutom kan AI:n fortfarande bara transkribera konversationen, men inte till fullo förstå konversationens betydelse. ”Att röra sig från att känna igen till att förstå tal är nästa stora utmaning för språkteknologi” säger Huang.
Dessutom gäller framgångarna endast engelska, vilket inte ens är världens största språk. Att utveckla god språkförståelse även på andra språk är en jätteutmaning, så det kommer nog dröja innan vi får se AI som kan förstå, och även själva föra en konversation på svenska.