Voice kommer att förenkla och förändra hur vi interagerar med internet och maskiner och det är ett måste att tänka röstinteraktion för alla företag, som idag bara tänker appar och webb.
Det säger Mattias Falkendal, som tillsammans med Erik Lidsheim grundat voice-byrån Talking to me med ambitionen att bli Nordens ledande specialiserade voice-byrå, i en intervju med Dagens Analys.
Varför startade ni voice-byrån Talking to me?
Erik och jag pluggade entreprenörskap tillsammans på Handelshögskolan i Göteborg. Han har haft en resa i byråvärlden och har bland annat grundat Söderhavet och Nansen. Jag har en bakgrund inom bland annat datadriven marknadsföring och sökmarknadsföring från Klikki-tiden, men vi har länge pratat om att göra något tillsammans.
För min egen del trillade polletten kring voice ner för ungefär ett år sedan när jag lyssnade på en produktägare från Alexa och Google i samma veva visade upp Duplex på en utvecklarkonferens (reds. anm: Duplex är en AI-teknik för att genomföra naturliga samtal som Google lanserade i maj 2018 på sin årliga utvecklarkonferens Google I/O).
Min magkänsla var att ”nu händer det på riktigt” med röst och röstinteraktion och det kommer vara omvälvande och för väldigt många användarfall kommer det vara det primära sättet att interagera med maskiner och med internet. Så det var baserat på den grundtron vi startade byrån i höstas.
Det är så mycket som är nytt kring voice att vi insåg att det fanns ett växande behov av specialistkunskap. Vi hade ju tidigare erfarenhet av digital transformation, digital branding och digitala affärer, men sedan vi startade byrån har vi gått all-in kring voice och provat det mesta som är möjligt. Det gör att vi har personer hos oss, som snabbt blivit auktoriteter på området.
Ett helt nytt angreppssätt krävs för att utveckla tjänster för voice och det är ett helt nytt gränssnitt, där det inte finns någon hierarki i flöden som på webben och där det krävs en annan typ av design. En annan dimension som är specifik för röst och röstinteraktion är att man som varumärke behöver bestämma hur man ska låta – helt enkelt vilken röst man ska ha.
Hur många företag i Sverige arbetar med voice och har lanserat funktioner för Google Assistant?
Det är ett femtiotal svenska företag som släppt appar, eller Actions, för Google Assistant. Du kan hitta dem på Assistant.google.com där de beskrivs mer ingående.
Det som krävs för att kunna bygga en bra röstfunktion är att man som företag har data som är väl strukturerad och att man har väl fungerande API:er.
Vad är målsättningen med Talking to me?
Vi har några målsättningar, dels att etablera den ledande byrån inom det här området inte bara Sverige utan initialt även i Norden. Vi har redan kunder i Danmark. På lite sikt ser jag en potential för oss att även växa mer internationellt. Vi är så pass tidigt ute att det inte är otänkbart att vi kommer göra projekt för kunder i andra länder, till exempel i USA.
En annan viktig målsättning som inte har med voice att göra är att vi vill vara en byrå som är mindre homogen än branschen och med mångfald som grundvärdering. Vi vill göra tvärtom mot vad som råder i stora delar av branschen idag och skapa ett mångfacetterat team och vi jobbar till exempel aktivt för att anställa kvinnliga kodare och personal med olika bakgrund, som speglar hur vårt samhälle ser ut.

Hur många kunder har ni idag?
Vi börjar närma oss tio kunder och det är framför allt stora etablerade varumärken, men det finns även lokala bolag med en innovativ approach.
Vi får även mycket strategifrågor ifrån globala bolag, både inom B2B och B2C, där de vill ha hjälp att förstå och utveckla sin strategi för voice.
Vilka av de digitala assisterna jobbar ni med för era kunder?
Google och Alexa, men nu är det ett stort fokus på Google i och med att de lanserat sin assistent på svenska.
Siri är också med i diskussionen ibland eftersom den har en intressant funktion som heter ”Siri Shortcuts”, som innebär att du kan ”enabla” din vanliga app så den fungerar med Siri.
Men framför allt är det stort fokus på konversationsdesign, som inte är plattformsspecifik och som innebär förbättrade röstinteraktioner för våra kunder.
Cortana från Microsoft och andra digitala assistenter har vi inget fokus på idag.
Tror ni att typen av kunder kommer förändras över tid och att det inte bara kommer vara stora etablerade varumärken som satsar på röstinteraktion?
Vi vill ju gärna jobba med kunder som förstår det skifte, som vi är inne i. Sitter man idag och planerar ett app-projekt eller ett webbprojekt och inte har med frågor kring hur man ska kunna interagera med röst, så är det verkligen hög tid att ta med voice som en viktig komponent.
Sen finns det ju innovativa företag som inte är storbolag idag där det kan vara lättare att ta en ”voice-first approach”, som kan vara väldigt spännande för oss att jobba med.
Vad är det som framför allt driver tillväxten av voice och voice-tjänster idag?
Dels är det den exponentiella utvecklingen av teknologin, som blir märkbart bättre månad för månad.
Sen är det försäljningen av smarta högtalare och tillgången till digitala assistenter med svenskt språk. De smarta högtalarna är en av de snabbast växande hemelektronikprylarna någonsin och vi har indikationer på att penetrationstakten i Sverige av till exempel Google Home är en av de högsta hittills på någon marknad globalt sett.
En annan sak som driver är aha-upplevelser med bra tjänster, som får folk att prova. Googles egen sökfunktion är bra och det finns en hel del andra bra funktioner kring att spela musik, poddar och radio och lägga till varor till din inköpslista, men många tjänster är fortfarande i experimentstadiet.
Om Amazon lanserar Alexa på svenska så kommer det också driva användning och intresse. Alexa har dessutom annan funktionalitet, som är intressant även om den inte nödvändigtvis är bättre än Google och Googles funktionalitet.
Hur ser du på SEO och voice, du som har en bakgrund på Klikki och Nordic Morning?
Det är både relevant och superintressant och det kommer vara andra faktorer än vanlig SEO, som avgör om Alexa eller Google Assistant kommer föreslå din röstapp som den mest relevanta vid en röstsökning jämfört med andra typer av sökningar.
Det gäller att direkt leverera nytta, kvalitet och relevanta svar. Sen kan den inledande konversationen leda till köp senare.
Och till sist: är Voice överhajpat eller underhajpat just nu?
Det är svårt att bedöma när man sitter mitt i det, men jag tycker nog att det är underhajpat. Intresset är stort och röstsökningarna blir både bättre och fler. I Sverige bör man tänka sig ett scenario med minst en miljon användare av smarta högtalare och en funktionalitet, som är mångfalt bättre än idag: hur kan det påverka din affär? Det är ett scenario som inte ligger fem år bort utan snarare 5 månader.
Med det perspektivet tycker jag att det är otroligt underhajpat.