Att kombinera data från olika källor är framgångsmelodin

Förra veckan gick årets Kvalitetsseminarium av stapeln, och i år låg fokus på hur undersökare och statistiker kan samla in information från olika datakällor och använda styrkan i Big Data. Under ledning av konferencier Karin Nelsson äntrade både representanter från universitetsvärlden och kommersiella aktörer scenen och beskrev såväl utmaningar som möjligheter med de nya insamlingsmetoderna.

Lilli Japec från SCB beskrev med målande exempel hur kunder idag förväntar sig data som är vidare, djupare, bättre, snabbare och billigare än någonsin förut. Det har å andra sidan lett till att både företag och myndigheter letat nya datakällor och använder sig idag av nya metoder för att besvara gamla frågor. Forskare har exempelvis studerat ungdomars rörelsemönster genom att analysera data från deras aktivitetsklockor. I studier i Finland och Slovenien undersöker man möjligheterna att snabbare beräkna landets BNP genom att mäta antalet bilar på vägarna. Det finns dessutom flera försök med AI och maskininlärning för att snabba på delar av undersökningsprocesserna och på så sätt få både snabbare och mer exakta data.

Dan Hedlin, professor vid Stockholms universitet, slog sedan ett slag för något som flera andra talare sedan repeterade, nämligen att vi inte enbart kan förlita oss på nya datakällor, utan vi måste kombinera detta med traditionella mätdata. Han pekade på en paradox som gör gällande att i Big Data-sammanhang så ökar totalfelet i undersökningen med mängden data som finns att tillgå. Hedlin menade därför att vi behöver sannolikhetsurval, och Thomas Laitila från Örebro universitet och SCB höll med i detta uttalande. Laitila menade att studier baserade på sannolikhetsurval om inte annat är ett mycket bra sätt att validera de modeller man använder för att analysera data från andra källor.

Men vilka är då dessa andra källor kan man fråga sig?

Fredrik Törn från Coop Sverige berättade att de använder sig av bland annat försäljningsdata och även uppgifter från sina medlemmar om vad, när och var de handlar. De kompletterar dessutom sin data med undersökningar som medlemmarna får svara på som kan röra exempelvis hur nöjda de är med sin butik, eller vad de skulle vilja ha i en fryspizza. Törn menade även att om de får välja mellan undersökningsdata och försäljnings-/beteendedata så väljer de helst det senare, eftersom det är både billigare och snabbare att få fram.

Gunnar Ehrnborg från Ericsson Consumer & Industry Lab menade vidare att undersökningsdata inte heller går att lita på, eftersom människor har en dålig uppfattning om vad de gjort. Han lyfte som exempel hur länge en person i genomsnitt använder internet på sin dator under en dag, där endast hälften låg inom 20% av det rätta värdet. För internetanvändning i mobilen är uppfattningen ännu sämre, och därför är det inte tillförlitligt att fråga människor om sådana saker. Däremot behöver vi ställa andra frågor för att förstå människors inställning till olika fenomen, för även om vi vet vad de gör så vet vi inte varför.

Från Tobii kom sedan Cecilia Ydremark som beskrev fördelarna med eyetracking som komplement till andra mätningar när man vill förstå exempelvis hur människor uppfattar reklam och varumärken. Idag mäts ofta reklamens räckvidd genom viewability, det vill säga om reklamen varit på skärmen och därmed kunnat ses. Men genom att studera var människor fäster blicken går det att se om reklamen inte bara visats, utan om den också blivit sedd. Tobiis undersökning visar nämligen att endast 29% av de annonser som varit synliga (enligt IABs standard) faktiskt blivit sedda av användarna. Denna data kan därför på ett effektivt sätt komplettera data om vad som visats på skärmen, för att skapa bättre förståelse för hur människor interagerar med bland annat reklam.

Tobias Sjöqvist från Odyssey bekräftade sedan värdet av att samla ihop olika typer av data för att skapa en större och mer exakt bild. I deras fall använder de både beteendedata och surveyundersökningar i kombination, för att exempelvis förstå hur människors köpresa ser ut för olika branscher. Kombinationen av tracking i digitala miljöer, med enkäter som samlar in kompletterande information menar han är oslagbar när det handlar om att förstå komplexa samband som kan ligga till grund för viktiga affärsbeslut.

Sist upp på scenen var Sophie Hedestad från Meltwater, vars tjänst syftar just till att sålla och förstå information från onlinekällor. Hon menar att grunden visserligen ligger i att ta hand om organisationens egna data, men för de som vill utvecklas vidare in i framtiden blir det avgörande att även ta hänsyn till den data som finns utanför organisationen. Att förstå sitt sammanhang blir allt viktigare i takt med att antalet kanaler att finnas i blir fler och konsumenterna blir mer kräsna kring vilka budskap de tar till sig.

Slutsatserna som kan dras efter en dag med några av Sveriges främsta experter är att det erbjuds en hel del nya möjligheter genom nya datakällor, men dessa kommer till sin rätt främst när de kombineras med traditionella surveyundersökningar där de tillsammans ger en mer sammansatt bild. Vi kan med andra ord inte förlita oss på vare sig det ena eller det andra, utan många olika informationskällor tillsammans är rätt väg att gå i dagens ofta komplexa värld. Detta gäller dessutom oavsett om du är en myndighet, lärosäte eller kommersiellt företag.

Efter en dag fylld med intressant information och spännande case längtar jag redan till nästa års Kvalitetsseminarium.