Keymetrics

Hur många kunder har du egentligen?

Dålig datakvalitet leder till bristfällig kommunikation, irrelevanta analyser, felaktiga slutsatser och dåliga beslut. I min första krönika tänkte jag gå igenom några vanliga typer av datakvalitetsproblem och ge några exempel på vilka konsekvenser det kan få.

Den här krönikan är den första i en serie av Andreas Franson som till vardags driver företaget Internet Intelligence AB.

Ett vanligt problem är att man har dubbletter i sitt data. Exempelvis kan samma person förekomma som 2 eller fler kunder. Anledningen till det kan vara att personen uppgivit olika mailadresser eller efternamn vid olika tillfällen. När en person är flera kunder blir det svårt att veta hur många kunder man egentligen har, och man riskerar också att ge samma person olika erbjudanden.

Data behöver vara komplett. Ni vill att alla sidor på sajten mäts, annars kommer er statistik för besök, besökare och sidvisningar att vara fel. Ni vill ha så många e-mailadresser som möjligt till era prospects och kunder, för annars kommer ni inte maximera värdet av er investering i Marketing Automation. Komplett data betyder inte att ni ska samla så mycket data som möjligt, det betyder att ni ska säkerställa att ni har tillgång till all den data som är relevant för er.

Data behöver också vara konsistent, vilket syftar på att data som avser samma sak ska vara identisk oavsett var den hämtas ifrån. En kund som är kategoriserad som Aktiv i ett system kan inte vara kategoriserad som Inaktiv i ett annat. Om en besökare ser en video på er sajt så ska det inte heta ”Video View” i en Google Analytics-vy och ”Klick på knapp” i en annan. När data inte är konsistent kommer olika personer inom ert företag att ge olika svar på exakt samma fråga, och detta sker helt enkelt för att dom använder data från olika system.

Det kanske mest intuitiva är att data behöver vara korrekt, d.v.s. spegla verkligheten så som den ser ut. Ta en titt och se hur många av era kunder som är 119 år gamla (födda år 1900) eller hur många varor ni har sålt till ett pris som är mindre än 0 kronor.

En vanlig anledning till inkorrekt data är annars att den är utdaterad; exempelvis en kund som har flyttat medan ni har kvar den gamla adressen. Man behöver hålla sitt data uppdaterat, och korrekt periodiserat: Vad gäller nu, och vad gällde vid varje given tidpunkt bakåt i tiden.

Ni vill också att ert data ska ha ett konsekvent format. Om bara vissa telefonnummer har landskod så blir utländska nummer svåra att ringa. Vid mätning av digitala kampanjer är det viktigt att vara konsekvent ända ner till stor och liten bokstav i kampanjparametrarna för att uppföljningen ska kunna göras på ett effektivt sätt.

Avslutningsvis så behöver data ha rätt detaljeringsgrad (precision). Vad som är en relevant detaljeringsgrad styrs av vad ni vill kunna göra med er data. Om ni vill göra utskick till kunderna så räcker det inte att veta vilka som bor i Sverige. Om ni vill kunna bygga prediktiva churnmodeller så behöver ni sannolikt veta varje kunds samtliga transaktioner och interaktioner med företaget; i det sammanhanget gör det stor skillnad att endast veta om en kund kontaktat kundservice eller att veta hur många gånger en kund kontaktat kundservice, med vilka ärenden, vilka åtgärder som vidtogs, samt hur kunden betygsatte samtalen.

Det gäller att säkra data redan när den samlas in. Viss information behöver vara obligatorisk så att datat blir komplett. Ett telefonnummer behöver skrivas in på ett visst sätt för att säkerställa ett enhetligt format etc. etc. All digital mätning behöver testas och verifieras innan den går ut i produktion och det behöver vara enkelt att göra kompletteringar och korrigeringar (det är därför ni använder Tag Manager på er sajt).

Förutom bristande kontroll av själva datainsamlingen så är manuell hantering och bearbetning av befintlig data en vanlig orsak till försämrad datakvalitet. Manuella inmatningar och en överanvändning av Excel är grogrund för dålig datakvalitet.

Brister i datakvalitet visar sig när man börjar jobba med sin data. Det är då man upptäcker att även enkla KPI’er blir svåra (eller omöjliga) att ta fram, och att den Data Scientist som skulle bygga avancerade prediktiva modeller endast kan konstatera att datat är för odetaljerat, inkomplett och inkorrekt för att någon enda vettig modell ska kunna byggas (hen kommer försöka ändå och det kommer leda till irrelevanta analyser, felaktiga slutsatser och dåliga beslut).

Ett bra första steg mot bättre datakvalitet är att genomföra en systematisk audit. Baserat på resultaten kan man sedan börja säkra upp datainsamlingen, förändra rutiner inom företaget för hur data hanteras, samt påbörja arbetet med att förbättra kvaliteten på sitt befintliga data.

Artikeln är skriven av:

Andreas Franson
Andreas Franson
andreas@internetintelligence.se 

På Dagensanalys.se skriver vi för alla som jobbar med digitala medier och digital marknadsföring. Vi plockar upp trender, skriver om nyheter och delar våra tips och idéer. Häng med genom att läsa Dagensanalys.se!

RELATERADE NYHEER
Statista drar fram 230-sidor lång rapport om vår digitala ekonomi