fredag 5. oktober 2007

Løgn, forbanna løgn og statistikk

Norge.no har tryna etter å ha gått seg vill i web-statistikken og rapportert sjokkerande låge besøkstal. Saka har fleire fasettar enn som so, men her er det fenomenet web-statistikk som er interessant å dvela ved.

Web-statistikk er eit vanskeleg felt fordi det har dårleg definerte begrep, problematiske målemetodar og generelt høg grad av usikkerheit. Eg skal ikkje påstå å sitja med full oversikt over feltet, men vil ta opp ein del moment til diskusjon:

  • Uklare begrep: Kva er ein unik brukar? Kva med ein (ikkje-unik) brukar? Sideoppslag? Treff? Det siste burde ingen rapportera, det er jo heilt uinteressant og direkte misvisande som målestokk. Analyseverktøya definerer ein unik brukar ulikt (kor langt tidsrom skal gjelda?) og gir difor ulike tal på dette og på andre parametrar ved analyse av same logg.

  • Målemetodar: Grovt sett kan vi dela metodane i server-baserte og klientbaserte målemetodar. Den første er den tradisjonelle analysen av web-loggen; den andre er script-basert og kombinerer Javascript og cookie for måling og verifisering. Det finst også kombinasjonar av desse. Ein annan ting er kva serveren blir sett opp til å logga.

  • Maskinell trafikk: Mykje av trafikken på ein nettstad er ikkje generert av menneske, men av maskiner. Korleis skal det filtrerast ut? På våre eigne prosjekt-nettstader har vi sett at andelen søkerobotar i periodar har vore på meir enn 50 % av all trafikk!
Det er også fleire moment som gjer temaet web-statistikk vanskeleg. Men det største problemet er likevel at dei fleste ikkje ser verdien av web-statistikken. Web-statistikken inneheld gull, og du treng ikkje grava lenge for å finna det. Det er når du skal samanlikna tala med andre, problema oppstår.

Ingen kommentarer: