tirsdag 15. februar 2011

Google for fall?


Google er suverene på søk, men stadig fleire uheldige eksempel på lureri (spam) skadar søkegiganten. Dersom det ikkje hadde vore så stor avstand til konkurrentane, kunne dette vore tids¬punktet der kongen vart kasta.

Eventyret Google
Historia om Google er som henta frå eventyret, det amerikanske sjølvsagt. To studentar som startar ein søkemotor frå hybelen, som del av ein master og seinare PhD. John Battelle har skrive om dette i den fascinerande ”The Search – How Google and its Rivals Rewrote the Rules of Business and Transformed Our Culture”.

Google ope eller lukka?
Mange ser på Google som det opne alternativet, og samanlikna med t.d. Apple har det mykje for seg. Men ein må ikkje la seg lura, for kjerneverksemda søk har Google alltid vore lukka. Algoritmar har vore leiestjerna for Larry Page og Sergey Brin. Eg har tidlegare fortalt om konferansen Search Engine Meeting i Boston i 2000 der alle dei viktigaste søkemotorane var representerte, også Google. Larry Page var den gangen outsideren på veg opp. Han hadde eitt svar på alle utfordringar (om søkemotorane kunne klara å indeksera heile weben, korleis unngå at spam øydela søk osv.): Betre algoritmar.

Svaret er betre algoritmar
Google er då også gjennomsyra av denne tankegangen; alt kan løysast med betre algoritmar. Nokre ganger får det komiske resultat, som blemma med Buzz der dei smarte algoritmane viste seg å provosera brukarane kraftig, og tok i praksis livet av Twitter-konkurrenten.

God PR og dårleg PR
Mykje av Googles suksess byggjer på systemet PageRank. Det er grunnlaget for PhD-arbeidet til Larry Page og Sergey Brin, og går i korte trekk ut på å rangera nettsider etter kor mange og kor gode (autoritetsmessig) lenker dei har til seg. Systemet er ikkje noko Page & Brin har funne på sjølve, dei tok utgangspunkt i Eugene Garfields citation analysis, ein metode han utvikla ved University of Pennsylvania i 1950-åra. PageRank er elles patentert av Stanford University og det betyr at kvar gang du og eg søkjer på Google, tikkar det inn nokre cent til dei. Til saman blir det ein ganske hyggeleg  årleg sum.

Men PageRank kan også lurast ved å etablera såkalla lenkefarmar (link farms). Tusenvis av nettstader blir brukte til å lenka til kunden sin nettstad, og for spesifiserte søkeord. Det er mellom anna dette som er avslørt i saka om J. C. Penney, omtalt litt lenger nede.

Akkurat no betyr PR dårleg PR for Google.

Avstand mellom teori og praksis
Google sin offisielle politikk har heile tida vore å slå hardt ned på forsøk på lureri. Men praksis har vore ein annan. Det har heile tida vore muleg å lura Google, og spam har vorte eit større og større problem. Avstanden mellom politikk og praksis er farleg, og det er den som gjer Google sårbar.

Organisk kontra ”black hat”
Den eksplosive veksten i firma som tilbyr søkemotor-optimalisering, har fått fram mange firma som har lureri som forretningside. Eit SEO-firma (Search Engine Optimization) har i hovudsak to måtar å arbeida på: organisk og ”black hat”. Det første alternativet inneber å følgja reglane (skrivne og uskrivne) og ha brukaren brukaropplevinga som rettesnor. Det andre alternativet har topp-plassering i Google-søk som einaste mål, og alle teknikkar er tillatne.

Det er her snakk om det som blir kalla organiske søk, altså søk der søkemotoren står for alt arbeid og der det ikkje er betalt for plassering. Betalte resultat skal tydeleg merkast, og i Google vil dei enten vera i starten av resultatlista, eller typisk i høgremargen.

Den siste ærlege SEO
Jill Whalen har arbeidd med søkemotor-optimalisering i meir enn 10 år, og har gjennom nyheitsbrevet High Rankings Advisor spreidd kunnskap om organisk SEO og stimulert til diskusjon. Når ein så profilert SEO-ekspert er i ferd med å gi opp, bør varsellampene blinka kraftig hos Google. I eit kraftig oppgjer med Google, ”Dear Google... Stop Making Me Look Like a Fool!”, set ho ord på frustrasjonen mange har:

Dear Google,
I'm tired of you making me look like a fool.
I've spent a good portion of the last 10 years patiently explaining to business owners and budding SEO enthusiasts that the key to being found in Google is to have one, great, all-encompassing website. That throwing up multiple keyword-rich domain doorway sites is a fool's errand. That writing crappy articles and submitting them to networks full of other crappy articles is a waste of time and bandwidth. That keyword-stuffed gibberish on your website just makes it look stupid. That link farms are spammy.
And I really thought that by 2010 all of the above would be 100% true. And yet they're not. I'm not sure if they're even 50% true.

Google i meir trøbbel
I New York Times-artikkelen “The Dirty Little Secrets of Search” blir eit av dei mange vellykka forsøka på å lura Google avkledd. Firmaet J. C. Penney har ved hjelp av eit SEO-firma klart å komma på topp for mange søkeord innan manufaktur (kle, interiør). Sjølv om firmaet er stort, er det likevel merkeleg at dei skal kunna slå kjende merke¬varenamn som Macy’s, WalMart, Home Depot og Sears m.fl. på standard søkeord. Korleis kunne det vera muleg?

New York Times henta eksperthjelp frå Blue Fountain Media og såg nærmare på J. C. Penneys nettsider. Det dei fann, var ikkje pent. Det var velkjende triks frå ”black hat”-verda, triks som Google offisielt seier vil føra til utelukking, men som i praksis er veldig mykje brukte og som gir resultat. Det er nettopp det ærlege ekspertar som Jill Whalen blir frustrerte over.

Dette er farleg for Google. Dersom dei hadde hatt sterkare konkurrentar, kunne det gått skikkeleg ille. Men Microsofts Bing, som er den einaste reelle konkurrenten, er plaga av dei same problema som Google. Men som nummer to langt bak, får dei mykje mindre merksemd.

Now’s the time
Kan nokon ta opp konkurransen med Google? Ja, eg trur det. Eg har tru på at eit skikkeleg open source-initiativ der ein starta med eit godt produkt (Lucene?) og tok i bruk grid-teknologi gjennom bruk av all ledig datakapasitet rundt om på nettet, kunne ha ein sjanse. Det ville i så fall vera ein open søkemotor der algoritmane var kjende, og der brukarinvolvering ville vore med og forma resultatet (stemma opp/ned søkeresultat, luka ut kjeltringar osv.). Jimmy Wales hadde ein liknande ide som oppfølgjar til Wikipedia. Dessverre ser det ut som han har gitt opp. Er det andre som vågar å utfordra Goliat?

Ingen kommentarer: