onsdag 27. februar 2008

Semantisk web? Lær heller å krabba først!

Verda er full av spennande idear, men røyndommen slår ofte brutalt gjennom. Eg søkjer etter informasjon om konferansen "Semantiske dager 2008" som skal haldast i Stavanger i april ein eller annan gang, eg skulle gjerne visst datoen.

Eit søk på konferansenamnet Google gir meg ingen verdifulle treff, sjølv om både Norstella og Abelia (medarrangørar) dukkar opp. Norstella-treffet verkar relevant, men fører meg berre til ei generell side der konferansen ikkje er nemnd. Abelia viser meg til eit innlegg på Semantiske dager 2007.

Eg prøver OLF - Oljeindustriens Landsforening - som er ein sentral organisasjon i arrangementet. Eit søk på 'semantiske dager' gir meg 114 treff der ingen ser ut til å dreia seg om arrangementet. Søket 'semantiske dager 2008' gir også 114 treff (!) - sannsynlegvis dei same treffa.

Denne konferansen skal altså handla om det store nye området semantic web, men arrangørane er ikkje ein gong på web 1.0-stadiet. Her bør ein først læra seg å krabba før ein prøver å gå.

[eg prøvde for moro skuld søket 'semantisk' og det ga berre 4 treff! Det første treffet hadde tittelen 'Semantic Days 2008' - tenk det! Intelligensen i OLF sin søkemotor overgår min forstand.]

torsdag 21. februar 2008

Nintendo Wii - Jippii!

Det er mykje kjekt med å ha ungar - å kunna få fullt utløp for eigne barnslege lyster er berre ein av dei kjekke tinga. Det resulterte denne veka i eit innkjøp av Nintendo Wii, godt hjelpt av litt dårleg samvit for å måtta jobba heile vinterferieveka.

Nintendo Wii fortener ein eigen omtale. Eg trur utviklinga av denne spelplattforma vil gå inn i historien som eit veldig godt eksempel på innovasjon. I staden for å konkurrera med dei to store, Playstation og XBox, om stadig meir og betre fart og grafikk, gjekk Nintendo ein heilt ny veg og utvikla ein aktiv spelestil der ulike rørsler med kontrollen er det sentrale. Dermed kan du spela bowling eller tennis nesten på verkeleg. Det er innovativt og det er ein kjempesuksess - og den er fullt fortent.

søndag 17. februar 2008

Grafisk presentasjon

Eg var innom Sosial- og helse- direktorat- et for å finna informasjon om IT-planen S@mspill 2007 og støytte på følgjande graf. Eg stussa litt over presentasjonsmåten, det er vanskeleg å oppfatta informasjonen i figuren med det same.

Problemet er dei doble tidsaksane. Her ville det klart vore betre å visa utviklinga over år, som X-akse, og droppa månad. Eventuelt kunne enkelte månader vore plotta på X-aksen mellom årstala.

Edward R. Tufte er den som framfor alt er kjend for analysar av grafisk presentasjon. Det er særleg boka The Visual Display of Quantitative Information som har gjort han kjend. Men også boka Envisioning Information inneheld mange interessante eksempel på grafisk presentasjon. Mellom anna er det ein fantastisk intrikat togtabell frå Indonesia og ein ditto komplisert og omfattande togtabell frå Japan.

Tufte seier at dei aller fleste grafiske presentasjonar har tid som ein variabel. I følgje ei undersøking av 4 000 tilfeldig utvalde grafiske presentasjonar frå 15 aviser i perioden 1974 - 1980, var meir enn 75 % tidsseriar. Det er liten grunn til å tru at dette forholdet har endra seg seinare.

Når tidsseriar er så vanlege, betyr det også at det er konvensjonar knytt til oppfatninga av dei. Den vanlege oppfatninga er sjølvsagt at data varierer tidsmessig frå venstre mot høgre. Det gjer dei forsåvidt også i SHDir-grafen, men der er det dei underordna månadene som dominerer, medan den meir interessante utviklinga over år blir øydelagt visuelt.

Edward R. Tuftes hovudtese er elles: "Above else show the data."
Ironisk nok er ERT si eiga heimeside ikkje heilt vellykka visuelt sett...

fredag 15. februar 2008

Classification and categorization - a difference that makes a difference

(Sporadisk) bloggar i1277 peikte på denne artikkelen av Elin K. Jacob etter innlegget om klassifisering og kategorisering. Artikkelen understrekar og gir gode argument for at det er fundamental skilnad mellom dei to begrepa.

Elin K. Jacob har eg faktisk møtt, og eg diskuterte liknande problemstillingar med ho og kollegaen hennar, Kiduk Yang, på ein konferanse i Algarve for 2-3 år sidan. Diskusjonen den gongen var knytt opp mot arbeidet med Los (tidlegare kalla LivsIT) og måten me valde å organisera begrepa på.

I artikkelen Classification and categorization - a difference that makes a difference tek Elin K. Jacob for seg skilnaden på klassifisering og kategorisering og viser også til at det er mykje samanblanding her, sjølv av framståande forskarar. Her følgjer eit kort (og slik sett absolutt ikkje dekkande) samandrag av artikkelen:

I følgje Jacob er klassifisering ein rigid måte å ordna informasjon på der ein entitet/eit objekt kan vera medlem av ein og berre ein klasse. Klassane er ordna hierarkisk og systemet inneheld mykje informasjon berre som følgje av strukturen. Verken kontekst eller ordninga av klassar varierer, noko som skaper eit stabilt system.

Kategorisering er på den andre sida ei meir fleksibel måte å dela "verda av erfaringar" inn i grupper (kategoriar) der medlemmene har enkelte umiddelbare likskapar i ein gitt kontekst. Denne konteksten kan variera, og med den variasjonen også samansetjinga av kategorien. Det er basisen for både fleksibiliteten og styrken ved kategorisering. Ulempa er at det ikkje er stabile strukturar. Kategorisering tillet i motsetnad til klassifisering overlapping og medlemsskap i meir enn ein kategori.

Jacob påstår at det er seks systematiske eigenskapar som må vurderast for samanlikning av klassifisering og kategorisering:

1. Prosess (process)
2. Grenser (boundaries)
3. Medlemsskap (membership)
4. Kriterium for tilordning (criteria for assignment)
5. Typikalitet (typicality)
6. Struktur (structure)

Av desse meiner ho struktur er den desidert viktigaste for å skilja klassifisering frå kategorisering.

Tilbake til figuren i forrige innlegg kan eg sjå at det me har kalla kategorisering (som er måten Los ordnar informasjonen på) stemmer godt med definisjonane til Jacob. Når det gjeld klassifisering er eg litt usikker, særleg når det viser seg at eit emne kan vera av fleire emnetypar. Emnetypane treng heller ikkje ordnast strengt hierarkisk, så slik sett er vel også dette ei form for kategorisering.

torsdag 7. februar 2008

Klassifisering og kategorisering

Ei sentral problemstilling i fleire av prosjekta våre som omhandlar nettstrukturar er forholdet mellom den interne (generiske) portalstrukturen og tilhøyrande stikkord eller emneord. Ein ting er korleis dette blir representert, t.d. i eit emnekart, ein annan ting er korleis det blir framstilt.

Me har prøvt oss med eit skilje mellom klassifisering på den eine sida og kategorisering på den andre. Normalt blir det ikkje skilt skarpt mellom desse begrepa, men me meiner det kan vera fornuftig å gjera det. Det me prøver å få fram, er at strukturen på informasjonen blir sett på frå to synsvinklar. Ei samanlikning med boka kan få fram desse perspektiva: klassifiseringa blir då innhaldslista i boka (sjølve strukturen), medan kategoriseringa blir stikkordlista bak. Meir om dette på Vestforsk-bloggen (der illustrasjonen også er meir leseleg).

søndag 3. februar 2008

Microsoft + Yahoo!

Så ser det ut som Microsoft får viljen sin og sluker Yahoo!. Bodet dei har lagt inn blir rett nok sett på som "uvennleg" frå Yahoo! si side, men dei får nok til slutt viljen - money talks!

Mange spekulerer i synergiar og kva Microsoft kan få ut av kjøpet. Ein del meiner at Microsoft er ute etter søketeknologi, men det tvilar eg på. Kjernen i Yahoo! var heile tida katalog-delen, søketeneste kjøpte dei lenge eksternt (dei kjøpet søketeneste av Google inntil for eit par år sidan!). Microsoft har dessutan søketeknologi sjølve gjennom MSN/Live Search, sjølv om dei aldri har fått skikkeleg dreis på det.

Annonsering blir trekt fram av mange som ein hovudgrunn, og då er det kampen mot Google som er hovudfokus. Det kan nok henda, Microsoft ønskjer nok i sterkare grad å vera med i kampen om den store potten.

Tim O'Reilly meiner det luraste vil vera å satsa meir på det området der Microsoft og Yahoo! alt har ein fordel, og han trekkjer fram epost som eksempel. Yahoo! Mail har ein sterk posisjon på nettpost og Microsoft eig nesten heile epostmarknaden når det epostserver og klient med Exchange og Outlook. I tillegg har Microsoft også hatt ein sterk posisjon på nettet med Hotmail. Med Pipes har Yahoo! også vist spennande nyutvikling.

Det er nok uansett brukarane av Yahoo! som er interessante for Microsoft. Sjølv om Yahoo! er ein klar nummer to av søkemotorane, har dei stor trafikk, ikkje minst gjennom tenester som My Yahoo! (og kopling mot e-post ++). Problemet for Microsoft er at dei så langt ikkje har fått taket på web 2.0 og utviklinga "the network is the computer". Men Yahoo! er heller ikkje eit ekte web 2.0-selskap, i motsetnad til Google. Yahoo! kan vel kallast web 1.5. Og viss Microsoft er endå dårlegare på web 2.0, kanskje web 1,25 - blir resultatet framleis ikkje heilt 2.0 (hmm, kanskje litt søkt matematikk dette..).