tirsdag 20. februar 2007

Semantisk web

Software 2007 vart arrangert forrige veke, 13. - 15. februar. Eg deltok på parallellsesjonen Semantic Web og var litt overraska over at det ikkje var meir enn 40-50 deltakarar. Eg trudde temaet ville interessera fleire.

Guus Schreiber, professor ved Vrije Universiteit (Free University) Amsterdam, var hovudpersonen i programmet. Me møtte Guus og kollegaene hans på studieturen vår til Amsterdam i fjor vår og hadde møte med han dagen før Software 2007. Guus er ein sentral person i W3C sitt arbeid med semantisk vev. Me drøfta muleg felles prosjektsøknad til 7. rammeprogram i EU som no har hatt første utlysing.

Guus var veldig bra. Det er alltid interessant å høyra på folk som har full oversikt og som dermed kan forklara enkelt nokså kompliserte saker. Han framstod typisk pragmatisk og var mest oppteken av løysingar og mulegheiter og mindre av teknologi og type standardar. Han meinte at ein av dei største feila innan semantisk vev var å overvurdera kompleksiteten av ontologiar og dermed gjera det mykje vanskelegare for seg sjølv.

Han likte ikkje begrepet 'ontologi' og meinte det var for "voldsomt" for det som ligg bak: "shared concepts". Han var opprinneleg mot begrepet då han arbeida i arb.gruppa for OWL, men måtte gi tapt.

Trua på den eine "sanne" og altovergripande ontologien er heilt feil, meinte han. Det er mange ulike ontologiar som kan ha enkelte berøringspunkt: ontology alignment. Han advarte også mot det einsidige fokuset på logikk (første ordens predikat-logikk) - noko eg likte godt :-)

Han gjekk gjennom fire grunnleggjande prinsipp for utvikling av ontologiar:

1. Modesty
- bruk eksisterande vokabular
- WordNet er t.d. ein veldig viktig ressurs (finst dessverre ikkje på norsk)

2. Scale!
- tenk stort!
- tenk mange ontologiar og justering (alignment) av desse

3. Pattern principle
- ikkje ver for kreativ, gjenbruk er viktig
- sjå mellom anna tilrådingar frå Semantic Web Best Practices and Deployment Group

4. Enrichment principle
- ikkje endra, berre legg til (don't modify, add!)

Som eksempel viste Guus nokre kulturprosjekt der RDF + OWL er brukt som basisteknologi for semantisk støtte. Eit av prosjekta er Culture Web.

Til slutt minna han om kor viktig det er å følgja standardar, mellom anna tilrådingane frå WAI. Guus er svært svaksynt og viste korleis tekst ofte ser ut i hans nettlesar når han må stilla den størst muleg. Med dårleg design forsvinn ofte mykje av teksten.
Presentasjonen til Guus finn du her.

7 kommentarer:

Anonym sa...

Takk og lov for at det finnes pragmatikere i semantisk web-bransjen. Jo mer jeg leser om og forsøker å sette meg inn i ontologier og logiske føringer jo mer skeptisk blir jeg. Jeg er veldig tvisynt til semantisk web, på den ene siden er det antakelig mulig (innenfor svært begrensede og stabile domener) å lage presise ontologier, på den andre siden er det veldig mange områder der det mangedimensjonale eller flerfasetterte utgjør en essensiell egenskap ved det som håndteres. I de siste tilfellene vil ambisjoner om å lage ontologier i ekstrem semantisk web-form være håpløse. Puh, så var det av brystet, nå skal jeg se nærmere på Schreibers presentasjon.

Svein Ø sa...

Full støtte her. Det er difor eg har stor sans for emnekart, som verkar mindre rigorøs. Men det må seiast at eg har berre moderat kunnskap om teknologiane å uttala meg utfrå.

i1277 sa...

Det er lett å bli skeptisk til rigide og kompliserende ontologitvangstrøyer, selv har jeg sansen for grasrot-semantikk og "lowercase semantic web"-tilnærminger. Men det handler jo og om å kunne kombinere det beste fra flere tilnærminger. Totalt uregulert darwin-liberalisme kan fort bli like lite kjekt som Sovjet-style diktatur.

Når Clay Shirky kritiserer ontologier/ klassifikasjonskjema, er det blant annet med utgangspunkt i det voldsomme og ensrettende i ontologibegrepet. Men når han sier at "the movie people don’t want to hang out with the cinema people" er det jo nettopp "shared concepts" han sikter til, man "deler" ikke "konseptene" med hele verden, men man deler dem med noen.

Grunnen til at Shirky nevnes her er debatten i kjølvannet av at han gikk ut mot Semantic Web for noen år siden. Jeg har egentlig ikke sånn voldsom kjennskap verken til den debatten eller til SW, men jeg synes uansett at dette svaret fra Paul Ford var veldig klargjørende for mulighetene rundt en Semantic Web med litt mer oppkneppet skjorte.

Anonym sa...

"Han advarte også mot det einsidige fokuset på logikk (første ordens predikat-logikk)" - noko seier meg at ikkje alle i reisefølgjet ditt reagerte med same uavkorta entusiasme på dette punktet. Korriger meg om eg har feil.

Svein Ø sa...

he-he, trur nesten vedkommande sov litt akkurat då. Men eg har minna han på det etterpå...

Svein Ø sa...

Til i1277 (hmm, dette verka veldig robotisert - nesten semantisk web..) - interessant diskusjon du refererer til. Peter Morville viser også til denne diskusjonen i Ambient Findability, ei bok som eg elles ikkje får heilt tak på. Han er også typisk pragmatisk i haldninga til den semantiske veven.

Det er klart Clay Shirky langar ut noko voldsomt og slår litt i blinde. Han treffer litt, men har mange bomslag også. Likevel trur eg det er reell ueinigheit på ein del vesentlege punkt, og eg trur det kokar ned til kultur eller fag. Det er den gamle kampen mellom dei "harde" naturvitskapane (i dette tilfellet matematikk/logikk) og dei mjukare disiplinane som biblioteksfag o.l. Og trekkjer me det endå lenger, er det kanskje eit reelt ulikt filosofisk syn; den positivistiske forståinga mot den humanistiske. Her kan eg visa til alvorleg meiningsbryting på kollegialt plan, jfr. postingane rett over..

Svein Ø sa...

... og Paul Ford har eit veldig bra svar på Clay Shirkys utblåsing, på http://www.ftrain.com/ContraShirky.html

Han viser på ein oversiktleg måte korleis semantiske teknologiar kan hjelpa oss.

Den pragmatiske tilnærminga hans minner mykje om Guus Schreibers haldning. Så lenge det er slike som sit i førarsete, føler eg meg trygg...