tirsdag 4. mars 2008

Semantisk web isolert frå web-en?

Som ei oppfølging av det forrige innlegget vil eg peika på det viktige i ei stegvis utvikling. Kan semantisk web realiserast utan at ein har ei genuin forståing for korleis web-en fungerer i dag, og byggjer på denne?

Eg vil jo svara nei på eit slikt spørsmål og også hevda at dette er ei stor svakheit i dagens semantisk web-initiativ. Utviklinga og forståinga for problema er etter mitt skjønn i for stor grad lausriven frå web-ens grunnleggjande funksjon og oppbygging.

Eg tolkar også det manglande gjennomslaget for semantisk web (?) og dei mange nye semantiske initiativa som Microformats saman med ulike ikkje-standardiserte, men populære tiltak (type Freebase og andre) som eit uttrykk for at hovudsporet i semantisk web er for langt frå web-utviklinga generelt og ikkje ser ut til å bry seg særleg om web-en som sådan. Eg vil ta dette temaet opp att seinare, frå ein annan vinkel.

3 kommentarer:

Steinar S. sa...

Det blir spennende å lese din neste post om dette temaet, Svein, for det kan se ut til at vi har tilnærmet motsatt syn på denne saken.

Jeg forutsetter at du med "dagens semantisk web-initativ" sikter til W3Cs aktiviteter (jfr illustrasjonen). I mine øyne ligger styrken ved W3Cs semantisk web nettopp i at den bygger på en grunnleggende forståelse for hvordan web-en fungerer (både igår, i dag og imorgen ...) og bygger på denne. Kanskje skyldes mitt syn en overdrevet tillit til sir Timothy John Berners-Lee OM -- men at hans tanker om semantisk web skulle være uten forankring i grunnleggende forståelse for hvordan web-en fungerer, har jeg vanskelig for å forestille meg.

For moro skyld tar jeg meg den frihet å gjette litt på hva du kommer til å skrive.

Semantic Web fra W3C er udemokratisk fordi det er vanskelig å kode, sammenlignet med f.eks. Microformats, jfr din post om Microformats, eller Freebase, som du også har postet om. Der skriver du også at sistnevnte er en reaksjon på den "litt kompliserte RDF/OWL-standarden". (Du nevner samtidig DBpedia, og det kan se ut som du mener at den, i likhet med Freebase, er et slags alternativ til W3Cs semantic web-teknologi ("semantic web med liten 's'"), men DBpedia bruker RDF og spørrespråket SPARQL, og omtaler seg selv som et prosjekt for å gjøre data i wikipedia tilgjengelig for den semantiske weben:
"The DBpedia project approaches both problems [kun fulltekst-søk i Wikipedia, og mangel på data på den semantiske weben] by extracting structured information from Wikipedia and by making this information available on the Semantic Web.")

Og skulle jeg ha rett, så kan du sikkert gjette hva mine kommentarer til din kommende post vil være:
* Microformats er bra (og kan enkelt transformeres til RDF-data), men kan ikke erstatte et så generelt og fleksibelt verktøy for data som RDF er, bl.a. vil du måtte skrive dedikerte parsere for hvert nye Microformat, mens du bare trenger en parser for å lese alle RDF-data [Selvsagt vil du måtte implementere logikk for å utnytte nye felles vokabular også for RDF, men da har du i det minste kommet ett nivå høyere.]
* Freebase er sikkert også bra, men det bryter med prinsippet om å unngå sentraliserte løsninger, noe som er et grunnleggende prinsipp i den eksisterende weben.
* Jeg tror mange oppfatter RDF/OWL som mer komplisert enn det egentlig er, fordi XML-syntaksen til RDF er ganske uleselig. Velger du f.eks. å uttrykke RDF ved hjelp av sirkler, piler og bokser, er det ganske lett å følge med. Og N3-formatet er heller ikke så fryktelig vanskelig, :N3 :lettere_enn :RDFXML ... :-)

Så, skullle jeg ha rett i mine antagelser, trenger jeg strengt tatt ikke kommentere din neste post. Jeg håper med andre ord jeg tar feil ... ;-)


Litt på siden: Du har et spørsmålstegn i parantes knyttet til "manglende gjennomslag". Jeg synes det er et veldig interessant spørsmål, særlig siden "manglende gjennomslag" er en tilbakevendende kritikk av semantisk web: Hvordan kan vi vurdere graden av gjennomslag for semantisk web, og hvor stort/lite gjennomslag må semantisk web ha på et gitt tidspunkt for å kunne sies å være en suksess/fiasko? Skal vi måle tiden det tar fra det tidspunktet visjonen ble formulert (og hva bør regnes som det tidspunktet), eller skal vi regne det fra det tidspunktet der alle elementene i teknologien er på plass, f.eks. alle elementene i "the layer cake" (og isåfall hvilken versjon av den)? Det hadde vært interessant å vite hva du mener om dette.

Svein Ø sa...

Eg trur faktisk ikkje me har så ulike oppfatning av dette når det kjem til stykket. Men det er interessant å diskutera ulike sider av dette.

Likte veldig bra at du svarer før du har sett kva eg vil skriva :-) Minner meg litt om "Hallo i uken" som seier "vi gir deg nyhetene før de skjer!".

Eg har stor sans for TBL, men ikkje for ein del av dei tankane han har om den semantiske web-en (då tenkjer eg særleg på artikkelen frå 2001).

Eg meiner absolutt at RDF/OWL har for høg terskel, og at det er litt å læra av initiativ som Freebase. Men eg meiner ikkje Freebase i seg sjølv er løysinga (heller ikkje Microformats sjølv om det er interessant).

Elles er eg redd eg kjem til å skuffa deg med omsyn til innhaldet i neste post, den går nok ikkje på Microformats el. liknande initiativ, men på web services og REST (så slik sett er den litt på sida av dette temaet, men ikkje mykje). Stay tuned! (har du forresten gitt opp din eigen blogg?)

Steinar S. sa...

REST og web-services? Spennende! da er det jo bare å legge til RDF-lager med SPARQL-grensesnitt, så har du RESTful web-service med mulighet for å kjøre egendefinerte spørringer mot de bakenforliggende dataene. Åpenbart en god idé :-)

[Det er ihvertfall dithen jeg har tolket bl.a. denne artikkelen.]

Jeg skal forøvrig forsøke å gjenoppta bloggingen etterhvert. Må først venne meg av med å lese bloggen din ... ;-)