onsdag 23. mai 2007

Microformats

Den semantiske veven er i emning, men det går seint. Eit spørsmål mange stiller seg (vel, enkelte) er om dei skal satsa på RDF/OWL eller emnekart (Topic Maps) for å realisera den semantiske veven. Svaret er sannsynlegvis: verken eller! Svaret er mest sannsynleg mikroformat.

Mikroformat er "low level" semantisk annotering. Eit av problema med den semantiske veven og visjonen er den høge terskelen. Det er ikkje gjort på ei kveldsstund å implementera rdf eller emnekart viss du startar frå null. Med mikroformat er det annleis, her er det lett å komma i gang og det er lett å ta det steg for steg.

Slagordet for mikroformat er "designed for humans first and machines second" som kanskje kan verka som eit paradoks sidan det er maskinene som først og fremst må nyttiggjera seg informasjonen. Men ved nærmare ettertanke er det kanskje her det største problemet med "tung" semantikk ligg: Det blir for fjernt frå vanleg tankegang.

Microformat tek også sikte på å løysa spesifikke problem og det har resultert i standardar som hCard, hCalendar og hResume for å nemna nokre. Dei to første er web-parallellar til vCard og vCalendar.

Finn ut meir på www.microformats.org og/eller les John Allsops artikkel i Digital Web Magazine. Sistnemnde har også komme med boka "Microformats - Empowering your markup for Web 2.0".

3 kommentarer:

Steinar sa...

Hei Svein, jeg tror du tar feil her. Med det mener jeg ikke å si at ikke Microformats kan spille en viktig rolle for utbredelsen av Semantic Web. Men å se på det som en erstatning for f.eks. RDF/OWL tror jeg er en feilslutning.

Microformats er, som navnet til en viss grad avslører :-) først og fremst et format. RDF påstår i navnet at det er noe så ambisiøst som et rammeverk. Og i dette tilfellet tror jeg vi med god samvittighet kan skue de to teknologiene på hårene ...

RDF inngår, som du forsåvidt også viser til gjennom "/OWL", i et sett av teknologier som tilsammen er ment å etablere den semantiske veven, blant annet det nevnte ontologi-språket OWL for dem som trenger/ønsker mer uttrykkskraft i sitt vokabular eller ønsker å utvide eller mikse vokabular. Dessuten finnes spørrespråket SPARQL, og etterhvert er det ikke utenkelig at det kommer en standarisering av et regelspråk.

En overbevisende gjennomgang og demonstrasjon av forholdet mellom Microformats og RDF er gitt i presentasjonen "Open Data in HTML: GRDDL, eRDF and RDFa". Både i foilene og i oppsummeringen påpeker han flere begrensninger ved Microformats. En viktig ting det koker ned til er at applikasjoner som skal utnytte dataene må skrives spesielt for hvert enkelt Microformats datastruktur, ettersom datastrukturen ikke er standardisert. For RDF-data, derimot, er datastrukturen kjent (tripler), og dermed kan generelle verktøy gjøre halve jobben, som f.eks. spørringer ved hjelp av SPARQL.

Men det beste er selvsagt at også Microformat-kodede data vil kunne konverteres til RDF, gjennom bruk av stanarden GRDDL. Så hvis valget står mellom å bruke Microformats eller ingenting, er Microformats definitivt bedre!

Forøvrig mener jeg det er galt å si at Microformats er et format for mennesker. Det er riktignok mer menneskeegnet enn RDF/XML, men først og fremst er det nyttig fordi det er noenlunde kompatibelt med HTML, slik at de samme dataene både kan presenteres på en pen måte i HTML-dokumentene, _og_ forstås av maskiner. Hvis du er på jakt etter det mest menneskevennlige formatet, er N3-formatet for RDF/OWL (og muligens Linear Topic Maps (LTM) for Emnekart) å foretrekke. Med andre ord: :N3 :merMenneskevennligEnn :Microformats. :-)

Det beste med Microformats er etter min mening at de støtter oppunder og øker utbredelsen av en del sentrale vokabular, som blant annet vCard. Og desto flere delte vokabular, desto større glede av den semantiske veven.

Svein Ølnes sa...

Gode poeng, Steinar, og vanskeleg å vera ueinig. Eg ser at innlegget mitt lett kan forståast som at Microformats skal erstatta andre semantiske retningar. Det trur heller ikkje eg på.

Det som opptek meg, er at terskeleg for å setja i gang med semantisk tillegg/utviding av nettressursar er høg - altfor høg. Eg er ikkje i tvil om at det er ein viktig grunn til at semantisk web ikkje har fått det omfanget som var spådd.

Eg er også oppteken av "demokratiske" teknologiar - teknolgiar for vanlege folk. Her har HTML vore eineståande og utan tvil grunnen til at web-eb har eksplodert. Så å seia alle kan skriva HTML-kode. Det same kan ikkje seiast verken om RDF eller emnekart. Om det bør vera eit mål, er eg litt usikker på. Men eg er litt skeptisk til ei utvikling som går i retning av at det berre er ekspertar som kan handtera kodinga.

Innføringa av RDFa viser etter mitt syn at W3C begynner å forstå problema med fotfeste og skalering, og at vegen kanskje bør gå gjennom (x)html. I alle fall bør det finnast eit alternativ.

Det er uansett ein interessant diskusjon, og enno har me ikkje komme inn på dei vitskapsfilosofiske sidene ved semantisk web. Her er det også mykje interessant, men det får me ta seinare.

Takk for nyttig innspel; me legg i dag siste hand på ein søknad til Forskingsrådet om "Strategisk instituttprogram" innafor temaet Semantisk vev og denne diskusjonen er nyttig i beskrivelsen av status på området.

Steinar S. sa...

Ikke overraskende ser det ut til at vi er ganske så enige her, Svein. Jeg er ihvertfall helt enig i det du skriver om viktigheten av at teknologien er "demokratisk".

Lykke til med søknaden deres -- det høres veldig spennende ut! Jeg håper dere får den igjennom, da blir det forhåpentligvis fortsatt spennende samarbeid, og tilsvarende spennende diskusjoner, fremover! (Vel, det blir det forhåpentligvis uansett -- uavhengig av utfallet av søknaden.)