fredag 4. april 2008

Topic Maps 2008 - dag 2






David Weinberger: Everything is Miscellaneous
Tittelen på foredraget er det same som den siste boka hans. Han er nok endå meir kjendt for boka The Cluetrain Manifesto.

Han er litt ueinig i Alex Wright i The Web That Wasn't fordi ein del av dei tinga som ikkje vart ein del av web'en, ville ha føresett sentralisert kontroll. Det ville ha brote med det viktige end-to-end-designet av Internett. Må laga eit Internett som er så enkelt at det faktisk er tomt inni! Det er ein føresetnad for innovasjon og fridom. Det er f.eks. ei dårleg ide å ha typed links, altså lenker med semantisk innhald, fordi det ville ha fjerna det enkle og fleksible ved web'en.

Internett gir oss innovasjon, fridom og overflod! Overfloda gjeld både det dårlege og det gode - det utruleg mykje dårleg på nettet, men det er også utruleg mykje bra. Overfloda av det som er bra, representerer også ei utfordring: information overload. Denne overfloda bryt med gamle måtar å organisera informasjon på - den gamle måten skalerer rett og slett ikkje til nettet sitt volum. Som eksempel på den gamle måten, brukar Weinberger Deweys desimalsystem, det rådande klassifiseringssystemet i bibliotekssektoren.

Eit hovudproblem med Deweys system, og andre liknande, er at all historie viser at me blir aldri einige om korleis verda ser ut! Då må me heller ikkje prøva på det. Karakteristisk for vestleg tenking er at det finst eit organiserande prinsipp, eit hierarkisk system, som gir ting meining. Og den einaste meininga. Det stammar frå den måten vi organiserer livet vårt kvar dag - vi må heile tida ta binære avgjerder: skal denne tingen i denne haugen eller i den andre (eksempel med klesvask!).

Første ordens organisering er å organisera ting etter likskap og ulikskap. Den andre ordens organisering er å trekka ut metadata og organisera desse. Den tredje ordenen skjer på grunn av digitaliseringa. Karakteristisk for utviklinga mot den tredje ordenen er at uorden (messiness) er eit poeng i seg sjølv og gjer informasjonen rikare.

Skiljet mellom data og metadata er i ferd med å forsvinna. Alt innhald er i ferd med å bli metadata.

På nettet er det brukarane som har kontroll med organiseringa og oversikt over orden. Det gjer at det veks fram nye, brukarkontrollerte måtar å organisera informasjon på.

Det som ikkje blir sagt, er også viktig.
olksonomiar er nærare knytte til prototype-teorien enn klassisk kategorisering.

Fire avsluttande setningar:
1. There is no one world order
2. What matters most is what cannot be said (language is the best knowledge represent action)
3. We need every way of seeing and knowing (keep the center simple)
4. We can only do this together

[Dette "referatet" yter på ingen måte David Weinberger rettferd - som den glimrande foredragshaldaren han er]

Stian Danenbarger, Bouvet: Small pieces meaningfully joined
Tittelen er ein vri på David Weinbergers kjende utsagn: Small pieces loosely joined.

Modell med 7 ulike interoperabilitets-begrep:
0 - ingen i.o.
1 - teknisk
2 - syntaktisk
3 - semantisk
4 - pragmatisk
5 - dynamisk
6 - konseptuell

Overgangen frå semantisk til pragmatisk interoperabilitet er viktig: Den semantiske interop.bil. føreset ei meining medan den pragmatiske opnar for fleire ulike meiningar etter kontekst, om det same temaet (blir i TM løyst med m.a. scope).

Frå Porters Value Chain til Value Network (communication, coordination, cooperation, collaboration, channel).

Tags are cheap, og taggar gir heilt klar meirverdi, men samtidig har dei også klare begrensingar pga. at det berre er syntaktisk interoperabilitet. Eit eksempel frå Weinbergers blogg der han skriv om Topic Maps-konferansen og brukar taggen topicmaps frå Technorati. Det finst andre taggar som 'topic maps', 'topicmap' og 'emnekart' på Technorati, men pga. ulik skrivemåte klarer ikkje Technorati å sjå at dei alle handlar om det same.

OASIS Technical Committee:

Published Subjects Identifiers (PSI) Requirements:
1. A Published Subject Identifier must be a URI
2. A PSI must resolve to a human-readable Published Subject Indicator
3. A Published Subject Indicator must explicitly state the unique URI that is to be used as its Published Subject Identifier

Kan kombinera det bloggarar har utvikla (tagging, trackback osv.) med verktøy som PSI'ar og slik løfta interoperabilitetsutfordringane.

Steve Pepper: Everything is a Subject
Steves tittel på foredraget heng nøye saman med tittelen på årets konferanse: Towards the Vision of a Subject-Centric Computing.

Startar med Vannevar Bush og hans banebrytande artikkel frå 1945, As we may think. Arikkelen har inspirert mange og har i grunnen ført fram til web'en som Tim Berners-Lee lanserte. Bush meinte dåtidas teknologi var håplaust gammaldags for å realisera det han meinte var presserande behov. Hans Memex-system var veldig fokusert på dokument.

Her er Steve Pepper ueinig med Bush. Dokument handlar om subjekt. Subjekta eksisterer som konsept i hjernen vår.

Bush hadde rett i at vi tenkjer assosiativt; han hadde rett i at ..., men han tok feil når han tok det dokument-sentrerte konseptet og ikkje det subjekt-sentrerte. Den underliggjande modellen for emnekart er as we may think. Emnekart har helst vorte brukt til portalar, men det er ikkje ein spesifikk portal-teknologi. I det heile er det ikkje ein spesifikk web-relatert teknologi. Emnekart vart funne opp i 1991, før web'en som me kjenner den, var kjendt.

Semantisk og pragmatisk (interop.bil.) er vesensforskjellige. Semantisk interop. er utan kontekst, medan pragmatisk interop. tek omsyn til kontekst. I TM blir pragmatisk interop. ivareteke ved scope.

Fletting (merging) er den kraftigaste funksjonen i TM. Fletting kan skje automatisk. Det er noko som er umuleg med databasar eller XML-dokument. Ein viktig grunn er at namn (tekststrenger) er notorisk upålitelege til slikt. Dette er noko bibliotekarar og lingvistar har visst i hundrevis av år, men som it-sektoren av ein eller annan grunn ser ut til å måtta erfara igjen og igjen. Det finst nokre svært få unnatak frå regelen om at alle subjekt/konsept har fleire namn; det finske sisu er eitt, Xhosa-ordet ubuntu eit anna. Begge to er veldig kulturelt betinga.

Meining er uttrykt i relasjonen mellom representasjonen og referenten (også kalla intensjonalitet).

Published Subject Identifier er ein veldig viktig del av TM og er ein modell for global identitet. For tida er det berre TM som har eit system for å handtera ein global identitet. Men korleis skal nokon få tak i den? Det er eit godt spørsmål og eit spørsmål som det enno ikkje finst noko godt svar på. Men å publisera identifikatorane våre er heilt sentralt, det ligg jo i begrepet PSI. Ein god modell for PSI-forvaltning og -gjenfinning er ei stor utfordring som må løysast.

TAO-modellen (topics, associations og occurrences) står for berre 10 % av potensialet i emnekart. Scope står for nye 20 % og bruk av PSI-ar aukar potensialet til minst 50 %. Resten av potensialet i TM er mellom anna å læra frå web 2.0 (subject-centric tagging, wikis, blogging).

Steve meiner subject-centric computing representerer eit paradigme-skifte. Ordet paradigme-skifte blir dessverre brukt litt for ofte, men kanskje det er på sin plass her? [min kommentar]. Avslutningsvis gjentok Steve sjølvsagt at "forøvrig mener jeg at den nasjonale kunnskapsbasen må bygges på emnekart".

Paneldebatt
Kvifor er ikkje TM meir brukt (internasjonalt)?
Steve meiner at det skuldast mykje W3C og Tim BLs enorme innflyting. Sjølv om TBL hadde ein genial ide (web'en), betyr ikkje det at den neste er like genial (semantisk web).

Kva ville vera "killer application" for TM?
TM-drivne portalar må kunna kallast i alle fall ein delvis KA - i Norge, og særleg i offentleg sektor har det vist seg å bli svært populært.

Peter Brown: Trur ikkje på ein KA, men på ein nettverkseffekt der mange små TM-drivne nett blir kopla saman. Men det må skje med identitetar som ein er einige om og som er kjende.

Er ikkje TM og "everything is miscellaneous" motstridande syn?
David W.: På ingen måte. Sjølv om "alt er ulikt" ser vi det ikkje slik. Sjølv om informasjonen på nettet i grunnen er kaotisk, ser vi den ikkje slik. Vi ser den alltid strukturer på ein eller annan måte, gjennom eit presentasjonslag.
Trur at namnet Topic Maps står i vegen for du må først forklara at det ikkje er eit kart. Subject-centric computing er truleg eit betre namn. Men ein bør gå ut og spørja folk!

Eg etterlyste ein lettvekts-versjon av TM fordi det er for høg barriere å starta opp. Spørsmålet var kanskje litt uklart, men Steve peika på at fleire forslag til ontologiar som ein startpakke, kunne vera ein ide. Stian lurte på om spørsmålet gjaldt utviklarar eller sluttbrukarar (eg meinte det siste) og var til dels einig i at det mangla litt for å gjera det lettare for sluttbrukarar å bruka TM.

Ordstyrar Shazad Rana, Microsoft, tok også opp att utfordringa med å gjera TM enklare i avslutninga av paneldebatten.

Og så var TM 2008 over - alt i alt ein god konferanse som sikkert vil forsterka interessen for TM i alle fall i norsk offentleg sektor.


Ingen kommentarer: