lørdag 12. januar 2008

Freebase = semantic web + Wikipedia

Freebase er eit interessant forsøk på å skapa semantisk web for folk flest. Når to såpass respekterte skribentar som Jon Udell og Tim O'Reilly snakkar varmt om produktet, er det verdt å ta ein nærmare titt.

Freebase hentar informasjon frå Wikipedia og utstyrer den med struktur. Men i tillegg opnar dei opp for brukarane til å leggja til eigen informasjon og struktur - det er det som er det mest interessante. Ideen er god og det er mange slike initiativ for tida; eit nærliggjande eksempel er DBpedia. Det er semantic web med "liten s" - kanskje ein reaksjon på den litt kompliserte RDF/OWL-standarden. På ei anna side er det også grunn til å sjå på dette som semantiske strukturar som kanskje kan koplast til andre semantiske web-kjelder.

Etter å ha sett litt på systemet må eg seia at det minner veldig om emnekart (Topic Maps). Topics er det sentrale i Freebase og emna er av ein type. Så langt heilt parallelt til emnekart. Typane har eigenskapar (properties) som også emna (instansar av typar) arvar. Assosiasjonar mellom emne (topics) blir handtert av eigenskapane til emna. Spørjespråket heiter MQL - MetaWare Query Language.

Det verkar altså veldig likt emnekart, men det er også ein del skilnader. Eit emne kan vera av fleire typar (!) - eit eksempel her er George W Bush som både er av typen 'Person' og typen 'President'. I emnekartforstand verkar det her som dei sausar saman rollar og typar. Dei sentrale begrepa i Freebase er:
  • Topic: Eit kva som helst slags emne
  • Type: Gruppering av emne (merk at eit emne kan tilhøyra fleire typar)
  • Property: Emna har eigenskapar (arva frå typen/typane). Eigenskapane uttrykkjer både verdiar og relasjonar.
  • Schema: Settet med eigenskapar til ein type
  • Domain: Gruppering av typar med eit visst slektskap (eksempelvis musikk)
Ut frå dette lurer eg litt på gjenbruk av t.d. måten relasjonar blir handtert på. Det verkar heller ikkje veldig klartenkt at eit emne kan ha fleire typar, og grupperinga av typar i domene ser også noko uklar ut.

I tillegg til dette sit eg att med eit stort spørsmål (og ei stor utfordring): Kvifor ikkje bruka Topic Maps som grunnlag for Freebase? Og kvifor ikkje laga ei tilsvarande/liknande teneste basert på emnekart, men der det blir opna opp for at brukarane kan leggja til emne og typar sjølve?

5 kommentarer:

Arnar Lundesgaard sa...

> eit emne kan vera av fleire typar (!)

Mulig jeg misforstår det du skriver, men hvis jeg har forstått emnekartstandarden korrekt så støtter den flere typer per emne da emnetyper kun er priviligerte assosiasjoner. De kan til og med spesifiseres i forskjellige perspektiv (uten at det er noe jeg har sett bli brukt så ofte). Se seksjonen om type-instans assosiasjoner
i TMDM.

(Bare en teknisk detalj, det er mange andre spennende diskusjoner rundt hvordan en best kan klassifisere et tema. Typing, klasser, roller, funksjoner, iboende egenskaper osv.)

Svein Ø sa...

Du har nok rett i det, det verka berre litt rart. Muleg at det også var eksempelet som gjorde at eg steila litt; eg synest uansett ikkje det er god modellering å seia at emnet 'George W. Bush' er både av typen 'Person' og typen 'President'.

I eit emnekart ville det kanskje vore betre å seia at han spelar rollen (eller forsøker!) som 'president' i assosiasjonen 'styring' av 'USA'(?).

Lars Marius Garshol sa...
Denne kommentaren har blitt fjernet av forfatteren.
Lars Marius Garshol sa...

Jeg har skrevet litt mer om dette i bloggen min.

Å si at Bush er både "person" og "president" er smør på flesk. Han kan ikke være "president" uten å være en "person". Så egentlig burde "president" være en subtype av "person", slik at det holder å si at han er en "president". (Hvis man altså insisterer på å gjøre det slik.)

Det er også helt klart, som Svein sier, at "president" er en rolle mer enn en egen type. Det er dermed best å unngå å ha den som en type, men samtidig kan det godt være at typen er så viktig (at det f.eks er egne regler for den i skjeamet) at det er riktig å ta den med likevel.

Anonym sa...

[url=http://akreoplastoes.net/][img]http://akreoplastoes.net/img-add/euro2.jpg[/img][/url]
[b]download kaspersky antivirus free, [url=http://rastimores.net/]educational software for students[/url]
[url=http://akreoplastoes.net/][/url] windows vista screenshots academic productivity software
filemaker pro 10 crack [url=http://akreoplastoes.net/]buy cheap software[/url] softwares price list
[url=http://akreoplastoes.net/]adobe image software[/url] academic software reseller
[url=http://akreoplastoes.net/]doenload adobe photoshop cs4[/url] buy dreamweaver templates
buy used adobe software [url=http://rastimores.net/]internet selling software[/url][/b]