onsdag 28. april 2010

7 råd for opning av data

Dette blogginnlegget skulle eigentleg vore publisert på data.norge.no. Men så fekk Fornyingsdep. kalde føter (?) og fann ut at dei ikkje kunne sleppa til andre gjestebloggarar enn representantar for offentleg sektor. For korleis skulle dei elles styra dei mange forslaga dei ville få inn? Nei, det er jo klart, me veit jo alle at det største problemet med bloggar er altfor mange innlegg og altfor mange kommentarar - kort sagt altfor stor aktivitet! Jeez..

Det demrar for meg at departementet ikkje er dei rette til å driva eit slikt arbeid som føreset stor vilje til inkludering, ikkje berre av offentleg sektor, men frå alle. Det er synd, for dei har starta bra, problemet blir å følgja opp med ei slik innstilling til sosiale medium.

Ja-ja, her er i alle fall kollega Robert Engels og mitt forslag til retningslinjer for publisering av offentlege data:

7 råd for opning av data
Svein Ølnes og Robert Engels, Vestlandsforsking

Opning av offentlege data er eit høgaktuelt tema for mange land og regjeringa ved Fornyings­departementet fortener ros for å ha starta prosessen sjølv om ikkje alle svara er kjende. I dette blogginnlegget vil vi føreslå nokre retningslinjer for tilgjengeleggjering av data.

Det er viktig å starta arbeidet med å gjera offentlege data tilgjengelege sjølv om ikkje alt er 100 % klart. På dette område er ei slik beta-tilnærminga nødvendig fordi ein må læra medan ein utviklar tenestene. Eit anna viktig prinsipp er at frislepp av offentlege data er viktig fordi vi ikkje veit kva dei vil bli brukte til. Dette er ein nokså uvant tankegang for offentleg sektor. Men det er her det store potensialet for innovasjon ligg. Fordi om ikkje offentleg sektor veit kva data kan brukast til, er det sikkert mange andre som har idéar om det.

Mange organisasjonar er i startgropa med digitalisering av eigne objekt eller ressursar og sit med mange av dei same spørsmåla om "den rette vegen framover". Kva skal vi ta omsyn til? Kva må på plass? Kva skal vi prioritera? Må vi tilretteleggja noko i IKT-arkitekturen vår før vi set i gang med sjølve digitaliseringa?

Som eit eksempel har Digitaal Erfgoed i Nederland (tilsvarande vårt ABM Utvikling) definert ein pakke med minimumskrav for å bli funnen digitalt ("findability"). Dette er noko som kan gjerast også her i landet når ulike organisasjoner skal setja i gang digitaliseringsprosjekt.

Vi føreslår desse retningslinjene for publisering av offentlege data som svar på nokre av spørsmåla over (sjå også W3C sine tilrådingar på dette feltet):

1.       Bruk standard internett-protokollar (http) for tilgang til nettressursar
2.       Alle objekt må ha ein unik identifikator (URI)
Adressa (URI-en) må vera permanent (persistent) og kunna lesast både maskinelt og av menneske
3.       Unngå aggregering av data
Data er best som råkost, ikkje aggreger utan at det er heilt nødvendig
4.       Strukturer metadata på ein maskinlesbar måte (t.d. XML-serialisering eller XML/RDF/XTM)
5.       Bruk internasjonalt teiknsett (UTF-8)
6.       Bruk minimum Dublin Core som global standard for beskrivelse av data (metadata)
7.       Tenk på kopling mot andre datakjelder ved å tilretteleggja for Linked Data

Det viktige er at ein ikkje prøver å tenkja seg til kva data skal brukast til og korleis. Då blir det fort som i eventyret med den kjende dialogen ”God dag, mann – Økseskaft!”. Tilby opne data og la potensialet utvikla seg fritt.

Ingen kommentarer: