Dnr A 5 3482/06

Digital arkivering vid Göteborgs universitet Utredning rörande förekomst av allmänna handlingar i digitala format samt förslag till modell för bevarande Version: 2006-09-13

Sammanställd av universitetsarkivarie Christer Johansson

1

Dnr A 5 3482/06

Innehåll

SammanfattningSammanfattning...... 444

Bakgrund och förutsättningar ...... 888 Bakgrund...... 8 Syfte och mål ...... 8 Frågeställning och genomförande...... 8 Avgränsning...... 9 Definitioner...... 9 Lagstiftningens krav ...... 11 Riksarkivets föreskrifter och allmänna anvisningar ...... 11 Erfarenhet av digital långtidslagring vid GU...... 14 Elektronisk publicering vid Universitetsbiblioteket ...... 14 Svensk samhällsvetenskaplig datatjänst ...... 14 Språkvetenskaplig databehandling vid Institutionen för svenska språket...... 15 Informationshämtning från andra projekt och verksamheter rörande digital långtidslagring ...... 15 AGDA – Arbetsgruppen för ett gemensamt digitalt arkiv bland svenska universitet och högskolor ...... 15 REDA – Regionalt digitalt arkiv i Skåne...... 16 SVEP – Samordning av den svenska högskolans elektroniska publicering ...... 18 LDB – Långsiktigt digitalt bevarande ...... 19 Arkivering av webbsidor vid Kungliga biblioteket ...... 20 Arkivering av webbsidor vid Högskolan i Borås...... 20

Förekomst av allmänna handlingar i olika digitala format vid GöteGöteborgsborgs universitetuniversitet...... 212121 Inventeringens genomförande...... 21 Något om IT-strukturen ...... 21 Förekomst av allmänna handlingar i olika IT-system...... 22 Olika format och medier ...... 23 Rutiner för säkerhetskopiering...... 24

Anvisningar för digitalt bevarande ...... 262626 Modell för långsiktigt bevarande...... 26 Vad bör bevaras i digital form? ...... 27 Teckentabeller och filformat...... 27 Medium...... 29 Konvertering och migrering...... 30 Förvaring...... 31 Förslag till bevarande av myndighetens webbsidor...... 32

2 Dnr A 5 3482/06

Databasfiler och statistikfiler ...... 34 Dokumentation och metadata ...... 36 OAIS-modellen...... 37 Ansvar...... 39 Kostnader ...... 39 Vinster...... 39 Fler åtgärder...... 40

BilagorBilagor...... 434343 BILAGA 1: Sammanställning över universitetsgemensamma IT-system som innehåller uppgifter som skall bevaras för framtiden ...... 44 BILAGA 2: Plan för långsiktigt bevarande av digital information vid GU ...... 49

3 Dnr A 5 3482/06

Sammanfattning

Flertalet av de handlingar som upprättas i digital form vid GU bevaras på papper eller lagras enbart i de olika IT-systemen. Därför är det viktigt att se över denna fråga så att myndigheten kan uppfylla lagstiftningens krav vad gäller hanteringen av allmänna handlingar. Risken är annars stor att viktig och värdefull informa- tion försvinner eller förstörs. Undersökningen består av två delar: först en allmän inventering av de digitala handlingar som förekommer vid GU och därefter förslag till anvisningar för be- varande. I sistnämnda del presenteras också en modell för hur den digitala arki- veringen kan organiseras i framtiden. Frågor som undersökningen syftar till att besvara är:

Allmän inventering  Vilka typer av handlingar förekommer digitalt vid GU?  I vilka format och på vilka medier förekommer handlingarna?  Hur ser rutinerna för säkerhetskopiering ut?

Förslag till bevarande  Vilka handlingar måste bevaras och vilka får gallras efter en viss tid?  Vilka format och medier bör eftersträvas vid arkivering?  Var bör handlingarna arkiveras fysiskt?  Vem ansvarar för att handlingarna dokumenteras och bevaras?  Vem ansvarar för framtida konverteringar och migreringar?  Vem betalar?

Det kan i stort konstateras att den digitala arkiveringen inte har kommit igång i någon större omfattning vid något av landets lärosäten. Det pågår dock ett antal projekt som rör dessa förhållanden. Ett exempel är AGDA-projektet (14 lä- rosäten i samverkan) som undersöker förutsättningarna för bevarande av forsk- ningsdata. Ett annat exempel är REDA-projektet (Lunds universitet tillsammans med flera lokala verksamheter i Skåne) som arbetar med att skapa ett regionalt digitalt arkiv. Ett annat positivt exempel är Högskolan i Borås, där man har bör- jat bevara lärosätets webbsidor. Vad gäller förekomsten av allmänna digitala handlingar vid GU så förekom- mer denna information i följande typer av system:

 Forskningsdatabaser/IT-system för bearbetning av forskningsdata  IT-system för distansutbildning  Administrativa IT-system  Myndighetens webbsidor  Foto, film och ljud

4 Dnr A 5 3482/06

Handlingarna förekommer i en mängd olika format och på olika medier. Kon- torsdokument förekommer bl.a. i olika MS Office-format samt PDF. Före- kommande databaser är bl.a. Access, FileMaker, DB2 och Excel samt SAS och SPSS för olika statistikprogram. Myndighetens webbsidor förekommer som HTML och bilder som GIF och JPEG. Ett annat vanligt bildformat är TIFF. Därutöver förkommer handlingar också i ett flertal analoga format. Olika typer av medier är optiska skivor och magnetiska band samt hårddiskar. I regel säkerhetskopieras informationen i alla större IT-system vid GU en gång per dygn och uppgifterna bevaras för en period av några veckor upp till fyra månader. Därutöver tas också säkerhetskopior per månad, halvår och år. Denna information bevaras för en tid av upp till ett år. Utbildningsvetenskapliga fakulteten och Handelshögskolan har som ambition att bevara årliga säkerhets- kopior för en längre period. Redan här i sammanfattningen bör det betonas att säkerhetskopiering inte är detsamma som att arkivera digital information. Säkerhetskopiering syftar enbart till att säkerställa att information finns kvar vid driftstopp/systemkrasch motsv. medan digital arkivering handlar om att avgränsa och bevara en viss informa- tionsmängd för framtiden. Varför dessa rutiner tas upp här är för att de om- nämns i Riksarkivets föreskrift RA-FS 2003:2. Vad som måste bevaras i digital form är sådan unik information som förlorar sin funktionalitet vid utskrift på papper. Några exempel på handlingar är:

 Myndighetens diarium i DIABAS  Dokumentation av studieresultat i LADOK  Rådata (primärmaterial) i olika forskningsdatabaser  Myndighetens webbsidor  Beståndet av foto, film och ljud i olika analoga och digitala format

I stort kan följande format rekommenderas för arkivering:

 XML för data och metadata  8-bits ASCII (SS-ISO 8859-1) eller Unicode för ren text  TIFF (300 dpi) för scannade dokument och bilder  PDF/A (SS-ISO 19005-1) för dokument  MPEG 2 för ljud och film

Vid digital arkivering bör i första hand optiska skivor (CD-R/DVD-R) och magnetbandskassetter användas som medium för bevarande. Det är också tillåtet att lagra information på en separat hårddisk, om säkerhetskopior tas med löpan- de intervaller. Det mest ideala är annars en RAID-lösning där ett antal diskar kopplas mot varandra. Varje arkivbildare har att tillse att den egna digitala informationen arkiveras, konverteras och migreras (med konvertera menas här att spara om information i ett nyare format och med migrerar att överföra information mellan två medier). Handlingarnas läsbarhet bör kontrolleras minst vart 5:e år. Tills vidare skall

5 Dnr A 5 3482/06

handlingarna förvaras i verksamheten. Ett undantag är myndighetens webbsidor som bör arkiveras i Vasaparken. I och med att det inte finns några särskilda medel avsatta för digital arkive- ring så måste eventuella kostnader tas från befintlig budget. På sikt vore det önskvärt att det fanns en gemensam resurs som kunde ge stöd till hela verksam- heten, ett centralt digitalt arkiv. Då blir det också lättare att hantera, vårda och tillgängliggöra materialet utifrån ett långsiktigt perspektiv. Vad som bör göras för att kunna gå vidare med frågan om digital arkivering vid GU är att ytterligare styra upp myndighetens dokumenthantering. Från den 1 januari 2008 kommer nya föreskrifter att gälla för myndigheternas arkivredo- visning. De nya reglerna skall fullt ut tillämpas från den 1 januari 2010. Vad som då sker är att det äldre förteckningssystemet enligt allmänna arkivschemats principer avskaffas och istället ersätts med ett nytt processorienterat system. Av denna anledning måste samtliga arkivförteckningar som utarbetades av arkivpro- jektet 2004–2005 göras om. I detta sammanhang kommer också processoriente- rade dokumenthanteringsplaner att spela en viktig roll. Då bör även riktlinjerna för bevarande och gallring av forskningshandlingar ses över liksom myndighe- tens diarieplan. Detta arbete bör utföras fram till 2010. Först därefter är det ak- tuellt att ta upp frågan om ett gemensamt digitalt arkiv vid GU samt eventuellt införandet av ett myndighetsgemensamt ärendehanteringssystem. För att kunna gå vidare krävs också tekniskt stöd från IT-avdelningen. Uni- versitetets arkivarier har goda kunskaper i informationsstruktur och arkivhanter- ing men har ingen direkt IT-teknisk kompetens. Därför bör en IT-kunnig per- son utses som sätter sig in i ämnet. Det vore också bra att närma sig IT- universitetet i denna fråga. GU bör även fortsätta att stödja det nationella projekt (AGDA) som pågår kring digital arkivering av forskningsdata. Följande åtgärder bör sålunda vidtas de närmaste åren:

(2006–) Fortsätta att stödja det nationella projekt (AGDA) som pågår kring digital arkivering av forskningsdata. Avvakta utveckling- en och inhämta vidare kunskaper.

(2007) Utse IT-kunnig person som sätter sig in i frågan kring digital arkivering. Samverka med IT-avdelningen. Skapa kontakt med IT-universitetet.

(2007) Revidera riktlinjer för bevarande och gallring av forsknings- handlingar

(2008–2010) Avsluta de äldre arkivförteckningarna och skapa nya process- orienterade förteckningar

(2008–2010) Utarbeta processorienterad registreringsplan för myndighetens diarieföring

6 Dnr A 5 3482/06

(2010–) Införskaffa gemensamt digitalt arkiv och ärendehanteringssy- stem för hela myndigheten.

7 Dnr A 5 3482/06

Bakgrund och förutsättningar

Bakgrund Flertalet av de allmänna handlingar som förekommer vid Göteborgs universitet (GU) upprättas och hanteras digitalt i olika IT-system. Bevarandet sker dock till dock till största delen på papper eller så ligger informationen kvar i de olika sy- stemen. Därför är det viktigt att se över denna fråga så att myndigheten kan uppfylla lagstiftningens krav vad gäller hanteringen av allmänna handlingar. Ris- ken är annars stor att viktig och värdefull information försvinner.

Syfte och mål Syftet med denna utredning är att inventera behovet rörande digital arkivering vid GU samt att ge förslag på hur handlingarna kan bevaras för framtiden. En viktig fråga i sammanhanget är vem som skall ansvara för framtida konvertering- ar och migreringar samt stå för dessa kostnader. Utredningen skall också ses som en första plan till långsiktigt bevarande av digital information vid GU.

Frågeställning och genomförande Utredningen är indelad i två delar, först en allmän inventering av vilka hand- lingar som förekommer digitalt vid GU och därefter ett förslag till hur handling- arna kan bevaras för framtiden. Till respektive del förekommer ett antal frågor som utredningen syftar till att besvara:

Allmän inventering  Vilka typer av handlingar förekommer digitalt vid GU?  I vilka format och på vilka medier förekommer handlingarna?  Hur ser rutinerna för säkerhetskopiering ut?

Förslag till bevarande  Vilka handlingar måste bevaras och vilka får gallras efter en viss tid?  Vilka format och medier bör eftersträvas vid arkivering?  Var bör handlingarna arkiveras fysiskt?  Vem ansvarar för att handlingarna dokumenteras och bevaras?  Vem ansvarar för framtida konverteringar och migreringar?  Vem betalar?

Utredningen har genomförts av universitetsarkivarie Christer Johansson i sam- verkan med ett flertal medarbetare vid GU. Vid respektive avdelning vid Ge- mensamma förvaltningen har det funnits minst en referensperson för de univer- sitetsgemensamma systemen. Vid flertalet fakulteter har framförallt arkivsam-

8 Dnr A 5 3482/06

ordnarna koordinerat uppgifterna om vilka handlingar som förekommer inom respektive verksamhet. Christer Johansson sitter också med i den nationella Arbetsgruppen för ett Gemensamt Digitalt Arkiv (AGDA) och erfarenheterna från detta arbete har varit till stor hjälp under utredningens gång. Arbetsgruppen är ett samverkansprojekt mellan 14 universitet och högskolor i Sverige. På detta sätt har pilotstudien ock- så en grund i de diskussioner som förs på nationell nivå rörande digital arkive- ring.

Avgränsning Vid GU förekommer allmänna handlingar i ett flertal olika format och på olika medier. Utredningen fokuserar framförallt på förekomsten av digitala handlingar och hur detta material kan bevaras för framtiden. Till viss del berörs även be- ståndet av handlingar i olika analoga format då även detta material på sikt bör migreras till något digitalt format. Det bör poängteras att utredningen inte utgör någon totalinventering av det digitala beståndet av allmänna handlingar vid GU. Syftet har inte heller varit detta, utan att istället ge exempel på typer av handlingar, format och medier och utifrån dessa uppgifter ge förslag till långsiktigt bevarande. De IT-system som behandlas är framförallt sådana som innehåller allmänna handlingar som skall bevaras för all framtid . Vilka dessa handlingar är framgår i universitetets doku- menthanteringsplan, se http://www3.gu.se/organisation/gf/rektors-kansli/Bilaga5. . Det har också visat sig svårt att få in relevanta uppgifter från fakulteterna. En anledning till detta är att det verkar råda en allmän osäkerhet kring vilken in- formation som är aktuell för arkivering. Därför är det också svårt att säga något om några exakta mängder. Vad som ändå kan konstateras är att behovet av digi- tal arkivering finns. Denna resurs måste dock kompletteras med en detaljerad in- struktion för att komma till sin fulla rätt.

Definitioner I texten förekommer ett antal begrepp som bör förklaras:

Digital arkivering Med digital arkivering menas här att tillföra arkivet handlingar som förekommer i digital form. Med handling förstås enligt 2 kap. tryckfrihetsförordningen fram- ställning i skrift eller bild samt upptagning som kan läsas eller på annat sätt upp- fattas endast med tekniskt hjälpmedel. Som allmän räknas en handling om den förvaras hos myndigheten och är att anse som inkommen till eller upprättad hos myndigheten. Handlingar räknas som inkomna när de har anlänt till myndighe- ten eller har kommit behörig befattningshavare tillhanda. Som upprättad räknas en handling när den har expedierats, justerats eller på annat sätt fått sin slutgilti- ga utformning.

9 Dnr A 5 3482/06

Säkerhetskopiering Säkerhetskopiering, eller tagande av ”back-up”, skall inte blandas samman med digital arkivering. Säkerhetskopiering syftar enbart till att säkerställa att informa- tion finns kvar vid driftstopp, systemkrasch, motsv. Digital arkivering innebär att information avgränsas, ställs av och bevaras utifrån ett långsiktigt perspektiv. Säkerhetskopior brukar enbart bevaras ett visst antal år.

IT-system I GU:s IT-regelpolicy ( http://www.alf.adm.gu.se/sakerhet/doc/definition.pdf ) defi- nieras IT-system som utrustning och programvara som behandlar d.v.s. insam- lar, bearbetar, lagrar samt distribuerar information och utbyter data mellan funktionsenheter med hjälp av dataöverföring och i enlighet med tekniskt pro- tokoll.

Format Med format menas i vilken form uppgifter förekommer. Format kan antingen vara analoga eller digitala. Några exempel på digitala format är t.ex. TXT, DOC och PDF för textdokument, JPEG, GIF och TIFF för bilder samt MPEG för fil- mer.

Medium Riksarkivet definierar medium som ”medel och metoder för överföring eller lag- ring av information”. Begreppet omfattar såväl databärare som mer allmänna medier, t.ex. IT, foto och film.

Databärare Ett annat mer specifikt ord för medium, som används i Riksarkivets föreskrifter. Fysiskt underlag för handlingar/uppgifter (t.ex. papper, foto, film, server, hård- disk, CD-R m.m.).

Konvertering Med konvertering menas förflyttning av data mellan exempelvis olika versioner av ett ordbehandlingsprogram. Man konverterar alltså ett dokument från Word 6.0 till Word 97.

Migrering Med migrering avses här flyttning av datamängder till ny systemmiljö, nytt till- lämpningsprogram eller nytt medium. Information bevaras i bästa fall oföränd- rad men representation och teckenkoder kan vara annorlunda. Ett exempel på migrering är t.ex. om man överför innehållet i en Access-databas från en NT- server till en Oracle-databas i Unixmiljö.

Metadata Metadata beskrivs allmänt som ”data om data”. Dessa uppgifter behövs för att man i framtiden skall kunna förstå vad det är som har arkiverats, i vilket sam- manhang och med vilket syfte samt hur man tekniskt kan ta del av informatio-

10 Dnr A 5 3482/06

nen. I arkivsammanhang brukar man tala om deskriptiva, tekniska/strukturella och administrativa metadata.

Gallring Med gallring menas att förstöra allmänna handlingar eller uppgifter i allmänna handlingar. I digitala sammanhang kan gallring inträffa i samband med överfö- ring till annat medium och/eller annat program/systemmiljö om överföringen medför

 informationsförlust,  förlust av möjliga informationssammanställningar,  förlust av sökmöjligheter eller  förlust av möjligheter att fastställa informationens autenticitet.

Lagstiftningens krav Myndigheternas hantering av allmänna handlingar regleras i 2 kap. tryckfrihets- förordningen (1949:105), arkivlagen (1990:782), arkivförordningen (1991: 446), sekretesslagen (1980:100) samt i Riksarkivets författningssamling (RA-FS) och myndighetsspecifika föreskrifter (RA-MS). Syftet med att myndigheterna skall sköta sina arkiv framgår i 3 § arkivlagen:

Myndigheternas arkiv är en del av det nationella kulturarvet. Myndigheternas arkiv skall bevaras, hållas ordnade och vårdas så att de tillgodo- ser 1. rätten att ta del av allmänna handlingar 2. behovet av information för rättsskipningen och förvaltningen, och 3. forskningens behov.

I sammanhanget är det viktigt att uppmärksamma att det gällande regelverket är teknik- och medieneutralt vilket innebär att det inte spelar någon roll om en upp- gift förekommer på papper eller i digital form. Vad gäller myndigheternas hantering av digital information förekommer det dock vissa specialbestämmelser. Vid utlämnande av allmänna handlingar i digi- talt format är myndighet inte skyldig att tillhandahålla informationen i annan form än utskrift. Det finns å andra sidan en långtgående skyldighet att på begä- ran göra sammanställningar och andra bearbetningar av digital information om detta kan ske med rutinbetonad åtgärd. Undantag från denna regel är person- uppgiftssammanställningar som myndighet enligt lag eller förordning inte får göra tillgänglig.

Riksarkivets föreskrifter och allmänna anvisningar Riksarkivet (RA) är tillsynsmyndighet för de statliga myndigheternas arkivhan- tering och har rätt att utfärda särskilda föreskrifter rörande arkivfrågor (RA-FS och RA-MS).

11 Dnr A 5 3482/06

Som tidigare har nämnts är det gällande regelverket teknik- och medieneut- ralt. De anvisningar som gäller för bevarande och gallring av t.ex. personal- och ekonomihandlingar gäller sålunda oavsett om informationen förekommer på papper eller i digital form. Det viktiga är sålunda att de unika uppgifterna hante- ras på rätt sätt. Riksarkivet har utfärdat tre föreskrifter som särskilt rör myndigheternas han- tering av digital information:

RA-FS 2003:1 Häri framgår vilka format och tekniska medier som skall användas vid leverans till arkivmyndighet. I föreskriften anges också krav på hur informationen skall organiseras och representeras med filformat och teckenkoder.

RA-FS 2003:2 Häri framgår hur myndigheterna praktiskt skall sköta det långsiktiga bevarandet av sina handlingar. Denna föreskift är mer beskrivande till sin karaktär.

RA-FS 2003:3 Häri framgår anvisningar för hur leveranser praktiskt skall genomföras till arkivmyndighet.

I RA-FS 2003:2 framgår ett antal punkter som är intressanta i relation till arkiv- hanteringen vid statliga myndigheter:

 Vid utveckling av ett system/applikation skall dataorganisationdataorganisation och reprrepre-e-e-e- sentation väljas med hänsyn till att informationen skall kunna överfö- ras/konverteras till annan databärare och/eller annan dataorganisa- tion/datarepresentation under den fortsatta hanteringen.

 Myndigheten skall regelbundet framställa säkerhetskopior av ADB- upptagningarna. Säkerhetskopiorna skall för att ge avsett skydd förvaras se- parat och på ett betryggande sätt.

 Under driften av ett system eller en applikation för ADB skall dokumentdokumenta-a-a-a- tion med följande innehåll upprättas eller sammanställas ur befintlig doku- mentation.

- översiktlig beskrivning av systemet/applikationen - redogörelse för indata och utdata - redogörelse för registrerings- och uttagsmöjligheter - beskrivning av rutiner i systemet - beskrivning av lagrade data såsom struktur, samband och definitioner - redogörelse för ändringar i systemet/applikationen.

12 Dnr A 5 3482/06

Av dokumentationen skall framgå vilka dokument som finns i syste- met/applikationen och vilka sammanställningar av uppgifter som myndighe- ten kan eller har kunnat göra Dokumentationen skall fortlöpande kompletteras och hållas aktuell.

 Myndigheten skall upprätta en plan för långtidslagringlångtidslagring, med följande in- nehåll:

- överföring till annan databärare - databärare (typ och fabrikat) - klimat (avläsning, avvikelser) - kontrolläsning (läsfel) och annan vård - användningsfrekvens (om beständigheten kan påverkas) - bevakningsdatum för olika moment - ansvarig operatör.

Vid val av tidpunkt och periodicitet för överföring till långtidslagring ska hänsyn tas till långsiktiga behov av återsökning och användning av data.

 Vid överföring av ADB-upptagningar till databärare för långtidslagring skall två arkivexemplar framställas. Arkivexemplar får inte användas för till- handahållande eller vid utlåning. Vid utlämnande av databärare skall sär- skilda låneexemplar framställas. Arkivexemplaren skall förvaras i arkivlokal med klimat som är anpassat till databäraren.

I de rapporter som publicerats av Riksarkivet (Att bevara digitala handlingar – förslag till framtida inriktning 2006 samt ”Långsiktigt bevarande av digital arkiv- information” ur arkivutredningen Arkiv för alla 2002 ) framgår att arkivmyndig- heten arbetar med att ta fram en modell för hur man i framtiden skall kunna ta hand om det digitala material som upprättas idag. Tidigare ägnade sig Riksarki- vet i stort åt att skriva författningar och verksamheten hade en låg operationell nivå och saknade en sammanhängande vision. Nu arbetar man istället mer aktivt tillsammans med andra statliga myndigheter och målet är att utveckla en gemen- sam teknisk plattform liksom att bestämma standarder för datautbyte, rutiner för masslagring m.m. Utvecklingen verkar gå mot att XML (eXtended Markup Language) accepteras som ett leverantörsoberoende arkivformat för data och me- tadata. Som generell referensmodell för digital arkivering omnämns OAIS som standard. Vid migrering av data rekommenderas bl.a. 8-bits ASCII/Western La- tin 1 eller Unicode (för ren text), TIFF (bildformat t.ex. vid scanning av doku- ment) samt XML/SGML (som märkspråk för att skilja innehåll och presenta- tion). Dessa nationella ansatser har givetvis också en grund i den internationella standard som utvecklats för Records management (ISO 15489). I sammanhanget kan det också vara intressant att nämna att PDF/A sedan hösten 2005 räknas som ett internationellt standardformat för arkivering av scannade dokument (SS-ISO 19005-1).

13 Dnr A 5 3482/06

Erfarenhet av digital långtidslagring vid GU Frågan rörande digital långtidslagring eller arkivering av digital information har tidigare inte behandlats centralt vid GU men 2000–2001 fanns en projektgrupp som undersökte förutsättningarna för elektronisk ärendehantering (Dnr A11 4332/2000). Detta arbete behandlade sålunda myndighetens informationsflöde, s.k. workflow, men inte själva bevarandet av handlingarna. Vid myndigheten finns dock ett antal enheter som faktiskt arbetar med frågor rörande elektronisk långtidslagring – Universitetsbiblioteket (UB), Svensk sam- hällsvetenskaplig datatjänst (SSD) och Språkdata vid Institutionen för svenska språket.

Elektronisk publicering vid Universitetsbiblioteket Handelshögskolans bibliotek har under flera år publicerat fakultetens vetenskap- liga publikationer samt studenternas uppsatser på webben. 2004 initierades ett projekt vid UB som syftar till att bygga upp en universitetsgemensam resurs för e-publicering. Som bakgrund till detta arbete ligger regeringens regleringsbrev från 2003 där det framgår att alla lärosäten till utbildningsdepartementet skall återrapportera sina forskningspublikationer. Projektet består av tre delar

 Göteborgs Universitets Publikationer GUP (en databas för re- dovisning av forskningspublikationer)  Elektronisk publicering GUPEA Göteborgs Universitets Publi- kationer och e-publicering och e-arkiv  Open Access – en översikt

Som system för lagring av e-publikationer har UB valt att använda DSpace , vil- ket är en öppen programvara och teknisk plattform för digital långtidslagring. Läs mer om projektet och sök i databasen: http://www.ub.gu.se/publicera/

Svensk samhällsvetenskaplig datatjänst Svensk samhällsvetenskaplig datatjänst (SSD) hörde tidigare till Samhällsveten- skapliga fakulteten vid Göteborgs universitet men överflyttades 2006 till Veten- skapsrådet. Där är verksamheten organisatoriskt knuten till kommittén för infra- struktur (KFI) men GU har fortfarande arbetsgivaransvar för SSD. SSD har som uppdrag att ta emot och bevara samt tillgängliggöra primärdata från samhällsvetenskaplig och humanistisk forskning. Informationen bevaras som flata filer i ASCII-format (rent text) för att vara oberoende av specifik pro- gramvara. Metadata tas fram och bevaras enligt särskilda specifikationer. Materi- alet komprimeras med programvaran G-zip och lagras på server. Backup bränns ned på DVD-skivor en gång i veckan och en gång per år. Läs mer på: http://www.ssd.gu.se/ .

14 Dnr A 5 3482/06

Språkvetenskaplig databehandling vid Institutionen för svenska språ- ket Språkvetenskaplig databehandling (med Språkbanken) tillhör Institutionen för svenska språket och arbetar med lexikaliskt material i elektronisk form. Samling- en utgörs i huvudsak av texter men man skall eventuellt även börja bevara talma- terial. Informationen lagras på server/hårddisk och backup tas på band en gång per kvartal och en gång per år. Formatet som används är TEI (Text Encoding Initiative) samt för metadata SGML och XML. Unicode används som tecken- kod. Läs mer på: http://hum.gu.se/institutioner/svenska-spraket/sprakdata/ .

Informationshämtning från andra projekt och verksamheter rörande digital långtidslagring Idag sker ingen omfattande arkivering av digital information vid landets univer- sitet och högskolor men det pågår ett antal projekt som behandlar dessa frågor. I detta stycke avser jag att referera till de resultat som har framkommit genom det- ta arbete samt andra angränsande verksamheter.

AGDA – Arbetsgruppen för ett gemensamt digitalt arkiv bland svenska universitet och högskolor Förutsättningarna för digital arkivering utreds även nationellt av Arbetsgruppen för ett gemensamt digitalt arkiv (AGDA). Projektet genomförs på uppdrag av för- valtningscheferna vid 14 av landets universitet och högskolor. Under perioden 2004–2005 genomfördes en första pilotstudie och 2006–2007 kommer studien även att omfatta material från andra lärosäten. Syftet med projektet är att undersöka förutsättningarna för långtidsbevarande av forskningsdatabaser och att testa en teknisk plattform för den generiska mo- dellen Open Archival Information System (OAIS). Metoder som testats inom projektet är bevarande i ursprungligt format ( bit preservation ) och bevarande genom migrering ( functional preservation ), d.v.s. flytt av information från ett system till ett annat med bevarande av informationens autenticitet, integritet, tillförlitlighet och användbarhet. De båda metoderna testades tillsammans med en teknisk plattform kallad DSpace. DSpace bygger på gratis och öppen programvara utvecklad av Massa- chusetts Institute of Technology (MIT) i USA och Hewlett Packard (HP). Dspace är under utveckling och används som elektroniskt arkivsystem och en digital ar- kivdepå (institutional repository) av flera universitet och institutioner runt om i världen. En av användarna är Universitetsbiblioteket i Göteborg som lagrar och tillgängliggör vetenskapliga publikationer på webben. Under pilotprojektet installerades DSpace på en Intelbaserad server och ma- terialet lagrades på en hårdvaru-RAID (Redundant Array of Independent Disc). RAID innebär säkrare lagring då flera diskar är sammanslagna till en enda logisk disk. Dspace använder programspråket Java och kräver olika javakomponenter.

15 Dnr A 5 3482/06

Dessa är fri programvara och hämtas gratis från SUN Microsystems hemsida. DSpace använder också databasen PostgreSQL De studerade objekten i pilotprojektet utgjordes av tre databaser: ”Växtnär- ingsförsök”, ”Riksinventeringar av sjöar och vattendrag” och ”Hönsgenetik”. Även inscannat material i form av fältprotokoll från projektet ”Barrskogsland- skapets ekologi” testades i samspel med DSpace. Testet med ”bit preservation” bestod av tre försök där databaserna migrerades till flata textfiler, överfördes i komprimerad form eller överfördes som ren text. Resultatet av dessa försök visar att arkiverad information förblir oförändrad över tiden men att informationen samtidigt blir omöjlig att återanvända utan speciel- la program och speciell teknisk bearbetning. I pilotprojektets slutrapport konstateras att det ändå är meningsfullt med bit preservation. Det pågår ett omfattande utvecklingsarbete med den metod som kallas emulgering, d.v.s. en strategi som går ut på att man återskapar den ur- sprungliga tekniska miljön genom simulering. Det blir således möjligt att åter- använda det digitala materialet med hjälp av nya tekniska lösningar samtidigt som man behåller materialets logiska innehåll och fångar dess ursprungliga ”look and feel”. För att testa functional preservation arkiverades samma databaser i DSpace med hjälp av en XML-plattform. Ett XML-verktyg har utvecklats för att produ- cera en XML-representation av respektive databas. Verktyget är uppdelat i flera filer och databasens innehåll och struktur visas i separata XML-filer. Migreringen av samma databaser med hjälp av en särskild rutin för XML- överföring uppvisade helt andra möjligheter för bevarande och tillgång till det arkiverade materialet. Både databasens innehåll och struktur extraherades samti- digt som informationen kunde presenteras för användning omedelbart och på samma sätt som den var nyttjad ursprungligen. Informationens integritet, auten- ticitet och tillförlitlighet förblev oförändrad. Behovet av metadata har också utretts under testen. Dataelement från den metadatastandard som kallas Dublin Core, och den som används av DSpace, har jämförts med internationella och nationella arkivstandarder för metadata samt med metadata för bevarande enligt OAIS-modellen. En viss begränsning i Dub- lin Core-uppsättningen har konstaterats, främst för användningen av administra- tiva metadata. Pilotprojektets slutsats är att de bästa förutsättningarna för långtidsbevarande uppnås genom migrering av forskningsdatabaser till ett XML-format. Med XML kan man arkivera, återvinna och visa information på ett strukturerat sätt, obero- ende av datasystem. DSpace som är en teknisk plattform för arkivering och till- gängliggörande kan vara en möjlig lösning. Mer att läsa: http://dspace.slu.se:8080/dspace/bitstream/123456789/47/1/Slutrapporten+ver. 3.doc .

REDA – Regionalt digitalt arkiv i Skåne I Lund utreds förutsättningarna för digital arkivering inom det s.k. REDA- projektet . Deltagande parter är Region Skåne, Lunds universitet, Landsarkivet i

16 Dnr A 5 3482/06

Lund, Lunds kommun, Länspolismyndigheten i Skåne och Skånes arkivför- bund. Projektet offentliggjorde sin förstudierapport i december 2005. Under perio- den 2006–2007 planeras ett pilotprojekt för att därefter utvärdera framkomna resultat. De studerade objekten kommer att utgöras av ett PA-system, ett Pati- entjournalsystem och ett omfattande digitalt bildmaterial. Slutmålet är skapan- det av ett digitalt arkiv i någon form. Som utgångspunkt i projektet har man utgått ifrån följande förutsättningar:

 REDA-projektet skall ta sin utgångspunkt i den referensmodell för digitalt arkiv som beskrivs i OAIS-standarden (ISO 14721:2003)  Så långt som möjligt skall projektet tillämpa öppna strategier. Till exempel bör en konvertering av informationsinnehållet till nya format (s.k. ”func- tional preservation”) inte utesluta att även originalfilen bevaras (s.k. ”bit preservation”)  Den föreslagna modellen för ett regionalt arkiv skall vara skalbar från pilot till full skala.  För att minimera frågeställningen kring lagringsmedia skall förslaget till regionalt digitalt arkiv i så stor utveckling som möjligt förespråka ren disk- lagring.  En möjlighet som bör övervägas är en RAID-lösning där back-up och ar- kivfunktion på ett ekonomiskt sätt kan integreras.

REDA-gruppen har inte inom ramen för det befintliga arbetet bestämt vilken metadatauppsättning som skall tillämpas. Ett lovande internationellt arbete som lyfts fram i förstudien är OCLC:s (Online Computer Libraray Center) och RLG:s (Research Libraries Group) gemensamma ansträngning i The Preserva- tion Metadata: Implementation Strategies (PREMIS) group. Andra viktiga refe- renser är dokumenttypsdefinitionen EAD (Encoded Archival Description) och den internationella förteckningsstandarden ISAD(G). Förstudien har inte bildat tillräckligt underlag för val av specifik teknisk lös- ning. REDA-gruppen trycker dock på vissa principiella ställningstaganden som bör vara vägledande i kommande tekniskt val. Den tekniska implementeringen bör så långt som möjligt:

 vara leverantörsoberoende  vara plattformsoberoende  bygga på verkliga och defactostandarder, samt  uppnå största möjliga tillgänglighet och undvika migrering på grund av databärarens fysiska livslängd genom lagring på disk i ett RAID-system.

I valet av hårdvara väger projektgruppen olika databärare mot varandra. Även om det förekommer vissa kostnadsskillnader mellan lagring på disk och lagring på magnetiska band och optiska skivor måste man väga in ett flertal andra fakto- rer i valet av lagringsteknik:

17 Dnr A 5 3482/06

 disklagring i ett redundant disksystem med feltolerans och paritet innebär bättre garantier för bevarad dataintegritet.  migrering p.g.a databärarens fysiska livslängd är inte nödvändig (felaktiga och föråldrade diskar kan bytas ut under drift, s.k. ”hot swap”)  betydligt snabbare åtkomst till data uppnås (jämför åtkomsttiden för en SCSI-hårddisk med data som lagrats på sekventiellt band).

Arbetsgruppens rekommendation är sålunda online-lagring i ett RAID-system, nivå 5 eller motsvarande och inte offline-lagring på band och skivor. Lagrings- teknik som ILM (Information Lifecycle Management) och HSM (Hierchial Sto- rage management) kan dock vara ett alternativ för att styra lagring av större da- tamängder mindre frekvent material till billigare lagringsmedier. I förstudien framgår att ingen programvara motsvarar den totala funktionali- teten i REDA-modellen. I botten måste finnas en databashanterare som håller reda på de digitala objekten, deras inbördes relationer och metadata kopplade till respektive objekt. SQL:2003-standarden kan vara en tänkbar utgångspunkt. För att uppnå leverantörsoberoende på operativsystemsidan är det idag svårt att se något alternativ till GNU/Linux-distribution. Användargränssnittet bör vara webbaserat enligt W3C:s standarder och specifikationer för att undvika platt- formsberoende klientutveckling. Vad gäller kostnaden för att skapa och underhålla ett digitalt arkiv konstate- ras i förstudien att det är svårt att göra en dylik uppskattning. Digital arkivering är ett långsiktigt ekonomiskt åtagande. Dock kan man se vissa kostnadsreduce- rande faktorer:

 samverkan och samfinansiering  automatisering av manuella rutiner  standardisering i floran av accepterade format, samt  maximal skalbarhet i koncept och implementering.

Ett intressant förhållande som uppmärksammas av projektgruppen är att kost- naden för digital lagring tenderar att sjunka med 30-40% per år vilket innebär att man också sparar större mängder information. Teknikutvecklingen medför alltså inte automatiskt minskade kostnader. Mer att läsa: http://dspace.slu.se:8080/dspace/bitstream/123456789/48/1/REDA+f%3Frstud ierapport+slutlig.pdf .

SVEP – Samordning av den svenska högskolans elektroniska publice- ring SVEP-projektet har under åren 2003 –2005 finansierats och samordnats av BIB- SAM/Kungl. biblioteket. Syftet med projektet var att främja en mer samordnad och kraftfull utveckling av elektronisk publicering av forskares och studenters egna arbeten vid universitet och högskolor. Projektets mål var att definiera stan-

18 Dnr A 5 3482/06

darder, sprida lösningar för långsiktigt tillgänglighet, ge råd och stöd kring verk- tyg för publicering samt utveckla nya söktjänster. Projektet har byggt på ett sam- arbete mellan Kungl. biblioteket, Lunds universitet, Uppsala universitet och en rad andra svenska universitet och högskolor. Projekttiden löpte ut i december 2005. Delprojekt 2 (DP2) inom SVEP-projektet behandlade aspekten långtidsbeva- rande. Ändamålet med studien var att skapa en infrastruktur som bygger på ge- mensamma rutiner för överföring och lagring av dokument mellan en lokal pro- ducent och det nationella digitala arkivet. Det centrala arkivet skall finnas på KB. Delrapportens underrubrik är arbetsflöden och tekniska lösningar för arki- vering av elektroniskt publicerade dokument vid svenska universitet och högsko- lor. Viktiga ledord i arbetet har varit:

 Långsiktig tillgänglighet  Resurssnålhet  Långsiktig hållbarhet  Samordning  Standardisering

DP2 rekommenderar OAIS som referensram. Projektet enades om att alla lös- ningar som tas fram under SVEP/DP2 skall vara kompatibla med OAIS. DP2 har arbetat med att se över de tekniska metadata som behövs för att kunna bevara digital information långsiktigt. Till paketering av enkla och kom- plexa objekt rekommenderas användningen av Library of Congress Meta Enco- ding and Transmission Standards (METS) och MPEG21 – Digital Item Declara- tion Language (DIDL). PREMIS (PREservation Metadata: Implementation Strategies) Working Group´s arbete har varit viktigt för SVEP. I maj 2005 pub- licerade PREMIS ett viktigt dokument: ”Data Dictionary for Preservation Me- tadata: Final Report of the PREMIS Working Group” som kan användas som en referenshandbok för bevarandedata. En viktig slutsats av DP2 är vikten av ändamålsenliga verktyg som är enkla att tillämpa, särskilt vid skapande av tek- niska metadata. Detta moment bör vara automatiserat så långt det är möjligt. Mer att läsa: http://www.svep-projekt.se/preservation/ .

LDB – Långsiktigt digitalt bevarande LDB-projektet i Luleå är ett samverkansprojekt mellan Riksarkivet, Luleå teknis- ka universitet, Bodens kommun och Riksförsäkringsverket. Verksamheten består av tre delar: systemutveckling, forskning och nätverkande. 2006 fick projektet en fastare form, som en egen enhet inom Riksarkivet. Syftet med LDB är att ut- veckla projektmetoder och teknik för digital arkivbildning och arkivinforma- tionssystem. Man arbetar också med att ta fram ett ramverk/ implementerings- förslag för hur Riksarkivet/Landsarkiven ska hantera arkiveringsprocessen i en- lighet med OAIS . Nätverkandet syftar till att skapa ett nationellt kompetens- centrum.

19 Dnr A 5 3482/06

På LDB-enhetens hemsida finns ett flertal intressanta rapporter, uppsatser och avhandlingar publicerade, bl.a. rörande bevarande av webbsidor, e-mail, ar- kivredovisning m.m. Mer att läsa: http://ldb.project.ltu.se/~Projekt_LDB .

Arkivering av webbsidor vid Kungliga biblioteket Vid Kungliga biblioteket (KB) bedrivs sedan 1997 projektet Kulturarw³. Syftet är att samla in, bevara och tillgängliggöra förekommande svenska webbsidor på internet. Därför scannas nätet regelbundet för att fånga upp intressant material. Bl.a. har www.gu.se bevarats 2–3 gånger per år sedan 1997. Allmänheten kan enbart ta del av materialet i KB:s lokal i Stockholm. Förekommande dynamiska webbsidor med olika inställningar och vyer bevaras som statiska ”frusna” sidor. Mer att läsa: http://www.kb.se/kw3/ .

Arkivering av webbsidor vid Högskolan i Borås Högskolan i Borås bevarar sedan 2005 lärosätets webbsidor. Webbsidorna beva- ras i två olika format – dels som statiska sidor med programvaran webbstripper, dels som en kopia av filstrukturen (rotkatalogen) från webbservern. För att speg- la högskoleårets olika skeenden bevaras materialet i januari, maj och oktober. Som arkiveringsmedium används DVD-skivor (Riksarkivet rekommenderar an- nars CD-R) och anledningen till detta är att kunna samla ett arkiveringstillfälle på en och samma skiva. DVD-skivorna upprättas enligt Riksarkivets anvisningar i tre exemplar (arkiv-, kopierings- och användarexemplar). För att kunna bevara och läsa det arkiverade materialet upprättas systemdo- kumentation. Dessa handlingar följer med varje arkiveringstillfälle i pappersform och som textdokument på DVD:n.

20 Dnr A 5 3482/06

Förekomst av allmänna handlingar i olika digitala format vid Göteborgs universitet

Inventeringens genomförande Vad som har varit av intresse att ta med i denna inventering är de IT-system som innehåller uppgifter som skall bevaras för all framtid. Vid GU förekommer ett mycket stort antal IT-system och flertalet av dessa innehåller information som bör räknas som av tillfällig och ringa betydelse (jämför RA-FS 1997:6). Några exempel är stöd för lokalbokning och schemaläggning. Dessa IT-system och handlingar har alltså inte tagits med här. Under våren 2006 informerade chefen för rektors kansli övriga avdelnings- chefer vid Gemensamma förvaltningen om utredningens genomförande. Dessa har därefter utsett en eller flera kontaktpersoner på respektive avdelning. Utifrån kontaktpersonernas anvisningar har universitetsarkivarien därefter vänt sig till re- spektive systemförvaltare. Denna del av inventeringen får därför ses som relativt heltäckande. Under våren har också kanslicheferna vid respektive fakultet informerats om utredningens genomförande. Dessa rekommenderade då universitetsarkivarien att ta kontakt med arkivsamordnarna för att få in relevant information den vä- gen. Detta har dock inte fungerat särskilt bra. Mer eller mindre heltäckande uppgifter har enbart kommit in från Humanistiska fakulteten och IT- universitetet. Att så blev fallet kan bero på att man har missuppfattat uppgiften eller att den ansetts som svår att genomföra. I stort kan konstateras att verksam- heten känner stor osäkerhet kring vilken digital information som skall bevaras för framtiden. Resultatet av inventeringen är här alltså inte heltäckande utan får ses som exempel på det digitala material som förekommer vid fakulteterna. Resultatet av inventeringen rörande de universitetsgemensamma systemen framgår enligt bilaga 1. Vad gäller uppgifter rörande fakulteternas handlingar så har dessa bakats in i den löpande texten. Förekomsten av foto och film vid Konstnärliga fakulteten inventerades 2004 av två studenter, som en del i arkiv- utbildningen vid Landsarkivet.

Något om IT-strukturen Vad gäller IT-strukturen vid GU så finns för tillfället ingen enhetlig sådan. Ge- mensamma förvaltningens avdelningar tillsammans med stora delar av Sahl- grenska akademin och UFL ingår i ett nätverk där informationen lagras på ett antal speglade servrar. Servrarna förvaras fysiskt i Vasaparken och i Lyktan på Medicinarberget. Här lagras också de uppgifter som hanteras i de universitets- gemensamma IT-systemen, t.ex. för personal och ekonomi. Fakulteterna har också egna nätverk samt egna fil-, mail- och printservrar. På institutioner och avdelningar förekommer även information på hårddiskar och andra typer av medier. Vid Gemensamma förvaltningen används idag huvudsakligen tunna kli-

21 Dnr A 5 3482/06

enter ( nätverksansluten minimalistisk dator som har som sin enda uppgift att kommunicera tangent- och muskommandon till en server och därifrån hämta skärmuppdateringar) .

Förekomst av allmänna handlingar i olika IT-system Som tidigare har nämnts förekommer det ett flertal olika IT-system vid GU och majoriteten av dessa innehåller information som kan räknas som av tillfällig och ringa betydelse. De IT-system som förväntas innehålla uppgifter som bör bevaras för all framtid kan grovt delas in i följande kategorier:

 Forskningsdatabaser/IT-system för bearbetning av forskningsdata  IT-system för distansutbildning  Administrativa IT-system  Myndighetens webbsidor  Foto, film och ljud

Forskningsdatabaser/Forskningsdatabaser/ITITITIT----systemsystem för bearbetning av forskningsdata förekom- mer på fakulteternas olika institutioner och avdelningar. Dessa system används framförallt till att lagra och bearbeta olika former av forskningsdata. I många fall är livslängden för systemen väldigt lång och kan räknas i decennier. Uppdatering av programvara sker löpande vid behov. Vad gäller de system som förekommer vid Sahlgrenska akademin kan det i många fall vara svårt att dra gränsen för vem materialet tillhör, GU eller sjukvården. Dessa förhållanden behöver utredas vi- dare. Många fakulteter ger också distansutbildningar på webbenwebben som administre- ras via olika IT-system. Lärare och studenter kan här kommunicera och studen- terna laddar ner kursmaterial och lämnar in tentor m.m. Vad jag har stött på så förekommer sådana system bland annat på IT-universitetet, Sahlgrenska akade- min och Samhällsvetenskapliga fakulteten. Liknande system förekommer säkert även på andra håll inom GU. Till kategorin adadadministrativaad ministrativa ITIT----systemsystem räknas t.ex. personal- och ekonomi- systemen samt LADOK. Hit räknas också system för diarieföring, arkivredovis- ning, fastighetsförvaltning, kemikaliehantering, upphandling och övrig studie- administration. Här rör det sig i huvudsak om universitetsgemensamma system men lokala system förekommer också på fakulteterna. En viktig kanal för att sprida information om universitetets verksamhet är myndighetens webbsidor på www.gu.se . Flertalet webbsidor inom universitetet administreras inom en gemensam plattform för publicering av dynamiska webb- sidor, CMS (Content Management System). Några fakulteter har dock valt att stå utanför detta system och använder egna lösningar. Dessa är Universitetsbib- lioteket, Humanistiska fakulteten och Handelshögskolan. Därutöver förekom- mer också ett flertal lokala webbsidor på institutionerna, som inte ingår i den gemensamma CMS-plattformen.

22 Dnr A 5 3482/06

Mycket av informationen på myndighetens webbsidor styrs också via ett antal webbwebbportalerportalerportaler. På kurs- och studentportalerna förekommer information rörande utbildning och studiedokumentation. Medarbetarportalen behandlar främst per- sonalens anställning vid GU. I flera fall länkar också webbportalerna till olika administrativa IT-systemen. Till kategorin foto, filmfilmfilm och ljud räknas Universitets-TV:s produktioner och bilderna i GU:s bilddatabas. Vid vissa fakulteter, bl.a. vid de humanistiska och konstnärliga, förekommer också ett omfattande material av foto, film och ljud i olika digitala och analoga format. För att kunna bevara sistnämnda handlingar så bör även dessa på sikt konverteras till något lämpligt digitalt format. Därför om- nämns även dessa i denna utredning.

Olika format och medier Det mesta av informationen i de universitetsgemensamma IT-systemen hanteras i SQL-databaser och lagras på förvaltningens servrar. Vad gäller enskilda doku- ment så förekommer dessa i en mängd olika format, t.ex. som DOC (Word), XLS (Excel) och PDF (Adobe Acrobat). Den information som hanteras i forskningsdatabaser och IT-system för bear- betning av forskningsdata förekommer i ett flertal olika format, beroende på programvaran som används. Några exempel är Access , FileMaker, DB2 och Excel . Forskningsdata bearbetas också i olika statistikprogram, t.ex. SAS och SPSS . Ma- terialet lagras mestadels på olika servrar men lokala hårddiskar förekommer ock- så. Vilka format utbildningsplattformarna använder känner jag inte till men för- modligen rör det sig här om SQL-databaser . Bifogade handlingar förekommer bl.a. som DOC och PDF-filer . Informationen lagras på olika servrar. Myndighetens webbsidor förekommer mestadels i formatet HTML . Bilder förekommer bl.a. som GIF och JPEG . Flertalet av myndighetens webbsidor är dynamiska och innehåller script ( PEARL, PHP ) och flash. Informationen lagras huvudsakligen på olika servrar. Sedan hösten 2004 bevaras de program som produceras av Universitets-TV i formatet MPEG-2. Därutöver förekommer också ett flertal olika format, både analoga och digitala. Några exempel på analoga format är BVU, Betacam och I”C och digitala format DV, DVCam, DVCPro och DigitalS. Arkivkopior förvaras i ett särskilt bandarkiv och nyare produktioner finns även tillgängliga på server. Bilderna i GU:s bilddatabas bevaras i formaten TIFF och JPEG . Bilderna lag- ras på server. Vad gäller foto, film och ljud på de olika fakulteterna så förekommer även dessa handlingar i en mängd olika format och på olika medier. Fotografier före- kommer t.ex. som skioptikonbilder (glasskivor), papperskopior och som negativ och positiv film. Ljudinspelningar finns på rull- och kassettband samt DAT- band (Digital Audio Tape). Filmer finns inspelade på 16- och 35 mm film, Beta-film, VHS (Video Home System) och DV (Digital Video). Digitala filer lagras även på optiska skivor som CD-R och DVD-R.

23 Dnr A 5 3482/06

Rutiner för säkerhetskopiering Vad gäller rutinerna för säkerhetskopiering (skall inte blandas samman med be- greppet ”digital arkivering”) så varierar dessa inom GU. De största IT-systemen säkerhetskopieras i regel en gång per dygn och informationen bevaras från några veckor upp till ett år. Den information som hanteras inom Gemensamma för- valtningen (tillsammans med delar av Sahlgrenska akademin och UFL) samt IT- universitet bevaras i tre månader. Därutöver förekommer också att säkerhetsko- pior tas per månad, halvår eller år. I regel bevaras denna information för en peri- od av ett år. Två undantag är Utbildningsvetenskapliga fakulteten och Handels- högskolan som bevarar sina årliga säkerhetskopior för all framtid. På förstnämn- da fakultet har denna rutin gällt i 4–5 år och vid den sistnämnda sedan 1995. Det kan alltså konstateras att mycket av informationen vid GU kan återska- pas för en period av några veckor upp till fyra månader. Därutöver förekommer enbart information som har bevarats vid vissa specifika tillfällen.

FakultetFakultet/motsv./motsv. Säkerhetskopiering och tid för bevbevaaaaranderande Gemensamma förvaltningen Inkrementell back-up tas en gång per dygn och informationen bevaras i 3 månader. Fullback-up tas en gång per månad och in- formationen bevaras i 1 år. Sahlgrenska akademin Mycket av informationen på Sahlgrenska akademin lagras på universitetets centrala servrar. GF och SA har gemensam IT- avdelning. Lokala lösningar finns också. Humanistiska fakulteten All informationen säkerhetskopieras två gånger i månaden och bevaras från 2,5 må- nader upp till 10 månader. Konstnärliga fakulteten Det finns inget enhetligt nät eller enhetliga rutiner på fakulteten. På Artisten hämtas e-post hem från en gemensam server till respektive hårddisk där den anställde själv får ansvara för eventuell säkerhetskopiering. På Valand ansvarar var och en för sin egen back-up. Tillfälliga säkerhetskopior tas för webbsidorna och vissa registersystem. Visst webbmaterial har bevarats sedan 1995. Samhällsvetenskapliga fakulteten Finns inget enhetligt nät utan institutioner- na ansvarar själva för sina IT-resurser. Back- up tas i allmänhet per natt. Informationen bevaras olika lång tid, minst en vecka. Psy- kologen bevarar den säkerhetskopierade in- formationen upp till 1 år. Handelshögskolan Back-up tas varje dygn, fullback-up var 128 dygn. Mailloggar kan återskapas för 1 år tillbaka i tiden. Den fullback-up som tas sist på året bevaras och så har skett sedan 1995.

24 Dnr A 5 3482/06

Naturvetenskapliga fakulteten Inget enhetligt nät, uppdelat mellan olika GU-institutioner och Chalmers. Vid Geovetarcentrum tas back-up en gång per dygn. Försök pågår med att lagra infor- mationen centralt på Gemensamma förvalt- ningens servrar. Utbildningsvetenskapliga fakulteten Varje natt tas dygnsback-up och informa- tionen lagras 2–4 veckor. Första söndagen varje månad tas back-up och informationen bevaras i 1 år. Mitt på året tas också back-up och informationen bevaras för all framtid. Denna rutin har gällt i 4–5 år. UFL UFL hör till GF:s nät och all information lagras på de centrala servrarna. IT-universitetet 1 ggr dygn (3 månader) 1 ggr halvår (1 år) Universitetsbiblioteket 1 ggr dygn (-) 1 ggr månad (2 år)

25 Dnr A 5 3482/06

Anvisningar för digitalt bevarande

Modell för långsiktigt bevarande Idag ansvarar respektive arkivbildare (kansli, institution, avdelning) för den egna arkiveringen. I praktiken medför detta att arkiven ser väldigt olika ut innehålls- mässigt, trots att det finns centrala direktiv och riktlinjer. Om man i framtiden skall införa någon form av enhetlig digital arkivering är det viktigt att styra do- kumentflödet än mer än idag. Ett oordnat pappersarkiv är relativt enkelt att ordna upp men ett digitalt arkiv som befinner sig i oreda är desto svårare att hantera. Förmodligen blir det också väldigt kostsamt. Därför är det viktigt med en väl genomtänkt struktur för den framtida dokumenthanteringen. Idag kan skönjas vissa strategiska ”flaskhalsar” i det digitala handlingsflödet. Några exempel är Kursportalen och Universitetsbibliotekets publiceringsdatabas GUP/GUPEA för vetenskapliga publikationer. Här samlas mycket av den kurs- dokumentation som upprättas (bl.a. kursplaner, deltagarlistor, scheman, kom- pendier) samt flertalet doktorsavhandlingar. På ett liknande sätt bör det digitala handlingsflödet styras i framtiden så att all information slutligen hamnar på ett ställe, i ett arkiv ( institutional repository ). Då blir det också lättare att hantera, vårda och tillgängliggöra materialet utifrån ett långsiktigt perspektiv.

Modell för dokumentstyrning

Forskningsdata Kursdokumentation Webbsidor

Administrativa Avhandlingar, upp- Foto, film data satser och publika- och ljud tioner

Digitalt arkiv

Forskningens behov Allmänhetens behov Verksamhetens behov

26 Dnr A 5 3482/06

Det bör dock poängteras att digital arkivering inte har något egensyfte i sig själv. I princip spelar det ingen roll vilken typ av medium informationen bevaras på utan det viktiga är att den bevaras och är autentisk. Troligtvis kommer det under mycket lång tid att vara så att handlingar bevaras i många olika format och på olika medier, t.ex. digitalt, på papper och mikrofiche. Några fördelar som ändå följer med digitala format är att informationen kan bli lättare att tillgängliggöra, sprida, kopiera, söka och sammanställa. Den stora nackdelen är att informatio- nen får ett permanent vårdbehov i form av konverteringar och migreringar. Ett pappersarkiv kan ordnas upp en gång men ett digitalt material blir aldrig färdig- ställt.

Vad bör bevaras i digital form? Som läget ser ut vid GU idag är det bäst att flertalet handlingar inom forskning, utbildning och administration bevaras på papper. Detsamma gäller för uppsat- ser, avhandlingar och övriga publikationer. Vad som måste bevaras digitalt är sådan unik infoinforrrrmationmation som förlorar sin funktionalitet vid utskrift på papap-p-p-p- perperper,per t.ex. data från forskningsdatabaser och administrativa system samt webbsi- dor. Även beståndet av foto, film och ljud (gäller såväl digitala som analoga for- mat) bör bevaras digitalt för att garantera läsbarheten i framtiden. Först när det finns en fullt utvecklad arkivorganisation kan verksamheten gå över till en mer enhetlig digital arkivering. Några exempel på handlingar som bör bevaras i digital form är:

 Rådata (primärmaterial) i olika forskningsdatabaser  Myndighetens diarium i DIABAS  Dokumentation av studieresultat i LADOK  Myndighetens webbsidor  Beståndet av foto, film och ljud i olika analoga och digitala format

Teckentabeller och filformat Vid digital arkivering bör enhetliga format och standarder väljas, som är allmän- na, öppna och leverantörsoberoende. Därför är de vanliga kontorsformaten (ex- empelvis Word/DOC och Excel/XLS) inte lämpliga för arkivering. Informatio- nen får heller inte vara krypterad eller lagrad i komprimerad form, t.ex. ZIP, TAR eller SIT. Vid val av teckentabeller rekommenderar Riksarkivet framförallt SS-ISO 8859-1 (WesternWestern Latin II) men godkänner även SS 63 61 27 (svensk 7-bits ASCII). I arkivsammanhang omnämns också ISO 10646-1:2000 (UTFUTFUTF----88 eller UTFUTF----16161616). Även Unicode 3.0 eller senare är helt kompatibel med andra utgå- van av ISO 10646-1:2000, Universal Character Set. Följande filformat rekommenderas av Riksarkivet för arkivering:

 XML för data och metadata  8-bits ASCII (SS-ISO 8859-1) eller Unicode för ren text

27 Dnr A 5 3482/06

 TIFF (300 dpi) för scannade dokument och bilder  PDPDPDF/APD F/AF/AF/A (SS-ISO 19005-1) för dokument  MPEG för ljud och film

Försäkringskassan är en av de myndigheter som kommit längst i hanteringen av digitala handlingar och denna myndighet rekommenderar följande arkivformat:

Format Format för arkivering Affärsprocesser, finans ebXML-ramverket XBRL (eXtensible Business Reporting Lan- guage) FpML (Financial products Markup Language) OAGIS-ramverket (Open Applications Group) Allmänt TEI (Text Encoding Initiative) IPTC NewsML XHTML (eXtensible Hyper Text Markup Language) CAD och GIS (vektoriserade GML (Geography Markup Language) för 2 D format) och 3 D CGM (Computer Graphics Metafile ISO/IEC 8632) för 2 D I vissa fall kan även TIFF användas för 2 D Ev. WebCGM för 2 D Ev. SVG (Scalable Vector Graphics) för 2 D Ev. PDF/E för 2 D/3 D Ev. från Web3D Consortium för 3D Databasfiler och statistikfiler Ren text/ASCII XML Kontorsdokument ISO 19005-1:2005 PDF/A Ren text/ASCII XHTML Metadata och arkiv EAD (Encoded Archival Description) ISO 15836:2003 DC (Dublin Core) e-Goverment Metadata Standard W3C RDF (Resource Description Framework) Ev. PRISM, NARA:s RFC:er för långtidslagring Ev. EAC (Encoded Archival Context) Ev. MODS (Metadata Object Description Schema) Ev. METS (Metadata Encoding and Tranpsortation Standard) Ev. VERS (Victorian Electronic Records Strat-

28 Dnr A 5 3482/06

egy) MOREQ, ISO 23081-1:2004 Records man- agement processes Naturvetenskap MathML (Mathematical Markup Language) Scanning (300 dpi) och ra- TIFF 6.0 CCITT T.6/”grupp 4” för s/v strerad grafik TIFF 6.0 LZW (Lempel-Ziv-Welch) för färg/gråskala Ev. TIFF 6.00 Uncompressed Bitmap för färg/gråskala Ev. PDF/A Ev. JIFIF (JPEG File Interchange Format) Ev. ISO 15444-1:2004 JPEG 2000 Ev. W3C SVG Ev. ISO 15948:2004 PNG Systemutveckling och teknik ISO 19503 XMI (XML Metadata Inter- change) DocBook STEP-ramverket SOAP Ev. W3C ECMAScript, STEPml, WfXML Webbsidor HTML och TXT för text JPEG och GIF för bilder Video, ljud, virtuella format ISO 11172:1993 MPEG-1 MP3 = MPEG-1 layer 3 13818:1995 MPEG-2 Ev. X3D från Web3D Consortium, MPEG-4 * Tabellen baserar sig på en sammanställning gjord av Magnus Wåhlberg 2005-11-02.

År 2004 utkom en utredning rörande strategi och bevarande för de samlingar som ingår i Statens ljud- och bildarkiv (SOU 2004:53). Materialet utgörs bl.a. av det totala utbudet från Sveriges Radio AB, Sveriges Television AB, Utbild- ningsradion AB och TV 4 AB samt digitala marksända kanaler. I utredningen rekommenderas ett bevarande som motsvarar sändningskvalitén, vilket innebär MPEGMPEG----22 8 Mbit/sMbit/s. Detta filformat används även vid GU för att bevara de pro- gram som produceras av Universitets-TV.

Medium I RA-FS 2003:1 framgår att optiska skivor och magnetbandkassetter accepteras som medium vid leverans till Riksarkivet eller landsarkiven. Som optiska skivor räknas CDCDCD- CD ---RRRR ( Recordable) och CDCDCD- CD --- ROM (Compact Disc - Read Only Memory). Skillnaden mellan båda dessa är att CD-R framställs en och en genom bränning medan CD-ROM produceras i större upplagor med master. Godkända standarder är ISO 13490 för CD-R och ISO 9660 för CD-ROM.

29 Dnr A 5 3482/06

Ett annat optiskt medium som ännu inte har godkänts i någon föreskrift är DVD (Digital Versatile Disc). Skillnaden mellan DVD- och CD-skivor är att de förstnämnda rymmer betydligt mer data. Om en vanlig CD-skiva rymmer 700 MB (megabyte) så rymmer en DVD-skiva upp till 4,7 – 18 GB (gigabyte). DVD används dock vid flertalet myndigheter som arkiveringsmedium, bl.a. vid Lunds universitet och vid Högskolan i Borås. Bandkassetter som rekommenderas av Riksarkivet är av 3480-typ, Digital Audio Tape (DAT), Exabyte-typ och (DLT). Ett flertal olika ISO-standarder har godkänts för bandkassetter vilka framgår av tidigare nämnda föreskrift. Även hårddiskar och servrar kan accepteras för arkivändamål men då bör dessa hållas åtskilda från det övriga nätverket. Informationen skall också säker- hetskopieras med vissa fastställda intervaller. Det mest ideala är annars att välja en RAIDRAID- ---lösninglösning (Redundant Array of Independent Discs) där ett antal hårddiskar är kopplade mot varandra och spa- rar informationen dubbelt. Denna lösning bygger på att sannolikheten att samt- liga hårddiskar går sönder samtidigt är väldigt liten. En trasig hårddisk kan också ersättas med en ny, utan att den sparade informationen påverkas. Oavsett vilket medium som väljs för bevarande så skall det vara av god kvali- tet. På så vis förbättras mediets hållbarhet.

Konvertering och migrering I och med att det inte finns några arkivbeständiga format och medier så måste digitala handlingar konverteras och migreras med ett visst tidsintervall. Annars kommer informationen inte att vara läsbar i framtiden. I sammanhanget talas det om fysisk och teknisk livslängd. För att ta en CD-R-skiva som exempel så håller den fysiskt från några år upp till kanske 15–20 år, beroende på skivans kvalitet och bränning. En CD-ROM-skiva bör ha en längre fysisk livslängd, kanske upp till 100 år. Därefter vittrar eller krackelerar skrivytan sönder. Vad gäller den tekniska livslängden så vet vi inte hur länge det finns apparatur som kan läsa CD-skivor. Vem minns inte de gamla disketterna som fanns i olika format, t.ex. 5¼ tum s.k. floppy och 3,5 tum. Idag säljs inga nya datorer med diskettstationer utan dessa har ersatts av optiska läsare och USB-portar. Det är heller inte säkert att en fil som har bevarats i ett visst format kan läsas i framti- den. Informationen måste då sparas om i ett nyare format. Därav krävs en lång- siktigt plan för konvertering av filer och migrering av information mellan olika medier. I arkivutredningen Arkiv för alla (SOU 2002:78) återges en tabell som be- handlar olika mediers beständighet enligt följande:

Databärare Mediets fysiska Mediets tekniska livslängd livslängd Magnetband 2-30 år 5 år Videoband 10-20 år 5 år

30 Dnr A 5 3482/06

Magnetiska diskar 5-10 år 5 år Optiska diskar 5-100 år 10 år * Tabellen baserar sig på uppgifter som publicerats i Scientific American 1995 av Jeff Rothenberg..

Med dessa uppgifter som grund vore det lämpligt att föreslå att all information vid GU kontrolleras varvarvartvar ttt 5:e år så att den är läsbar. Vid behov bör informatio- nen konverteras till nytt format eller migreras till nytt medium. På så vis kan man minimera risken att viktig information blir liggande och på sikt förstörs. Handlingar (främst foto och film) som förekommer på olika analoga medier, t.ex. rull- och kassettband, 16- och 35 mm-film, Beta-film och VHS bör så fort som möjligt konverteras till lämpligt digitalt format. På så vis kan materialet också räddas för framtiden och blir lättare att vårda. Ytterligare anvisningar för hur en plan för långsiktigt bevarande av digital in- formation skall utformas framgår enligt RA-FS 2003:2.

Förvaring I 6 § arkivlagen (1990:782) framgår att landets myndigheter skall skydda sina arkiv mot förstörelse , skada , tillgrepp och obehörig åtkomst . Dessa krav förtydligas ytterligare i RA-FS 1997:3 där det framgår att hand- lingarna skall förvaras i skåp eller annat slutet utrymme som skyddar dem mot:

 vatten och skadlig fukt  brand, brandgas och skadlig upphettning i 120 minuter  skadlig klimat- och miljöpåverkan, samt  skadegörelse, tillgrepp och obehörig åtkomst.

Följande krav ställs på klimatmiljön:

 pappershandlingar: <18°C ± 2°C 30-40% RF ± 5% RF (Relativ fuktighet)  magnetiska databärare: <15°C ± 2°C 30% RF ± 5% RF  optiska datadatabärare:bärare: <18°C ± 2°C 30% RF ± 5% RF  mikrofilm: <18°C ± 2°C 30% RF ± 5% RF  svart/vita negativ: <18°C ± 2°C 30% RF ± 5% RF  svart/vita påsiktsbilder: <18°C ± 2°C 30% RF ± 5% RF  färgnegativ: <-5°C ± 2°C 30% RF ± 5% RF  färg påsiktsbilder: <-5°C ± 2°C 30% RF ± 5% RF  färgdiapositiv: <-5°C ± 2°C 30% RF ± 5% RF  nitratnegativ: <11°C ± 2°C 30% RF ± 5% RF

Vad gäller magnetiska databärare så bör dessa inte förvaras i samma utrymme som dammalstrande pappershandlingar. Luften i arkivlokalen bör också renas genom avskiljning av både fasta och gasformiga föroreningar. Magnetiska data- bärare skall även skyddas mot skadlig elektromagnetisk påverkan. Ju mer förva-

31 Dnr A 5 3482/06

ringsklimatet avviker från de rekommenderade värdena, desto kortare blir den fysiska livslängden.

Förslag till bevarande av myndighetens webbsidor Som tidigare har nämnts i texten administreras flertalet av GU:s webbsidor via en gemensam CMS-plattform (Content Management System). De verksamheter som för närvarande ingår i denna är Gemensamma förvaltningen, Sahlgrenska akademin, Samhällsvetenskapliga fakulteten, Naturvetenskapliga fakulteten och Utbildningsvetenskapliga fakulteten. Övriga fakulteter har valt egna lösningar. Detta innebär att ansvaret för arkiveringen av myndighetens webbsidor också måste delas av verksamheten. Nedanstående plan för bevarande av myndighetens webbsidor har utarbetats av universitetsarkivarie Christer Johansson och webbkoordinator Mikael Stoltz . Dessa kan också besvara frågor rörande olika programvaror för bevarande m.m. Planen bygger i stort på den arkiveringsplan som tillämpas vid Högskolan i Borås.

Hur skall myndighetens webbsidor bevaras?

 Webbsidorna bevaras i ett statiskt HTMLHTML----formatformat med programvaror som Webstripper eller Webdevil. Med dessa program är det möjligt att spara webbinformationen och göra den tillgänglig med en offline-browser. Då blir det också möjligt att ”klicka sig runt” inom webbsidan.  Rotkatalogen bevaras i ursprungligt format.

Vilket urval skall göras?

 Endast den egna verksamhetens webbsidor skall bevaras, d.v.s. kansli, in- stitution, avdelning eller annan enhet vid Göteborgs universitet.  Externa webbsidor som det finns länkar till behöver ej bevaras.  Uppgifter i administrativa system och databaser behöver inte bevaras med webbsidorna. Dessa uppgifter bevaras separat vid myndigheten.

Hur ofta skall webbsidorna bevaras?

 Myndighetens webbsidor bevaras två gånger per årår, i augusti och januari.

På vilket medium skall webbsidorna bevaras?

 Webbsidorna bränns ned på DVDDVD----skivorskivor i två exemplar (arkiv- och ko- pieringsexemplar). Om inte informationen får plats på en DVD-skiva skall universitetsarkivarie Christer Johansson kontaktas för ytterligare anvis- ningar.

32 Dnr A 5 3482/06

Hur dokumenterar vi processen?

 Vid varje arkiveringstillfälle skall användardokumentationanvändardokumentation bifogas mate- rialet – dels som ren textfil (.txt) på DVD-skivorna och dels som pappers- dokument.  Användardokumentationen skall bestå av en allmän instruktion om hur man kan ta del av informationen på DVD-skivan samt en teknisk beskriv- ning rörande hård- och mjukvara. Nedanstående tekniska dokumentation utgör enbart exempel på hård- och mjukvara. Dessa uppgifter måste korri- geras vid respektive arkiveringstillfälle.

Instruktion för att läsa DVDDVD----skivanskivan

1. Utrustning som kan läsa DVD krävs 2. Starta en filutforskare 3. I roten på din DVD-enhet finns en kopia av detta doku- ment som textfil. 4. Två kataloger vid namn, filkopia och stripped 5. Filkopia innehåller en ren filkopia av webbarna 6. Stripped innehåller en länkad filstruktur så att man kan navigera ”offline” (d.v.s. surfa lokalt) 7. Ingångssidan på varje webb startas med filen in- dexW., förutom cem där man startar med defa- ult.html och ei där man startar med eilogon.html.

För att tanka ner filerna ifrån universitetets webb nyttjas programmet XXXXXX.

HårdHård---- och mjukvara

 Hårdvara Dator: PC Dell Optiflex Gx 150 RAM-minne: 256 KB Processor: P3 1 GHz/133 MHz  Mjukvara Operativsystem: Windows XP Stripper: Webstripper 2.0  Webbläsare: Internet Explorer 6.0  PDF-läsare: Adobe Acrobat Reader 5.0  Dokumentläsare: Microsoft Office 97  DVD-hårdvara: Bravo Primera Disc Publisher  DVD-media: Verbatim DVD-R2X

33 Dnr A 5 3482/06

Vem ansvarar för vad?

 Avdelningen för externa relationer ansvarar för att de webbsidor som administreras inom den gemensamma CMS-plattformen arkiveras  HandelshögsHandelshögskolan,kolan, Humanistiska fakulteten och UniversitetsUniversitetsbiblibiblibiblio-o-o-o- teket ansvarar för att de egna webbsidorna arkiveras. Detsamma gäller för övriga enheter vid GU, som inte ingår i den gemensamma CMS- plattformen.

Slutförvaring, konvertering och migrering

 Efter varje arkiveringstillfälle skall DVD-skivorna skickas till registraturet i VasaparkenVasaparken. Där kopieras filerna över till någon form av disk för att kunna tillgängliggöras för allmänheten, antingen via webben eller på en stationär dator. Rektors kansli ansvarar sålunda för framtida konvertering- ar och migreringar av insänt material.

Databasfiler och statistikfiler Den vanligaste typen av databaser är s.k. relationsdatabaser. I dessa organiseras informationen i tabeller som relaterar till varandra. Exempel på relationsdataba- ser är DB2, Access och FileMaker liksom Oracle, Microsoft SQL Server och My-SQL. Exempel på statistikprogram är SAS och SPSS. Vad som är intressant att bevara är inte programvaran i sig utan den informa- tion (rådata) som hanteras i systemen. Så länge ett program hålls i bruk bör in- formationen bevaras i sitt ursprungliga format. Används inte informationen un- der en tid av minst fem år så bör informationen bevaras i ett format som är oav- hängigt programvaran. Bevarandet bör ske genom att informationen konverteras till 888- 8---bitsbits ASCII (SS(SS(SS-(SS ---ISOISO 88598859----1)1)1)1) eller till XMXMXML XM LLL. Det förstnämnda alternativet är godkänt av Riksarkivet och praktiska anvisningar ges i RA-FS 2003:1. Även XML godkänns som lämpligt arkivformat. Detta alternativ förespråkas bl.a. av AGDA-gruppen (14 svenska universitet och högskolor i samverkan) som har testat olika former av bevarande av forskningsdata. Därutöver bör den arkiverade informationen även bevaras i ursprungligt formatformat. Det är möjligt att man i framtiden kommer på ännu bättre sätt att återanvända och tillgängliggöra data och då kan det vara bra att ha kvar det ursprungliga formatet. Stadsarkivet i Stockholm ( www.ssa.stockholm.se ) publicerade i början av juni 2006 ett antal utkast till handledningar för hantering av digital information inom Stockholms stad. Häri framgår bl.a. en sammanställning över för- och nackdelar mellan olika arkiveringsformat vid bevarande av databaser:

34 Dnr A 5 3482/06

Format Fördel Nackdel När välja? XML  Lätt att presentera  Svårt att söka och  När det finns en  Mindre behov av bearbeta individ eller ett ob- separat dokumenta-  Svårt att generera ur jekt att samla in- tion, eftersom do- befintlig databas formationen kring. kumentationen är  När databasen är sammanlänkad svår att ”platta till” med informationen p.g.a. hierarkier genom märkorden och samband.  Inte utrymmes- krävande  Lätt att upprätthål- la hierarki och rela- tioner Positionsbestämd  Enkel att söka och  Är obegriplig utan  När en fil består av textfil bearbeta separat dokumenta- få fält och fältens  Lätt att generera ur tion längd inte varierar befintlig databas  Utrymmeskrävande stort mellan pos- (fältets storlek anpas- terna sat efter den mest ut-  Om data har ka- rymmeskrävande raktären av regis- posten). ter.  Känsligt för fasför- skjutningar.  För att upprätthålla hierarki och relatio- ner krävs separat do- kumentation. Teckenseparerad  Enkel att söka och  Är obegriplig utan  När en fil består av textfil bearbeta separat dokumenta- många fält och  Inte utrymmes- tion fältlängden varierar krävande  Svårt att presentera mycket mellan oli-  Lätt att generera ur  För att upprätthålla ka poster. Då är befintlig databas hierarki och relatio- teckenseparerad fil ner krävs separat do- utrymmesbespa- kumentation rande.  Känsligt för felläs- ningar om teckense- paratorn förekom- mer i ett fält. Kombination Samtliga fördelar Större kostnader för att generera och lagra

Det finns idag ingen central resurs för bevarande av digital information vid GU. Därför vilar ansvaret för bevarandet av myndighetens digitala handlingar på re- spektive arkivbildare, d.v.s. varje kansli, institution och avdelning. En möjlighet att tillgängliggöra data från humanistisk och samhällsvetenskap- lig forskning är att leverera materialet till Svensk Samhällsvetenskaplig Datatjänst (SSD). Det bör dock poängteras att GU inte kan avsäga sig arkivansvaret som statlig myndighet. I sammanhanget är det också viktigt att belysa att SSD sedan årsskiftet 2005/2006 lyder under Vetenskapsrådet och ej under GU. Därför mås- te alla allmänna handlingar också arkiveras vid myndigheten.

35 Dnr A 5 3482/06

Dokumentation och metadata Inom det s.k. AGDA-projektet undersöks förutsättningarna för bevarande av forskningsdatabaser. Den metadatastandard som man valt att tillämpa är en kva- lificerad version av Dublin CoreCore. Nedanstående text baserar sig på detta arbete. Andra standarder som nämns i arkivsammanhang är bl.a. EAD (Encoded Archi- val Description), EAC (Encoded Archival Context) och ISAD(G) (Internatio- nal Standard for Archival Description, General). I arkivsammanhang brukar man urskilja följande typer av metadata:

 deskriptiva metadata  tekniska/strukturella metadata  administrativa metadata

För att kunna identifiera en viss informationsmängd behövs kunskap om både innehåll och kontext. Vad innehåller filen för information, vilken tidsomfatt- ning eller andra avgränsningar kan göras i materialet? Vilket organisatoriskt ur- sprung har informationen? Vem har skapat den och i vilket syfte? Utan tillgång till information om vilken teknisk miljö en viss fil skapats i är det omöjligt att göra den läsbar. Man måste veta vilken hårdvaruplattform, vil- ket operativsystem och vilken applikationsprogramvara som krävs för att pre- sentera informationen. Filtyp, filstorlek, kodschema och eventuell komprime- ring är andra viktiga metadata. Hur tabeller och fält i en databas relaterar till varandra är nödvändig dokumentation för att återskapa en databas från t.ex. flata filer. Det behövs också en del metadata för att hantera den arkiverade informatio- nen rätt. Finns det t.ex. några restriktioner för tillgängliggörandet? Kanske råder det sekretess i materialet, kanske innehåller filerna personuppgifter eller upp- hovsrättsskyddat material som inte får spridas hur som helst? Det kan också fin- nas bestämmelser om gallring av hela eller delar av materialet efter en viss tid.

Beskrivning av metadata

1.1.1. Deskriptiva metadata

a) beskrivning av det digitala objektets informationsinnehållinformationsinnehåll t.ex. beskrivning av ingående dataelement, variabler och parametrar och relationen mellan dessa, tidsomfattning, validitet m.m.

b) kontextuell information t.ex. organisatorisk tillhörighet, projektbeskrivning, procedurer för datain- samling, standarder, referenser till kompletterande information.

36 Dnr A 5 3482/06

2.2.2. Tekniska och strukturella metadata

a) beskrivning av den ursprungliga filen (”bit preservation”) t.ex. filtyp, filstruktur, version, operativsystem, applikationsprogramvara, hårdvaruplattform, eventuell komprimering, databasdesign etc.

b) beskrivning av funktionellt format (”functional preservation”) t.ex. filtyp, filstruktur, version, operativsystem, applikationsprogramvara, hårdvaruplattform, eventuell komprimering, databasdesign etc.

3.3.3. Administrativa metadata

a) metadata för återsökning, indexering och systematisering t.ex. beteckningar, sökbegrepp, referenser till andra arkiverade objekt etc.

b) metadata för tillgängliggörandet t.ex. sekretess, upphovsrätt, informerat samtycke till behandling av per- sonuppgifter.

c)c)c) metadata för autenticering, migrering och konverterkonverteringing t.ex. dokumentation av migrering och konvertering till nya versioner, format och media, checksummeberäkningar och andra kontroller.

d)d)d) metadata för bebevarandevarande och gallring t.ex. evalueringsinformation, gallringsfrist etc.

Teknisk dokumentation och manualer för olika IT-system skall arkiveras hos re- spektive systemägare. IT-avdelningen vid Gemensamma förvaltningen skall arki- vera en lista med gemensamma IT-system en gång per år. Detsamma gäller för IT-ansvariga ute i verksamheten, vad gäller fakulteternas egna system. Om man beslutar att bevara data i digital form bör även dokumentation och metadata upprättas enligt exemplet ovan. Ytterligare anvisningar rörande systemdokumentation framgår enligt RA-FS 2003:2-3.

OAIS-modellen En modell som ofta omtalas i samband med digital arkivering är den s.k. OAIS- standarden (Open Archival Information System) ISO 14721:2003. OAIS är, som det återges i arkivutredningen Arkiv för alla (SOU 2002:78), en referens- modell och ett konceptuellt ramverk för digital arkivering, som är framtaget av amerikanska rymdflygstyrelsen NASA. Modellen etablerar terminologi och kon- cept som är relevanta för digital arkivering, identifierar centrala delar och proces- ser som vanligtvis förekommer vid digital arkivering och föreslår en informa- tionsmodell för digitala objekt och tillhörande metadata.

37 Dnr A 5 3482/06

I informationsmodellen identifieras tre typer av s.k. informationspaket:

 Submission Information Package (SIP)  Archive Information package (AIP)  Dissemination Information Package (DIP)

Alla informationspaket består av fyra delar:

1. dataobjektet som skall bevaras, t.ex. en ordbehandlingsfil eller en digital bild 2. information om objektet som är nödvändig för dess bevaran- de, t.ex. uppgifter om format, när objektet skapades och av vem 3. information om vad som utgör informationspaketet och av- gränsar det mot andra paket 4. beskrivning av informationen, helt eller delvis hämtad från den andra delen, och som används vid återsökning av det di- gitala objektet, t.ex. ärendemening och namn på avsändare i ett diariefört ärende eller e-brev.

OAISOAIS----modellenmodellen

Förklaring: producer(arkivbildare), management (arkivförvarande institution), consumer (användare).

Det är i längden inte realistiskt att arkivbildarna skall stå för vården av myndig- hetens digitala arkiv. Detta förutsätter någon form av gemensam resurs, vilket också är en förutsättning för den dokumentstyrningsmodell som presentera des i kapitlets inledning. I detta sammanhang är OAIS-modellen intressant.

38 Dnr A 5 3482/06

Ansvar Rektor är övergripande ansvarig för myndighetens arkivhantering. Därefter följer ansvaret linjeorganisationen med dekaner, överbibliotekarie, förvaltningschef, o.s.v. Det hör också till varje anställds ansvar att sköta hanteringen av myndighe- tens allmänna handlingar. Vad gäller bevarandet av myndighetens digitala handlingar så vilar här ett sär- skilt ansvar på respektive systemägaresystemägare. När ett system avvecklas bör universi- tetsarkivarien kontaktas. Tillsammans får man avgöra om aktuell information skall bevaras eller inte. För att få förstöra allmänna handlingar krävs särskilt gall- ringsbeslut från Riksarkivet. Några exempel på systemägare är personal- och or- ganisationsutvecklingsdirektören för det personaladministrativa systemet och chef för en forskargrupp för gruppens forskningsdatabas. I dagsläget finns ingen central resurs för bevarande av digital information vil- ket innebär att verksamheten tillsammans får stå för det långsiktiga bevarandet .

Kostnader Det finns idag heller inga särskilda medel avsatta till bevarandet av myndighe- tens digitala handlingar. Förekommande behov måste sålunda täckas inom be- fintlig budget. Om man i framtiden skall börja med någon form av enhetlig digital arkive- ring vid GU så bör medel för detta avsättas centralt. Det är inte realistiskt att ar- kivbildarna själva skall stå för det långsiktiga bevarandet. En viktig orsak till det- ta är att varken fakulteter eller institutioner kan räknas som stabila enheter. Verksamheter omorganiseras, tillkommer och försvinner. Därav bör ansvaret vila på universitet centralt. Det bör sålunda finnas en gemensam resurs som kan ge stöd till hela verksamheten. En viktig fråga i sammanhanget är vad det skulle kosta att skapa ett gemen- samt digitalt arkiv. I REDA-projektets slutrapport daterad 2005-12-05 framgår att det är väldigt svårt att beräkna en exakt summa. Vad som påverkar kostnaden är bl.a. mängden data som skall bevaras och vilket system som väljs för teknisk implementering. Helt säkert är dock att ett digitalt arkiv medför långsiktiga ekonomiska åtaganden.

Vinster Vad verksamheten vinner på att standardisera dokumenthanteringen och skapa ett gemensamt digitalt arkiv är:

 Bättre tillgänglighet till myndighetens handlingar, såväl för anställda som studenter och allmänhet.  Effektivare verksamhet – enklare att bevara, söka, distribuera, återanvän- da och sammanställa uppgifter, såväl administrativa data som forsknings- data.

39 Dnr A 5 3482/06

 Förbättrad säkerhet – visa rätt version av dokument, kontroll av behörig- het, kvittens av mottagande.  Minskade behov av arkivlokaler (positivt när verksamheten sitter i trånga lokaler).

Fler åtgärder För att kunna skapa en enhetlig organisation för digital arkivering vid GU är det viktigt att styra upp dokumenthanteringen än mer än idag. För att nå detta mål bör följande delprojekt initieras:

 Processorienterade dokumenthanteringsplaner och arkivförteckningar  Reviderade anvisningar för bevarande och gallring av forskningshand- lingar  Processorienterad registreringsplan för myndighetens diarieföring, som även inkluderar institutionernas verksamhet  Införskaffande av ärendehanteringssystem för hela myndigheten

Från den 1 januari 2008 kommer nya föreskrifter att gälla för statliga myndighe- ters arkivredovisning. Det äldre förteckningssystemet enligt allmänna arkiv- schemats principer kommer att ersättas av ett nytt processorienterat system. Fö- reskrifterna har en övergångstid fram till den 1 januari 2010 och skall därefter tillämpas fullt ut. Detta innebär att samtliga arkivförteckningar som utarbetades inom ramen för arkivprojektet 2004–2005 måste göras om. Som en viktig grund för detta ar- bete kommer processorienterade dokumenthanteringsplaner att ligga. På så vis får vi också bättre kontroll över myndighetens dokumentflöde och kan bestäm- ma var och i vilket format handlingar skall bevaras. Detta arbete bör igångsättas när de nya föreskrifterna börjar gälla 2008 och vara avslutat senast 2010. Det vore också önskvärt att revidera det tillämpningsbeslut som gäller för be- varande och gallring av forskningshandlingar vid GU. Detta dokument besluta- des 2004 men har i efterhand visat sig ha vissa brister. En brist är att riktlinjerna är för allmänna och istället borde delas upp i olika forskningsområden. Därför bör nya tillämpningsbeslut utformas för medicin (inklusive odontologi och om- vårdnad), naturvetenskap/IT samt humaniora/samhällsvetenskap (inklusive eko- nomi, utbildningsvetenskap och eventuellt konst). Det bör förtydligas var grän- serna går mellan GU andra verksamheter, t.ex. gentemot sjukvården. Vilket ma- terial tillhör vem? Vad som också bör förtydligas är när olika typer av handlingar blir allmänna, i Tryckfrihetsförordningens (1949:105) mening. De nya tillämp- ningsbesluten bör vara processorienterade och kopplas samma med de anvis- ningar som rör digital arkivering. Detta arbete bör ingångsättas under verksam- hetsåret 2007. En annan nyhet som införs med det nya förteckningssystemet är processori- enterade registreringsplaner. Av vad som framgår av den information som finns publicerad på Riksarkivets webbsida (www.ra.se ) så skall sådana planer utarbetas för respektive myndighet och innehålla uppgifter om verksamhet, processer och

40 Dnr A 5 3482/06

handlingsslag. Denna information motsvaras idag av de uppgifter som ingår i myndighetens arkivredovisning och diarieplan. Dessa dokument skall alltså slås samman till en övergripande registreringsplan. Av denna anledning bör GU:s di- arieplan granskas och eventuellt revideras utifrån verksamhetens behov. Nu finns även möjlighet att få med det handlingsflöde som förekommer på institutioner och avdelningar. Detta delprojekt bör löpa parallellt med utarbetande av nya ar- kivredovisningar och dokumenthanteringsplaner och avslutas 2010. I kapitlets inledning (se även nästa sida) återges en figur som visar en modell för dokumentstyrning. Mapparna kan sägas utgöra arbetet med att ta fram pro- cessorienterade dokumenthanteringsplaner och arkivförteckningar för perioden 2008–2010. Därefter bör man se över möjligheterna att införskaffa någon form av digitalt arkivsystem (t.ex. DSpace tillsammans med en RAID-lösning) och ett ärendehanteringssystem. Sistnämnda system skulle kunna utgöra en länk mellan de olika system (personaladministration, ekonomi, dokumenthantering, help- desk, e-post m.m.) som förekommer i verksamheten och det digitala arkivet. Här gäller det alltså att bygga en ”tratt” eller ”flaskhals” för att kunna samla in- formationen på ett ställe. På så vis kan man skapa en enhetlig organisation för bevarandet av myndighetens handlingar.

Tidsplan för skapandet av ett digitalt arkiv vid GU

Modell fföööörr dokumentstydokumentstyrrrrningning

Forskningsdata Kursdokumentation Webbsidor Administrativa Avhandlingar, up p- Foto, film data satser och publika- och ljud tioner 2008 –2010

Digitalt arkiv

2010–

Forskningens Allmänhetens behov Verksamhetens behov behov

För att kunna realisera ovan nämnda modell är det viktigt att GU:s IT-avdelning och IT-universitetet är delaktiga. Därför bör någon medarbetare vid någon av dessa enheter sätta sig in i frågan kring digital arkivering. Vad universitetets ar- kivarier kan bistå med är kunskap kring informationsstruktur och arkivering men de har ingen direkt IT-teknisk kompetens. Därför bör dessa kunskaper sammanföras i någon form.

41 Dnr A 5 3482/06

Vad som bör göras i närtid är alltså att strukturera upp GU:s dokumenthan- tering än mer, avsluta de äldre arkivförteckningarna och skapa nya processorien- terade förteckningar. Vad gäller införskaffandet av ett digitalt arkiv och ärende- hanteringssystem så bör detta vara aktuellt först om ett antal år. Till dess bör GU fortsätta att stödja det nationella projekt som pågår kring digital arkivering (AGDA-projektet) samt iaktta utvecklingen vid andra universitet och högskolor (bl.a. REDA-projektet). Först när det finns konkreta lösningar att ta efter bör GU gå vidare med frågan kring digital arkivering.

42 Dnr A 5 3482/06

Bilagor

Bilaga 1. Sammanställning över universitetsgemensamma IT-system som innehåller uppgifter som skall bevaras för framtiden.

Bilaga 2. Plan för långsiktigt bevarande av digital information vid GU.

43 Dnr A 5 3482/06

BBBILAGA 1:1:1: Sammanställning över universitetsgemensamma ITIT----systemsystem som iin-n-n-n- nehåller uppgifter som skall bevaras för framtiden

1. Rektors kansli Systemägare: Anna Lindholm

System Funktion Format & medi- Handlingar Bevarande um Diabas Diarieföring av SQL-databas på Myndighetens Bevaras löpande myndighetens server diarium på server. handlingar Visual Arkiv Upprättande av SQL-databas på Arkivredovisning- Bevaras löpande myndighetens ar- server ar på server. kivredovisning Papperskopior bevaras också i respektive arkiv.

2. Personalavdelningen Systemägare: Christina NorNorddddbergberg

System Funktion Format & medi- Handlingar Bevarande um Ansti Rapportverktyg SQL-databas på Ersätts inom kort för personaladmi- server av Datalagret. nistration KataGU Personal- och or- SQL-databas på Administrativ Uppgifter i syste- ganisationskata- server katalog met gallras vid log inaktualitet. Den tryckta kata- logen bevaras (har givits ut se- dan 1892). Om utgivningen av den tryckta ka- talogen upphör måste informatio- nen i KataGU be- varas. Medarbetarporta- Onlinetjänst för SQL-databas på Webbsidan beva- len GU:s anställda server ras centralt på Ex- rörande anställ- terna relationer. ning, ledighet Innehållet i porta- m.m. len gallras vid inaktualitet. Palasso Personalsystem SQL-databas på Lönelistor Lönelistor och för personaladmi- server Tjänstgörings- tjänstgöringsjour- nistration, löner, journaler naler bevaras på analys, resor, mikrokort. Ledighetsansök- egenrapportering ningar Ledighetsansök- av ledigheter och ningar, övertids- sjukfrånvaro. Övertids- och mertidsuppgifter och mertidsupp- gifter samt sjuk-

anmälningar gall- ras efter 2-5 år. Pir Rapportverktyg SQL-databas på Ersätts inom kort för personaladmi- server av Datalagret. nistration

44 Dnr A 5 3482/06

3. Ekonomiavdelningen Systemägare: Lars NilNilsssssonsonsonson

System Funktion Format & medi- Handlingar Bevarande um Agresso Business Ekonomisystem Oracle-databas, Grundbokföring Bevaras löpande World 5.5.0 SP1 med funktioner textfiler, på ser- Huvudbokföring på server. som huvudbok ver. Sidoordnad bok- samt reskontror föring för leverantör, kund och anlägg- ningar. Horisonten Ekonomisystem - Redovisningsda- ersatt 1/4-06 av ta, VSAM-filer, in- Agresso formation har överförts till GU:s datalager. Kontraktsreskont- Ekonomisk pro- SQL-databas, Diarium över in- Bevaras löpande ra jekt- hantering, pdf-dokument, på komna kontrakt på server. håller reda på server. och avtal rörande Kontrakt och avtal kontrakt gällande externa medel. bevaras på pap- medel från exter- Scannade hand- per. na givare lingar. Loop, Naviasion Fondförvaltnings- SQL-databas, Bevaras löpande stiftelsesystem applika- textfiler, på ser- på server. ver. tion/system för stiftelseredovis- ning. Systemet innehåller redo- visningsdata och stiftelseinforma- tion. Perspektiv Budget och upp- Ersätts 2007 med följningssystem annat system Stipendiesystem Webbaserat sy- Server Bevaras löpande stem för stipen- på server. diehantering. Beslut om tilldel- I systemet före- ning av medel di- kommer person- arieförs centralt i uppgifter såsom Vasaparken och namn, adress, bevaras på pap- bankkonto samt per. ansökningsblan- ketter med olika uppgifter beroen- de på stipendium.

4. Fastighetsavdelningen Systemägare: Ingmar ThThoooorénrénrénrén

System Funktion Format & medi- Handlingar Bevarande um Fastighetsinfor- Kontrakts- och lo- SQL-databas på Kontrakt Bevaras löpande mation online kalhantering för server Ritningar på server. (Fiol) fastigheter och Informationen hyreskontrakt som utgörs av scannade kopior av kontrakt och ritningar gallras vid inaktualitet. Kontrakt, ritningar och andra origi- nalhandlingar be-

45 Dnr A 5 3482/06

varas på papper. Kemikalieregistret Register över vil- Databas på ex- Bevaras löpande (Klara) ka kemikalier som tern server hos på server. hanteras vid GU Nordic Port Upphandling.com Hantering av upp- SQL-databas på Handlingar röran- Bevaras löpande (Grus) handlingsprojekt server, pdf- de upphandling på server. och distribution av dokument och Upphandlings- avtals- och leve- andra bifogade fi- ärenden bevaras rantörsinformation ler på papper.

5. Studentavdelningen Systemägare: Gunilla Dörner BuBusssskaskaskaskas

System Funktion Format & medi- Handlingar Bevarande um Kursportalen Online-tjänst för SQL-databas på Handlingar röran- Webbsidan beva- att skapa hemsi- server de kursverksam- ras centralt på Ex- dor på Internet för heten vid GU terna relationer. varje enskild kurs Uppgifter i syste- och där lägga ut met gallras vid kursinformation inaktualitet. samt digital mö- tesplats för infor- Respektive insti- mationsutbyte tution bevarar (diskussionsfo- nedanstående rum) mellan stu- handlingar på denter, lärare och papper: administratörer.  Kurs- och ut- bildningsplaner  Scheman  Litteraturlistor  Provformulär  Sammanställda kursutvärde- ringar  Mer omfattande kompendier LADOK/LANT Hantering av stu- SQL-databas på Dokumentation av Bevaras löpande diedokumentation server studieresultat på server. på grund- och På papper eller forskarutbildning, mikrokort beva- lokal antagning ras: och examen.  Äldre studiere- sultat (-1989) från tiden innan LADOK  Studieresultat från perioden 1989-1993 som är utgallrade ur systemet.  Resultatlistor på prov som gäller som slut- betyg för hel kurs samt änd- ring av betyg på prov.  Examensbevis.

46 Dnr A 5 3482/06

Utbkat Applikation för att SQL-databas på Utbildningskata- Webbsidan beva- producera kurska- server log ras centralt på Ex- talog via papper terna relationer. och på webb. Uppgifter i syste- Systemet innehål- met gallras vid ler information inaktualitet. rörande kurser, Den tryckta kata- kursansvariga, logen bevaras. användare och behörighet. Studentportalen Online-tjänst för SQL-databas på Webbsidan beva- studenter rörande server ras centralt på Ex- kursinformation, terna relationer. studieresultat, e- Uppgifter i syste- postsystem och met gallras vid sökmöjlighet i inaktualitet. UB:s kataloger.

6. Externa relationer SystemägSystemägaaaare:re: Siv Bondenäs Brink

System Funktion Format & medi- Handlingar Bevarande um Cumulus GU:s bilddatabas SQL-databas på Fotografier Bevaras löpande server, bilder i tif- på server. och jpeg-format Icon Register över in- Filemaker- Kontrakt Bevaras löpande ternationella kon- databas på server Avtal på server. takter med kon- Kontrakt och avtal trakt, avtal, utbe- bevaras på pap- talningar m.m. per. rörande medel för studier i Norden och Europa (Sok- rates, Erasmus, Nordplus) Universitets-TV GU:s produktion På enheten finns TV-produktioner Nyare produktio- av TV-program en del äldre pro- ner lagras på ser- duktioner (1986- ver och sedan 1999) som produ- 2005 bevaras cerats av enheten dessa på DVD- för Medieteknik skivor. och Avd för konfe- Aktuellt arkive- rens och service. rings- format är Dessa handlingar MPEG2. förekommer i oli- ka analoga format Samtliga arkivex- (BVU, Betacam, emplar förvaras i 1”C). särskild arkivlokal. Det yngre materi- alet (1999- ) före- kommer mesta- dels i formatet DCVPro. Andra förekom- mande digitala format är DV, DVCam och Digi- talS.

47 Dnr A 5 3482/06

www.gu.se Myndighetens HTML Myndighetens Informationen på webbsidor webbsidor www.gu.se beva- ras två gånger per år (januari och augusti), dels i ett statiskt HTML- format, dels som kopia av rotkata- logen. Respektive arkivkopia bränns ned på två DVD- skivor. Externa relationer tillser att den in- formation som fö- rekommer i CMS bevaras centralt. De fakulteter som inte ingår i CMS- plattformen an- svarar själva för att deras webbsi- dor bevaras.

7. Planeringsavdelningen Systemägare: PerPer----ErikErik ErikEriksssssonsonsonson

System Funktion Format & medi- Handlingar Bevarande um Sirius Uppföljning av SQL-databas på Systemet ersätts kursverksamheten server inom kort av Da- med uppgifter ur talagret LADOK

8. Övrigt SysteSystemägare:mägare: PP----OO RehRehnnnnqvistqvist

System Funktion Format & medi- Handlingar Bevarande um Datalagret Uppföljning av Ersätter inom kort verksamheten Sirius. med uppgifter ur Bevaras löpande andra system på server.

48 Dnr A 5 3482/06

BBBILAGA 2:2:2: Plan för långsiktigt bevarabevarandende av digital informationinformation vid GU

PriPriPrimärmaterialPri märmaterial i forskningsdatabas/forskningsdatabas/ITITITIT----systemsystem för bearbetning av forskningforskningssssdatadata Tidpunkt för arkivering Vid forskningsprojektets avslutande eller när datan inte har använts på 5 år Befintlig databärare Server/hårddisk/motsv. Överföring till annan databärare Optiska skivor (CD/DVD), bandkassetter eller disk Arkivformat 8-bits ASCII (Western Latin 1) eller XML samt ur- sprungligt format Förvaringsplats Tillsvidare hos arkivbildaren Klimat Optiska skivor: <18°C ± 2°C 30% RF ± 5% RF Magnetiska databärare: <15°C ± 2°C 30% RF ± 5% RF Kontrolläsning (läsfel) och annan Vart 5:e år vård Användningsfrekvens (om bestän- Bör upprättas i minst två exemplar (arkiv- och kopie- digheten kan påverkas) ringsexemplar). Om användningsfrekvensen påverkar beständigheten skall också ett bruksexemplar upprättas. Sistnämnda exemplar kan lagras på hårddisk. Arkiveringsansvar Systemägare Övriga anmärkningar När ett system avvecklas bör universitetsarkivarien kon- taktas för att tillsammans med systemägaren avgöra om aktuella uppgifter skall bevaras eller ej. Följande typer av forskningsdata skall bevaras för fram- tiden: - bedöms ha ett fortsatt inomvetenskapligt värde - har ett värde för annat forskningsområde - bedöms vara av stort vetenskapshistoriskt, kulturhi- storiskt eller personhistoriskt värde - bedöms vara av stort allmänt intresse.

Kursdokumentation i utbildningsutbildningssystemsystem eller kursportal Tidpunkt för arkivering Minst 1 gång per år Befintlig databärare Papper/digitalt Överföring till annan databärare Papper Arkivformat Papper Förvaringsplats Arkivbildaren (d.v.s. den enhet som upprättar hand- lingen). Handlingarna levereras vid behov till Landsar- kivet Klimat Pappershandlingar: <18°C ± 2°C 30-40% RF ± 5% RF Kontrolläsning (läsfel) och annan - vård Användningsfrekvens (om bestän- - digheten kan påverkas) Arkiveringsansvar Kursansvarig Övriga anmärkningar Vad som skall bevaras per kurs är: - Kurs-/programplan - Litteraturförteckning - Schema - Prov-/tentamensformulär - Sammanställd kursutvärdering - Mer omfattande egenproducerade kompendier

49 Dnr A 5 3482/06

Uppgifter i administrativa ITIT----systemsystem Tidpunkt för arkivering Vid systemets avveckling Befintlig databärare Server Överföring till annan databärare Optiska skivor (CD/DVD), bandkassetter eller disk Arkivformat 8-bits ASCII (Western Latin 1) eller XML samt ur- sprungligt format Förvaringsplats Tillsvidare hos arkivbildaren Klimat Optiska skivor: <18°C ± 2°C 30% RF ± 5% RF Magnetiska databärare: <15°C ± 2°C 30% RF ± 5% RF Kontrolläsning (läsfel) och annan Vart 5:e år vård Användningsfrekvens (om bestän- Bör upprättas i minst två exemplar (arkiv- och kopie- digheten kan påverkas) ringsexemplar). Om användningsfrekvensen påverkar beständigheten skall också ett bruksexemplar upprät- tas. Sistnämnda exemplar kan lagras på hårddisk. Arkiveringsansvar Systemägare Övriga anmärkningar När ett system avvecklas bör universitetsarkivarien kontaktas för att tillsammans med systemägaren avgöra om aktuella uppgifter skall bevaras eller ej.

Myndighetens webbsidor Tidpunkt för arkivering 2 gånger per år, januari och augusti Befintlig databärare Server Överföring till annan databärare DVD-skivor (1 arkivex och 1 kopieringsex) Arkivformat Statiskt HTML-format och i ursprungligt format (rot- katalogen) Förvaringsplats Skickas löpande till registrator i Vasaparken. Klimat Optiska skivor: <18°C ± 2°C 30% RF ± 5% RF Kontrolläsning (läsfel) och annan Vart 5:e år vård Användningsfrekvens (om bestän- Allmänheten kan ta del av materialet på dator i digheten kan påverkas) Vasaparken. DVD-skivorna förvaras i låst arkivlokal. Arkiveringsansvar Webbkoordinator och vissa av fakulteternas informatö- rer (Handelshögskolan, Humanistiska fakulteten och Universitetsbiblioteket) arkiverar webbsidorna och till- ser att dessa skickas till Vasaparken. Övriga anmärkningar -

Foto, filmfilmfilm och ljud Tidpunkt för arkivering Löpande/vid behov Befintlig databärare Olika analoga och digitala format Överföring till annan databärare Digitalt format på optiska skivor (CD/DVD), bandkas- setter eller disk Arkivformat Bild: TIFF 300 dpi alt. framkallad bild Film och ljud: MPEG-2 Förvaringsplats Arkivbildaren/motsv. Klimat Optiska skivor: <18°C ± 2°C 30% RF ± 5% RF Magnetiska databärare: <15°C ± 2°C 30% RF ± 5% RF Kontrolläsning (läsfel) och annan Minst vart 5:e år vård Användningsfrekvens (om bestän- Foto, film och ljud i digitalt format bör upprättas i digheten kan påverkas) minst två exemplar (arkiv- och kopieringsexemplar).

50 Dnr A 5 3482/06

Om användningsfrekvensen påverkar beständigheten skall också ett bruksexemplar upprättas. Sistnämnda ex- emplar kan lagras på hårddisk. Arkiveringsansvar Arkivbildaren Övriga anmärkningar -

51