CODA Slutrapport
Total Page:16
File Type:pdf, Size:1020Kb
CODA Curation of Digital Assets Slutrapport 2007 Upphovsrättsinnehavare vid LDB-centrum står bakom framtagandet av denna skrift. Förutsatt att Ni i förväg meddelar hur materialet skall användas och inhämtar medgivande från Upphovsrättinnehavarna så kan Ni erhålla tillåtelse att för icke kommersiella ändamål, helt eller delvis, mångfaldiga och sprida innehållet. Vid sådan hantering och användning skall källan "© LDB-centrum 2008" alltid anges. I annat fall gäller den rådande lagen om upphovsrätt: ”Mångfaldigande av innehållet i denna skrift, helt eller delvis, är enligt lagen om upphovsrätt förbjudet utan medgivande av copyrightinnehavarna. Förbjudet gäller varje form av mångfaldigande genom tryckning, kopiering, bandinspelning, överföring till elektroniskt media etc." © LDB-centrum 2008 - 2 - Abstract Format Manager (FORM) The report CODA FORM discusses three areas: • Criteria for archive formats • Evaluation of format registers • Test of software for identification of logical formats Criteria for archive formats has been created, a total of 22 points to check in order to estimate formats suitability for long-term digital preservation. The criteria have been ranked after requirements, important and advantage where the condition requirements are a minimum requirement and must be met for a good archive format. An evaluation of five format registers has been done. The format register that fulfilled the examining points best was PRONOM. A test of four software identifying files has been carried out. After testing 25 different types of files with shifting results, the best programs turned out to be DROID and JHOVE. DROID achieved the best result with an accuracy rate of 60%. However, none of the programs operates perfectly. Processes of Preservation (POP) The aim of project CODA-POP was to produce guidelines within four areas: • Criteria for when it is time to refresh digital files • Selection criteria for data carriers • Criteria for when to transcode (convert) to new logical file formats • Criteria for when system migration is required The results were: A list of nine different aspects for when to refresh files, divided into three criteria concerning preservation, and six criteria regarding efficiency improvement. The report also contains some suggestions for further work in this area. Three documents with the aim to improve and simplify the process of choosing data carriers have been made: one for simplifying and improving the selection process, one that defines the ‘Total cost of ownership” of data carriers and finally a table to evaluate and compare various data carriers. A list of criteria for when to convert files into new file formats was created. Also, the process when to initiate this work has been described, and a table to fill in when checking if the file format used is in danger. The work with the fourth area resulted in a list of nine criteria, useful as warning signals for when system migration is required. We also argue about the need of a written action plan describing how critical each criterion is, as well as how to act when any of the warning signals occur. - 3 - Sammanfattning Format Manager (FORM) Rapporten CODA FORM avhandlar tre punkter: • Kriterier för arkivformat • Undersökning av formatregister • Test av programvara för identifiering av format Kriterier för arkivformat har tagits fram, totalt 22 punkter för att bedöma ett formats lämplighet för långsiktigt digitalt bevarande. För att underlätta kontrollen av ett format har kriterierna rangordnas efter krav, viktig samt fördel. Punkterna i villkoret krav är ett minimi- krav och måste uppfyllas för ett bra arkivformat. En undersökning av fem formatregister har gjorts efter åtta punkter. Det formatregister som uppfyllde de undersökta punkterna bäst var PRONOM. Därefter har en test av fyra stycken programvaror gjorts som identifierar filer. Testade mot 25 filer med skiftande resultat, bästa programvaror blev DROID samt JHOVE. DROID gav bäst resultat med 60 % rätt. Dock är ingen av programvarorna fulländad. Processes of Preservation (POP) Projektet CODA-POP har haft som syfte att ge riktlinjer inom fyra områden: • Kriterier för när omkopiering skall ske • Kriterier för val av databärare • Kriterier för när transkodering/konvertering skall ske • Kriterier för när systembyte skall ske Resultatet blev följande: En lista med kriterier för när omkopiering skall ske, uppdelade på tre bevarande- respektive sex stycken effektiviseringskriterier och förslag på hur organisationer kan jobba vidare med denna fråga. När det gäller kriterier för val av databärare har tre dokument skapats för att förenkla och förbättra arbetet: beskrivning över de steg som bör tas när man ska välja databärare, en lista på vilka delar som bör ingå i en databärares livslängdskostnad och en tabell att ha som grund för att utvärdera och jämföra olika databärare. En lista har tagits fram med kriterier som kan ses som varningssignaler för att det är dags att inleda konvertering. Dessutom har processen för att besluta om tidpunkt beskrivits, samt en tabell gjorts för att ha som underlag för att kontrollera om de filformat som används är i riskzonen för att bli dåliga eller i värsta fall oläsliga. Arbetet med punkt fyra har resulterat i en lista med nio kriterier som påvisar behovet av systembyte och som även de kan användas som varningssignaler. Förslag ges på att organisationer i en skriftlig handlingsplan beskriver hur kritisk vardera situationen är och hur ansvarig operatör ska agera när någon av punkterna infaller. - 4 - ABSTRACT.......................................................................................................................................................- 3 - FORMAT MANAGER (FORM).......................................................................................................................... - 3 - PROCESSES OF PRESERVATION (POP) ............................................................................................................. - 3 - SAMMANFATTNING .....................................................................................................................................- 4 - FORMAT MANAGER (FORM).......................................................................................................................... - 4 - PROCESSES OF PRESERVATION (POP) ............................................................................................................. - 4 - 1. BAKGRUND .................................................................................................................................................- 8 - 2. CODA 2007....................................................................................................................................................- 8 - 3. PROJEKT CODA-FORM............................................................................................................................- 9 - 3.1 SYFTE........................................................................................................................................................ - 9 - 3.2 MÅLGRUPP................................................................................................................................................ - 9 - 3.3 DISPOSITION.............................................................................................................................................. - 9 - 3.4 ARBETSGRUPP........................................................................................................................................... - 9 - 4. BAKGRUND - KUNGL. BIBLIOTEKET................................................................................................- 10 - 4.1 PROBLEMOMRÅDE................................................................................................................................... - 10 - 4.2 PROJEKTET .............................................................................................................................................. - 10 - 5. KRITERIER FÖR ARKIVFORMAT ......................................................................................................- 11 - 5.1 GENERELLA KRITERIER ........................................................................................................................... - 12 - 5.2 RANGORDNADE KRITERIER ..................................................................................................................... - 14 - 5.3 BEDÖMNING AV FORMAT......................................................................................................................... - 15 - 6. FORMATREGISTER ................................................................................................................................- 16 - 6.1 UPPSALA FORMATREGISTER .................................................................................................................... - 16 - 6.2 PRONOM............................................................................................................................................... - 17 - 6.3 GLOBAL DIGITAL FORMAT REGISTRY (GDFR)....................................................................................... - 18 - 6.4 LIBRARY OF CONGRESS........................................................................................................................... - 18 - 6.5 THE FILE EXTENSION SOURCE (FILEXT) ................................................................................................ - 19 - 6.6 ANALYS .................................................................................................................................................