Standardy W Procesie Digitalizacji Obiektów Dziedzictwa Kulturowego
Total Page:16
File Type:pdf, Size:1020Kb
Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego pod redakcją Grzegorza Płoszajskiego Warszawa 2008 Biblioteka Główna Politechniki Warszawskiej Autorzy/współautorzy Grzegorz Płoszajski i Kazimierz Schmidt (rozdz. 1) Grzegorz Płoszajski (rozdz. 2–6) Tomasz Kalota, Dariusz Paradowski, Grzegorz Płoszajski i Kazimierz Schmidt (rozdz. 7) Grzegorz Płoszajski (rozdz. 8–9) Opiniodawca Mirosław Górny Utwór udostępniany na licencji Creative Commons 2.5 Polska w wersji: Uznanie autorstwa Użycie niekomercyjne Na tych samych warunkach Pewne prawa zastrzeżone dla zespołu autorskiego. Pełny tekst licencji dostępny na stronie: http://creativecommons.org/licenses/by-nc-sa/2.5/pl/ Biblioteka Główna Politechniki Warszawskiej Pl. Politechniki 1, 00-661 Warszawa, tel. 022 234 74 00, 022 621 13 70 Biblioteka Cyfrowa www.bg.pw.edu.pl/dlibra ISBN 978-83-7207-797-4 Druk: Oficyna Wydawnicza Politechniki Warszawskiej ul. Polna 50, 00-644 Warszawa, tel. 022 825 75 18, 022 234 75 03, zam. 622/08 Księgarnia internetowa: www.wydawnictwopw.pl, e-mail: [email protected] 2 Spis treści PRZEDMOWA ..................................................................................................................................................... 9 1 WPROWADZENIE .................................................................................................................................. 11 1.1 STANDARDY TECHNICZNE W DIGITALIZACJI — UWAGI WSTĘPNE........................................................ 11 1.2 METADANE OBIEKTÓW CYFROWYCH .................................................................................................. 15 1.3 ZAKRES TEMATYCZNY OPRACOWANIA ............................................................................................... 19 1.4 UWAGI NA TEMAT OBIEKTÓW 3D I OBIEKTÓW ZŁOŻONYCH ................................................................ 22 1.4.1 Obiekty cyfrowe 3D ....................................................................................................................... 22 1.4.2 Obiekty fizyczne złożone ................................................................................................................ 23 2 O DIGITALIZACJI DZIEDZICTWA KULTUROWEGO .................................................................. 24 2.1 DĄŻENIE DO STANDARYZACJI ............................................................................................................. 24 2.1.1 Typowe obiekty digitalizowane ..................................................................................................... 24 2.1.2 Potrzeba standaryzacji .................................................................................................................. 25 2.1.3 Znaczenie metajęzyków XML i SGML ........................................................................................... 26 2.1.4 Standardy a polityka digitalizacji .................................................................................................. 28 2.2 WSTĘPNE UWAGI DOTYCZĄCE PRZYKŁADÓW PODEJŚCIA DO DIGITALIZACJI ....................................... 29 2.2.1 O standardach metadanych ogólnie .............................................................................................. 29 2.2.2 Metadane dla archiwów, bibliotek i muzeów ................................................................................ 30 2.2.2.1 Uwagi dotyczące bibliotek .................................................................................................................. 30 2.2.2.2 Uwagi dotyczące archiwów ................................................................................................................. 31 2.2.2.3 Uwagi dotyczące muzeów ................................................................................................................... 32 2.2.2.4 Object ID — standard informacji o obiektach kultury ........................................................................ 35 2.2.2.5 Europeana — metadane opisowe w formacie opartym na Dublin Core .............................................. 37 2.2.2.6 Sprowadzanie metadanych opisowych do Dublin Core – projekt Matapihi ........................................ 38 2.2.2.7 Metadane opisowe — podsumowanie ................................................................................................. 39 2.2.3 Kwestie techniczne w przypadku plików graficznych .................................................................... 39 2.2.4 Uwagi na temat zapisu struktury informacji ................................................................................. 41 2.2.5 Uwagi na temat rozpoznawania tekstu i jego struktury programami OCR ................................... 41 2.2.6 Wstępne wiadomości o metadanych dla obiektów graficzno-tekstowych ...................................... 43 2.3 STANDARDY PROPONOWANE PRZEZ BIBLIOTEKĘ KONGRESU USA .................................................... 45 2.3.1 MIX................................................................................................................................................ 46 2.3.2 METS ............................................................................................................................................. 47 2.3.3 PREMIS ......................................................................................................................................... 48 2.3.4 TextMD .......................................................................................................................................... 49 2.3.5 MARCXML, MODS i in. — uwagi ................................................................................................ 50 2.4 STANDARDY PROPONOWANE DLA OBIEKTÓW TEKSTOWYCH .............................................................. 51 2.4.1 TEI — Text Encoding Initiative ..................................................................................................... 51 3 2.4.2 SGML ............................................................................................................................................ 53 2.4.3 Uwagi o METS w odniesieniu do obiektów graficzno-tekstowych ................................................ 53 2.4.4 DocBook ........................................................................................................................................ 53 2.4.5 Tekst prosty ................................................................................................................................... 54 2.5 STANDARDY „REGIONALNE” W RAMACH POLITYK/STRATEGII DIGITALIZACJI ..................................... 54 2.5.1 Biblioteka Narodowa Australii ...................................................................................................... 55 2.5.2 AIATSIS — Australian Institute of Aboriginal and Torres Strait Islander Studies ....................... 55 2.5.3 Biblioteka Narodowa Nowej Zelandii ........................................................................................... 55 2.5.4 Biblioteka Narodowa Niemiec....................................................................................................... 56 2.5.5 Biblioteka Narodowa Włoch ......................................................................................................... 57 2.5.6 Prace w Wielkiej Brytanii ............................................................................................................. 57 2.5.7 Biblioteka narodowa Republiki Czeskiej ....................................................................................... 58 2.6 INICJATYWY UNII EUROPEJSKIEJ ........................................................................................................ 59 2.6.1 Minerva ......................................................................................................................................... 59 2.6.2 Erpanet .......................................................................................................................................... 60 2.6.3 Prestospace ................................................................................................................................... 60 2.6.4 Europeana ..................................................................................................................................... 61 2.7 DIGITALIZACJA CZASOPISM — PRZEGLĄD PROJEKTÓW I STANDARDÓW ............................................. 61 2.7.1 National Digital Newspapers Program ......................................................................................... 62 2.7.2 Chronicling America: Historic American Newspapers ................................................................. 63 2.7.3 Biblioteka Narodowa Wielkiej Brytanii......................................................................................... 64 2.7.4 Biblioteka Narodowa Australii ...................................................................................................... 65 2.7.5 Biblioteka Narodowa Nowej Zelandii ........................................................................................... 65 2.7.6 Biblioteka Narodowa Holandii ..................................................................................................... 66 2.8 UWAGI DOTYCZĄCE DIGITALIZACJI CZASOPISM .................................................................................. 66 2.9 TEI, ALTO W POŁĄCZENIU Z INNYMI STANDARDAMI ......................................................................... 67 2.9.1 METS i TEI ...................................................................................................................................