Varðveisla rafrænna gagna - aðferð og áskoranir

Njörður Sigurðsson, sviðsstjóri skjalasviðs Umfjöllun

• Afhendingarskyldir aðilar og skyldur þeirra • Reglur um varðveislu rafrænna gagna • Áskoranir • Stefna ÞÍ um rafræna skjalavörslu Afhendingarskyldir aðilar

• Skilgreint í 14. gr. laga nr. 77/2014 um opinber skjalasöfn – Allar stofnanir, embætti og nefndir ríkisins – Öll sveitarfélög, stofnanir og nefndir þeirra – Öll fyrirtæki sem eru 51% eða meira í eigu hins opinbera – Sjálfseignarstofnanir og sjóðir sem sinna opinberum verkefnum – Einkaaðilar sem sinna opinberum verkefnum með rekstrarsamningi – Einkaaðilar sem fengið hafa vald til að taka stjórnsýsluákvarðanir Skyldur afhendingarskyldra aðila (lög nr. 77/2014) • Afhenda opinberu skjalasafni skjöl sín (15. gr.) – Pappírsskjöl þegar þau eru 30 ára gömul – Rafræn gögn þegar þau eru ekki eldri en fimm ára gömul • Haga skjalastjórn og skjalavörslu í samræmi við lög og reglur ÞÍ (22. gr.) • Skrá mál sem koma til meðferðar og varðveita málsgögn þannig að þau séu aðgengileg (22. gr.) Reglur um skjalavörslu og skjalastjórn

• Reglur um skjalavistunaráætlanir (nr. 571/2015) • Reglur um málalykla (nr. 572/2014) • Reglur um frágang, skráningu og afhendingu pappírsskjala )nr. 573/2015) • Reglur um grisjun í skjalasöfnum sveitarfélaga og stofnana þeirra (nr. 627/2010) • Reglur um tilkynningu og samþykkt rafrænna skjalavörslukerfa (nr. 624/2010) • Reglur um tilkynningu rafrænna skráa og gagnagrunna (nr. 625/2010) • Reglur um afhendingu á vörsluútgáfum gagna úr rafrænum gagnakerfum (nr. 100/2014) • Reglur um skráningu mála og skjala – í umsagnarferli Hlutverk ÞÍ gagnvart afhendingarskyldum aðilum • Setja reglur um skjalastjórn og skjalavörslu, þ.m.t. frágang og afhendingu skjala • Veita leiðbeiningar og ráðgjöf • Ákveða um eyðingu skjala • Hafa eftirlit með skjalavörslu og skjalastjórn • Taka við skjölum til langtímavarðveislu Rafræn skjalavarsla – staðan í dag

• Nánast öll gögn sem verða til hjá stofnunum eru á rafrænu formi – Tölvupóstur, rafræn skjalavörslukerfi, gagnagrunnar, skjöl eru samin í rafrænum kerfum o.s.frv. • Að meðaltali eru 2,7 rafrænir gagnagrunnar hjá opinberum stofnunum • 72% opinberra stofnana nota rafræn skjalavörslukerfi • Rafræn stjórnsýsla heimil með breytingu á stjórnsýslulögum 2003 • Afhendingarskyldum aðilum er skylt að varðveita rafræn gögn eins og önnur opinber gögn Varðveisla rafrænna gagna - áskorunin

• Einkum þarf að hafa tvennt í huga við varðveislu rafrænna gagna – Vistunarsnið tryggi aðgengi til framtíðar – Vörslumiðill sé haldgóður Fjölbreytt skráarsnið –textaskjöl

•602 – Text602 document •NBP – Mathematica Player Notebook •ABW – AbiWord Document •ODM – OpenDocument master document •ACL – MS Word AutoCorrect List •ODT – OpenDocument text document •AFP – Advanced Function Presentation – IBc •OTT – OpenDocument text document template •AMI – Lostus Ami Pro •OMM – OmmWriter text document •Amigaguide •PAGES – Apple Pages document •ANS – American National Standards Institute (ANSI) text •PAP – Papyrus word processor document •ASC – ASCII text •PDAX – Portable Document Archive (PDA) document index file •AWW – Ability Write •PDF – Portable Document Format •CCF – Color Chat 1.0 •Radix-64 •CSV – ASCII text as comma-separated values, used in spreadsheets and database management •RTF – Rich Text document systems •QUOX – Question Object for Quobject Designer or Quobject Explorer •CWK – ClarisWorks / AppleWorks document •RPT – Crystal Reports •DBK - DocBook XML sub-format •SDW – StarWriter text document, used in earlier versions of StarOffice •DOC – Microsoft Word document •STW – OpenOffice.org XML (obsolete) text document template •DOCM - Microsoft Word for Mac document •Sxw – OpenOffice.org XML (obsolete) text document •DOCX – Office Open XML document •TeX – TEX •DOT – Microsoft Word document template •INFO – •DOTX – Office Open XML text document template • •EGT – EGT Universal Document •TXT – ASCII nebo plaintext Text file •EPUB - EPUB for e-books •UOF – •EZW - Reagency Systems easyOFFER document[2] •UOML – Unique Object •FDX – Final Návrh •VIA – Revoware VIA Document Project File •FTM – Fielded Text Meta •WPD – WordPerfect document •FTX – Fielded Text (Declared) •WPS – Microsoft Works document •GDOC – Google Drive Document •WPT – Microsoft Works document template •HTML – Markup Language (., .htm) •WRD – WordIt! document •HWP – Haansoft (Hancom) Hangul Word Processor document •WRF – ThinkFree Write •HWPML – Haansoft (Hancom) Hangul Word Processor Markup Language document •WRI – Microsoft Write document •LWP – Lotus Word Pro •XHTML (, XHT..) – eXtensible Hyper-Text Markup Language •MBP – metadata for Mobipocket documents •XML – eXtensible Markup Language •MCW – Microsoft Word for Macintosh (versions 4.0–5.1) •XPS – Open XML Paper Specification •Mobi – Mobipocket documents •NB – Mathematica Notebook Fjölbreytt skráarsnið - myndir

•ASE – Adobe Swatch •PDN – Paint.NET image file •ART – America Online proprietary format •PGM – Portable graymap •BMP – Bitmap formatted image •PI1 – Low resolution, uncompressed Degas picture file •BLP – Blizzard Entertainment proprietary texture format •PI2 – Medium resolution, uncompressed Degas picture file. Also Portrait Innovations encrypted image format. •CD5 – Chasys Draw IES image •PI3 – High resolution, uncompressed Degas picture file •CIT – Intergraph is a monochrome bitmap format •PICT, PCT – Apple Macintosh PICT image •CPT – Corel PHOTO-PAINT image •PNG – Portable Network Graphic (lossless, recommended for display and edition of graphic images) •CR2 – Canon camera raw format. Photos will have this format on some Canon cameras if the quality "RAW" is •PNM – Portable anymap graphic bitmap image selected in camera settings. •PNS – PNG Stereo •CUT – Dr. Halo image file •PPM – Portable Pixmap (Pixel Map) image •DDS – DirectX texture file •PSB – Big image file (for large files) •DIB – Device-Independent Bitmap graphic •PSD, PDD – Adobe Photoshop Drawing •DjVu – DjVu for scanned documents •PSP – Paint Shop Pro image •EGT – EGT Universal Document, used in EGT SmartSense to compress PNG files to yet a smaller file •PX – Pixel image editor image file • – Exchangeable image file format (Exif) is a specification for the image file format used by digital cameras •PXM - image file •GIF – CompuServe's Graphics Interchange Format •PXR – Pixar Image Computer image file •GPL – GIMP Palette, using a textual representation of color names and RGB values •QFX – QuickLink Fax image •GRF – Zebra Technologies proprietary format •RAW – General term for minimally processed image data (acquired by a digital camera) •ICNS – file format use for icons in Mac OS X. Contains bitmap images at multiple resolutions and bitdepths with •RLE – a run-length encoded image alpha channel. •SCT – Scitex Continuous Tone image file •ICO – a file format used for icons in Microsoft Windows. Contains small bitmap images at multiple resolutions •SGI, RGB, INT, BW – Silicon Graphics Image and sizes. •TGA (.tga, .targa, .icb, .vda, .vst, .pix) – Truevision TGA (Targa) image •IFF (.iff, .ilbm, .lbm) – ILBM •TIFF (.tif or .) – Tagged Image File Format (usually lossless, but many variants exist, including lossy ones) •JNG – a single-frame MNG using JPEG compression and possibly an alpha channel. •TIFF/EP (.tif or .tiff) – ISO 12234-2; tends to be used as a basis for other formats rather than in its own right. •JPEG, JFIF (.jpg or .jpeg) – Joint Photographic Experts Group – a lossy image format widely used to display •VTF – Valve Texture Format photographic images. •XBM – X Window System Bitmap •JP2 – JPEG2000 •XCF – GIMP image (from Gimp's origin at the eXperimental Computing Facility of the University of California) •JPS – JPEG Stereo •XPM – X Window Syst •LBM – image file •MAX – ScanSoft PaperPort document •MIFF – ImageMagick's native file format •MNG – Multiple Network Graphics, the animated version of PNG •MSP – a file format used by old versions of . Replaced with BMP in Microsoft Windows 3.0 •NITF – A U.S. Government standard commonly used in Intelligence systems •OTA bitmap (Over The Air bitmap) – a specification designed by Nokia for black and white images for mobile phones •PBM – Portable bitmap •PC1 – Low resolution, compressed Degas picture file •PC2 – Medium resolution, compressed Degas picture file •PC3 – High resolution, compressed Degas picture file •PCF – Pixel Coordination Format •PCX – a lossless format used by ZSoft's PC Paint, popular at one time on DOS systems. Líftími hugbúnaðar

Word Excel Forrit Notkun Ekki lengur Hætt að Forrit Notkun Ekki lengur Hætt að hófst aðalþjón- þjónusta hófst aðalþjón- þjónusta ustuvara ustuvara

Word 97 16/01/1997 31/08/2001 16/01/2004 Excel 97 16/01/1997 16/01/2004 16/01/2005

Word 2000 07/06/1999 30/06/2004 14/07/2009 Excel 2000 07/06/1999 30/06/2004 14/07/2009

Word 2002 31/05/2001 11/07/2006 12/07/2011 Excel 2002 31/05/2001 11/07/2006 12/07/2011

Word 2003 27/11/2003 14/04/2009 08/04/2014 Excel 2003 27/11/2003 14/04/2009 08/04/2014

Word 2007 27/01/2007 09/10/2012 10/10/2017 Excel 2007 27/01/2007 09/10/2012 10/10/2017

Word 2010 15/07/2010 13/10/2015 13/10/2020 Excel 2010 15/07/2010 13/10/2015 13/10/2020

Word 2013 09/01/2013 10/04/2018 11/04/2023 Excel 2013 09/01/2013 10/04/2018 11/04/2023 Fjölbreytt stýrikerfi - Microsoft

• Xenix (licensed version of Unix; licensed to SCO in • Windows NT (Full 32-bit or 64-bit kernel, not dependent on MS-DOS) 1987) – Windows NT 3.1 – Windows NT 3.5 • MSX-DOS (developed by MS Japan for the MSX 8- – Windows NT 3.51 bit computer) – Windows NT 4.0 • MS-DOS (developed jointly with IBM, versions – Windows 2000 (Windows NT 5.0) – Windows XP (Windows NT 5.1) 1.0–6.22) – Windows Server 2003 (Windows NT 5.2) • Windows (16-bit and 32-bit preemptive and – Windows Fundamentals for Legacy PCs (based on Windows XP) cooperative multitasking) – (Windows NT 6.0) – Windows 1.0 (Windows 1) – Windows Azure (Cloud OS Platform) 2009 – Windows Home Server (based on Windows Server 2003) – Windows 2.0 (Windows 2 - separate version for – Windows Server 2008 (based on Windows Vista) i386 processor) – (Windows NT 6.1) – Windows 3.0 (Windows 3) – Windows Server 2008 R2 (based on Windows 7) – Windows Home Server 2011 (based on Windows Server 2008 R2) – Windows 3.1x (Windows 3.1) – Windows Server 2012 (based on Windows 8) – Windows for Workgroups 3.1 (Codename – Windows 8 (Windows NT 6.2) Snowball) – Windows Phone 8 – Windows 3.2 (Chinese-only release) – Windows 8.1 (Windows NT 6.3) – Windows Server 2012 R2 (based on Windows 8.1) – Windows for Workgroups 3.11 – Xbox One system software – Windows 95 (Codename Chicago - Windows 4.0) – Windows Phone 8.1 – Windows 98 (Codename Memphis - Windows 4.1) – Windows 10 (Windows NT 10.0) – Windows 10 Mobile – Windows Millennium Edition (Windows Me - • Windows CE (OS for handhelds, embedded devices, and real-time applications that is Windows 4.9) similar to other versions of Windows) – Windows CE 3.0 – Windows CE 5.0 – Windows CE 6.0 – Windows Mobile (based on Windows CE, but for a smaller form factor) – Windows Phone 7 • Singularity – A research written mostly in managed code (tag">C#) • Midori – A managed code operating system • Xbox 360 system software Vörslumiðill Áskorunin - tæknileg

• Fjölbreytt skráarsnið • Kerfin – OneSystems, GoPro, SharePoint, File shares (sameign) og fleiri kerfi. • Gagnagrunnar – Stigveldisskipaðir gagnagrunnar – Flatar gagnaskrár – Venslaðir gagnagrunnar • Tryggja þarf að hægt sé að keyra gögn úr kerfunum í vörsluútgáfu

14 Áskorunin - mannleg

• Rafræn skjalavarsla snýst að stærstum hluta um skipulag – Ef skipulagið er ekki í lagi þá verður erfitt að endurheimta upplýsingar úr kerfunum • Huga þarf að skipulagi og notkun á öllum rafrænum gagnakerfum – Markmiðið er að gögn sem á að varðveita varðveitist og séu aðgengileg þegar á þarf að halda – Allir starfsmenn sem vinna í kerfunum þurfa að kunna hvernig skuli skrá og vinna í kerfunum, samræmd vinnubrögð skila betri gæðum • Meðhöndlun skjala • Meðhöndlun tölvupósts • Skönnun – Skráning • Lýsigögn • Tenging gagna við mál • Ferill máls

15 Markmiðið

• Að tryggja að gögn verði aðgengileg eftir 50, 100 eða 500 ár – Elsta skjal ÞÍ 800 ára gamalt

16 Aðferðarfræðin

• Gögn verða keyrð úr rafrænum gagnakerfum yfir í kerfisóháð form og varðveitt þannig • Tilkynna þarf rafræn gagnakerfi til ÞÍ – Úrskurður um varðveislu eða ekki • Rafræn gögn afhent til ÞÍ á 1-5 ára fresti í formi vörsluútgáfu – Til að tryggja heilleika gagnanna – Til að tryggja að þau festist ekki inni í úreltum hug- og vélbúnaði eða vörslumiðli Afhending í vörsluútgáfu

Skráarsnið Textaskjöl Unicode UTF-8 XML Stafræn skjöl TIFF 6.0 baseline, JPEG-2000 Hljóðskeið MP3 Myndskeið MPEG-2, MPEG-4 Landfræðileg gögn GML ISO-19136 Reglurnar

• Reglur um tilkynningu og samþykkt rafrænna skjalavörslukerfa afhendingarskyldra aðila (nr. 624/2010) • Reglur um tilkynningu rafrænna skráa og gagnagrunna afhendingarskyldra aðila (nr. 625/2010)

• Reglur um afhendingu á vörsluútgáfum gagna úr rafrænum gagnakerfum afhendingarskyldra aðila (nr. 100/2014) Árangur til dagsins í dag

• 151 tilkynning á rafrænum gagnakerfum • 31 samþykkt rafræn skjalavörslukerfi • 17 afhendingar á rafrænum gagnakerfum Tillögur ÞÍ um rafræna skjalavörslu

• Niðurstöður könnunar á skjalavörslu ríkisins 2012 sýndu að ríkisstofnanir þurfa fjárveitingu til að efla rafræna skjalavörslu: – Veita þarf fé til ríkisstofnana til fjárfestingar í rafrænum skjalavörslukerfum. Enn eru um 30% stofnana án skjalavörslukerfis – Veita þarf fé til þess að gera ríkisstofnunum kleift að skila kerfisóháðum vörsluútgáfum til Þjóðskjalasafns – Fjölga þarf starfsfólki í skjalastjórn Stefna ÞÍ um rafræna skjalavörslu

• Í stefnumótun ÞÍ 2014-2018 er stefnan að – „Þjóðskjalasafn leiði þróun stjórnsýslunnar í stýringu og vörslu rafrænna gagna. Í framtíðinni verði öll rafræn gögn stjórnsýslunnar varðveitt á viðurkenndu rafrænu formi.“ • Markmiðin eru: – Þjóðskjalasafn leiði þróun í viðtöku og varðveislu rafrænna gagna. – A.m.k. 50% allra gagnakerfa ríkisins verði tilkynnt Þjóðskjalasafni fyrir árslok 2018. – Í lok árs 2016 verði Þjóðskjalasafn búið að taka við 50 afhendingum úr rafrænum gagnakerfum og í árslok 2018 verði þær orðnar 100. – Fyrir árslok 2015 verði reglur um tilkynningu rafrænna gagnakerfa afhendingarskyldra aðila endurskoðaðar (í vinnslu). Að lokum

• Varðveisla rafrænna gagna er flókið verkefni og krefst samstarfs afhendingarskyldra aðila og opinberra skjalasafna • Skjalaverðir Þjóðskjalasafns eru tilbúniðir að veita ráðgjöf og leiðbeiningar – Sími 590-3300 – [email protected]