Introduktion Till Datateknik För Språkvetare Ht2015
Total Page:16
File Type:pdf, Size:1020Kb
Introduktion till datateknik för språkvetare ht 2015 Per Starbäck Kapitel 1 Inledning 1.1 Om kursen Schema och annat finns på http://stp. lingfil.uu.se/kurs/ids/. Där kommer det även finnas länkar till de olika delarna av detta kompendium. Mål (citerat från kursplanen) Kursen skall förmedla grundläggande kunskaper om datasystem och databehandling, som en bas för databehandling av naturligt språk. Efter avslutad kurs ska studenten minst kunna: • nämna och översiktligt förklara funktionen hos en modern datorhårdvaras viktigaste komponenter, inklusive externt och internt Figur 1.1: Ett gnuhuvud som symboliserar operativ- systemet GNU (= GNU’S Not Unix) minne och andra viktiga digitala media • nämna och översiktligt förklara funktionerna hos ett vanligt operativ- och filsystem • skapa och använda filer i de vanligaste for- maten för textdokument med elementär ty- annat för att underlätta min kontroll ska uppgif- pografi, spela in och spela upp ljudresurser, terna göras på våra datorer här, och man ska va- samt visa bilder ra närvarande vid undervisningstillfällena. Om du • översiktligt redogöra för begreppen tecken- någon gång inte kan närvara så hör av dig i förväg kodning, ordbehandling, elektronisk typsätt- om detta! ning och filöverföring samt arbeta praktiskt Bara betygen underkänt och godkänt finns på med dem i några elementära sammanhang denna kurs. • använda program för elementär textbearbet- ning och enkel kvantitativ analys 1.2 Vårt datorsystem • översiktligt förklara begreppen klient/server- system, Internet, www, webserver och web- På STP används operativsystemet GNU/Linux läsare som är ett system som liknar operativsystemet • skapa HTMLsidor och publicera dem på nä- Unix. Vid »normalt« användande är det mest tet på skrivbordsmiljön man märker skillnad på sy- • översiktligt beskriva hur någon viktig sök- stem, med menyer, paneler, ikoner osv. Den heter tjänst på nätet fungerar och använda denna Gnome och är gjord särskilt för GNU, men går på ett avancerat sätt även att köra på andra Unix-liknande system. I • resonera kring digitala rättighetsfrågor i rela- denna kurs kommer vi inte att använda det sär- tion till konkreta objekt skilt mycket, utom denna första gång. Det ska ni till största delen kunna sätta er in i med den in- Examination byggda hjälpen. I labbarna kommer vi istället mycket att hålla För att få godkänt på kursen ska man göra klart på med kommandoraden och annat som är svårare inlämningsuppgifterna i samtliga moment. Bland att komma in i på egen hand. 3 1. INLEDNING Våra datorsalar dan vid första steget genom att alla användare har goda lösenordsvanor. De datorer som ni använder finns i två datorsalar, tillsammans med servrar som även går att använ- da utifrån. Dessutom har en del anställda datorer Att logga ut som ingår i samma system. Våra datorer har fått namn som t. ex. prepo- När du lämnar datorn ska du logga ut. Använd sition, futurum, dativ och numerus. Institutio- Log Out i menyn till höger som du får genom att nen för lingvistik och filologi har domännamnet klicka på ditt namn. Stäng inte av datorn! Dessa lingfil.uu.se, så datorernas fullständiga namn datorer står på dygnet runt, bland annat för att är i stil med numerus.lingfil.uu.se. Den da- uppdateringar ska kunna göras utifrån. torn har även aliaset stp.lingfil.uu.se och det Man kan istället låsa datorn om man lämnar är dit man ska koppla sig ifall man ska arbeta på den en kortare stund. Andra kan också logga in våra datorer utifrån, t. ex. hemifrån. på datorn då. De två datorsalarna är öppna dygnet runt, året runt, och är tillgängliga med era passerkort med vilka ni också kommer in i huset. När salarna inte Ljud är bokade för undervisning är det bara att slå sig För att inte få för mycket olika ljud i datorsalarna ner vid en ledig dator där. så använder vi hörlurar. Volymkontrollen finns i Med rätt program på en annan dator kan man överpanelen på skärmen, men observera att en del också koppla sig till våra datorer utifrån och kom- hörlurar dessutom har en egen volymkontroll, så ma åt samma filer och program som man når från om det inte hörs något kan det vara kontrollen där datorsalarna. som behöver ändras snarare än något på datorn. Datorernas hörlurar ska sitta i ett urtag på bak- Att logga in sidan av datorn. Det finns även ett urtag för hör- lurar på framsidan som används som urtag för ex- När man ska använda systemet måste man först tra hörlurar ibland. Flytta inte de normala hörlu- logga in. Ditt användarnamn och lösenord får du rarna dit. Då blir lätt sladdarna liggande på golvet av Per. Till användarnamnet finns knutet en sär- och sönderkörda av stolarna, och det blir besvär- skild hemkatalog där man kan lagra sina filer. ligare för den som vill koppla in egna hörlurar. Att välja lösenord Tangentbord På alla ställen där man ska sätta ett lösenord bru- Våra tangentbord är uppsatta så att vissa tangen- kar man uppmanas att ha säkra lösenord: »Undvik ter med accenter är döda (se figur 1.2), dvs. inte lättgissade lösenord! Använd inte riktiga ord, var- ger något tecken av sig självt utan bara i kombina- ken på engelska, svenska eller något annat språk! tion med nästa tecken. Det gäller dels en tangent Använd inte samma lösenord som på något annat med vilken man kan skriva t. ex. »ú« och »ù«. Dels ställe!« Och så vidare. en tangent med vilken man kan skriva t. ex. »ü«, I själva verket är förstås lösenord till olika stäl- »û« och »u«.˜ Den sistnämnda står till höger på tan- len olika viktiga, och ibland kan det mycket väl genten och får man därför fram tillsammans med duga att använda samma slasklösen på flera stäl- AltGr. AltGr (= Alternate Graphic) kan kombi- len där man behöver registrera en användare med neras med en mängd tangenter för att ge andra lösenord för att kunna använda någon tjänst. tecken. Många av dessa står till höger på den tan- Men i en del fall är det viktigare, och detta är ett sådant fall, så om du ändrar ditt lösenord så se till att du följer sådana regler. Blanda gärna stora och små bokstäver (de räknas som olika!) och stoppa gärna in nån siffra eller nåt skiljetecken. Ett skäl till att det är viktigt att alla har bra lö- senord, förutom ens egen säkerhet, är systemets säkerhet. På datorer som sitter på nätet pågår he- la tiden försök från olika håll att ta sig in olovligen på datorerna och få administratörsrättigheter där. Sådana attacker sker ofta i två steg. Först behöver förövaren komma in på datorsystemet överhu- vudtaget, sedan hitta ett öppet säkerhetshål som Figur 1.2: De två döda tangenterna på våra tangent- kan ge mer behörighet. Det andra steget är det bord upp till systemadministratörerna att ha stoppat, men för säkerhets skull bör det även ta stopp re- 4 1.3. Filer och kataloger gent det gäller (t. ex. C på AltGr + e), men det En fil foo.c kan innehålla källkoden till ett pro- finns andra också, t. ex. þ på AltGr + t. gram skrivet i programspråket C, foo.exe va- För att skriva ^, ~ och ` som egna tecken kan ra den exekverbara binärfilen med programmet, man trycka ett mellanslag efter den döda tangen- foo.pdf en text (i formatet Portable Document ten. Format) som beskriver programmet, foo.html samma text som HTML (Hypertext Markup Lan- guage), och så vidare. Ofta finns det en begräns- 1.3 Filer och kataloger ning på hur lång filnamnsändelsen får vara. I syn- nerhet kan gränsen vara tre tecken, vilket är för- Data av olika slag lagras i filer. klaringen till att man ibland kan se t. ex. HTML- Innehållet kan vara bl. a. texter, ljud, bilder, filer vars namn slutar på .htm istället för .html. databaser och program, och allt ligger normalt Även i Unix-filsystem brukar man ge många fi- lagrat som en sekvens av bytes, som kan ses som ler sådana namn, men en punkt är egentligen som värden 0–255, i ett visst format, dvs. kodade en- vilket tecken som helst i filnamn, så ett filnamn ligt någon särskild konvention. Detta återkommer kan innehålla ingen, en eller flera punkter, och det vi till senare. finns ingen särskild begränsning på hur lång delen Filer med program omfattar både källkoden av namnet efter punkten får vara. (textfiler skrivna av programmerare, skrivna i ett Genom att man ger filnamnen sådana ändelser visst programspråk) och filer som inte är läsbara är det lättare för såväl program som människor att för människor (binärfiler), men vars innehåll kan förstå vad det är för slags filer utan att titta i dem. tolkas som instruktioner som kan utföras (exekve- Några få av de vanligare filnamnsändelserna är: ras) direkt av datorn. (De senare genereras au- tomatiskt från de förra med program som kallas txt Vanliga textfiler kompilatorer.) html Hypertext Markup Language xml eXtensible Markup Language Typsättningssystemet T X Kataloger tex E java Programspråket Java Filerna samlas i kataloger (directories). När man pl Programspråket Perl använder kommandoraden är denna beteckning py Programspråket Python ofta vanligare än mappar (folders). Det finns dels centrala kataloger till för systemet och dels har wav, ogg, mp3 Olika ljudformat varje användare sin egen hemkatalog att lagra filer gif, png, jpg Olika bildformat i. pdf Portable Document Format I en katalog kan det förutom filer ligga andra odt Open Document Text kataloger, underkataloger (subdirectories), till den första katalogen. Fil- och katalognamn Körbara program brukar inte ha någon än- delse i Unix, så en kompilerad version av pro- I Unix-system är det skillnad på små och stora grammet foo heter troligen bara foo (och inte bokstäver vad gäller namn på filer och kataloger. t. ex.