A R Installieren, Konfigurieren Und Benutzen
Total Page:16
File Type:pdf, Size:1020Kb
A R installieren, konfigurieren und benutzen Dieser Teil des Anhangs soll Hilfestellung beim Herunterladen und bei der In- stallation von R geben. Außerdem wird gezeigt, wie R gestartet wird. In diesem Zusammenhang werden auch Besonderheiten bei Installation und Start von R auf g¨angigen Betriebssystemen vorgestellt. Die Installation und Verwaltung von Paketen wurde in Abschn. 10.3 vorgestellt. Wenn sich das Vorgehen bei verschiedenen Betriebssystemen unterschei- det, so wird in den folgenden Abschnitten zun¨achst immer UNIX und Co.“ ” vorgestellt. Darunter sind alle UNIX-artigen Betriebssysteme, z.B. Linux und Solaris, zusammengefasst. Fur¨ den Macintosh wird zurzeit als einziges Be- triebssystem MacOS X unterstutzt.¨ Wenn vorhanden, werden wesentliche Un- terschiede zu UNIX und Co.“ erw¨ahnt. Auch fur¨ die große Anzahl der Win- ” dows Benutzer gibt es kurze Abschnitte zu Eigenarten von R fur¨ Windows. Fur¨ einige hier nicht aufgefuhrte¨ Details zur Installation und Wartung von R sei auf das Handbuch R Installation and Administration“ (R Development ” Core Team, 2008c) verwiesen. A.1 R herunterladen und installieren Einleitend (Kap. 1) wurde bereits erw¨ahnt, dass es sich bei CRAN (C ompre- hensive RArchive N etwork) um ein Netz von Servern handelt, das weltweit den Quellcode und die Bin¨arversionen von R fur¨ diverse Betriebssysteme be- reitstellt. Der zentrale Server von cran ist zu erreichen unter der URL http: //CRAN.R-project.org. Dort ist eine aktuelle Liste der Spiegelserver1 (engl. mirror) zu finden, aus der man sich einen Server aussucht, der geogra- phisch m¨oglichst nahe am aktuellen Standort liegt. Dadurch erh¨alt man eine 1 http://CRAN.R-project.org/mirrors.html 212 A R installieren, konfigurieren und benutzen m¨oglichst schnelle Verbindung und entlastet zus¨atzlich den zentralen Server. Es macht Sinn, sich den hier ausgew¨ahlten Server fur¨ den sp¨ateren Gebrauch zu merken. Zum Beispiel k¨onnen von dort zus¨atzliche Pakete heruntergeladen und auf dem neuesten Stand gehalten werden (s. Abschn. 10.3). Nachdem ein Server ausgew¨ahlt wurde, gibt es die M¨oglichkeit, den Quell- code (sources) oder eine bereits fertig kompilierte Bin¨arversion von R her- unterzuladen. Die Installation einer kompilierten Bin¨arversion ist oft etwas unproblematischer und schneller, es gibt sie aber nicht fur¨ alle Plattformen. Wer den Quellcode herunterl¨adt, muss R noch kompilieren, hat dafur¨ aber auch die M¨oglichkeit, R fur¨ die gegebene Plattform besonders gut anzupas- sen. Beispielsweise gewinnt R fur¨ große Matrixoperationen an Geschwindig- keit, wenn man gegen ATLAS2 linkt (R Development Core Team, 2008c). Auch andere spezialisierte BLAS3 Bibliotheken k¨onnen benutzt werden, zum Beispiel die AMD Core Math Library (ACML,s.Advanced Micro Devices, 2008). Sowohl ATLAS als auch ACML sind speziell fur¨ die jeweilige Plattform angepasste und optimierte Bibliotheken, die Routinen fur¨ Matrixoperationen bereitstellen. Als Plattform bezeichnet man dabei die jeweilige Kombination aus Rech- nertyp (bei den meisten Lesern sicherlich ein PC mit x86-kompatiblem Pro- zessor von Intel oder AMD) und Betriebssystem (z.B. Windows). UNIX und Co. Fur¨ viele Linux Distributionen gibt es Bin¨arversionen von R in Form von ‘.rpm’ (z.B. RedHat, SuSE) oder ‘.deb’ (Debian) Dateien auf cran. Man braucht sich aber vor der Installation und dem Kompilieren aus den Quellen nicht zu scheuen. Meist sind n¨amlich die notwendigen Werkzeuge dazu schon installiert. Notwendig bzw. empfehlenswert sind Perl, C und Fortran Compiler, make und einige Entwickler-Bibliotheken (insbesondere diejenigen fur¨ X11 und libreadline sind sinnvoll, fehlen aber manchmal). Die Quellen fur¨ R-2.7.1 sind im Paket ‘R-2.7.1.tar.gz’ verpackt (die Versi- onsnummern sind entsprechend anzupassen). Wurde es heruntergeladen, kann wie folgt standardm¨aßig (1) entpackt, (2) in das Verzeichnis gewechselt, (3) konfiguriert, (4) kompiliert und (5) installiert werden: $ tar xfz R-2.7.1.tar.gz $ cd R-2.7.1 $ ./configure $ make $ make install 2 Automatically Tuned Linear Algebra Software, http://math-atlas.sourceforge.net 3 Basic Linear Algebra Subprograms A.1 R herunterladen und installieren 213 Fur¨ spezielle Einstellungen und weitere Details sei auf das Handbuch RIn- ” stallation and Administration“ (R Development Core Team, 2008c), Hornik (2008) und die Datei ‘INSTALL’ im Hauptverzeichnis der R Quellen verwiesen. Ein anschließendes $ make check uberpr¨ uft,¨ ob R richtig kompiliert wurde und korrekt arbeitet. Mit den Voreinstellungen von ./configure ist R durch die o.g. Prozedur im Verzeichnis /usr/local/lib/R installiert worden. Sollte der Pfad /usr/ local/bin als Suchpfad fur¨ ausfuhrbare¨ Dateien gesetzt sein, kann R nun einfach mit $R gestartet werden. Es wird derjenige Pfad als Arbeitsverzeichnis gesetzt, aus dem R aufgerufen wird. Macintosh Fur¨ den Macintosh unter MacOS X empfiehlt sich i.A. die Installation der Bin¨arversion. Seit R-2.3.0 wird die Bin¨arversion als universal binary zur Verfugung¨ gestellt, also sowohl fur¨ die PowerPC- als auch die i686-Architektur. Fur¨ R-2.7.1 liegt die Bin¨arversion beispielsweise als Diskimage Datei ‘R- 2.7.1.dmg’ auf den cran Spiegelservern. Die Installation weist keine beson- deren Hurden¨ auf und erfolgt mit einem Doppelklick auf die im Diskimage enthaltene Datei ‘R.mpkg’. Zum Kompilieren von R aus dem Quellcode empfiehlt sich dringend ein Blick in Iacus et al. (2008). Windows —Bin¨arversion Die Bin¨arversion von R fur¨ Windows wird in Form eines unter diesem Betriebs- system ublichen¨ Setup-Programms bereitgestellt. Fur¨ R-2.7.1 ist das die Datei ‘R-2.7.1-win32.exe’ (auch hier ist die Versionsnummer entsprechend anzupas- sen). Derzeit werden Windows VersionenabVersionWindows 2000 unterstutzt,¨ wobei R als 32-bit Programm auch auf 64-bit Versionen von Windows auf x64 Hardware l¨auft. Das Setup-Programm legt eine Verknupfung¨ im Windows-Startmenuan.¨ Ein Klick auf diese Verknupfung¨ startet R, genauer das Programm Pfad_zu_ R/bin/RGui.exe. Das Programm Pfad_zu_R/bin/Rterm.exe ist zur Verwen- dung unter der Windows command shell ( Eingabeaufforderung“4)gedacht. ” 4 Wird h¨aufig auch als MS-DOS“ Fenster bezeichnet, obwohl es bei modernen ” Windows Versionen nichts mit DOS zu tun hat. 214 A R installieren, konfigurieren und benutzen Oft m¨ochte man nicht das voreingestellte Arbeitsverzeichnis verwenden, sondern ein eigenes Verzeichnis angeben, oder je nach Projekt eigene Verzeich- nisse benutzen. Neben den in Abschn. 2.6 auf S. 26 beschriebenen Methoden zum Setzen des Arbeitsverzeichnisses kann es auch in der Verknupfung¨ gesetzt werden, mit der R gestartet wird (etwa eine Verknupfung¨ auf dem Desktop oder im Startmenu,¨ s. Abb. A.1 auf S. 218). Fur¨ Windows sind bereits kompilierte Versionen der Datei ‘Rblas.dll’auf cran vorhanden5, die gegen ATLAS gelinkt wurden, und sich bei Operatio- nen auf großen Matrizen durch hohe Geschwindigkeit auszeichnen, manchmal aber auch zu leichten Einbußen fuhren.¨ Details sind in der entsprechenden ‘ReadMe’-Datei nachzulesen. Windows — R selbst kompilieren Die Vorarbeiten, um R unter Windows aus den Quellen zu kompilieren, er- fordern etwas mehr Muhe¨ als unter den anderen Betriebssystemen. Eine An- leitung ist in dem Handbuch R Installation and Administration“ (RDe- ” velopment Core Team, 2008c) zu finden, die Zeile fur¨ Zeile m¨oglichst exakt befolgt werden sollte, da nahezu jedes Detail entscheidend fur¨ das Gelingen ist. Notwendige Werkzeuge dazu findet man auf folgender Seite von Dun- can Murdoch: http://www.murdoch-sutherland.com/Rtools/. Ein Beispiel zum Einrichten einer entsprechenden Umgebung zum Kompilieren von R wird in Ligges und Murdoch (2005) gegeben. Nach erfolgreichem Kompilieren sollte man noch eine Verknupfung¨ zur Datei Pfad_zu_R/bin/RGui.exe im Start- menu¨ anlegen, die das komfortable Starten von R erm¨oglicht. A.2 R konfigurieren R l¨asst sich in weiten Teilen konfigurieren. Dazu stehen verschiedene Mecha- nismen zur Verfugung:¨ Kommandozeilenoptionen beim Aufruf, Umgebungs- variablen und Konfigurationsdateien. Auf diese Mechanismen und auch einige davon abweichende Spezialit¨aten unter Windows wird im Folgenden einge- gangen. Insbesondere sei auch die Lekture¨ des Handbuchs R Installation ” and Administration“ (R Development Core Team, 2008c) und der Hilfeseite ?Startup empfohlen. Letztere gibt einen genauen Ablaufplan des Starts von R und zeigt, wann welcher Konfigurationsschritt durchgefuhrt¨ wird. Sprache und Schriften R bietet einige M¨oglichkeiten zur Internationalisierung (Ripley, 2005a), d.h. entsprechende Konfigurierbarkeit von Sprache und Schrift. 5 http://CRAN.R-project.org/bin/windows/contrib/ATLAS/ A.2 R konfigurieren 215 Fehler- und Warnmeldungen sowie Hinweise k¨onnen in der Sprache des Benutzers ausgegeben werden, sofern entsprechende Ubersetzungen¨ vorliegen. Liegt keine entsprechende Ubersetzung¨ vor, so wird auf Englisch zuruckgegrif-¨ fen. Per Voreinstellung w¨ahlt R die Sprache der aktuell vom Betriebssystem verwendeten Lokalisierung. Dazu werden die Umgebungsvariablen LANGUAGE, LC_ALL, LC_MESSAGES und LANG ausgewertet und die erste davon verwertba- re Aussage benutzt. M¨ochte man R dazu bewegen, die deutsche Ubersetzung¨ zu verwenden, wenn man unter einem anders lokalisierten Betriebssystem ar- beitet, so spezifiziert man die Umgebungsvariable LANGUAGE = de.Wersich andererseits an die englischen Meldungen gew¨ohnt hat und sich nicht mit den deutschen Meldungen anfreunden kann, w¨ahlt LANGUAGE = en. Auf die Umstellung auf andere Schriften, die beispielsweise von Benutzern im arabischen, asiatischen