Arxiv:1805.05419V7 [Math.HO] 20 Sep 2020 Äquivalenz Und Wahrheit Stefan Müller-Stach

arXiv:1805.05419v7 [math.HO] 20 Sep 2020 oansGtnegUiesttMiz Germany Mainz, Gutenberg–Universität Johannes -aladdress E-mail qiaezudWahrheit und Äquivalenz : [email protected] tfnMüller-Stach Stefan

Vorwort

Dies ist ein Text über die Mathematik, der diese Wissenschaft und ihre Bedeutung auf eine neue Weise, die vielleicht etwas zugänglicher als üblich ist, beleuchten will. Das Ziel ist es, wichtige und lange bekannte erkenntnistheoretische Fragestellungen mit neueren Entwicklungen des Fachs zu verbinden. Die Mathematik ist aus mehrerlei Gründen eine bemerkenswerte Wis- senschaft. Einerseits ist sie eine a priori Wissenschaft, die auf keiner anderen Wissenschaft aufbaut1 und sich ausschließlich mit abstrakten Begriffen befasst, die man in unserer gegenständlichen Welt nicht direkt wiederfindet. Andererseits ist sie eine Wissenschaft, die in sozialen Zirkeln betrieben wird - im Widerspruch zu manchen Vorurteilen. Wer jemals im Mathematischen Forschungsinsititut in Oberwolfach oder im Banff Center in Alberta zu Gast war, der weiß wie das kleine Völkchen der Mathematiker sich gegenseitig Vorträge hält, aber auch zusammen durch die Wälder spaziert, musiziert, gesellig zusammen- sitzt und über viele Dinge nachdenkt. Das gesamte menschliche Denken ist weit über die Mathematik hinaus äußerst mächtig. Dabei spielt die Abstraktion eine wichtige Rol- le. Sie wird zur Präzisierung von Formulierungen und zur Ökonomie unseres Denkens benötigt. So dienen Begriffe wie „Tiere” und „Men- schen” zur Beschreibung ganzer Ansammlungen von Lebewesen, ohne dass man jedesmal die einzelnen Vertreter aufzählen muss. Sind solche Begriffe noch ziemlich konkret, so sind Begriffe wie „Vernunft” oder „Freiheit” sehr abstrakt, aber ebenso nützlich.

iii Eine eng damit zusammenhängende Frage ist die nach der Existenz und der Natur der abstrakten Objekte in unserem menschlichen Den- ken. Die Frage, wie das menschliche Denken – also unser Gehirn – funktioniert und wie unser Bewusstsein entsteht, kann trotz der Fortschritte der Neurowissenschaften bis heute niemand beantworten, ebensowenig die Platonsche Frage, ob es einen Ort außerhalb unseres Gehirns gibt, in dem die Begriffe unseres Denkens lokalisiert sind. Bereits Leibniz hat in seinem „Mühlenbeispiel”2 darauf hingewiesen, dass jede Reise durch unser Gehirn nur eine Maschine – eben eine Mühle von innen – zeigen würde, ohne dass Wahrnehmungen, das Bewusstsein oder andere Qualia erkennbar wären. Es gibt Antworten zahlreicher Wissenschaftler, die das Bewusstsein – oder andere emergente Phänomene des Lebens – gewissermaßen durch eine virtuelle Maschine (oder Software) in der Hardware unseres Gehirns – also unter dem Aspekt der Berechenbarkeit – erklären wollen. Das „Mühlenbeispiel” von Leibniz bleibt als Mahnung dafür stehen, dass man auf diesem Gebiet noch sehr wenig weiß. Die Mathematik ist trotz aller Abstraktion kein reiner Selbstzweck. Sie hat vielfältige Anwendungen in ganz praktischen Bereichen. Be- reits Mathematiker der Antike wie Pythagoras, Archimedes, Dio- phant, Euklid und viele andere davor und danach haben sich mit elementarer Geometrie und Arithmetik nicht nur aus reiner Neugier an der Forschung beschäftigt, sondern auch damals schon Anwendun- gen für den Handel, die Astronomie, die Kriegsführung, für Baukon- struktionen und in der Landwirtschaft im Auge gehabt. Die Naturwissenschaften können ihre Theorien nicht ohne Zuhilfe- nahme mathematischer Strukturen ausdrücken. Es ist vermutlich kein Zufall, dass die Mathematik die „Sprache der Natur” ist, wie es Ga- lileo Galilei einmal ausgedrückt hat. Eugene Wigner hat dies einmal wunderbar ausgedrückt, indem er von der Unreasonable effectiveness of mathematics in the natural sciences gesprochen hat. Natürlich ist diese Aussage besonders in der Phy- sik von enormer Bedeutung. Keine andere Wissenschaft profitiert so

iv von der Mathematik als grundlegende Sprache. Die Sprache, d.h. die Syntax, der Mathematik ist allerdings sehr formal und das macht sie unzugänglich für viele Menschen. Es war ein Ziel von Gottfried Wilhelm Leibniz, solche Gedankenge- bäude zu errichten und eine universelle Wissenschaftssprache – Lin- gua Universalis – dafür zu konstruieren. Dabei spielte von Anfang an die Semantik abstrakter Begriffe eine große Rolle, denn aus der Syn- tax der Mathematik und deren einfachen Grundprinzipien entfaltet sich ein Kosmos von verschiedenen Strukturen und Mustern, deren Existenz, Eindeutigkeit und Sinnhaftigkeit in Frage steht. Die semantische Welt, die dabei entsteht, zeichnet sich durch eine eigene innere Schönheit aus. Weil es in diesem Gebäude nur wenige Grundprin- zipien gibt, spricht man von einer Einheit der Mathematik. Gerade deshalb ist es so bemerkenswert, welche Vielfalt die Mathematik in sich birgt. Die Begriffe Wahrheit, Beweis und Berechenbarkeit spielen eine große Rolle in diesem Bild. Neben diesen Begriffen gibt es weitere, die zum Verständnis von Mathematik und ihrer Arbeitsweise wichtig sind, wie die Gleichheit oder Identität von Objekten und ihre Abschwächungen wie Äquivalenz und Isomorphie. Berechenbarkeit und Beweisbarkeit sind dabei weitaus einfacher zu verstehen als der Wahrheits- und der Gleichheitsbegriff. Der Wahrheitsbegriff leidet unter der Kontextabhängigkeit der Wahr- heit, der daraus resultiert, dass Annahmen getroffen werden müssen, um Wahrheit festzustellen. In der Wahrheitstheorie von Tarski wird dies durch Wahl einer übergeordneten formalen Sprache gelöst, in der die Semantik als Interpretation erscheint oder durch Hinzufügen von Axiomen in der sogenannten Axiomatischen Wahrheitstheorie. Die Umgangssprache des täglichen Lebens ist mit beiden Ansätzen nicht gut abbildbar. Trotzdem muss es im Leben allgemeingültige Wahr- heiten geben, die über jeden Zweifel erhaben sind und die wir durch hartnäckiges Suchen finden können. Der gängige Gleichheitsbegriff in der Mathematik ist etwas zu starr und kann nicht gut mit auftretenden Isomorphien und Äquivalenzen

v umgehen, die allgemeiner als Gleichheit im engeren deﬁnitorischen Sinne sind. Im Grunde ist die Praxis der Verwendung des Gleich- heitszeichens eine Art Baufehler der Mathematik und eine erweiterte Sichtweise auf Gleichheit ist notwendig. Dieses innermathematische Problem ist durch die Arbeiten von Per Martin–Löf in der Typen- theorie oder durch die Theorie der höheren Kategorien angegangen worden und hat eine große philosophische Relevanz. Die Zusammenhänge zwischen solchen Fragen und den damit verbundenen Begriﬀen möchten wir in diesem Text, dessen Inhalt auf einen Vortrag im Studium Generale der Johannes Gutenberg–Universität Mainz zurückgeht, auf unterhaltsame und verständliche Weise skizzieren und dabei gleichzeitig einen historischen Bogen spannen, der von der Antike bis zur aktuellsten Forschung reicht. Dabei werden wir insbesondere über die Ideen von Platon, Gottfried Wilhelm Leibniz, Richard Dedekind, Gottlob Frege, Kurt Gödel, Alfred Tarski, Saul Kripke, Alexander Grothendieck, Daniel Quillen, Per Martin–Löf und Vladimir Voevodsky sprechen. Gerade die beiden letztgenannten Ma- thematiker haben – aufbauend auf den Ideen vielen anderer – neue Konzepte entwickelt, die die abhängige Typentheorie als alternative Syntax der Mathematik etabliert und mit einer kategoriellen Seman- tik versieht. Unsere Absicht ist es, den Leser in die genannten Themen einzuführen und dadurch zum eigenen Nachdenken und zum Selbst- studium anzuregen. Um Missverständnissen vorzubeugen, möchte ich betonen, dass dies weder ein streng philosophischer noch ein wissenschaftshistorischer Text ist, sondern aus einem ganz neuen und individuellen Blickwinkel eines Mathematikers geschrieben ist. Andere Sichtweisen und abweichende Einschätzungen sind selbstverständlich möglich. Annika Denkert, Jürgen Jost, Sieglinde Müller-Stach, Andreas Röd- der und Rainer Wieland danke ich für wichtige Gespräche.

Mainz und Neustadt–Haardt, im Herbst 2020

Stefan Müller-Stach

vi Inhaltsverzeichnis

Vorwort iii Vorbemerkungen ix Kapitel 1. Grundlegende Fragen 1 Kapitel 2. Die Suche nach einer Universalwissenschaft 21 Kapitel 3. Wie denken Mathematiker? 43 Kapitel 4. Mathematik in unserer Kultur 69 Kapitel 5. Berechenbarkeit und Entscheidbarkeit 93 Kapitel 6. Kategorientheorie 107 Kapitel 7. Deduktive Systeme und ihre Semantik 123 Kapitel 8. Gödel und Tarski: Unvollständigkeit und Wahrheit 133 Kapitel 9. Typentheorie und ihre Semantik 153 Kapitel 10. Mathematik und Wahrheit 175 Anmerkungen 181 Literaturverzeichnis 193

vii

Vorbemerkungen

Bevor wir beginnen, wollen wir einige der wichtigsten Fragen vorweg- nehmen, denen wir später begegnen werden. Die erste und vermutlich die schwierigste Frage ist: Was ist ein Gedanke und wo sind die Begriffe unseres Denkens lokalisiert? Darauf gibt es bis heute jedoch keine befriedigende Antwort, auch wenn manche Philosophen wie die Platoniker abstrakten Objekten eine Realität an einem Ort außerhalb der Wirklichkeit zugewiesen haben. Eine Einstiegsfrage dazu ist die Frage: Was ist eine Zahl? Zahlen sind nämlich Objekte, die zwar jedermann kennt, die aber in der Wirklichkeit eigentlich nicht selbst, sondern nur in Form von Anzahlen vorkommen. Mit kleinen Zahlen gehen wir souverän um, aber sehr große Zahlen entziehen sich vollständig unserer Vorstellung. Ähnliches gilt für ideale geometrische Gebilde, wie zum Beispiel Krei- se, die in ihrer mathematischen Reinform höchstens näherungsweise in der Realität vorhanden sind. Da wir mit diesen Fragen schon tief in der Mathematik stecken, sollen auch folgende Fragen nicht zu kurz kommen: Wie denken Mathematiker und welche Rolle hat die Mathematik in unserer Kultur? Die grundsätzlichste Frage, die wir uns stellen, ist: Wie kann man den Begriff der Wahrheit definieren?

ix Diese Frage wurde bereits im Altertum von Aristoteles und anderen gestellt und über viele Jahrhunderte mit der problematischen Korre- spondenztheorie der Wahrheit beantwortet. Alfred Tarski hat im 20. Jahrhundert mit Hilfe semantischer Methoden eine tragfähige Ant- wort auf diese Frage gegeben, indem er den Wahrheitsbegriff zumindest für formale Sprachen, wie sie beispielsweise in der Mathematik vorkommen, mit Hilfe einer Metasprache als Semantik – in der Regel die formale Sprache der Mengenlehre – ermöglicht hat. Bemerkenswerterweise hat Tarski aber in einem anderen Resultat für die wahren Sätze der Arithmetik gezeigt, dass diese innerhalb aller arithmetischen Aussagen keine definierbare Menge bilden. An dieser Aussage sieht man, dass Wahrheit ein komplizierter Begriff ist. Der Begriff der Beweisbarkeit hingegen ist wesentlich leichter zu verstehen. Die Wahrheit einer Aussage in der Mathematik lässt sich am besten mit einem Beweis überprüfen. Deshalb kann man sich fragen: Ist Wahrheit gleich Beweisbarkeit? Natürlich ist jede beweisbare Aussage in einem vernünftigen logischen Kalkül wahr. Die Umkehrung gilt aber nicht, wie Kurt Gödel in seinem berühmten Unvollständigkeitssatz bewiesen hat. Trotz dieser negativen Antwort kann man folgende Frage stellen: Ist Beweisbarkeit gleich Berechenbarkeit? Jeder Beweis ist eine Berechnung in einem logischen Kalkül. In einem gewissen Sinne ist umgekehrt auch jede Berechnung ein Beweis für die Aussage, die das Ergebnis der Berechnung behauptet. Eine etwas schwerere Frage ist das Entscheidungsproblem von Hilbert und Ackermann: Kann man entscheiden, ob eine Proposition in einer axiomatischen Theorie mit logischen Methoden beweisbar ist? Eine solche Entscheidung wäre ein Algorithmus, der das Ergebnis 1 liefert, wenn die Proposition beweisbar ist und 0 andernfalls. Die Ant- wort auf diese Frage ist jedoch ein klares Nein, wie Alan Turing und Alonzo Church in ihren berühmten Arbeiten von 1936 gezeigt haben.

x Diese und weitere unentscheidbare Probleme, wie das Halteproblem für Turingmaschinen, beruhen auf der Existenz von unentscheidba- ren, aber rekursiv aufzählbaren, Teilmengen der natürlichen Zahlen. Eine verwandte Frage ist offenbar: Was unterscheidet die menschliche Intelligenz von einem Computer? Alan Turing hatte bereits über diese Frage nachgedacht und dazu seinen Turingtest entwickelt. Wir werden auch auf die Frage eingehen, ob es einen Berechenbarkeitsbegriff jenseits von Turingberechenbar- keit gibt, auch Hypercomputing genannt. Eine andere Richtung unserer Überlegungen bezieht sich auf die Frage nach der Identität: Was bedeutet die Gleichung A = A? Viele Philosophen, wie zum Beispiel Gottfried Wilhelm Leibniz, Da- vid Hume und Martin Heidegger, haben darüber nachgedacht. Erst der Logiker Per Martin–Löf hat in der zweiten Hälfte des 20. Jahrhun- derts eine abhängige Typentheorie entwickeln können, die die Frage der Gleichheit oder Identität durch die Einführung des Identitätstyps in das Zentrum rückt und ihnen eine angemessene Rolle als Spielart einer Äquivalenz innerhalb der modernen Mathematik zuordnet. Vla- dimir Voevodsky hat vor wenigen Jahren mit seinem Univalenzaxiom diese Theorie noch wesentlich erweitert. Mit dieser Theorie verbindet sich die Hoffnung, mit den Fragen der Gleichheit bzw. Identität, Isomorphie und Äquivalenz in der Mathematik besser umgehen zu können und gleichzeitig ein neues System von Grundlagen für die Mathematik zu schaffen. Dieser Text hat sich zum Ziel gesetzt, auf möglichst verständliche Weise alle Aspekte dieser Entwicklung darzustellen, einschließlich einiger Beispiele und Anwendungen. Am Ende wollen wir wieder auf Wahrheitstheorien zurückkommen und sehen, inwiefern die von uns betrachtete Mathematik ein neues Licht darauf werfen kann.

KAPITEL 1

Grundlegende Fragen

In diesem Kapitel führen wir in einige grundlegende Themenkom- plexe ein, die wir in diesem Buch untersuchen wollen. Wir beginnen damit, die Natur abstrakter Begriffe3 in der Mathematik zu betrachten und darüber nachzudenken, ob die mathematischen Objekte eindeutig identifizierbar sind und ob sie eine eigene Existenz jenseits des symbolischen Kalküls besitzen. Neben antiken Philosophen wie Platon und dem Universalgelehrten Gottfried Wilhelm Leibniz haben insbesondere die Mathematiker Georg Cantor, Richard Dedekind und Gottlob Frege zu diesem Thema zuerst tiefe Überlegungen im Bereich der Zahlen und Mengen angestellt. Mathematische Objekte und ihre Identifikation Was sind die Gegenstände der Mathematik? Diese Frage ist nicht leicht zu beantworten. Erschwerend kommt hinzu, dass die Mathe- matik eine enorm präzise Wissenschaft ist, die ihre Erkenntnisse in einer eigenen und sehr formalen Sprache ausdrückt, was sie schwer verständlich erscheinen lässt. Gleichzeitig ist sie – trotz aller Anwen- dungsmöglichkeiten in der realen Welt – eine a priori Wissenschaft, d.h. sie beruht weder auf Erfahrungen noch auf anderen Wissen- schaften. Es gibt also sozusagen nichts vor der Mathematik. Den- noch scheint Mathematik in unserem Gehirn angelegt zu sein. Man hat herausgefunden, dass ganz kleine Kinder, manche Tierarten und Menschen in Kulturen ohne nennenswerte Schulbildung elementar- mathematische Probleme verstehen und lösen können.4

1 Wir wollen uns zuerst mit abstrakten mathematischen Objekten be- schäftigen und die mathematische Denkweise anhand einiger Beispie- le mit Zahlen und Figuren illustrieren, um schnell zu den tieferen Fragen über die Grundlagen der Mathematik zu kommen. Wenn Sie denken, dass Sie bereits wissen, was die natürlichen Zahlen 0, 1, 2, 3, 4, 5,... sind, oder was für ein Objekt eine einzelne dieser Zahlen, wie die Zahl 5 ist, dann sind Sie im Irrtum. Selbst Mathematiker hatten in der Ge- schichte viele Probleme damit, dies zu erklären. Georg Cantor, Ri- chard Dedekind und Gottlob Frege haben im 19. Jahrhundert als Erste erkannt, dass es notwendig ist, die natürlichen Zahlen in mathematisch präziser Weise zu definieren und ihre gewünschten Eigen- schaften zu beweisen. Schon alleine die Notation für die Zahl 5 variiert in den verschiedenen Weltsprachen und in der Geschichte. Dies alleine stellt natürlich noch kein Problem dar, denn wir alle, selbst kleine Kinder, haben eine klare Vorstellung von der Zahl 5 und auch jedes intelligente außerirdische Wesen, das uns besuchen würde, hätte einen Begriff davon, denn es würde beim Betrachten unserer Hände mit ihren 5 Fingern einen Zusammenhang herstellen können und hätte vermutlich auch einen Ausdruck oder ein Art Wort dafür, je nachdem welche Form von Kommunikation es pflegt. Aber ist das bei allen Menschen die gleiche Idee, d.h. sind alle „Avat- are” der Zahl 5 irgendwie identisch? Mit anderen Worten: Gilt immer die Identität 5=5? Man hat irgendwie das Gefühl, dass das richtig ist und man alle Va- rianten der Zahl 5 identifizieren kann. Dieser Eindruck kommt vermutlich daher, dass wir beim täglichen Umgang damit eben alle das Gleiche meinen und uns prima über solch kleine Zahlen verständigen können. Untersuchungen im frühkindlichen Alter legen nahe, dass ein

2 Gefühl für kleine Anzahlen von Objekten angeboren ist oder zumindest sehr schnell erlernt werden kann, ähnlich wie beim Spracherwerb. Wir verstehen jedoch nicht, warum diese Anlagen im Gehirn vorhanden sind und wie sie dort „verdrahtet” sind. Zu allem Überfluss gibt es auch noch komplizierte additive und multiplikative Beziehungen zwischen den Zahlen, die innerhalb der Arith- metik auftreten. Die Gleichungen 5=1+1+1+1+1 oder 5=2+3=1+4=2 2+1=2 3 1 · · − sind als nichttriviale Aussagen über die Zahl 5 anzusehen. Hier tut sich ein großes Problem auf, nämlich die Frage nach der Iden- tifizierbarkeit mathematischer Objekte. Die Begiffe Gleichheit bzw. Identität oder auch Isomorphie sowie Äquivalenz sind dazu in der Mathematik gebräuchlich. Die Gleichung 5=5 und insbesondere auch die verschiedenen Darstellungen der Zahl 5 als Summen von anderen kleineren Zahlen berühren tiefere Ebenen der Mathematik. Richard Dedekind und Gottlob Frege haben als erste gesehen, dass die natürlichen Zahlen nicht nur eine sondern sogar unendliche viele Realisierungen als Mengen besitzen und solche Glei- chungen zwischen Zahlen wie oben eine subtile Form von Gleichheit darstellen, die man mathematisch erklären und beweisen muss. Fre- ge hatte vergeblich versucht, durch seine Methode der „Abstraktion” dieses Problem zu lösen. Georg Cantor hat die dazu nötigen Grund- lagen der Mengenlehre weiterentwickelt und ist auch in den Bereich der transfiniten Zahlen vorgestossen. Die Auffassung solcher Gleichungen als eine naive Form der Gleich- heit ist in jedem Fall viel zu optimistisch. Wir werden in Kapitel 9 bei der Diskussion der Fragen der Identität und der Univalenz sehen, dass solche Nichteindeutigkeiten in der Mathematik zum Forschungs- gegenstand werden, aber größere Schwierigkeiten bereiten. Dies führt neben einer präziseren Definition des Begriffs der Gleichheit und der

3 Identität auch zu einem besseren Verständnis von Verallgemeinerun- gen wie Isomorphien oder Äquivalenzen. Die Frage nach der Gleichheit oder der Identität Der Begriff der Gleichheit oder der Identität ist ein wichtiger Begriff, der ganz pragmatische Aspekte besitzt. Wir haben dies bereits am Beispiel der Zahl 5 gesehen, denn es ist natürlich unglaublich nütz- lich, dass wir uns über solche Konzepte wie Anzahlen von Dingen schnell und fehlerfrei verständigen können. Ein anderer Aspekt ist die Wiedererkennbarkeit von Objekten und Personen. Ein komponiertes Musikstück, das mit einem festen Notensatz versehen ist, wird bei jeder Aufführung etwas anders gespielt werden. Trotzdem handelt es sich für den Hörer um das gleiche Musikstück. Also gibt es eine Art von Gleichheitsbegriff für Musikstücke bzw. musikalische Aufführungen. Noch etwas freier ist dies bei Jazzkom- positionen, bei denen über gewisse vorgegebene Grundthemen (z.B. bei Jazzstandards) improvisiert wird. Auch hier wird man niemals die selbe Aufführung hören, aber der Begriff der Gleichheit ist noch viel weiter und großzügiger gefasst. Jeder Mensch versteht dieses Bei- spiel sofort und erkennt „gleiche” Musikstücke ohne Probleme wieder. Das gilt auch für andere Kunstwerke. Jeder Autor kennt das Gefühl, dass ein Buch sich in der Entstehung weiterentwickelt, aber ab einem gewissen Stadium „gleich” bleibt, auch wenn noch gewisse Passagen verändert werden. Wenn sich einmal eine Identität des Buches her- ausgebildet hat, dann bleibt sie auch in der Folge erhalten. Ein weitere Beispiel ist der Mensch selbst und nicht umsonst wird der Begriff der Identität für Menschen sehr häufig in Zusammenhang mit der Identifizierung bei Ausweisen benutzt. Ein Mensch verändert sich im Leben sehr und viele Zellen zum Beispiel der Haut haben eine viel kürzere Lebensdauer als wir selbst. Wenn ich zum Friseur gehe, oder auf andere Art und Weise ein paar Haare oder Hautzellen verliere, wird niemand bezweifeln, dass ich noch der gleiche Mensch bin. Dies ist ein etwas anderer Fall als bei Objekten oder Dingen, denn ein Mensch ist eine Ansammlung von Einzelobjekten.

4 Der Begriff der Identität ist in Zusammenhang mit dem Menschen in vielerlei Weise verwendet worden. Dies berührt die Persönlich- keitsentwicklung in der Psychologie und Psychatrie und die sozialen Aspekte des Lebens in der Soziologie. Im Zusammenhang mit poli- tischen Strömungen ist dieser Begriff allerdings häufig in negativer Weise missbraucht worden. Auf alle diese Verästelungen werden wir aber nicht eingehen, sondern wieder zur Mathematik zurückkehren. Gottlob Frege, der sich ebenfalls mit dem Gleichheitsbegriff für Zah- len auseinandergesetzt hat, hat ein wunderbares mathematisches Bei- spiel dafür gefunden. Er schrieb über den Begriff der Gleichheit aus- führlich in seinem Aufsatz „Über Sinn und Bedeutung”.5 Für die Iden- tität A = B gab er darin das Beispiel zweier Schnittpunkte von jeweils zwei Seitenhalbierenden im Dreieck, die wegen eines bekannten Satzes der Dreiecksgeometrie übereinstimmen (siehe Figur).

A A = B B

Das Fregesche Beispiel.

Der Beweis dafür ergibt sich daraus, dass sich die drei Seitenhalbie- renden eines Dreiecks immer in einem gemeinsamen Punkt schnei- den (dem Schwerpunkt). Sowohl A als auch B sind also mit diesem Punkt identisch und damit sind A und B auch identisch. Die Identi- tät A = B drückt also die Richtigkeit des geometrischen Satzes vom Schwerpunkt aus und ist keine zufällige Identität von zwei a priori verschiedenen Punkten. In selben Aufsatz wies Frege darauf hin, dass in diesem Beispiel die beiden Punkte A und B zwar übereinstimmen und damit die gleiche Bedeutung haben, dass aber der jeweilige Sinn, der in der Definition der Punkte liege, unterschiedlich sei. Der Unterschied zwischen Sinn und Bedeutung von Zeichen drückt sich seiner Meinung nach also 5 gerade in der Existenz der Identität A = B aus. In seinem Text gibt Frege noch mehr Beispiele für den Unterschied zwischen Sinn und Bedeutung. Eines davon rührt von den beiden Bezeichnungen „Morgenstern” und „Abendstern” für den Planeten Venus her. Die Bedeutung dieser Bezeichnungen ist jeweils die Venus. Die Gleichung Morgenstern = Abendstern drückt die übereinstimmende Bedeutung beider als Planeten Venus aus, wobei der Sinn sich auf beiden Seiten der Gleichung durch die Tageszeit beim Betrachter unterscheidet. Dieser Aspekt macht er- neut deutlich, dass eine genauere Untersuchung des Identitäts– oder Gleichheitsbegriffs von Interesse ist. Solche Untersuchungen bilden bei Frege den Beginn einer Sprachphilosophie, die im weiteren Verlauf seines Textes in die Betrachtung von Gedanken und Aussagesätzen und deren Wahrheit mündet. Übrigens haben Sie vielleicht bemerkt, dass im obigen Beweis die beiden Dreiecke in der Abbildung das „selbe” Dreieck symbolisieren sollen. Um die jeweiligen Schnittpunkte besser sehen zu können, wurde zwei „identische” Kopien des Dreiecks gezeichnet, ein gängiger Trick. Man sieht gut, dass auch Originaldreieck und Kopie austauschbar sind. Unser Denken benutzt also Varianten des Gleichheitsbegriffs ohne Zögern. Gottfried Wilhelm Leibniz führte einen sehr wichtigen neuen Identi- tätsbegriff ein, der in der Mathematik eine wichtige Rolle spielt. In seinen eigenen Worten sagte er: Eadem vel coincidentia sunt quae sibi ubique sub- stitui possunt, salva veritate.6 Nach Leibniz gilt also für zwei Objekte die Identität A = B, wenn man in allen Untersuchungen zu solchen Objekten A durch B ersetzen kann bei Beibehaltung der Wahrheit der Aussage. Dies ist somit ein substitutioneller Identitätsbegriff, der schwächer ist als der Iden- titätsbegriff der Ununterscheidbarkeit. Er wird zu einer Schlussregel in formalen Kalkülen wie der Mathematik in dem Sinne, dass identische Ausdrücke unter gewissen Voraussetzungen in Formeln oder

6 Propositionen ersetzt werden können. Dies wird uns später bei unseren Betrachtungen der Typentheorie von Per Martin–Löf wieder begegnen. Die bisher diskutierten Beispiele sind sehr anschaulich und eigentlich unproblematisch. Worin besteht also nun das Problem der Identität? Mathematische Objekte wie Vektorräume, Gruppen oder Mannig- faltigkeiten etc. sind nicht eindeutig. Der Begriff der Isomorphie ist überall in der Mathematik und in den Anwendungen vorhanden. So sind zum Beispiel Raum–Zeit–Modelle in der Physik auf Mannigfal- tigkeiten modelliert, aber die physikalische Wirklichkeit ist natürlich unabhängig von der gewählten Modellierung. In der Regel gibt es für mathematische Objekte keine „kanonische” Wahl und es ist gängi- ge Praxis, Wahlmöglichkeiten wie zum Beispiel Isomorphismen zu ignorieren. Dies bedeutet, dass die „Wirklichkeit” eigentlich durch eine Äquivalenzklasse solcher Wahlmöglichkeiten beschrieben wird. Über den Isomorphismus hinaus gibt es auch allgemeinere Äquiva- lenzbegriffe, die man alle ebenfalls unter einen geeigneten Begriff der Gleichheit oder Identität fassen will. Eine gängige Anschauung ist es, Äquivalenzen als Pfade in einem umgebenden Raum anzusehen, wie wir in Kapitel 9 sehen werden. Die Probleme bestehen darin, wie weit der Gleichheitsbegriff gefasst werden darf und ob „gleiche Objekte” in allen mathematischen Untersuchungen jederzeit austauschbar sind. Der Identitätsbegriff in der Philosophie Wir wollen für die eher philosophisch interessierten Leser einen kleinen Ausflug machen. Das Problem der Identität ist nämlich nicht nur eine Fragestellung der Mathematik, sondern auch ein tiefes Problem der Philosophie. Martin Heidegger hat in einem Vortrag mit dem Ti- tel „Der Satz der Identität” zum Tag der Fakultäten in Freiburg (27. Juni 1957) die Frage der Identität mit der Existenz, d.h. dem Sein in Zusammenhang gebracht: Der Satz der Identität lautet nach einer geläufigen Formel: A = A. Der Satz gilt als das oberste Denk- gesetz. Diesem Satz versuchen wir für eine Weile

7 nachzudenken. Denn wir möchten durch den Satz erfahren, was Identität ist ... Was der Satz der Iden- tität, aus seinem Grundton gehört, aussagt, ist genau das, was das gesamte abendländische Denken denkt, nämlich dies: Die Einheit der Identität bildet einen Grundzug im Sein des Seienden.7 Dieser Aufsatz von Heidegger ist nicht leicht zu verstehen und geht weit in die Welt der Metaphysik hinein. Im Text beruft sich Heidegger auf Platon und Parmenides und zitiert letzteren mit den Worten in loc. cit.: Das Selbe nämlich ist Denken sowohl als auch Sein. In Wahrheit geht es ihm also um die Zusammengehörigkeit des Men- schen mit seinem Sein und Denken. Es gibt eine bemerkenswerte Schlussbemerkung in diesem Text, die die Berechenbarkeit im Ge- gensatz zum Denken einordnet: Heute errechnet die Denkmaschine in einer Sekun- de Tausende von Beziehungen. Sie sind trotz ihres Nutzens wesenlos. Hier steckt also auch die Frage dahinter, ob das menschliche Den- ken sich von der Berechenbarkeit unterscheidet. Hinter den Begriﬀen des Seins und des Selbst steckt natürlich auch die Frage nach dem Bewusstsein. Der englische Philosoph David Hume hat ebenfalls über Identität nachgedacht und ist auf ähnliche Fragen gestoßen: There are some philosophers, who imagine we are every moment intimately conscious of what we call our self; that we feel its existence and its continuan- ce in existence; and are certain, beyond the evidence of a demonstration, both of its perfect identity and simplicity ... Unluckily all these positive assertions are contrary to that very experience, which is plea- ded from them, nor have we any idea of self after the manner it is here explained ... The mind is a

8 kind of theatre, where several perceptions succes- sively make their appearance; pass, re-pass, glide away, and mingle in an infinite variety of postures and situations. There is properly no simplicity in it at one time, nor identity in different; whatever natural propension we may have to imagine that simplicity and identity. The comparison of the theatre must not mislead us. That are the successive perceptions only, that constitute our mind; nor have we the most distant notion of the place, where these scenes are represented, or of the materials, of which it is composed ... We have a distinct idea of an object, that remains invariable and uninterrup- ted through a supposed variation of time; and this idea we call that of identity or sameness ... that all the nice and subtle questions concerning personal identity can never possibly be decided, and are to be regarded rather as grammatical than as philosophical difficulties. Identity depends on the relations of ideas; and these relations produce identity ... 8 Man sieht aus diesen Sätzen, welch kritischer Geist David Hume war. So stellt der erste Satz die ganze Idee eines Bewusstseins in Frage. In der Tat ist das Rätsel des Bewusstseins bis heute noch ungeklärt. Die weiteren Sätze differenzieren sehr zwischen persönlicher Identität und anderen Formen. Hume untersuchte die Begriffe bis ins Feinste und traf detaillierte Urteile, die stets dem Skeptizismus verpflichtet waren. Er wird uns im Zusammenhang mit Frege noch einmal begegnen. Hume trug in vielerlei Weise zur Philosophie der Aufklärung bei und verkehrte lange Zeit im Pariser Salon von Baron Paul Thiry d’Holbach, einem Winzersohn aus Edesheim in der Pfalz. Er hatte mit den dort häufig anwesenden Personen engen persönlichen Kon- takt und trug viel zu den Debatten bei. Unter den Gästen war stets auch der einzigartige Denis Diderot, der zusammen mit dem Mathe- matiker Jean d’Alembert zu jener Zeit Herausgeber der berühmten

9 Encyclopédie war. Dieser Salon war, wie auch die Encyclopédie, dem Geist der Aufklärung und des Atheismus verbunden. Berühmt ist ein Anekdote, nach der Hume nach seinem ersten Eintreffen im Salon die Bemerkung machte, dass er keine Atheisten kenne und d’Holbach darauf sinngemäß antwortete, dass er ihm unter den 18 Anwesenden sofort 15 nennen könne und 3 weitere, die noch nicht ganz entschieden wären.9 Wahrheit und Beweisbarkeit Der griechische Philosoph Aristoteles hat die Ideenlehre Platons abgelehnt. Er begründete die mathematische Logik auf seine Art, indem er Syllogismen studierte. Dies sind zweistufige Folgen von Aussagen der Form (Modus Barbara) Obersatz: Alle B sind C Untersatz: Alle A sind B Konklusion: Alle A sind C. Die aristotelische Logik umfasst eine ganze Reihe solcher Modi und hatte über viele Jahrhunderte hinweg eine vorherrschende Stellung in der scholastischen Tradition bis ins Mittelalter. Aristoteles kannte auch bereits den Satz vom ausgeschlossenen Dritten, d.h. das Prinzip das dem Widerspruchsbeweis zugrunde liegt.10 In der Folgezeit, von der frühen Neuzeit bis zur Mitte des 19. Jahr- hunderts, war es in erster Linie Leibniz, der in der Logik die wesent- lichsten neuen Einsichten hatte. Er verfügte über eine symbolische logische Syntax, einschließlich einer Version von Quantoren. Dies blieb aber den meisten Zeitgenossen verborgen, weil Leibniz seine Arbeiten in der Logik nicht veröffentlichte. Vom heutigen Standpunkt sind die aristotelischen Modi nur ein Frag- ment der modernen mathematischen Logik. Leibniz hat Elemente einer mathematischen Logik zur Verfügung gehabt, die einen Kalkül von algebraischer Natur beinhaltete, der die algebraische Logik des 19. Jahrhunderts vorwegnahm. Leibniz hat auch in Ansätzen die Mo- dallogik zur Verfügung gehabt, die mit seiner Theorie der möglichen

10 Welten zusammenhängt.11 Die mathematische Logik wurde schließ- lich im 19. Jahrhundert durch George Boole, Augustus de Morgan, Charles S. Peirce, Ernst Schröder und andere Logiker, insbesondere durch Gottlob Frege, neu begründet. Aristotelische Logik wurde im 20. Jahrhundert durch Jan Łukasiewicz wieder aufgegriffen und mit damals modernen Theorien verglichen.12 Aristoteles hat sich aber auch mit dem Wahrheitsbegriff auseinandergesetzt und war damit ebenso einflussreich. In Aristoteles „Meta- physik”13 wurde der Wahrheitsbegriff ausfürhlich behandelt. Im We- sentlichen stellte er Überlegungen an, die man heute in zwei etwas unterschiedlichen Varianten Korrespondenztheorie der Wahrheit oder Adäquationstheorie der Wahrheit nennt. Die Adäquationstheorie besagt, dass Wahrheit in der Übereinstimmung zwischen dem Denken, d.h. den Bewusstseinsinhalten in unserem Gehirn, und der Wirklich- keit, d.h. der Dinge unserer Realität besteht. Die Korrespondenztheo- rie sieht Wahrheit in der Übereinstimmung zwischen den sprachlichen Aussagesätzen in unserem Denken, d.h. den Ausformulierungen unserer Gedanken, und der Wirklichkeit. Wahrheit wäre demnach in beiden Varianten eine Korrespondenz zwischen zwei unterschiedlichen Welten. Aristoteles gab dafür ein explizites Beispiel: Nicht darum nämlich, weil unsere Meinung, Du sei- est weiß, wahr ist, bist Du weiß, sondern darum, weil Du weiß bist, sagen wir die Wahrheit, indem wir dies behaupten.14 Thomas von Aquin drückte dies so aus: Veritas consistit in adaequatione intellectus et rei ...15 Diese beiden Theorien sind allerdings problematisch, weil dabei zu- nächst unvergleichbare Begriffe wie erstens das Denken, oder genauer die Bewusstseinsinhalte in unserem Gehirn, zweitens die Gedanken und die darin vorkommenden Aussagesätze und drittens die Wirk- lichkeit auf wundersame und unerklärte Weise miteinander in Verbin- dung gebracht werden. Probleme liegen dabei in der Bestimmung des 11 Wahrheitsträgers (Denken, Gedanke oder Aussage?) und des Wahr- machers (was ist eine Tatsache?). Wenn man solche Wahrheitsbegriffe auf die Mathematik anwendet, ergeben sich massive Probleme, denn mathematische Begriffe haben in der Regel keine Entsprechung in der Wirklichkeit. Außerdem ist der Begriff der Wirklichkeit (oder Reali- tät) selbst problematisch, denn es ist nicht klar, ob damit nur die physikalische Realität und alles was darauf aufbaut gemeint ist, oder noch mehr. Wenn die meisten Menschen von Realität sprechen, so sind sie geleitet von Aspekten der Materie und es gibt ein Urvertrauen in die Konkretheit dieser physikalischen Wirklichkeit. Bei tieferem Nach- denken stößt man jedoch auf Zweifel und wird zum Schluss kommen, dass selbst die physikalische Realität ein sehr abstraktes Wesen hat, das wir nicht in toto begreifen können und höchstens mit mathematischer Sprache beschreiben können. Man denke nur an elektromagne- tische Felder, die sich im völligen Vakuum ausbreiten. Solche Felder sind nicht greifbar, außer durch ihre Ausbreitungsgesetze und durch Messungen oder ihre Wirkung. Spaltexperimente in der Quantenme- chanik mit stochastischen Ausgängen in Experimenten machen den Begriff Realität zusätzlich schwierig. Vielwelten– oder Parallelwelten- theorien, möglicherweise auch die Theorie der möglichen Welten von Leibniz, auf die wir noch eingehen werden, können als Versuche ge- deutet werden, die Abstraktheit der Realität und ihrer Eigenarten zu fassen. Diese Probleme mit der Adäquationstheorie und der Korrespondenz- theorie der Wahrheit haben verschiedenste Folgen gehabt. Einerseits hat dies dazu geführt, dass Wahrheitstheorien gesucht wurden, die frei von Verbindungen mit einer wie auch immer gearteteten Wirk- lichkeit sind. Ein Beispiel dafür ist die sogenannte Kohärenztheorie der Wahrheit. Sie besagt, dass für die Wahrheit von Aussagen einer neuen Theorie hauptsächlich die Kohärenz im Umkreis des bereits bestehenden oder zugrundeliegenden Theoriegebäude wichtig ist.16 Eine conditio sine qua non dafür ist wiederum die Konsistenz – d.h. die Widerspruchsfreiheit – der betrachteten Theorie. Wir werden darauf

12 zurückkommen, ob diese Sichtweise wenigstens innerhalb der Mathe- matik zielführend ist. Andererseits haben Frege und andere sehr bald erkannt, dass man Methoden der mathematischen Logik benutzen muss, um Schluss- folgerungen im Kontext der Wahrheit von Aussagen zu präzisieren. Berühmt ist sein Cäsar–Beispiel, das zeigt, welche Probleme in der Untersuchung der Wahrheit von Aussagen der Umgangssprache be- graben liegen. Im nichtwissenschaftlichen Kontext sind mit dem Wahrheitsbegriff ganz fundamentale weitere Schwierigkeiten verbunden, denn in natür- lichen Sprachen kann man widersprüchliche selbst–referentielle Aus- sagesätze wie zum Beispiel das Lügnerparadoxon Eine Politikerin sagt: „Alle Politikerinnen lügen” oder andere Sätze wie Der Barbier der alle Männer rasiert, die sich nicht selbst rasieren bilden. Dies verhält sich in formalen Sprachen anders, wie Alfred Tarski gezeigt hat. Insbesondere kann man seine Theorie auf die formalen Sprachen anwenden, die der Mathematik zugrundeliegen. Dazu benutzt man eine über eine gegebene formale Sprache L hinausgehende Interpretation der Aussagen – ein sogenanntes Wahrheitsprädikat – in einer Metasprache M, d.h. die Hilfe einer Semantik. Durch diese Trennung der beiden Sprachen wird die Selbstreferenz vermieden und ein definierbarer Wahrheitsbegriff möglich gemacht. In der Ma- thematik wird die Semantik in der Regel durch mengentheoretische Modelle gegeben. Tarski hat dafür selbst ein Beispiel gegeben: Der Satz „Schnee ist weiß” ist wahr Schnee ist weiß. ⇔ Dabei ist der linke Satzteil in Anführungsstrichen eine atomare Aus- sage der formalen Sprache L und sie ist genau dann wahr, wenn innerhalb der Metasprache M nachgewiesen werden kann, dass die

13 Farbe des Schnees tatsächlich weiß ist. In der Literatur wird dieses Beispiel oft in der Form abgewandelt, dass der Satz auf der linken Sei- te in einer anderen Sprache formuliert wird. Mir erscheint dies aber nicht geeignet zu sein, um den Unterschied zwischen einer formalen Sprache und Metasprache (oder Semantik) besser zu verstehen. Für Mathematiker ist das vielleicht natürlichste Beispiel die formale Sprache der Dedekind–Peano Arithmetik und ihre semantischen Interpretationen in der Mengenlehre mit all den unterschiedlichen existierenden Modellen, siehe Kapitel 8 und die diophantischen Fra- gestellungen in Kapitel 5. Die Modelltheorie in der Mathematik ist daher eine Art ultimatives Beispiel einer Tarskischen Interpretation in einer Metasprache. Selbst–referentielle Gebilde aus natürlichen Sprachen von der Form Dieser Satz ist nicht wahr oder Dieser Satz ist nicht beweisbar kann man in bestimmten Kontexten von formalen Sprachen mit einem Kunstgriff ebenfalls erzeugen. Darauf basieren der (erste) Un- vollständigkeitssatz von Kurt Gödel und ein verwandter Satz von Alfred Tarski, auf die wir in Kapitel 8 genauer eingehen werden. Wahrheit hängt innerhalb und ausserhalb der Mathematik eng mit den verwandten Begriffen der Beweisbarkeit und Berechenbarkeit zusammen, die die Wahrheit von Aussagen implizieren. Die Umkehrung gilt jedoch nicht, denn der (erste) Unvollständigkeitssatz von Gödel zeigt die Existenz wahrer Aussagen, die nicht beweisbar sind. Es ist dennoch die Regel, dass die Wahrheit von Aussagen und die Verläss- lichkeit von Daten mittels geeigneter Algorithmen überprüft wird. Der platonische Realismus Nehmen wir mal für einen Moment an, dass wir alle „Avatare” der Zahl 5 identifizieren können. Wo lebt dann diese eine Vorstellung der Zahl 5, wenn es nur eine gibt?

14 Die sogenannte platonische Sichtweise – auch Platonismus oder pla- tonischer Realismus der mathematischen Objekte genannt – schreibt abstrakten Begriffen wie der Zahl 5 eine Existenz, d.h. eine Ontolo- gie, außerhalb der Wirklichkeit und auch außerhalb unserer Gedan- ken zu. Die platonische Sichtweise geht auf Platon, einen Schüler von Sokrates, zurück, der zuerst eine Ideenwelt mathematischer Objekte einführte. Platons Nachfolger Aristoteles hat die platonische Sicht- weise abgelehnt, aber er teilte die Auffassung, dass der Mensch in abstrakten Begriffen denkt.

Ideenwelt

Realität Verstand

Platonische Sichtweise.

Wenn man diese Vorstellung erklären will, so bietet sich ein dreige- teiltes Bild an (siehe Figur). Dieses Modell dient der gedanklichen Trennung der drei begriﬄichen Kategorien Realität, Idee und Ver- stand, auch wenn man der Welt der Ideen keine Existenz zumisst. Man kann nämlich der Meinung sein, dass die Welt der Ideen keine Existenz besitzt und nur in den Gedanken des Menschen (oder eines denkenden Wesens) vorhanden sind. Damit ist dann die Frage verbunden, ob Ideen grundsätzlich auch vorhanden sind, zum Beispiel schon bei der Entstehung des Universums, als noch keine menschlichen Wesen existierten. Die Strukturen in unserer Welt, besonders die mathematischen Grundlagen der Physik, legen nahe, dass die Ideen auch dann schon ihre Wirkung entfaltet haben. Somit waren die Ideen irgendwie doch existent, entweder in einem platonischen Sinne oder in den Augen eines göttlichen Wesen. Diese Art von Argument, unter

15 der Prämisse, dass Ideen nur im Verstand von Wesen existieren und nicht per se, kann man als ultimativen Gottesbeweis werten, wenn man den Platonischen Realismus ablehnt. Jedoch ist die Prämisse natürlich höchst zweifelhaft. Unter Mathematikern ist die platonische Sichtweise weit verbreitet. Die meisten Mathematiker schreiben die Existenz mathematischer Objekte einer Existenz von Mengen zu, sie glauben also ganz konkret an die Existenz von Mengen als abstrakte Objekte und damit auch an die Konsistenz der Mengenlehre als mathematische Theorie. Es gibt unterschiedlich starke Versionen des platonischen Realismus.17 Platon, Leibniz und Frege haben sich auch ähnliche Fragen für geometrische Gebilde gestellt. Betrachten wir einen „Kreis”. Mit dieser

Kreisﬁgur.

Zeichnung sind viele Fragen und Probleme verbunden. Ein „echter” Kreis hat im Grunde keine Ausdehnung, ein Hereinzoomen dürfte keine Pixel oder einen Kreisring erzeugen wie in dieser Abbildung, d.h. ein „echter” Kreis wäre eigentlich unsichtbar. Man kann also mit Fug und Recht sagen, dass ein echter Kreis noch niemals auf der Welt irgendwo gezeichnet oder gesehen wurde. Hieraus folgt, dass ein Kreis im Gegensatz zum Fall der Zahlen noch nicht einmal einen einzigen konkreten Vertreter besitzt. Was wir zeichnen oder sehen ist immer nur ein Bild unserer Vorstellung von einem Kreis, also ein Abbild unserer Gedanken oder eine Projektion aus der platonischen Ideenwelt.

16 Wenn man etwas wohlwollender ist, könnte man auch sagen, dass alle diese Annäherungen eines Kreises irgendwie äquivalent zueinander sind und wir sind wieder beim Begriff der Gleichheit bzw. Äquivalenz. Die Platoniker haben diese Ideenwelt als die eigentliche und sogar die wichtigere Welt im Vergleich zur Realität angesehen. Der platonische Realismus ist unter Mathematikern sehr populär und die Nichtexistenz „echter” Kreise in der Wirklichkeit liefert scheinbar ein überzeugendes Argument dafür, weil man sonst gar keine Verortung solcher abstrakten Objekte hätte. Kritik am platonischen Realismus Das Nichteindeutigkeitsproblem für abstrakte mathematische Objek- te wird oft als Argument gegen den Realismus verwendet. Diese Frage des Realismus von mathematischen Objekten kann man sich allerdings auch ohne die Annahme einer Identifikation stellen, wenn zum Beispiel alle „Avatare” der Zahl 5 verschieden sind. Dies führt zu einer Art von Parallelwelten oder einer Leibnizschen Theorie möglicher Welten, wodurch alles noch komplizierter wird und der platonische Realismus noch unwahrscheinlicher erscheint. Im Grunde ist der platonische Realismus also eine schwer zu recht- fertigende Position. Eine Gegenposition zu ihm bildet der Nomina- lismus, der die Existenz abstrakter Objekte in platonischen Welten oder extremen Fällen auch eine Semantik grundsätzlich ablehnt. Abstraktes Denken findet im Nominalismus nur in Zeichen und Wor- ten (also Namen) statt, daher kommt auch der Name dieser Strömung innerhalb der Philosophie der Mathematik. Bereits bei mittelalterlichen Denkern wie Roscellinus oder William von Ockham, auf den das Prinzip des Ockhamschen Rasiermessers zurückgeht, spielte diese Denkweise eine Rolle. Die Denkökonomie, die sich durch das Prinzip des Ockhamschen Rasiermessers ausdrückt, impliziert den Nomina- lismus, indem sie den unnötigen Realismus von Objekten verwirft. In neuerer Zeit vertreten Harty Field, Paul Benacerraf und John Searle nominalistische Ansichten.18

17 Die Frage, ob man eher die platonische oder die nominalistische Sicht- weise bevorzugt, ist verwandt mit dem sogenannten Universalienstreit in der Philosophie. Dieser wird meist nur auf die Existenz von Uni- versalien angewandt, d.h. auf die Existenz von universellen Oberbe- griffen, die Gesamtheiten von gleichartigen Objekten benennen. Ein bekanntes theologisches Beispiel dafür ist die Existenz der Dreifaltig- keit. Ein mathematisches Beispiel für Universalien stammt von Frege. Er definierte Zahlen wie 5 durch „Abstraktion” als die Klasse aller endlichen Ansammlungen, die aus 5 Elementen bestehen. Genauer gesagt identifizierte er alle Mengen mit 5 Elementen zu einem neuen Objekt, das diese Klasse repräsentiert. Dieser Ansatz hat ihn aber durch die Russellsche Antinomie in Schwierigkeiten gebracht, wie wir noch sehen werden. Es ist erstaunlich, dass dieser Universalienstreit und das Auftreten von Nominalisten bereits in der mittelalterlichen Scholastik begann. Anselm von Canterbury, der die Scholastik mit begründete, war ein Vertreter des Realismus und hatte auch Gottesbeweise versucht. Für ihn war es plausibel, dass man die Existenz eines göttlichen Wesens mit der Existenz mathematischer Objekte oder gewisser Universalien vergleichen kann. Ein bekannter Mathematiker, der sich zum platonischen Realismus bekannte, was Kurt Gödel. Er hatte in seinen letzten Jahren einen Gottesbeweis mit Hilfe einer geeigneten Modallogik skizziert.19 Es gibt bis heute keine eindeutigen Antworten auf solche Fragen. Es spricht manches dafür, den Realismus zu verwerfen, denn wir kön- nen auch ohne Realismus unsere Überlegungen mit abstrakten mathematischen Objekten durchführen, indem wir Zeichen oder Worte benutzen. Im „Dialogus” schrieb Leibniz dazu passend: Cogitationes fieri possunt sine vocabulis ... At non sine aliis signis.20 Das Problem des platonischen Realismus hängt mit der Frage zusammen, ob Mathematik eine Semantik besitzt oder nicht, d.h. ob den mathematischen Objekten eine Bedeutung in einem anderen, über- geordneten Kontext zukommt. In einem nominalistischen Kontext ist

18 dabei auch eine rein mathematische Semantik denkbar, etwa mit Hilfe mengentheoretischer Modelle.21 In der Wissenschaftstheorie gibt es ebenfalls diverse Formen des Rea- lismus. Die populäre Spielart des wissenschaftlichen Realismus stellt sich Wissenschaft als Repräsentation der Wirklichkeit vor.22 Diese Vorstellung ist sicherlich durch die Natur– und die Sozialwissenschaf- ten geprägt. Für die Mathematik als eigene Wissenschaft scheint eher der strukturelle Realismus geeignet, der sich auf die Beziehun- gen zwischen Phänomenen beruft. Mit anderen Worten, Mathema- tik beschreibt Strukturen, die anderswo auftauchen können, aber nicht müssen, und jegliche mathematische Erkenntnis ist ausschließ- lich symbolischer Art, ganz im Sinne von Leibniz. Wir werden auf die innermathematische Semantik in Kapitel 8 ausführlich eingehen. Ausblick Wir haben in diesem Kapitel viele oﬀene Fragen diskutiert, die mit der Mathematik zusammenhängen. Oﬀenbar ist die Mathematik aber ein sehr nützliches Werkzeug, das auf vielerlei Weise sehr erfolgreich im Einsatz ist, ohne dass diese Fragen sehr ins Gewicht zu fallen schei- nen. Man kann Mathematik einfach „machen”, wie die Mathematiker sagen. Aber diese Sichtweise ist nicht ganz richtig. Das größte Problem hinter der Fassade der Mathematik ist die richtige Sprache mit der man beginnen muss. Das nennt man die Grundlagen der Mathematik und sie sind auch für den reinen Anwender durchaus von Bedeutung. Da- für gibt es drei Kandidaten – die Mengenlehre, die Kategorientheorie und die Typentheorie. Auf diese drei Möglichkeiten und ihre Zusammenhänge werden wir im Rest dieses Buches nun genauer eingehen.

KAPITEL 2

Die Suche nach einer Universalwissenschaft

Die Suche nach einer Universalsprache der Menschheit ist eine sehr alte Idee. Das babylonische Sprachgewirr, d.h. das Phänomen dass die Menschheit sich aufgrund der unterschiedlichen Sprachen nur schwer gegenseitig verständigen kann, gab schon immer Anlass zu Überle- gungen, ob es einmal eine Ursprache gegeben habe (die von Adam und Eva gewissermaßen) und ob man wieder zu einer solchen zu- rückkehren sollte. Im Verlauf der Jahrhunderte gab es viele Ansätze zur Erfindung von verschiedenen Arten von künstlichen neuen interlinguistischen Plansprachen, die der gegenseitigen Verständigung dienen sollten, oder von philosophische Sprachen, die das Denken und die Wissenschaft unterstützen sollten. Umberto Eco hat die Ge- schichte all dieser Versuche in einem wunderbaren Buch23 aus dem Jahre 1993 festgehalten. Darin stellte er fest, dass die Suche nach solchen Sprachen im Grunde zum Scheitern verurteilt war, aber interessante Nebeneffekte hatte, wie u.a. die Entwicklung der Logik, der Computer und der künstlichen Intelligenz. Die Ideen von Gottfried Wilhelm Leibniz Gottfried Wilhelm Leibniz war ein Universalgelehrter mit einem enormen Oevre, das bis heute noch nicht vollständig editiert werden konnte. Seine zum Teil unveröffentlichten Werke haben erst zu Anfang des 20. Jahrhunderts nach Veröffentlichungen eines kleinen Teils durch Louis Couturat eine angemessene Wirkung entfaltet.24

21 Leibniz kann man – neben seinen Arbeiten zur Theologie und Meta- physik – als den Begründer der Erkenntnistheorie mit Hilfe symbolischer Methoden ansehen.25 Er war der Meinung, dass das menschliche Denken – im Gegensatz zur seiner Meinung nach intuitiven und umfassenden Auffassungsgabe Gottes – aufgrund der Grenzen der menschlichen Vernunft auf die symbolische Erkenntnis angewiesen sei. Leibniz träumte von einer Universalwissenschaft, die wir in diesem Buch Scientia Generalis nennen wollen. Sie sollte es ermöglichen, auf symbolische Weise mittels einer Universalsprache, die er Lingua Universalis oder Characteristica Universalis nannte, das menschliche Denken abzubilden. Die Scientia Generalis operiert auf diesem Gedankenalphabet mit einem symbolischen Kalkül, den er Calcu- lus Ratiocinator nannte und gewinnt dadurch neue Erkenntnisse und Einsichten, die in das Denken und Handeln eingehen. Das philosophische System von Leibniz, insbesondere das seiner Mo- nadologie, ist auf dem Konzept primitiver Denkbegriffe aufgebaut, welches er auch manchmal „Alphabet der Gedanken” nannte. Sein Zu- gang bestand also darin, die Begriffe des Denkens auf einfache (oder primitive) Begriffe zurückzuführen und mit diesen Bausteinen mit Hilfe eines logischen Kalküls übergeordnete Fragen wie zum Beispiel nach der Wahrheit von Aussagen auf elementare Begriffe zurückzu- führen. Auf diese Weise war Leibniz in seinem Denken ein Vorläufer der Logik von Gottlob Frege, der Nummerierung von Ausdrücken in formalen Sprachen bei Kurt Gödel und der Wahrheitstheorie von Al- fred Tarski. Wenn man nur seine Leistungen in der Logik betrachtet, ist Leibniz der einflussreichste Logiker nach den Vertretern der Antike und vor dem Aufstieg der Logik im 19. Jahrhundert. Leibniz hatte sich neben seinen zahlreichen anderen Gebieten auch intensiv mit der Mathematik auseinandergesetzt und dabei eine große Denktiefe erreicht. In vielerlei Hinsicht war der Leibnizsche Traum von der Scientia Generalis auch ein Traum von einer Art von gene- ralisierter Mathematik.

22 Leibniz baute seine Erkenntnisse auf Gedanken verschiedener Vor- läufer und Zeitgenossen auf. Zum einen hatte der mallorquinische Philosoph Ramón Llull (lat. Raimundus Lullus) bereits im 13. Jahr- hundert damit begonnen, menschliches Wissen methodisch mit symbolischen Methoden zu untersuchen. Leibniz bezieht sich in seiner „Dissertatio de arte combinatoria” von 166626 explizit auf das Buch „Ars Magna”27 von Llull von 1290. Ebenso kannte Leibniz die Ideen von René Descartes, Thomas Hobbes und John Wilkins. Hobbes hatte in seinem Werk „De Corpore”28 erkannt, dass man das Denken in einem verallgemeinerten Sinne mit Rechnen gleichsetzen kann. Descartes hatte schon vor Leibniz von einer universalen philosophischen Sprache geträumt, wie er in einem Brief an den Zah- lentheoretiker und Mönch Marin Mersenne vom 20. November 1629 schrieb: Man sollte sämtliche Gedanken methodisch so an- ordnen, wie die natürliche Zahlenreihe methodisch angeordnet ist. Wie man an einem einzigen Tag in irgendeiner fremden Sprache sämtliche Zahlen bis ins Unendliche zu nennen und zu schreiben erlernen kann, die Zahlen, die jedenfalls eine endlose Rei- he von Kombinationen bilden, ebenso muß man die Möglichkeit ﬁnden, sämtliche Wörter zu konstruieren, die erforderlich sind, um alles auszudrücken, was dem menschlichen Verstand einfällt und ein- fallen kann ... Die Erﬁndung einer solchen Sprache hängt von der wahren Philosophie ab.29 John Wilkins schrieb 1668 ein Buch über eine universelle philosopi- sche Sprache, die der natürlichen Sprache überlegen ist. Viele der anderen damals erdachten Universalsprachen waren hauptsächlich auf das Aufzeichnen von Wissen und die Kommunikation ausgelegt und gelten als Vorläufer von heutigen interlinguistischen Plansprachen.30 Leibniz träumte wesentlich tiefergehender31 als seine Vorgänger von einer ganz allgemeinen und über die Mathematik hinausgehenden

23 symbolischen Universalwissenschaft – der Scientia Generalis. Sie besteht aus zwei Teilen. Erstens aus einer universellen Sprache der Wis- senschaft, die er in unterschiedlichen Phasen seines Lebens Ars Com- binatoria, Lingua Universalis oder Characteristica Universalis nannte und zweitens darauf aufbauend einen Kalkül, für den er in unterschiedlichen Kontexten Namen wie Calculus Ratiocinator oder Ma- thesis Universalis wählte. Die Scientia Generalis war für Leibniz eine Möglichkeit, das Denken in einer symbolischen Weise zu vollziehen und Schlussfolgerungen sowie Beweise mit einer rechnerischen Metho- de durch Termersetzungen innerhalb des Kalküls durchzuführen. Die Nähe von Beweis und Berechnung, die für uns noch wichtig werden wird, war also bereits in den Ideen von Leibniz, Descartes, Hobbes und Wilkins vorhanden. Vermutlich aus Zeitgründen arbeitete Leibniz diese Ideen selbst nie in einer zufriedenstellenden Weise aus. Regelmäßig beschrieb er jedoch die Scientia Generalis in seiner Korrespondenz, zum Beispiel in einem Brief an Nicolas Rémond vom 10. Januar 1714 wie folgt: ... dann hätte ich die Hoﬀnung, eine Art „allgemeine Richtigkeitslehre” herauszubringen, in der alle Ver- nunftwahrheiten auf eine Art Rechnung zurückge- führt sein würden. Das könnte gleichzeitig eine Art universale Sprache oder universale Schrift sein, aber unendlich verschieden von all denen, die man bis heute vorgeschlagen hat; denn die Zeichen und die Worte selbst würden hier die Vernunft leiten, und die Irrtümer (mit Ausnahme derer über eine Tat- sache) wären hier nur Rechenfehler. Es wäre sehr schwierig, diese Sprache oder Charakteristik zu bilden oder zu erﬁnden, wohl aber sehr leicht, sie ohne irgendwelche Wörterbücher zu erlernen. Sie diente auch dazu, die Grade der Wahrscheinlichkeiten ein- zuschätzen (wenn wir nicht genügend Daten haben, um zu sicheren Wahrheiten zu gelangen) und zu sehen, wessen man bedarf, um hier zu ergänzen.32

24 Der von Leibniz erträumte Kalkül wurde innerhalb der mathematischen Logik im neunzehnten und zwanzigsten Jahrhundert durch Fre- ge und andere Logiker realisiert. In seiner angedachten Allgemeinheit wurde er jedoch bis heute nicht konstruiert und auch von Leibniz später nicht innerhalb seiner Metaphysik angewandt.33 Ein Grund dafür mag sein, dass seine Zeitgenossen einen Kalkül der eindeutig herleitbaren Wahrheit mit einiger Wahrscheinlichkeit ohnehin nicht akzeptiert hätten. Leibniz selbst hat viele Jahre lang eine Rechenmaschine mit Staf- felwalze für die vier Grundrechenarten bauen lassen und man kann spekulieren, ob er von einer leistungsfähigen, universellen Maschine geträumt hat, die seinen symbolischen Kalkül in die Praxis umsetzen könnte und mit Hilfe derer alle philosophischen Fragen durch eine Anwendung des Kalküls eine rationale Antwort bekommen könnten. Leibniz hat auch das Rechnen im binären Zahlsystem mit den Ziffern 0 und 1 eingeführt, sowie den sehr bekannten Differenzialkalkül, der noch heute in Form des Differenzials dx und des Differenzialquotien- ten df dx im Gebrauch ist, entwickelt.34 Das Differenzial dx symbolisiert eine infinitesimal kleine Größe. Der Kalkül von Leibniz hat sich bis in die heutige Zeit durchgesetzt und beinhaltete die Rechenregeln, die man auch heute noch in folgender Form kennt: d(f+g) = df+dg (Additivität) d(af) = adf (Linearität) d(fg) = fdg + gdf (Produktregel) f gdf fdg d = − (Quotientenregel) g g2 df d(f g) = dg (Kettenregel). ◦ dg In der Entwicklung der Infinitesimalrechnung war Leibniz in einem teils erbitterten Wettbewerb mit Isaac Newton und dessen Theorie 25 der Fluxionen. Die moderne Infinitesimalrechnung wurde erst im 19. Jahrhundert mit Hilfe von Grenzwerten von Folgen rigoros durch Karl Weierstraß und andere definiert. Jedoch konnte später die Exis- tenz unendlich kleiner Größen innerhalb der Nichtstandardanalysis von Abraham Robinson doch noch mathematisch exakt begründet werden. Der Begriff der Wahrheit war für Leibniz eine Eigenschaft der Ge- danken nicht der Dinge, ähnlich wie bei Frege.35 Im Leibnizschen Dialogus steht: Veritatem esse cogitationum non rerum.36 Leibniz hatte eine eigene Definition der Wahrheit von Aussagesätzen in einem symbolischen Kalkül. Zunächst zerlegte er kompliziertere, zusammengesetzte Aussagen (notio composita) in einfachere, unzer- legbare Aussagen, die Teile eines „Gedankenalphabets” sind.37 Mit Hilfe dieses Alphabets kann dann ein symbolischer Kalkül Verwen- dung finden gemäß der Intention der Scientia Generalis. Unzerlegba- re Aussagen mit Subjekt und Prädikat sind dann definitionsgemäß wahr, wenn das Prädikat aus dem Subjekt analytisch ableitbar ist. Die Leibnizsche Wahrheitstheorie ist auch gegründet auf die Un- terscheidung zwischen Tatsachenwahrheiten und Vernunftwahrhei- ten.38 Die Tatsachenwahrheiten gelten in unserer realen Welt und sind durch Erfahrung zu gewinnen. Die Vernunftwahrheiten gelten in allen möglichen Welten. Leibniz hatte eine solche Theorie möglicher Welten erfunden, um andere mögliche Realisierungen der Gegeben- heiten unserer Welt zu verorten. Die diente ihm auch dazu, die Wirk- lichkeit, in der wir leben, als diejenige darzustellen, die von Gott als die beste aller möglichen Welten gewollt ist. Leibniz hat übrigens über Gott gesprochen als jemand, der die symbolische Sprache nicht brauche, weil er die Wahrheiten direkt sehen könne. Zudem ist Gott seiner Meinung nach sicherlich ein „Wesen”, das zum Beispiel den Raum–Zeit Begriff und daher die gesamte Dy- namik der Welt als Ganzes auf einmal erfasst. Wenn man Gott aus solchen Gründen nicht als gewöhnliches „Wesen”, sondern als eine Art von universellem Prinzip begreift, das synonym mit der Welt ist,

26 dann wird Leibnizens Aussage zu einer Art Tautologie, die zwar nur Atheisten genügen dürfte, die aber klar herausstellt, dass warum wir als gewöhnliche Menschen die „Wirklichkeit” als eine Art von Seman- tik betrachten müssen, weil wir sie nicht ganz begreifen können. Während eine Erklärung von Gott von heutigem Standpunkt aus unklar erscheint, hat die Theorie möglicher Welten letztlich im zwanzigsten Jahrhundert zur Entwicklung der Modallogik geführt. Wahrheit und Kantsche Urteile In seinen Überlegungen zum Wahrheitsbegriff entwickelte Immanuel Kant die Leibnizsche Wahrheitstheorie wesentlich weiter, ohne aber Leibniz explizit zu erwähnen.39 Kant verwendete den Begriff Urteil für Aussagen, deren Wahrheit zu untersuchen ist. Er traf eine episte- mische Unterscheidung zwischen a priori Urteilen – notwendige und allgemeingültige Urteile unabhängig von der Erfahrung – und a posteriori Urteilen – Erfahrungsurteile und empirisches Wissen – die in gewisser Weise auf Aristoteles zurückgeht (in Form von Bedingung und Bedingtes). Ein einleuchtendes Beispiel für ein a priori Urteil ist jeder Gottesbe- weis, wie die Beweise von Anselm von Canterbury und Gödel, denn die Existenz göttlicher Wesen kann nicht aus der Erfahrung oder die Beobachtung der Welt gewonnen werden, auch wenn das manche Menschen behaupten. Gottesbeweise beruhen auf logischen Argumen- ten und meist auf dem Axiom, dass Gott alle positiven Eigenschaften in sich vereint. Axiome dieser Art sind natürlich ultimative Beispiele von Urteilen a priori. Immanuel Kant unterschied weiterhin zwischen analytischen und synthetischen Urteilen40, die einen Geltungsgrund der Wahrheit aus- drücken. Ein analytisches Urteil ist ein Erklärungsurteil, d.h. es kann aus der Definition des betrachteten Objekts (oder eines Begriffs, eines symbolischen Ausdrucks, eines Subjekts) direkt gefolgert werden. Dagegen ist ein synthetisches Urteil ein Erweiterungsurteil, d.h. es ist aus dem betrachteten Objekt nicht sofort erkennbar, sondern nur

27 über eine darüber hinausgehende Beobachtung, Erfahrung oder Be- gründung. Ein Beispiel für ein analytisches Urteil ist: Nachts ist es dunkel. Es ist nämlich gerade die Definition der Nacht, dass es zu dieser Zeit dunkel ist. Die Begriffspaare analytisch–synthetisch und a priori–a posteriori sind zunächst grundsätzlich voneinander unabhängig. Die Leibniz- schen Vernunfturteile werden in diesem Denksystem zu analytischen Urteilen a priori und die Tatsachenurteile zu synthetischen Urteilen a posteriori.41 Analytische Urteile a posteriori werden dabei ausgeschlossen, da analytische Urteile immer a priori sind42, so dass noch eine dritte Kategorie der synthetischen Urteile a priori übrig bleibt, die nach Kant eine neue Kategorie war. Kant hat der Mathematik im Allgemeinen diese Eigenschaftspaarung synthetisch a priori zugeschrieben. Mathematik ist sicherlich a priori, denn sie ist bestimmt kein Erfahrungswissen. Kant behauptete auch, dass Mathematik synthetisch ist, da sie aus nichts anderem abzuleiten ist. Als Beispiel hat er selbst die Gleichung 7+5=12 benutzt. Die Grundfrage ist, ob die dargestellte Gleichung aus der Definition der Zahlen unmittelbar folgt, welches einen Induktions- beweis mit umfassen könnte, oder ob es einen „tieferen Grund” gibt, aus dem man dies ableiten kann. Obwohl die Kantsche Gleichung sehr anschaulich ist, wäre die präzisere Frage, ob die gesamte Dedekind– Peano Arithmetik eine analytische Theorie ist oder nicht. Frege, Dedekind, Russell et al. haben im Rahmen des Logizismus diese Ansicht von Kant zurückgewiesen und wollten die Mathematik vollständig auf die Logik zurückführen, so dass die Mathematik als Konsequenz der Logik analytisch wäre. Das Programm des Logizismus ist trotz vieler Versuche bis in die heutige Zeit letztlich gescheitert, da man die Existenz und Unendlichkeit

28 der natürlichen Zahlen und ihre wichtigsten Eigenschaften nicht alleine aus der Logik erklären kann. Daher hatte Kant mit seiner Aussage vermutlich recht. Jedoch ist für die Mathematik die erkenntnistheoretische Abstufung von Urteilen nach Kant weitgehend unbedeutend. Die Ideen von Leibniz waren besonders im Hinblick auf die mathematische Logik wesentlich einflussreicher. Der Aufstieg der mathematischen Logik Leibniz kann als Begründer der modernen mathematischen Logik gesehen werden, da er alle logischen Operationen inklusive einer Versi- on der Quantoren eingeführt hatte, auch wenn sein Beitrag im We- sentlichen unbemerkt blieb. George Boole, Augustus de Morgan und andere Logiker entwickelten in der Mitte des 19. Jahrhunderts die Grundbegriffe der algebraischen Aussagenlogik und die Anfänge der Prädikatenlogik neu. Insbesondere erdachten sie einen Kalkül, um Aussagen mathematisch zu behandeln, den man im Begriff der Boo- lesche Algebren wiederfindet. Es gibt dabei die möglichen Wahrheits- werte (WAHR), (FALSCH) ⊤ ⊥ und Aussagen werden durch die Verknüpfungen A B (UND), A B (ODER), ∧ ∨ A (NEGATION), A B (KONDITIONAL oder IMPLIKATION) ¬ ⇒ zu neuen Aussagen verbunden. Der Begriff der Booleschen Algebra verallgemeinert diese Rechenregeln für Wahrheitswerte zu einem algebraischen Strukturbegriff.43 Während die UND–Verknüpfung in der Alltagswelt auch gebräuchlich ist, wird die ODER–Verknüpfung häufig als ausschließliches ODER verwendet. In der mathematischen Logik meint die Aussage A B aber, dass mindestens eine der beiden Aussagen A oder B erfüllt sind,∨ d.h. sie können auch beide gleichzeitig erfüllt sein. In der klassischen Aussagenlogik gelten Rechenregeln wie A B (A B) und A B B A, ¬ ∨ ¬ ⇔ ¬ ∧ ⇒ ⇔ ∨ ¬

29 so dass einige Zeichen im Prinzip redundant sind. Beweise für solche Rechenregeln kann man mit Wahrheitstafeln führen (siehe Figur).

A B A B B A wahr wahr wahr⇒ wahr∨ ¬ wahr falsch falsch falsch falsch wahr wahr wahr falsch falsch wahr wahr

Wahrheitstafel.

Beweise in der klassischen Logik verwenden oft Widerspruchsbeweise und damit den Satz vom ausgeschlossenen Dritten. Der Intuitionis- mus ist eine von Hermann Weyl, Luitzen E. J. Brouwer und Arnulf Heyting begonnene Strömung der Mathematik, die unkonstruktive Beweise in der Mathematik, und somit den Satz vom ausgeschlossenen Dritten und das Auswahlaxiom, ablehnt. Brouwer hat erbitterte Kämpfe mit Hilbert wegen dieser Einstellung gehabt. Der Satz vom ausgeschlossenen Dritten besagt, dass für jede Aussage A gilt: Entweder A ist wahr oder A ist wahr, d.h. A A. ¬ ∨¬ Man kann zeigen, dass dies gleichbedeutend ist zu folgenden zueinander äquivalenten Propositionen: Für jede Aussage A gilt: A A.44 • (Gesetz von Peirce) Für alle¬¬ Aussagen⇒ A, B gilt • ((A B) A) A. ⇒ ⇒ ⇒ Wenn man den Satz vom ausgeschlossenen Dritten nicht anerkennt, so kann man keine Beweise logischer Aussagen mit Wahrheitstafeln durchführen. Stattdessen benutzt man die Strategie der Brouwer– Heyting–Kolmogorov Korrespondenz, die einen Beweis von einer zu- sammengesetzten Aussage als eine Vorschrift darstellt, die aus den Beweisen der Bestandteile den Beweis der Aussage zusammensetzen. Dabei wird zum Beispiel ein Beweis von A B als eine Vorschrift angesehen, die aus einem Beweis von A einen⇒ Beweis von B macht. Was

30 eine Vorschrift genau ist unterscheidet sich in diversen Varianten dieser Theorie. Die Wahrheit von Aussagen wird mit dem Beweis– und Berechenbarkeitsbegriﬀ Intuitionismus gleichgesetzt. Mit einem entsprechenden Kalkül entwickelte Arnulf Heyting die intuitionistische Theorie der Arithmetik. Es gibt unterschiedliche Spielarten des Intuitionismus. Eine Form davon ist der Konstruktivismus. Dahinter liegt die Vorstellung, dass man mathematische Objekte stets „konstruieren” können muss. Oft wird argumentiert, dass dies wichtig wäre, um mathematischen Ob- jekten eine Existenz zu verleihen. Die Legitimation über eine Art von Existenz erscheint meiner Meinung nach jedoch aus mehrerlei Grün- den fragwürdig, insbesondere natürlich, wenn man gleichzeitig einen platonischen Realismus ablehnt, wie es manche Protagonisten des In- tuitionismus tun. Zum einen ist es für mathematische Objekte, die ohnehin nur ein abstraktes Dasein fristen, egal, ob sie „konstruktiv” erzeugt wurden oder nicht. Zum anderen kann man es den Objekten selbst gar nicht ansehen, ob sie „konstruiert” wurden oder überhaupt „konstruierbar” sind. Hinter solchen Vorstellungen vom Konstrukti- vismus oder des Intuitionismus steht in meinen Augen eher die sicherlich begründete Befürchtung, dass waghalsig erzeugte mathematische Objekte einen Widerspruch erzeugen könnten und nicht, dass sie in irgendweiner Weise nicht existierten. Einen solchen möglichen Wider- spruch können diese vorsichtigeren Zugänge aber nicht verhindern, wie wir bei der Diskussion des Gödelschen Unvollständigkeitssatzes sehen werden. Es gibt jedoch eine andere Interpretation des Konstruktivismus, bei dem das Wort „konstruierbar” im Sinne von „berechenbar” gemeint ist. In dieser Form macht der Konstruktivismus sehr viel Sinn und man bekommt unter gewissen Voraussetzungen einen Formalismus, in dem „alle” Funktionen f : N N berechenbar im Sinne von Ka- pitel 5 sind. Besonders in der Informatik→ ist diese Interpretation sehr geläuﬁg.

31 Die mathematische Logik wurde gegen Ende des 19. Jahrhunderts in der sogenannten logizistischen Periode besonders durch die Arbei- ten von Gottlob Frege und Bertrand Russell weiter entwickelt. Auch Richard Dedekind und der frühe Ludwig Wittgenstein spielten eine Rolle in der frühen Phase des Logizismus. Die mathematische Lo- gik als mathematische Theorie entfaltete sich erst im zwanzigsten Jahrhundert vollkommen. Die Resultate von Kurt Gödel und Alfred Tarski ab etwa 1930 spielen eine besondere Rolle in diesem Buch. Frege erkannte anhand vieler Beispiele, dass die natürliche Sprache keine gute Basis für die Grundlagen der Mathematik ist und entwickelte deshalb die mathematische Logik als Wissenschaft der allgemeinsten Gesetze des Wahr- seins.45 Frege begründete die moderne mathematische Logik mittels formaler Sprachen in seiner „Begriﬀsschrift”.46 Auf ihn und seine Zeitgenossen geht im Wesentlichen der Kalkül der mathematischen Logik zurück, der logische Zeichen wie den Urteilsstrich A ⊢ und den Allquantor (folglich auch den Existenzquantor) x (und x) ∀ ∃ beinhaltet. Auch Leibniz hatte bereits die meisten Teile dieses Kal- küls zur Verfügung, wie man aber erst im 20. Jahrhundert heraus- fand. Am Anfang der Begriﬀsschrift beruft sich Frege ausdrücklich auf Leibniz als Vorbild: Auch Leibniz hat die Vortheile einer angemessenen Bezeichnungsweise erkannt, vielleicht überschätzt. Sein Gedanke einer allgemeinen Charakteristik, eines Calculus Philosophicus oder Calculus Ratioci- nator war zu riesenhaft, als dass der Versuch ihn zu verwirklichen über die bloßen Vorbereitungen hätte hinausgelangen können.47

32 Übrigens hatte Leibniz auch einen großen Einfluss auf viele andere Logiker wie Giuseppe Peano und Kurt Gödel. Frege war somit der erste Mathematiker, der deduktive Systeme formal korrekt ein- geführte. Bei seiner Variante einer Leibnizschen Sprache handelt es sich um eine formale Sprache, die wir heute Prädikatenlogik zweiter Stufe oder einfach Logik zweiter Stufe48 nennen würden. Gottlob Frege: Wahrheit, Sinn und Bedeutung Wir sind bereits in Kapitel 1 darauf eingegangen, dass sich Frege neben der Logik mit dem Gleichheits- bzw. Identitätsbegriff beschäftigt hatte und in diesem Zusammenhang auch die Begriffe Sinn und Be- deutung von sprachlichen Aussagen untersuchte. Er dachte auch dar- über nach, wie man die Wahrheit von Aussagen nachweisen kann und wie die Aussagen und ihre potentielle Wahrheit mit den Gedanken und dem Inhalt unseres Bewusstseins zusammenhängen. Mit solchen Untersuchungen, in denen er alle vorkommenden Begriffe sorgfältig voneinander unterschied, wurde er nach seinen Arbeiten zur Logik zu einem der bedeutendsten Philosophen der Neuzeit.49 Frege war der Meinung, dass die Identität A = A eine a priori wahre analytische Aussage (im Sinne von Kant) sei. Jedoch sei die Aussage A = B eine Erweiterung von ganz anderer Gestalt, womöglich synthetisch und nicht automatisch a priori. An diesem Beispiel erklärte Frege den Unterschied zwischen den Begriffen Sinn und Bedeutung, wie wir bereits anhand des Dreiecksbeispiels erläutert haben. Besonders intensiv setzte sich Frege aber auch mit dem damit zu- sammenhängenden Wahrheitsbegriff auseinander. Bei seinem Nach- denken stellte er in einer Notiz von 1906 fest: Was wahr sei, halte ich für nicht erklärbar.50 Frege setzte sein Nachdenken über Wahrheit aber dennoch fort und versuchte, Aspekte der Wahrheit präzise zu erforschen. Er wollte

33 die aristotelische Adäquationstheorie bzw. Korrespondenztheorie der Wahrheit weiterentwickeln und schrieb 1918 in einem Aufsatz: So ist mit jeder Eigenschaft eines Dinges eine Eigen- schaft eines Gedankens verknüpft, nämlich die der Wahrheit.51 Die Wahrheit, obwohl häufig sinnlich erfahrbar, liegt also im Gedan- ken, d.h. der Gedanke ist der Träger der Wahrheit und nicht etwa der Mensch, sein Bewusstsein oder die Dinge selbst. In dem Moment, in dem die Wahrheit eines Gedankens behauptet oder gezeigt wird, fällt der Mensch ein Urteil.52 Aus diesen Überlegungen folgt, dass die Wahrheit weder Teil der Wirklichkeit noch Teil unseres Bewusstseins im Gehirn ist. Frege schrieb zum Denken und der Welt der Gedanken: Die Gedanken sind weder Dinge der Außenwelt noch Vorstellungen. Ein drittes Reich muß anerkannt werden.53 Das „Reich der Gedanken” als ein eigener Ort der mathematischen Objekte bzw. Gedanken ist verwandt mit der Idee des platonischen Realismus. Allerdings ist die Existenz eines solchen Ortes natürlich äußerst fraglich und wird von vielen Philosophen abgelehnt. Zu einem früheren Zeitpunkt hatte Frege zu diesem Thema geschrieben: Aber wenn auch das Subjective keinen Ort hat, wie ist es da möglich, dass die objective Zahl 4 nirgend- wo sei? Nun ich behaupte, dass darin gar kein Wi- derspruch liegt. Sie ist in der That genau dieselbe für jeden, der sich mit ihr beschäftigt; aber dies hat mit Räumlichkeit nichts zu schaffen. Nicht jeder objective Gegenstand hat einen Ort.54 Die hier diskutierten Begriffe Wahrheit, Sinn und Bedeutung gehören allesamt zum Bereich der Semantik, die in der Philosophie im Bereich der von Frege begründeten Sprachphilosophie und der Linguistik an- gesiedelt ist. In diesem Text werden wir die Semantik in erster Linie

34 in der Mathematik studieren und uns auf den Wahrheitsbegriff fo- kussieren. Gottlob Frege: Zahlbegriff und Logizismus Frege schrieb insgesamt drei Bücher zur Arithmetik: „Die Grundla- gen der Arithmetik”55 und die „Grundgesetze der Arithmetik”56(Teile I und II). Das Ziel der „Grundlagen der Arithmetik” war die Ausfor- mulierung des Zahlbegriffs und die Korrektur und Verbesserung von früheren Zugängen von Anderen. Dabei benutzte Gottlob Frege die Methode der Abstraktion, um Zahlen und andere mathematische Ob- jekte zu erklären. Zunächst erkannte er, dass es entscheidend ist, von Begriffen zu sprechen. Damit wird uns ... nahegelegt, dass die Zahlangabe eine Aussage von einem Begriffe enthalte.57 Die Zahl 0 lässt sich leicht durch einen Begriff definieren, der niemals erfüllt sein kann. Zur Illustration gab Frege das Beispiel der (großen) Jupitermonde in §57. Dem Begriff der (großen) Jupitermonde kommt offenbar die Anzahl 4 zu. Da die gleiche Anzahl mehreren Begriffen zukommen kann, benötigte Frege das sogenannte Humesche Prinzip: Der Ausdruck „der Begriff F ist gleichzahlig dem Begriffe G” sei gleichbedeutend mit dem Ausdrucke „es giebt eine Beziehung ϕ, welche die unter den Be- griff F fallenden Gegenstände den unter G fallenden Gegenständen beiderseits eindeutig zuordnet.”58 Diese Prinzip besagt in einfacher Sprache und auf Mengen angewandt, dass Mengen A und B genau dann gleichmächtig sind, wenn sie isomorph zueinander sind. Frege bemerkte in seinen Untersuchun- gen, dass diese Herangehensweise, die Zahlen selbst noch nicht definiert und dass außerdem zusätzliche Probleme auftreten können. Sein berühmtestes Beispiel ist das Problem, ob der Mensch Julius Cäsar eine Zahl ist oder nicht.

35 Im Weiteren sucht er einen Ausweg aus dieser Lage und versucht alle Vorkommnisse von Begriffen mit der gleichen Anzahl durch Ab- straktion zusammenzufassen zu einer Äquivalenzklasse. Als Lösung präsentiert er die Einführung des Konzepts des Begriffsumfangs, eine Idee, die auf Leibniz zurückgeht. Zum Beispiel wird - in heutiger Sprache - die Zahl 5 definiert als die Klasse aller Mengen, die aus 5 Elementen bestehen. Obwohl es viele Mengen mit 5 Elementen gibt, existiert nur eine solche Klasse. Daher wird diese Begriffsumfang zum Repräsentanten aller Gegenstände, die unter den Begriff der Zahl 5 fallen. In Freges Worten: Die Anzahl, welche dem Begriffe F zukommt, ist der Umfang des Begriffes „gleichzahlig dem Begriffe F ”.59 In mathematischer Notation würde man schreiben: Umfang(F )= G G F , { | ∼ } wobei hier ein Begriff wie F mit der Menge der Objekte (oder Ele- mente) gleichgesetzt wird, die zu F gehören. Diese Konstruktion führt zu einem Widerspruch durch die Russellsche Antinomie, wie Frege durch Bertrand Russell in einem berühmten Brief vom 16. Juni 1902 erfuhr. Dieser Brief beschreibt das Problem, das Russell entdeckte, drückt aber zugleich seine Wertschätzung für Frege aus: Sehr geehrter Herr College! Seit anderthalb Jahren kenne ich Ihre „Grundgeset- ze der Arithmetik”, aber jetzt erst ist es mir möglich geworden die Zeit zu finden für das gründliche Stu- dium das ich Ihren Schriften zu widmen beabsichti- ge. Ich finde mich in allen Hauptsachen mit Ihnen in vollem Einklang ... Nur in einem Punkte ist mir eine Schwierigkeit begegnet. Sie behaupten (S.17) es könne auch die Funktion das unbestimmte Element bilden. Dies habe ich früher geglaubt, jedoch jetzt

36 scheint mir diese Ansicht zweifelhaft, wegen des folgenden Widerspruchs: Sei w das Prädicat, ein Prä- dicat zu sein, welches von sich selbst nicht prädicirt werden kann. Kann man w von sich selbst prädi- ciren? Aus jeder Antwort folgt das Gegenteil. Des- halb muss man schliessen dass w kein Prädicat ist. Ebenso gibt es keine Klasse (als Ganzes) derjenigen Klassen die als Ganze sich selbst nicht angehören ... bei Ihnen finde ich das Beste, was ich aus unserer Zeit kenne, und deshalb habe ich mir erlaubt, Ihnen mein tiefes Respekt auszudrücken ...60 Frege antwortet einige Tage später am 22. Juni und drückte dabei aus, dass er die dramatischen Konsequenzen erkannt hatte: Ihre Entdeckung des Widerspruchs hat mich aufs Höchste überrascht und, fast möchte ich sagen, be- stürzt, weil dadurch der Grund, auf dem ich die Arithmetik sich aufzubauen dachte, ins Wanken ge- räth. Es scheint danach, dass die Umwandlung der Allgemeinheit einer Gleichheit in eine Werthverlaufs- gleichheit (§9 meiner Grundgesetze) nicht immer erlaubt ist, dass mein Gesetz V (§20, S. 36) falsch ist und dass meine Ausführungen im §31 nicht ge- nügen, in allen Fällen meinen Zeichenverbindungen eine Bedeutung zu sichern ... Sie ist umso ernster, als mit dem Wegfall meines Gesetzes V nicht nur die Grundlage meiner Arithmetik, sondern die einzig mögliche Grundlage der Arithmetik überhaupt zu versinken scheint ...61 Die Russellsche Antinomie kann in Freges Gedankenwelt durch den folgenden Begriff F ausgedrückt werden: F: Der Begriff aller Objekte, die unter keinen Begriff fallen, dessen Umfang sie bilden.

37 Wenn dann der Umfang von F unter F fällt, dann ergibt sich ein Widerspruch, ebenso wenn der Umfang von F nicht unter F fällt. Frege konnte die durch Russells Brief entstandenen Probleme nicht lösen und verzweifelte darüber sehr. Die Russellsche Antinomie hatte auch Konsequenzen für die von Can- tor und Dedekind ab etwa 1870 begründete Mengenlehre, die erst durch die Aufstellung der Zermelo–Fraenkel Axiome behoben werden konnte. Bertrand Russell (später mit Alfred Whitehead in der „Principia Mathematica”) versuchte auch selbst einen Ausweg aus den Antinomien der Mengenlehre, indem er Mengen in eine aufsteigende Folge unendlich vieler Typen hierarchisierte, so dass immer x / x gilt. ∈ Freges Buch „Die Grundlagen der Arithmetik” war auch eine Begrün- dung des Logizismus62, d.h. der Reduktion der Mathematik auf die Logik, und ist in dieser Hinsicht als Gegensatz zu Kant zu sehen, denn Frege behauptete, dass Mathematik analytisch sei und nicht synthetisch a priori wie Kant sagte. Mit anderen Worten könnte man auch sagen, dass der Logizismus ein Instrument ist, durch das die Mathe- matik keine a priori Wissenschaft mehr wäre, sondern auf noch fun- damentaleren Grundsätzen beruhte und damit ihre Rechtfertigung als Wissenschaft plausibler wäre. Dies bedeutet jedoch eine Verschie- bung der Rechtfertigung der Mathematik in eine andere noch grund- legendere Wissenschaft der Logik und verbessert die Situation nicht wesentlich. Dieses Vorgehen ändert ebenfalls nicht die grundsätzliche Problematik, dass die Mathematik Axiome postulieren muss, um ihre einzelnen Gebiete zu begründen. Da die Arithmetik auf dem Prinzip der vollständigen Induktion aufbaut, musste Frege insbesondere dieses Prinzip aus fundamentalen logischen Prinzipien ableiten. Nach Auﬀassung einer Gruppe von Neologizisten, zu denen Crispin Wright, Charles Parsons und Bob Hale zählen, gelang dies Frege dennoch trotz der Probleme mit der Russellschen Antinomien durch Verwendung des Humeschen Prin- zips, welches die Gleichmächtigkeit von Mengen mit deren Isomor- phie gleichsetzt. Dazu beobachteten sie, dass Frege im Grunde keine

38 „Umfänge” mehr benutzte, nachdem er das Humesche Prinzip bewiesen hatte. Wenn man daher das Prinzip einfach als Axiom postuliert, dann kann man die Antinomien vermeiden und Freges restliche Be- weise der Eigenschaften der natürlichen Zahlen können akzeptiert werden. Insbesondere definierte Frege die Nachfolgerfunktion S und alle Axiome der Dedekind–Peano Arithmetik.63 Es ist jedoch ziemlich klar, dass das Humesche Prinzip kein echtes logisches Prinzip ist. Russell hatte, ähnlich wie Frege, den Logizismus als Ziel. Henri Poin- caré war der Meinung, dass die vollständige Induktion synthetisch a priori sei und daher grundsätzlich nicht aus anderen Prinzipien ableitbar sei: Dieses Gesetz, welches dem analytischen Beweise(n) ebenso unzugänglich ist wie der Erfahrung, gibt den eigentlichen Typus des synthetischen Urteils a priori.64 Das Programm des Logizismus scheiterte daher unter anderem an der Existenz unendlicher Konstrukte wie der natürlichen Zahlen N, deren Existenz man aus rein logischen Prinzipien nicht folgern kann. Ein anderes, untergeordnetes Problem ist, dass jeder logische Formalis- mus in der Regel auch einen Zahl- und Mengenbegriff in der Notation enthält und die vollständige Induktion in vielen Beweisen vorkommt. Was wurde aus der Scientia Generalis? In der Mathematik, und auch in Teilen der Philosophie, hat die Ent- wicklung der Logik und der formalen wissenschaftlichen Sprachen uns in die Nähe einer Realisierung der Scientia Generalis gebracht. Wir werden in diesem Buch noch deutlich sehen, wie einflussreich die Ide- en von Leibniz derzeit in der Mathematik und Informatik sind. Man mag erstaunt sein, dass seine Vorstellungen erst in der heutigen Zeit so erfolgreich umgesetzt werden konnten. Was passiert außerhalb der Mathematik und in anderen Wissenschaf- ten sowie in der Gesellschaft? Dort sind wir im Moment noch weit davon entfernt, auch nur annähernd zu einer vollständigen Umset- zung von Leibniz Vision einer Scientia Generalis zu kommen. Leibniz

39 hatte schon das Motto „Theoria cum praxi” geprägt. Er wollte, dass Kalküle in formalen Sprachen, Beweise und Berechnungen auch das menschliche Leben bereichern, indem sie Irrationalität, Ungenauig- keiten und Ungerechtigkeit möglichst beseitigen. In anderen Wissenschaften, in den Medien und in der Kunst und im Rest der Gesellschaft sorgt die Digitalisierung derzeit dafür, dass eine starke Formalisierung von Wissensverarbeitung und Anwendun- gen in fast allen Bereichen Einzug hält. Dieser Prozess wird durch Algorithmen aus der Künstlichen Intelligenz mit hohem Druck vor- angetrieben, die große Ansammlungen von Daten (Big Data) von unterschiedlicher Qualität nutzen, um zum Beispiel neuronale Netze zu trainieren und damit eine mit einem enormen Wissen ausgestattete Form von Intelligenz zu erzeugen. Das Sammeln solch großer Datenmengen in Serverfarmen von kom- merziellen Firmen wie Google oder in den Datenbanken der staatli- chen Geheimdienste hat das Zeug, ein „Gedankenalphabet” im Sinne von Leibniz zu erzeugen, denn zumindest alle zugänglichen Schrift- stücke und Äußerungen der Menschheit werden über kurz oder lang in diesen Datenbanken verortet sein. Suchfunktionen und Verknüp- fungen der Daten sorgen dafür, dass auch gängige Schlussweisen und Systematisierungen und dergleichen sichtbar werden. Auf diese Weise wird in relativ kurzer Zeit in vielen Bereichen a posteriori eine schwache Form einer Lingua Universalis entstehen, die den digitalen Pro- zessen in den Programmiersprachen der Algorithmen zugrundeliegt. Man muss allerdings bedenken, dass alle zugrundeliegenden Formali- sierungen vielfach nur auf bereits vorhandenen Daten und der Arbeit von Nichtexperten beruhen und zudem die Algorithmen in der Re- gel nur stochastisch, und daher approximativ, arbeiten, ohne dass in jedem Fall Güteabschätzungen vorliegen. Das Ergebnis solcher Algo- rithmen ist also mit großer Vorsicht zu genießen, insbesonders, wenn der Verdacht besteht, dass zum Trainieren des Algorithmus ungeeig- nete oder zu wenige Daten benutzt wurden.

40 Bis heute ist noch keine wesentliche wissenschaftliche Neuentdeckung von solchen Systemen ausgegangen, obwohl man grundsätzlich krea- tive schöpferische Leistungen in der Kunst oder Wissenschaft auch mit Hilfe der künstlichen Intelligenz durch Formen von ungerichte- tem Suchen auf Basis des Vorhandenen implementieren kann. Solche Ansätze werden jedoch innerhalb der sogenannten „Strong Artiﬁci- al Intelligence” verfolgt. Es gab neben Wissenschaftlern auch immer schon Künstler, die sich digitale Technologien zunutze gemacht haben. Die Wissenschaft und die Universitäten sollten versuchen, diesen Pro- zess auf allen Ebenen mitzugestalten und ihn nicht nur anderen Play- ern zu überlassen. Mit einiger Wahrscheinlichkeit war das Wohlerge- hen der Menschheit das wichtigste Ziel von Leibniz in seiner Suche nach der Scientia Generalis.

KAPITEL 3

Wie denken Mathematiker?

Ob Mathematiker eine besondere Spezies sind oder nicht ist ein be- liebtes Thema. In Filmen oder auf Parties kann man sicher sein, dass Klischees bedient werden, die jedem Mathematiker regelmäßig un- angenehme Gefühle bereiten können. Fragen und Aussagen wie „In Mathe war ich immer schlecht” oder „Mathematiker sind autistisch” bis zu „Was gibt es da noch zu forschen?” sind an der Tagesordnung. In der Tat ist die Denkweise von Mathematikern einzigartig und äh- nelt oft eher der Herangehensweise von Künstlern. Godfrey Harold Hardy, ein sehr berühmter britischer Zahlentheoretiker, hat das vielleicht bekannteste Buch über die Innensicht eines Mathematikers geschrieben. Es trägt den Titel „A mathematician’s apology”.65 In diesem Buch spielt die Schönheit der Mathematik und ihre Verwandt- schaft mit der Kunst eine besondere Rolle. Hardy betont darin, dass die Nützlichkeit von Mathematik in Anwendungen kein Maßstab für ihren Sinn und ihre Qualität sei. Er verweist darauf, dass Gebiete wie die Zahlentheorie eine enorme Schönheit besäßen und niemals irgendwelche Anwendungen gehabt hätten. In diesem Punkte hat sich Hardy getäuscht, denn gerade die Zahlentheorie besitzt gerade heut- zutage enorm viele Anwendungen, die wir hier in diesem Buch zum Teil auch beschreiben.66 Wir werden jetzt einige erwähnenswerte Spezialfälle von mathemati- schem Denken erklären. Geometrie und der Raumbegriﬀ Geometrische Formen Formen modellieren viele Situationen in An- wendungen der Mathematik. Man möchte dabei möglichst einfache

43 geometrische Strukturen betrachten. Eine Möglichkeit, von einem geometrischen Objekt zu einer wesentlich einfacheren Struktur zu kommen, ist die Methode der Landvermessung, d.h. der Triangulie- rung. Dabei werden Stützpunkte gewählt, Verbindungskurven zwischen ihnen, Flächenstücke zwischen den Verbindungslinie usw. bis in höhere Dimensionen (siehe Figur).

Triangulierung einer Sphäre.

Diese Vorgehensweise hat eine lange Historie. Die Grundfrage, die sich von Anfang an stellte, war die nach den einfachsten geometrischen Objekten. Das einfachste 0–dimensionale geometrische Objekt ist offenbar einzig und allein der Punkt, den wir für unsere folgenden Zwecke mit ∆0 bezeichnen. In Dimension 1 gibt es die Verbindungs- linie bzw. das Einheitsintervall [0, 1], das wir mit ∆1 bezeichnen. Der Kreis S1 entsteht auf dem Intervall, wenn man den Anfangs und End- punkt identifiziert. Insofern ist ∆1 das einzige einfache geometrische Objekt der Dimension eins. In zwei Dimensionen gibt es das offensichtliche Dreieck ∆2, aber auch das Einheitsquadrat 2 und viele andere Vielecke. Jedoch kann man durch Triangulierung alle diese Objekte in Summen von Dreiecken ∆2 verwandeln. Das Einheitsqua- drat 2 wird durch Einfügen einer Diagonale zur Summe von zwei Dreiecken zum Beispiel. In höheren Dimensionen wird es komplizierter. Bereits in der Antike wurden die 5 platonischen und die 18 archimedischen Körper gefunden. Die platonischen Körper sind, neben

44 dem Würfel 3 und dem Tetraeder ∆3, der Oktaeder, das Dodeka- eder und das Ikosaeder. Bei den archimedischen Körpern kommen noch abgestumpfte Körper, wie der Ikosaederstumpf oder Fussball- körper vor, der aus 5– und 6–Ecken besteht und bis vor Kurzem als Modell für den Fussball diente. Ab Dimension 4 generalisieren sich diese geometrischen Formen aber nicht alle und es bleiben nur die drei Serien ∆n (n–Simplex oder Hypersimplex), n (Hyperwürfel) und das Kreuzpolytop (die Verallgemeinerung des Oktaeders) übrig. Von diesen drei Serien sind ∆n und n am gebräuchlichsten. Diese Gebilde kann man korrdinatisieren. So wird etwa ∆n durch n +1 Koordinaten t0,...,tn beschrieben, die die Gleichungen 0 t 1 und t + + t =1 ≤ i ≤ 0 ··· n erfüllen. Alle Räume, die wir gerade betrachtet haben, sind topologische Räu- me. Ein topologischer Raum in der Mathematik ist eine Menge X, die einen Umgebungsbegriff (auch Topologie genannt) trägt, indem offene Mengen in dieser Menge ausgezeichnet sind, so dass eine offene Menge U, die einen Punkt a enthält eine offene Umgebung des Punktes bildet. Ein topologischer Raum wird durch die Existenz solcher offenen Mengen axiomatisch charakterisiert. Er besitzt im All- gemeinen keinen Abstandsbegriff, wie wir es üblicherweise aus der Geometrie kennen. Der dreidimensionale euklidische Raum, der uns umgibt67, trägt einen natürlichen Abstandbegriff, auch Metrik genannt, den wir alle benutzen. Für zwei Punkte a = (a1, a2, a3) und b =(b1, b2, b3) ist der euklidische Abstand gegeben durch d(a, b)= (a b )2 +(a b )2 +(a b )2. 1 − 1 2 − 2 3 − 3 In der Mathematikp gibt es jedoch viele andere Beispiele von mehr oder weniger exotischen topologischen Räumen, die ganz verschieden vom euklidischen Raum sind und die man nicht leicht visualisieren kann, weil sie andersartige Topologien tragen. So gibt es zum Bei- spiel die nichteuklidischen Geometrien, die im 18. Jahrhundert von János Bolyai, Nikolai Lobatschewski und Carl–Friedrich Gauß entdeckt wurden. In diesen Geometrien gilt das Parallelenaxiom von

45 Euklid nicht. Mit Hilfe der Differentialgeometrie, die Bernhard Rie- mann entwickelte, konnte solche Räume als Mannigfaltigkeiten mit konstanter (negativer) Krümmung realisiert werden und die Defini- tion von „Geraden” in solchen auf die Betrachtung von geodätischen Kurven zurückgeführt werden. Die strukturerhaltenden Abbildungen zwischen topologischen Räu- men sind die stetigen Abbildungen. Sie sind dadurch definiert, dass sie den Abstandsbegriff in gewisser Weise erhalten. Dies ist gleichbedeutend damit, dass je zwei Punkte a, b X, die nahe genug beieinan- der liegen, Bildpunkte f(a), f(b) besitzen,∈ die nicht weit voneinander entfernt sind.68 Zwei Räume haben eine ununterscheidbare topologische Struktur, mit anderen Worten sie heißen homöomorph, wenn es eine bijektive stetige Abbildung f zwischen ihnen gibt, so dass f als auch die Um- kehrabbildung von f stetig sind. Bei einer Triangulierung wird ein geometrisches Objekt X sozusagen in gewisse einfache Teile zerlegt, die durch stetige Abbildungen f : ∆n X gegeben werden. Das enstandene kombinatorische Objekt, das−→ aus Simplices und Abbil- dungen zwischen ihnen besteht, nennt man auch einen simplizialen Raum. Simpliziale Räume bestehen also aus den einfachsten Bausteinen, nämlich den Simplices in mehreren (oder unendlich vielen) Dimen- sionen, und sie sind durch die Ränder der Simplices verbunden. Der Rand ∂∆n eines einzelnen Simplex ∆n ist durch die Vereinigung aller Teile der Form ∆n−1 gegeben, die durch Nullsetzen einer Koordinate entstehen, wenn ∆n wie oben beschrieben koordinatisiert wird. Besonders einfache simpliziale Räume sind Graphen, die nur 0– und 1–dimensionalen Simplices, d.h. aus Knoten (Ecken) und Kanten, bestehen. Graphen sind wichtige Strukturen in der Mathematik, genauso wichtig wie Zahlen oder geometrische Objekte. Sie beschreiben viele kombinatorische Zusammenhänge und Abläufe. Das Internet und viele Beziehungen zwischen Menschen, Organisationen und Objekten in der Welt kann man mit Graphstrukturen beschreiben. Die einfachsten Graphen sind die Bäume. Sie sind Graphen, die keine Schleifen

46 enthalten, d.h. geschlossene Pfade, die wieder zum Ausgangspunkt zurückkehren. Simpliziale Räume sind geometrische Realisierungen von sogenannten simplizialen Mengen, die im Grad n aus einer Menge von Simpli- ces bestehen. Simpliziale Räume bzw. simplizialen Mengen können sehr kompliziert sein und viele Simplices enthalten. So kann man einfach alle stetigen Abbildungen f : ∆n X für einen topologischen Raum X betrachten und erhält eine−→ simpliziale Menge, die mit Sing•(X) bezeichnet wird und in diesem Text eine besondere Rolle spielt. Simpliziale Räume und simpliziale Mengen kann man also als Verall- gemeinerungen topologischer Räume auffassen und sie stellen damit selbst Raumformen dar. Sie werden uns in diesem Text bald wieder begegnen, denn sie hängen eng mit dem Begriff der (höheren) Kate- gorien zusammen, siehe Kapitel 6. Die eigentliche Gestalt topologischer Räume oder solcher verallgemeinerten Räume ist in vielen Kontexten nicht sehr wesentlich, sondern eher die Äquivalenzklasse, die man erhält, wenn man kleine stetige Deformationen, auch Homotopien genannt, zulässt. Deren Äquiva- lenzklassen werden Homotopietypen genannt. Was ist eine Homotopie? Stetige Abbildungen kann man dazu benutzen, Raumformen unter Parametern zu deformieren, d.h. stetig durch eine sogenannte Homotopie zu „verbiegen”. Zwei Räume, die durch eine Homotopie auseinander hervorgehen, nennt man homoto- pieäquivalent. Beides lässt sich leicht mit Hilfe des Intervalls I = [0, 1] mathematisch definieren.69 Es gibt auch den etwas allgemeineren Be- griff der schwachen Homotopieäquivalenz zwischen zwei Räumen, der dadurch definiert ist, dass sich darunter die Homotopiegruppen nicht ändern. Solche Arten von schwachen Äquivalenzen werden in diesem Buch noch eine wichtige Rolle spielen. Beliebte geometrische Körper wie Sphären lassen sich bis auf Homoto- pieäquivalenz in kombinatorischer Weise leicht aus Simplices oder Hy- perwürfeln zusammenbauen. So entsteht zum Beispiel die n-Sphäre n S aus zwei Kopien von ∆n, die entlang einer Kopie von ∆n−1 verklebt

47 sind, denn die obere und die untere Hemisphäre sind jeweils homöo- morph zu ∆n. (Schwache) Homotopieäquivalenzen erhalten wesentliche Charakteristika und Invarianten von topologischen Räumen. Natürliche Zahlen und Primzahlen Zahlentheorie, auch Arithmetik genannt, ist ein Gebiet der Mathe- matik, das sich mit verschiedenen Arten von Zahlen und ihren Ei- genschaften beschäftigt. Dazu gehören insbesondere die natürlichen Zahlen, die ganzen Zahlen und die sogenannten algebraischen Zahlen. Die Zahlentheorie als Wissenschaft existierte bereits in der Antike. Die Bücher von Euklid und Diophant sind hier zu nennen. Die Werke von Diophant enthalten eine faszinierende Aufgabenstel- lung der Arithmetik, die in der Suche nach Lösungen von Diophanti- schen Gleichungen besteht. Dies sind Polynomgleichungen von denen Lösungen in ganzen Zahlen gesucht werden. Besonders berühmt wurde viele Jahrhunderte später die Fermatsche Gleichung xn + yn = zn. Sie hat nach einem Satz von Andrew Wiles aus dem Jahre 1993 nur positive ganzzahlige Lösungen hat, wenn n =1 oder 2 ist, wie es Pi- erre de Fermat vermutet hatte. Man hat Papyrusrollen entdeckt, auf denen sich Lösungen für den Fall n =2 finden. Anwendungen von Po- lynomgleichungen in den Naturwissenschaften finden sich zuhauf, da algebraische Nullstellengebilde und ihre Perioden sehr häufig in der Mathematik und auch in der mathematischen Physik vorkommen.70 Von Euklid stammt der euklidische Algorithmus, einer der am häu- figsten benutzten zahlentheoretischen Algorithmen. Er stellt vermutlich die Mutter der rekursiven Denkweise dar. Als Student lernte ich in einem Workshop für experimentelle Musik den Komponisten Kla- renz Barlow kennen, der schon in den 80er Jahren Computermusik komponierte. In seinen Algorithmen, die auf den damaligen langsa- men Computern erstaunlich gut funktionierten, kam auch das Pro- blem des größten gemeinsamen Teilers (kurz ggT) zweier ganzer Zah- len a und b vor. Aufgrund meines mathematischen Wissens konnte

48 ich damals einen Beitrag leisten, damit der größte gemeinsame Teiler in seinem Computerprogramm nicht mit Hilfe der Primfaktorisierung von a und b berechnet werden musste, was einen erheblich höheren Aufwand bedeutet hätte. Der euklidische Algorithmus beruht darauf, dass man zwei natürliche Zahlen a und b (mit b =0) als 6 a = qb + r mit 0 r < b ≤ darstellen kann. Dabei ist r der Rest von a „modulo” b wie Mathe- matiker es ausdrücken. Dies funktioniert auch wenn b größer als a ist, denn dann ist r einfach gleich a und q = 0. Ist aber a größer als b, so ist dies jedem vertraut und qb ist das maximale Vielfache von b, das noch kleiner oder gleich a ist. Der euklidische Algorithmus beruht nun darauf, dass man so lange das Paar (a, b) durch das Paar (b, r) ersetzt bis r =0 wird. In jedem Schritt muss als die Zahl q gar nicht berechnet werden, sondern nur der Rest r. Diesen Rest kann man am schnellsten erhalten, indem man so oft b von a abzieht, bis eine Zahl kleiner als b herauskommt. Diese Variante verzichtet auf die Berechnung von q, hat aber einige Zwischenschritte mehr. Man nennt das den schnellen euklidischen Algorithmus. Der Algorithmus bricht in beiden Varianten ab, sobald der Rest r das erste Mal Null wird. Die letzte Zahl b =0 in diesem Verfahren ist dann der gesuchte größte gemeinsame Teiler6 von a und b. In jeder gängigen Program- miersprache lässt sich dieser Algorithmus sehr zügig programmieren und ausführen.71 Die unendliche Folge der natürlichen Zahlen 0, 1, 2, 3, 4, 5,... ist ein menschliches Gedankengebilde und hat keine Entsprechung in der realen Welt. Die Mathematiker bezeichnen die Gesamtheit aller natürlichen Zahlen mit N und betrachten die 0 oft als die kleinste natürliche Zahl. Das „Weiterzählen” in den natürlichen Zahlen wird durch die Nachfolgerabildung S gegeben, die jede Zahl n auf ihren Nachfolger S(n)= n +1

49 abbildet. Es gilt also 1 = S(0) 2 = S(S(0)) . . Wenn wir hier n +1 schreiben, dann suggeriert das eine Additionsabbildung. Die natürli- chen Zahlen besitzen in der Tat eine Addition 1+1=2 und eine Multiplikation 2 3=6. · Wir werden später sehen, wie man diese Operationen präzise deﬁnie- ren kann. Man kann enorm große Zahlen in der Mathematik leicht hinschreiben, wie zum Beispiel durch Verwendung von Zehnerpoten- zen 102 = 100 103 = 1000 106 = 1000000, eine Million . . 10100 = 1000 ... 000, ein „Googol” 100 Nullen . . | {z } Die Folge aller natürlichen Zahlen hat jedoch kein direktes Pendant in der realen Welt. Dies kann man leicht einsehen, wenn man sich überlegt, wie groß die Anzahl aller Teilchen im Universum ist. Nach einigermaßen realistischen Schätzungen, die auf gegenwärtigen Mo- dellen des Universums aufbauen, ist diese Zahl durch etwa 1081 (eine Eins mit 81 Nullen) beschränkt.

50 Die Folge immer größerer Zahlen bildet aber für sich genommen noch kein Geheimnis. Erst wenn man einen Begriﬀ wie Teilbarkeit betrachtet, entfaltet sich aus den natürlichen Zahlen die Welt der Primzah- len: 2, 3, 5, 7, 11, 13,... die alle natürlichen Zahlen sind, die nur durch 1 und sich selbst teilbar sind. Es gibt unendlich viele Primzahlen und jede natürliche Zahl läßt sich eindeutig als Produkt von Primzahlen schreiben. Einen recht bekannten Beweis für die Unendlichkeit aller Primzahlen hat bereits Euklid gegeben.72 Ein wunderbarer anderer Beweis betrachtet die sogenannten Fermatschen Primzahlen der Form 2m Fm := 2 +1 für m =0, 1, 2,.... Es gilt also

F0 =3 F1 =5 F2 = 17 F3 = 257 F4 = 65537.

Die Zahl F5 = 641 6700417 ist keine Primzahl. Wir behaupten aber, dass all diese Zahlen· zueinander teilerfremd sind, d.h. keinen gemeinsamen Teiler besitzen. Daraus folgt die Unendlichkeit der Primzahlen, denn die Primfaktoren in allen Zahlen Fn sind dann alle voneinander verschieden. Für die Behauptung zeigt man zuerst die Formel73

F = F F F − +2. m 0 1 ··· m 1 Wenn dann Fk und Fm mit k < m einen gemeinsamen Teiler p hätten, dann würde p auch die 2 teilen. Dies ist aber ein Widerspruch, denn alle Fm und damit auch p sind ungerade. Computer können heute mit Zahlen der Größenordnung von etwa 10300 sehr gut umgehen und mit hohem Aufwand rechnen, d.h. die Faktorisierung solcher Zahlen in Primfaktoren untersuchen. Das Pro- blem, die Faktorisierung einer Zahl zu ﬁnden ist vermutlich wesentlich

51 schwerer, als zu überprüfen, ob eine gegebene Zahl prim ist, denn da- für gibt es Primzahltests, die in Polynomzeit, d.h. mit beschränkter Komplexität ablaufen. Ein Beispiel einer Primzahl mit 50 Stellen ist die Zahl p = 53542885039615245271174355315623704334284773568199. Primzahlen mit noch viel mehr Stellen kann man mit Hilfe von Mer- senneschen Primzahlen konstruieren, z.B. p =282589933 1. − Sie hat mehr als 24 Millionen viele Stellen (siehe www.mersenne.org). Mengenlehre Mengenlehre ist die verbreiteste Form aller möglichen Grundlagen der Mathematik, von denen wir noch zwei andere in diesem Text kennenlernen werden. Bernhard Bolzano hat 1851 als Erster den Mengen- begriff in seinem Buch „Paradoxien des Unendlichen”74 explizit ein- geführt, obwohl dieser Begriff sicherlich vielen seiner Vorgänger und Zeitgenossen geläufig war. Zwischen 1872 und 1882 schrieben sich Georg Cantor und Richard Dedekind viele Briefe. Darin unterhiel- ten sie sich über Probleme der Mengenlehre. Beide hatte unabhängig voneinander die Grundbegriffe der Mengenlehre entwickelt. Cantor benötigte Mengenlehre bereits in seinen Untersuchungen zu trigono- metrischen Reihen. Dedekind entwickelte die Mengenlehre für seine Untersuchungen zu den natürlichen Zahlen in seinem Buch „Was sind und was sollen die Zahlen?”75. Dabei benutzen beide wie auch Bolza- no einen naiven Mengenbegriff, bei dem Mengen als Ansammlungen von Objekten gedacht wurden. Diese Vorstellung wird heute oft als „materielle” Mengenlehre bezeichnet, weil man sich dabei Mengen so vorstellt, dass man immer genau alle Elemente x M einer Menge M kennt und für jedes Element x überprüfen kann,∈ ob x Element von M oder Element einer irgendeiner anderen Menge ist. Eine wichtige Eigenschaft dieser Vorstellung ist gerade die Tatsache, dass ein Element x in mehreren Mengen vorkommen kann.

52 Eine naive Menge kann von der Form A = Jans Hund, Heikes Katze { } sein. Die Mengenlehre besitzt diverse Operationen, wie die Abbildun- gen f : A B −→ zwischen Mengen, oder die Schnitt- und Vereinigungsmenge A B, A B ∩ ∪ und die Potenzmenge P (A)= die Menge aller Teilmengen von A. Die Mengenlehre hat einen Nachteil, die für uns später noch bedeut- sam sein wird: Ersetzt man in der Menge A oben „Jans Hund” durch „Eriks Hund”, bildet die Menge A′ = Eriks Hund, Heikes Katze { } und bildet dann den Durchschnitt mit einer anderen Menge B, wie z.B. B = Jans Haustiere , { } so sind A B und A′ B nicht gleich, obwohl die Mengen A und A′ isomorph∩ sind, weil sie∩ „nur” durch den Austausch eines Elements ineinander übergegangen sind. Mit anderen Worten: Die Schnittbil- dung ist eine diﬃzile Operation. Man sagt, dass sie intensional ist, da der Schnitt von den jeweiligen Mengen abhängt. Die Existenz unendlicher Mengen spielte von Anfang an eine große Rolle in diesen Untersuchungen. Dedekind war sogar der Meinung, dass er die Existenz einer unendlichen Menge mit Hilfe der Gesamt- heit aller einem Menschen möglichen Gedanken beweisen könne. Die- ser Beweis gilt aber natürlich nicht als streng mathematisch und daher nicht als korrekt. Dedekind benutzte die Existenz unendlicher Mengen zur Konstruktion von unendlichen Ketten 0,S(0),S(S(0)),...

53 von Elementen in einer unendlichen Menge mit einem Anfangsele- ment 0 und einer Abbildung S der Menge in sich selbst, die man auch Nachfolgerabbildung nennt. Wenn man annimmt, dass S die Punkte der Menge hinreichend trennt (d.h. S injektiv ist), dann sind all diese Elemente verschieden voneinander und bilden ein Modell der natürlichen Zahlen, das man üblicherweise mit N bezeichnet. Sowohl Dedekind als auch Cantor haben die Ansammlung aller na- türlicher Zahlen in einem solchen Modell N als ein einzelnes neues (und existentes) Objekt der Mathematik gesehen, wie die meisten Mathematiker dies auch tun. Man nennt dies ein „aktual unendliches” Objekt. Für Dedekind war klar, dass es viele unterschiedliche Modelle der natürlichen Zahlen gibt. Also bewies er einen Satz, der besagt, dass alle Modelle isomorph zueinander sind. Diese Situation ist wieder ein Beispiel dafür, dass mathematische Objekte verschieden sein können, man sie aber trotzdem identiﬁzieren will. Ähnliche Eindeutigkeitssätze kann man auch für die reellen Zahlen bewiesen. Im Nachlass von Dedekind hat man Papiere gefunden, die zeigen, dass er Konstruktionen kannte, mit denen man aus den natürlichen Zahlen heraus die ganzen Zahlen und die rationalen Zahlen als Men- gen konstruieren kann.76 Die reellen Zahlen hat Dedekind in seinem Buch „Stetigkeit und Irrationalzahlen”77 aus den rationalen Zahlen heraus mit Hilfe der Dedekindschen Schnitte konstruiert. Georg Cantor hat in seinen Arbeiten noch größere Zahlen innerhalb der Mengenlehre deﬁniert, die Ordinal– und Kardinalzahlen. Ordinal- zahlen sind wohlgeordnete Mengen, d.h. total geordnete Mengen, so dass jede nichtleere Teilmenge ein kleinstes Element besitzt. Das Aus- wahlaxiom impliziert, dass jede Menge wohlgeordnet werden kann. Kardinalzahlen sind gewisse Ordinalzahlen, die am kleinsten unter allen Ordinalzahlen sind, die die gleiche Mächtigkeit besitzen. Die kleinste unendliche Ordinalzahl ist ω, die Zahl, die der gewöhn- lichen Anordnung 0 < 1 < 2 < 3 < ···

54 der natürlichen Zahlen entspricht. Hinter der Ordinalzahl ω kann man „weiterzählen”: ω<ω+1 <ω+2 < < 2ω < <ω2 < <ωω < <ε < ··· ··· ··· ··· 0 ··· Dabei ist ε0 der kleinste Fixpunkt, der durch die Gleichung

ε0 ω = ε0 deﬁniert ist. Daher ist ε0 eine unfassbar große Potenz: ω . .. ω ε0 = ω . ω Mal Ordinalzahlen kann man mit (unendlichen)| {z } Bäumen in Verbindung bringen. Ein Baum mit einer Wurzel besitzt eine ausgezeichnete Ecke (die Wurzel) und endlich viele Kanten (oder Äste), die von jeder Ecke ausgehen und dabei keine Schleifen erzeugen (siehe Figur).

Wurzel

Ein Baum mit Wurzel.

Bäume mit endlich vielen Ästen an jedem Knoten kann man lexiko- graphisch ordnen, indem man die Äste, die von der Wurzel wegzeigen, an jedem Knoten durchnummeriert. Auf diese Weise bekommt man eine Wohlordnung auf der Menge aller solchen Bäume mit Wurzel. Diese Menge mit der lexikographischen Wohlordnung entspricht der Ordinalzahl ε0. Die natürlichen Zahlen kann man in einer Darstellung von John von Neumann als Mengen der jeweiligen Vorgänger deﬁnieren: 0 := , 1 := 0 , 2 := 0, 1 ,...,n + 1 := 0, 1,...,n ,... ∅ { } { } { }

55 John von Neumann erfand eine Variante dieses Konstruktion und deﬁnierte um 1928 die sogenannte kumulative Hierarchie von Mengen V = , 0 ∅ Vα+1 =P (Vα),

Vλ = Vα, α<λ [ die auf der leeren Menge aufbaut. Dabei ist α eine Ordinalzahl und λ eine sogenannte Limesordinalzahl. Für sogenannte (stark) unerreichbare Kardinalzahlen λ heißen die Mengen Vλ Grothendieck–Universen und sind potentiell Modelle für die Zermelo–Fraenkel Axiome. Die Existenz solcher Universen würde die Konsistenz der Zermelo–Fraenkel Axiome beweisen, wie wir in Kapitel 1 gesehen haben. Wegen des Gödelschen Unvollständigkeitssatzes (siehe Kapitel 8) ist die Exis- tenz (stark) unerreichbarer Kardinalzahlen unbeweisbar in der Men- genlehre und stellt daher ein neues Axiom dar. Also folgt aus den Zermelo–Fraenkel Axiomen weder die Konsistenz der Mengenlehre noch die Existenz eines Modells. Kontinuumshypothese und Forcing Nach dem Aufkommen der Russellschen Antinomie um 1902 geriet die naive Mengenlehre von Cantor und Dedekind in eine gewaltige Krise. Erst Ernst Zermelo gelang es 1907, ein Axiomensystem für die Mengenlehre zu formulieren, das auch optional das Auswahlaxiom enthielt, das er 1904 gefunden hatte. Dieses Axiomensystem wurde um 1921 von Abraham Fraenkel erweitert und nach den Erﬁndern Zermelo–Fraenkel Axiomensystem oder kurz ZF genannt, bzw. ZFC, wenn man das Auswahlaxiom hinzufügt. Der Buchstabe C steht dabei für die englische Übersetzung „axiom of choice”. Es ist bekannt, dass Zermelo die Russellsche Antinomie bereits vor Russell entdeckt hatte. Dies geht aus einem Brief von David Hilbert an Frege von 1903 hervor. Georg Cantor hat eine mehrteilige Reihe von Arbeiten mit dem Ti- tel „Über unendliche lineare Punktmannigfaltigkeiten” geschrieben.78 Wie David Hilbert einmal sagte, hatte Cantor mit der Mengenlehre

56 und der unendlichen Hierarchie von Mengen ein „Paradies” innerhalb der Mathematik geschaﬀen. In diesem „Paradies” hatte Cantor auch die Kontinuumshypothese formuliert. Die Kontinuumshypothese besagt, dass es keine Menge gibt, deren Mächtigkeit zwischen der Mächtigkeit 0 der natürlichen Zahlen und der Mächtigkeit 2ℵ0 der reellen Zahlenℵ liegt. Diese Vermutung kann man nicht beweisen, denn es gibt Modelle der Mengenlehre, die die Kontinuumshypothese erfüllen, wie Kurt Gödel mit Hilfe der kumula- tiven Hierarchie gezeigt hat und andere Modelle, die sie nicht erfüllen. Letzteres hat Paul Cohen mit Hilfe der Forcingmethode gezeigt.79 Die Forcingmethode baut auf vielen Ergebnissen der Mengenlehre auf, die bis zur Entdeckung durch Cohen bekannt waren. Darunter fallen der Vollständigkeitssatzes von Skolem und Gödel und der Satz von Löwenheim–Skolem. Skolem hatte die Idee, die der Forcingme- thode zugrundeliegt bereits 1922 angedeutet. Auf diese Sätze und den Zusammenhang mit der Semantik gehen wir in Kapitel 8 und Kapitel 9 ein.80 Freie Objekte und Adjunktion Die Forcingmethode konstruiert „neue” Mengen aus einem gegebenen und hinreichend kleinen abzählbaren Modell der Mengenlehre mit Hilfe eines raﬃnierten Tricks. Wir wollen die Forcingmethode nicht vollständig erläutern, aber der dabei verwendete Trick ist sehr ähnlich zu einem Konstruktionsprinzip der Mathematik, das man Adjunktion nennt und ganz gut wie folgt erklären kann. Die Methode der Adjunktion ist in der Mathematik sehr gebräuch- lich und besteht im Grunde darin, zu einer gegebenen Struktur neue unabhängige Elemente als Erzeuger hinzuzufügen, so dass gewisse Eigenschaften erhalten bleiben, aber die neuen Elemente auf kontrol- lierte Weise die gewünschten Eigenschaften bekommen. Die Adjunktionsmethode besteht aus zwei Schritten. Im ersten Schritt wird ein „generisches” neues Element hinzugefügt, das unabhängig von den Elementen der Ausgangssituation ist. So entsteht gewisser- maßen eine „freie” Struktur. Im zweiten Schritt werden den neuen

57 Elementen Bedingungen (Relationen) auferlegt, so dass die Rechen- regeln der alten Elemente erhalten bleiben und das neu konstruierte Objekt die gewünschten Regeln erfüllt. Ein schönes Beispiel für ein freies Objekt sind die natürlichen Zahlen N. Man kann sie sich als freies Objekt über einem einzigen Erzeuger 1 vorstellen, denn jede natürliche Zahl ist Summe von Werten der Zahl 1: 5=1+1+1+1+1. Die Zahl 0 fällt auch unter diese Deﬁnition, denn sie entsteht wenn man die Zahl 1 Null mal aufsummiert. Man nennt N auch ein freies Monoid über einem Erzeuger. Man kann ebenso freie Monoide über mehr als einem Element konstruieren. Das freie Monoid über zwei Elementen besteht aus endlichen Wörtern in den Buchstaben a und b. Solche Wörter kann man graphisch sehr gut als Knoten in einem binären Baum visualisieren: leeres Wort

a b

aa ab ba bb

Binärer Baum zu Wörtern in zwei Buchstaben.

Ebenso kann man „freie Gruppen” über einem oder mehreren Er- zeugern konstruieren. Die freie Gruppe über einem Erzeuger ist die Menge der ganzen Zahlen Z. Freie Gruppen mit mehr als zwei Er- zeugern sind nicht mehr kommutativ wie die ganzen Zahlen und man schreibt sie deshalb als multiplikative Gruppen. Die freie Gruppe F2 über zwei Erzeugern a und b besteht aus beliebigen endlichen Wörtern in den beiden Buchstaben und ihren Inversen a−1 und b−1, wie zum Beispiel dem Wort w = a3b2a−3ba. 58 Man kann sich diese freie Gruppe F2 sehr anschaulich vorstellen als die Menge aller geschlossenen Wege, die man auf einer geometrischen Figur, die man manchmal auch „liegende Acht” nennt, ausgehend vom Mittelpunkt zurücklegen kann (siehe Figur).

Die „liegende Acht”81.

Freie Objekte besitzen immer eine sogenannte universelle Eigenschaft. Das bedeutet, dass es für jede Gruppe G mit zwei Erzeugern, ob kommutativ oder nicht, eine Abbildung F G 2 −→ gibt, welche die zwei Erzeuger von F2 auf die beiden Erzeuger von G abbildet. Dies Abbildung ist surjektiv, d.h. die erreicht jedes Element von G, aber sie ist im Allgemeinen nicht injektiv, es sei denn G ist selbst eine freie Gruppe. Eine ähnliche universelle Eigenschaft gilt für freie Monoide. Mit diesem Wissen wollen wir nun ein konkretes Beispiel zur Adjunk- tionsmethode ansehen und nehmen ein Objekt R, in dem man ad- dieren und multiplizieren kann. Ein solches Objekt nennt man einen Ring, wenn die Addition kommutativ ist, d.h. wenn für alle Ringele- mente a, b a + b = b + a gilt. Der Leser sollte sich die ganzen Zahlen Z als wichtigstes Beispiel für einen Ring vorstellen. Gegeben einen Ring R, gibt es die Möglichkeit, ein neues Element T zum Objekt R hinzuzufügen, und das „freie” Objekt R[T ] zu bilden, auch „Polynomring” über R genannt. Die Elemente in R[T ] sind Polynome, d.h. endliche Summen f = a T d + + a T 2 + a T + a , d ··· 2 1 0 59 wobei die Koeffizienten ai Elemente von R sind und die Potenzen T i neue Ausdrücke sind. Alle Potenzen bilden unendlich viele neue Elemente und die endlichen Summen solcher Ausdrücke bilden erst recht eine unendlich große Menge. Der Polynomring R[T ] ist also ein wesentlich größeres Objekt als R selbst. Das Symbol T nennt man üblicherweise Unbekannte oder Variable. Die Addition und Multipli- kation in diesem neuen Objekt R[T ] wird auf offensichtliche Weise erklärt. Man nennt das Objekt R[T ] eine freie Struktur, weil der Variablen T noch keine Bedingungen auferlegt wurden und die Potenzen T i eine Kopie der natürlichen Zahlen bilden, denn die Hochzahl i kann genau die natürlichen Zahlen durchlaufen. Im zweiten Schritt der Adjunktion wird mit Gewalt eine Relation f =0 auferlegt. Dadurch konstruiert man ein neues Objekt, das man mit S = R[T ]/(f) bezeichnet. In S werden zwei Polynome von R[T ] identifiziert, wenn ihre Differenz ein Vielfaches von f ist. Mit anderen Worten: Wir erzwingen mit Gewalt die Gleichung f =0. Als Beispiel nehmen wir das Polynom f = T 2 2 und bilden das Objekt − S = R[T ]/(T 2 2). − Was entspricht dem Element T in diesem Konstrukt? Da wir mit Gewalt die Gleichung T 2 2=0 − erzwungen haben, gilt für die Variable T , dass T 2 =2 ist, d.h., dass T eine Quadratwurzel aus 2 ist: T = √2. Wir haben also durch zwei Schritte aus dem Ring R einen neuen Ring S konstruiert, in dem das Element 2 eine Quadratwurzel besitzt, obwohl es in R vorher nicht unbedingt eine Quadratwurzel hatte. Man kann dann auch schreiben S = R[√2].

60 Der Ring S ist von R verschieden genau dann, wenn √2 in R nicht existiert hat. Im Fall R = Z ist das offensichtlich so gewesen. Ein anderes Beispiel wird durch das Polynom f = T 2 selbst gegeben. Dann ist S = R[T ]/(T 2) der Ring der von Leibniz in seinem Infinitesimalkalkül benutzt wurde, denn das Element T in diesem Ring kann als infinitesimale Größe interpretiert werden. Homologiegruppen und Homotopiegruppen Eigenschaften äquivalenter Objekte in der Mathematik, die allen Re- präsentanten gemein sind, nennt man auch Invarianten. In der Ma- thematik und auch in der Physik gibt es viele Invarianten, die entscheidende Informationen über die betrachteten Objekte tragen. In diesem Text werden topologische Invarianten eine besondere Rolle spielen, insbesondere die Invarianten topologischer Räume, die unter Homöomorphie oder unter allgemeineren Operationen wie der Homo- topieäquivalenz erhalten bleiben. Die Mathematikerin Emmy Noether hat in entscheidender Weise dazu beigetragen, dass Invarianten algebraischer, topologischer und phy- sikalischer Natur ihre angemessene Bedeutung zugewiesen bekamen. Sie hat als Erste homologische Invarianten von abstrakten algebraischen Kettenkomplexen definiert und damit die Algebraisierung der Topologie eingeleitet. Wie funktioniert das? Jedem topologischen Raum oder jeder differenzierbaren Mannigfaltigkeit kann man eine natürliche simpliziale Menge und damit einen natürlichen singulären Kettenkomplex zuordnen. Dazu betrachtet man einfach alle stetigen Abbildungen der Simplices ∆n nach X und macht daraus eine Menge: Sing (X)= f : ∆ X stetig . n { n −→ } Dies definiert eine kanonische simpliziale Menge, die mit

Sing•(X)

61 bezeichnet wird. Dazu gehören auch Randabildungen ∂ : Sing (X) Sing (X), n n −→ n−1 die durch Einschränkung auf die Ränder ∂∆n der Simplices gegeben werden. Die Elemente von Singn(X) werden n–Simplices genannt, genauso wie die Objekte ∆n selbst. Man beachte, dass die n–Simplices degenerieren, wenn n größer ist als die Dimension von X. Man kann sie für vielerlei Zwecke weglassen, aber nicht immer, denn der Raum Sing•(X) enthält wertvolle sogenannte homotopietheoretische Infor- mation über X, die dann verloren geht. Jeder simplizialen Menge S• – und daher jedem topologischen Raum X durch seinen singulären Komplex ZSing•(X) – lassen sich Homo- logiegruppen zuordnen, wie Emmy Noether es ganz allgemein ein- geführt hatte. Bei dieser Sichtweise betrachtet man den singulären Kettenkomplex von abelschen Gruppen, der der simplizialen Menge S• zugrunde liegt

ZS• : ZS ZS − ZS ZS ··· −→ n −→ n 1 −→··· −→ 1 −→ 0 und bildet an jeder Stelle die Homologiegruppen Hn(S•) als die Quo- tienten Ker(ZSn ZSn−1) H (S•)= −→ . n Bild(ZS ZS ) n+1 −→ n Die n–te Bettizahl bn wird dann als der Rang von Hn(S•) definiert. Die nullte Bettizahl b0 gibt dabei gerade die Anzahl der Zusam- menhangskomponenten von S• an, die erste Bettizahl b1 die An- zahl der Schleifen. Die n–te Bettizahl gibt sozusagen an, ob eine n–dimensionale Raumform in Form eines n–dimensionalen „Lochs” existiert. Statt einer formalen algebraischen Definition wollen wir dies nur anhand einer einfachen geometrischen Figur, der sogenannten „liegenden Acht” skizzieren, bei der offenbar zwei Schleifen auftreten.

Die „liegende Acht” hat zwei „Löcher”, also ist b1 =2.

62 Die Homotopiegruppen πn(X) sind als Homotopieklassen von stetigen Abbildungen f : Sn X definiert (mit einer geeigneten Verknüpfung, um eine Gruppe−→ zu bekommen). Diese Gruppen sind abelsch (kommutativ), falls n 2. Die wichtigste dieser Gruppen ist die Fundamentalgruppe π (X,≥), wobei ein Basispunkt in X ist. 1 ∗ ∗ Wie wird π1(X, ) definiert? In einem topologischen Raum X gibt es den Begriff eines∗ Pfades. Ein solcher Pfad p ist gegeben durch eine stetige Abbildung f = f : [0, 1] X, p −→ wobei [0, 1] das reelle Einheitsintervall ist. Dabei ist f(0) = a der Anfangspunkt und f(1) = b der Endpunkt des Pfades.

b a

Zwei Pfade p, q von a nach b.

Pfade kann man auf natürliche Weise miteinander verknüpfen, wenn der Endpunkt des einen Pfades mit dem Anfangspunkt eines anderen übereinstimmt. Der inverse Pfad p−1 zu einem Pfad p von a nach b ist ein Pfad von b nach a und wird dadurch gegeben, dass man die Durchlaufrich- tung des Pfades p umdreht, d.h. er ist gegeben durch die Funktion g(t) = f(1 t), wobei t die Koordinate im Intervall [0, 1] ist. Zwei Pfade p, q sind− zueinander homotop, in Zeichen p q, wenn es eine ≃

63 p

b c a

Verknüpfung q p von Pfaden. ◦ Homotopie zwischen ihnen gibt. Ein solche deﬁniert man durch eine stetige Abbildung H : [0, 1] [0, 1] X, so dass H(0, ) und H(1, ) die beiden Pfade deﬁnieren.× −→ − − p

a b

Eine Homotopie zwischen zwei Pfaden p und q von a nach b.

Es gelten die folgenden Rechenregeln für diese Operationen bis auf Homotopie: p−1 p 1 , ◦ ≃ a p p−1 1 , ◦ ≃ b (p q) r p (q r). ◦ ◦ ≃ ◦ ◦ Hierbei sind 1a und 1b die konstanten Pfade bei a bzw. b. Die Ho- motopie von Pfaden in diesen Formeln ist im Wesentlichen eine Re- parametrisierung der Pfade als Abbildungen vom Einheitsintervall nach X. Die Formeln werden falsch, wenn man das Zeichen durch ≃ 64 die Gleichheit ersetzt, denn bereits die erste Formel gilt nur bis auf Homotopie. Die Fundamentalgruppe π1(X, ) ist die Gruppe der Homotopieklas- sen aller Pfade in X mit festem∗ Anfangs– und Endpunkt , dem Basispunkt. Sie ist in der Regel nicht kommutativ, wie man am∗ Bei- spiel der „liegenden Acht” sieht, deren Fundamentalgruppe die freie Gruppe über zwei Erzeugern ist, die den möglichen Wegen auf der „Acht” entsprechen. Die Fundamentalgruppe verschleiert dennoch viele Eigenschaften von Pfaden in X und die Abhängigkeit vom Basispunkt ist unnatürlich. Es ist daher besser, Verallgemeinerungen der Fundamentalgruppe zu betrachten, die aus der Gruppe eine Gruppoid oder sogar ein höheres –Gruppoid machen, die man auch Fundamentalgruppoid nennt. In diesem∞ Fall werden Pfade zwischen allen Punktn und nicht notwendig nur deren Homotopieklassen betrachtet und die obigen Rechenregeln gelten nur bis auf gewisse Äquivalenzen, d.h. Homotopien und hö- here Verallgemeinerungen davon. Wir werden darauf noch genauer eingehen. Die Homotopiegruppen bilden Invarianten mit überraschenden Ei- genschaften. Ein berühmtes Beispiel dafür ist die 2–Sphäre S2, für die es die Hopf–Faserung S3 S2 −→ gibt, die genau die entscheidende Information über die dritte Homo- 2 Z topiegruppe π3(S ) ∼= enthält. Neue Raum– und Zahlbegriffe Wir haben topologische Räume anhand einiger Beispiele kennengelernt. Mannigfaltigkeiten sind spezielle Fälle von topologischen Räu- men, bei denen man von differenzierbaren Funktionen auf offenen Teilmengen sprechen kann. Ist ein solcher Raum X gegeben und U X eine (offene) Teilmenge, so kann man die kommutative Alge- bra⊂A(U) der stetigen bzw. differenzierbaren reellwertigen Funktio- nen auf U betrachten. Die Zuordnung U A(U) bildet eine Garbe 7→

65 von Funktionen, die man mit X bezeichnet. Aus der Garbe X lässt sich der Raum X wieder rekonstruieren,O indem man maximaleO Ideale in A(U) betrachtet. Diese entsprechen den Funktionen auf U, die in einem Punkt verschwinden und X stimmt mit der Menge aller maximalen Ideale überein. Die Korrespondenz zwischen Räumen und Funktionenalgebren ist eine sehr wichtige Dualität, die in vielen Situationen vorhanden ist.82 Auch im algebraischen Fall kann man aus Algebren A sogenannte affine Varietäten X = Spec(A) definieren, die aus allen Primidealen in A bestehen. Maximale Ideale sind auch Primideale. Die Räume X tragen immer eine sehr grobe Topologie, die man Zariskitopologie nennt. Die Garbe der Funktionen auf X hat dann die Eigen- OX schaft, dass X (X)= A ist. Die Bezeichnung Spec stammt aus der – Spektraltheorie,O angelehnt an den Satz von Gelfand–Neumark. Durch „Verkleben” solcher Spektra erhält man den Begriff des Schemas von Alexander Grothendieck oder – noch allgemeiner – der Begriff des algebraischen Stacks von Grothendieck und Michael Artin. Bei den Stacks werden Methoden der Kategorientheorie benutzt, siehe das Stacks Project. Aus unserer Sicht ist dies jedoch problematisch, denn Stacks sollten primitive Objekte sein, wobei man höchstens deren Modelle durch (gefaserte) Kategorien beschreiben sollte und nicht die Objekte selbst. Diese Denkweise erscheint uns als unzu- lässige Vermischung von Grundlagen. In analoger Weise sollte man Unendlichkategorien nicht als Quasikategorien einführen, denn dies vermischt ebenfalls Objekte mit ihren Modellen. Unsere grundlegende Sichtweisen ist es, stets zwischen (primitiven) Objekten und ihre kategorischen oder mengentheoretischen Modellen zu unterscheiden. Statt der Zariskitopologie kann man auch andere Topoi wie die éta- le Topologie und andere Varianten betrachten, bei denen die offenen Mengen nicht notwendig Teilmengen von X sind, sondern Pfeile U X, die gewisse Axiome erfüllen. Algebraische Varianten von Räumen−→ in der nichtarchimedischen Geometrie sind die sogenannten rigid–analytischen Räume von John Tate und die ganz neuen perfek- toiden Räume von Peter Scholze.

66 Diese Beispiel zeigen, dass man zahlreiche Räume als topologische Räume zusammen mit einer Garbe von kommutativen Algebren betrachten kann. Diese Situation kann man auf vielerlei Weise verallgemeinern. Eine Option ist es, Räume durch Kategorien oder die Strukturgarben durch Komplexe zu verallgemeinern. Hat man andererseits keinen unterliegenden Raum X zur Verfügung, so kann man alleine eine Strukturgarbe betrachten. Die nichtkommutative GeometrieO betrachtet nur nichtkommutative Algebren von Funktionen, sogenannte C∗–Algebren. Ein unterliegen- der geometrischer Raum ist nicht wirklich vorhanden. Nichtkommu- tative Geometrie liegt vielen Theorien der Physik zugrunde, beispielsweise der Schleifenquantengravitation, die Gravitation und Quan- tenmechanik vereinigt. Dort gibt es in der Tat einen unterliegenden Raum, der aber ganz anders geartet ist und aus sogenannten Spin- netzwerken besteht, also eine rein kombinatorische graphtheoretische Struktur ist, und zuerst von Roger Penrose erdacht wurde. Sie erinnert an Ideen aus der Habilitationsschrift von Bernhard Riemann. Eine weitere Verallgemeinerung topologischer Räume ist die Theo- rie der Spektra. Ein Spektrum ist eine Sequenz von topologischen Räumen X X X − ··· −→ n+1 −→ n −→ n 1 −→··· zusammen mit Pfeilen σ : ΣX = S1 X X . n n+1 ∧ n+1 −→ n Ein Beispiel ist das Sphärenspektrum S, bei dem Xn die n–Sphäre Sn ist. Ganz allgemein kann man also algebraische Objekte wie Ringe und Algebren (oder Varietäten wie Spec(A)) durch Spektra, Stacks oder noch allgemeiner (höhere) Kategorien verallgemeinern. Dabei wird zum Beispiel das Sphärenspektrum S eine Verallgemeinerung der ganzen Zahlen Z als ein Ringspektrum mit „Multiplikationsabbildungen” Sm Sn Sm+n. ∧ −→ Verallgemeinerte Räume der verschiedensten Arten, die wir hier beschrieben haben, können trotz ihres hohen Abstraktionsgrades viel

67 ﬂexibler als klassische Räume behandelt werden und erlauben vielfäl- tige mathematische Konstruktionen, was sie enorm nützlich macht. Bei diesen Arten von verallgemeinerten Räumen ist noch sehr viel weitere Forschung zu erwarten. Insbesondere erwartet man, dass hier homotopietheoretische Methoden und die Typentheorie beim Ver- ständnis helfen. Ein Forschungsprojekt sei noch zum Schluss genannt. Alexander Gro- thendieck lag immer sehr die Algebraische Geometrie am Herzen. Durch seine Arbeiten über mehr als zwanzig Jahre hat er sie stärker weiterentwickelt als jeder andere Mathematiker. Er wäre auch daran interessiert gewesen, die Homotopietheorie der algebraischen Varie- täten (oder der Schemata) noch besser zu verstehen, nicht zuletzt auch deshalb, weil viele von deren Eigenschaften (wie Perioden und Motive, denn Grothendieck war auch der Erﬁnder der Theorie der Motive83) homotopischer Natur sind. Es gibt eine algebraische Ver- sion der Homotopietheorie, die sogenannte A1–Homotopietheorie. Es wäre interessant zu wissen, ob es auch eine algebraische Variante der ( , 1)–Kategorie der Homotopietypen aller algebraischen Schemata gibt∞ und ob sie gut beschreibbar ist.

68 KAPITEL 4

Mathematik in unserer Kultur

Wir haben bereits gelernt, dass sich Mathematik mit einer eigenen, aber auf der untersten Ebene ziemlich elementaren Formelsprache formulieren lässt. Aus dieser Syntax entfalten sich die Teile der Ma- thematik auf wunderbare Weise. Die Mathematik beschäftigt sich insbesondere mit Arithmetik und Geometrie. Sie setzen sich systematisch mit Zahlen bzw. geometrischen Gebilden auseinander.84 In der Mitte des 19. Jahrhunderts haben sich die Arithmetik und die Geometrie in die Moderne hinein geöﬀnet. Wir wollen anhand von mehreren unterschiedlichen Beispielen moderner Anwendung von Mathematik, nämlich der Kryptographie, den Blockchains, den Quantencomputern, den neuronalen Netzen, der topologischen Datenanalyse in der Bioinformatik und der Kovarianz in der Mathematischen Physik, erklären, wie man zu der dahinter liegenden Mathematik einen leichten Zugang ﬁnden kann. Kryptographie oder die Kunst der Verschlüsselung Verschlüsselungsverfahren wie RSA, ElGamal oder Shamirs Three– Pass–Protokoll benutzen Primzahlen und den euklidischen Algorith- mus. Bei diesen Protokollen rechnet man in Restklassen modulo einer großen Zahl N, d.h. mit den Zahlen 0, 1, 2, 3,...,N 1 { − } und addiert und multipliziert diese Restklassen auf die übliche Weise, wobei Vielfache von N eventuell abgezogen werden, wenn das Ergeb- nis größer als N wird. Dies ist den meisten Menschen vertraut, wenn

69 N =7 ist, denn die sieben Wochentage Mo, Di, Mi, Do, Fr, Sa, So bilden Restklassen modulo N = 7. Im Fall der RSA ist N = pq das Produkt zweier verschiedener großer Primzahlen mit mehr als hundert Stellen und bei ElGamal oder Shamirs Three–Pass–Protokoll ist N = p selbst eine große Primzahl. In der Kryptographie oder bei der Eingabe von Passwörtern in Com- putersystem werden Einwegfunktionen benutzt, die man auch Hash- funktionen nennt. Mit diesen ist es möglich, die Geheimhaltung oder die Verifizierung der Wahrheit von Aussagen – wie bei der Authen- tifizierung eines Benutzers – zu überprüfen, ohne die Sicherheit und die Anonymität eines Benutzers zu gefährden. Mit mathematischen Methoden kann man sehr viele solcher Funktionen generieren und Ge- heimhaltungsprotokolle technologisch realisieren und sicher machen. Darin liegt der eigentliche Wert der Zahlentheorie in der Kryptogra- phie. Hashfunktionen sind Funktionen mit der Eigenschaft, dass man aus einem Funktionswert f(x) nur sehr schwer das Argument x berechnen kann. Sie werden manchmal auch Einwegfunktionen genannt, wenn die entsprechende Funktion f injektiv ist, d.h. wenn unterschiedliche Argumente auch unterschiedliche Funktionswerte besitzen. Sol- che Funktionen könnte man auch „Fingerabdrücke” nennen, denn – klassische oder genetische – Fingerabdrücke haben ähnliche Eigen- schaften. Das folgende Beispiel einer mathematischen Einwegfunktion wird bei diversen Protokollen benutzt. Es ist die Potenzabbildung f(m)= gm mod N für m und N teilerfremd, wobei N eine sehr große Zahl ist. Die Umkehrfunktion zu dieser Funk- tion wird diskreter Logarithmus genannt und ist eine notorisch schwer zu berechnende Funktion. Ebenso schwierig ist es, aus dem Wissen von f(m) die Basis g zu bestimmen, selbst wenn m bekannt ist. Es gibt jedoch eine einfache Methode g zu bestimmen, wenn N = p eine Primzahl ist. Dazu wählt man ein m′ mit mm′ 1 mod p 1 und ≡ − 70 der kleine Satz von Fermat85 garantiert einem dann, dass ′ ′ (gm)m gmm g mod N. ≡ ≡ Die Entschlüsslung erfolgt also ebenfalls mit einer einfachen Expo- nentialfunktion. Dies ist offenbar keine besonders sichere Methode, denn die Zahl m′ ist leicht zu berechnen mit Hilfe des Euklidischen Algorithmus. Im N = p prim gibt es also eine einfache Entschlüsse- lungsmethode, die man auch Backdoor (Hintertür) nennt. Diese Methode funktioniert aber mit einer kleinen, entscheidenden Modifikation auch immer, wenn N keine Primzahl ist. Bei der RSA– Kryptographie ist N = pq das Produkt zweier großer voneinander verschiedener Primzahlen. Die Verschlüsselung f(m) verläuft wie eben erklärt, d.h. durch eine einfache Exponentialfunktion. Die Ent- schlüsselung, und damit eine Backdoor, erhält man ebenfalls durch exponentieren mit einem geeigneten m′, wenn die Faktorisierung von N bekannt ist. Diesmal ist m′ aber nicht so einfach zu ermitteln. Der Satz von Euler, der den kleinen Satz von Fermat verallgemeinert, lautet xϕ(N) 1 mod N, ≡ wobei ϕ(N) die Eulersche ϕ–Funktion86 von N ist. Die Entschlüsse- lung (oder Backdoor) ist dann gegeben durch ein m′ mit mm′ 1 mod ϕ(N). Ist N = pq, wobei p, q voneinander verschiedene Primzah-≡ len sind, so ist der Wert ϕ(N) gegeben durch ϕ(N)=(p 1)(q 1). Mit dem Euklidischen Algorithmus lässt sich m′ einfach− berechnen,− aber eben nur, wenn ϕ(N) gegeben ist. Diese Backdoor ist nicht so simpel wie im Fall N = p. Man vermutet, dass es genauso schwierig ist, eine große Zahl N der Form N = pq zu faktorisieren, wie es schwierig ist, ϕ(N) zu berechnen. Das bedeutet, dass ein Angreifer, selbst wenn er N kennt, aus dem Wissen von f(m) nur mit unvertretbarem Zeit– oder Rechenaufwand die Zahlen m oder g berechnen kann. Man kann entweder m oder g dabei als ein Geheimnis betrachten. Im Allgemeinen ist das Problem, eine natürliche Zahl zu faktorisieren viel aufwendiger, als nachzuprüfen, ob eine Zahl prim ist oder nicht.

71 Um Zahlen zu faktorisieren gibt es Algorithmen wie das quadrati- sche Sieb oder das Zahlkörpersieb. Diese haben keine polynomielle Komplexität, sondern sind subexponentiell vom Aufwand. Andererseits konnte man 2002 zeigen, dass man Primzahltests in Po- lynomzeit erledigen kann und dafür wurde der Ausdruck „PRIMES is in P” geprägt. Es wird jedoch vermutet, dass ein digitaler Compu- ter das Problem der Faktorisierung, auch FACTOR genannt, nicht in Polynomzeit lösen kann. Peter Shor hat 1994 bewiesen, dass ein Quantencomputer dies in Polynomzeit schaffen würde, sofern man ihn bauen könnte. Wie funktionieren mit solchen zahlentheoretischen Methoden kryptographische Protokolle? Bei Shamirs Three–Pass Protokoll möchten zwei Personen ein Geheimnis austauschen, ohne dass ein Angreifer es aufdecken könnte. Man kann dafür eine sehr praktische Vorgehens- weise angeben: Zwei Personen, in der Kryptographie meist Alice und Bob genannt, wollen ein Geheimnis über einen gewöhnlichen, ver- schließbaren Koffer verschicken, an denen beide Schlösser mit eigenen Schlüsseln anbringen können. Alice steckt das Geheimnis in den Koffer und verschließt ihn mit ihrem eignen Schlüssel, den niemand anderer besitzt, nicht einmal Bob und schon gar nicht irgendein An- greifer. Sie gibt den Koffer zu Bob, der seinerseits den Koffer nochmal verschließt und an Alice zurückgibt. Jetzt hat Alice die Möglichkeit ihr eigenes Schloss zu öffnen, ohne dass der Koffer geöffnet werden kann, denn Bobs Schloss hängt ja noch dran. Schließlich gibt sie den Koffer wieder Bob, der ihn nun aufschließen kann und das Geheim- nis mit Alice teilt. Kein Angreifer hat jemals die Gelegenheit gehabt, einen unverschlossenen Koffer vorzufinden, der unterwegs war. Wenn man die Schlösser von Alice und Bob mit natürlichen Zahlen realisiert, so wählt Alice Zahlen m und m′ mit mm′ 1 mod p und Bob n und n′ mit ebenfalls nn′ 1 mod p. Dann≡ kann man das Protokoll dadurch realisieren, dass≡ zuerst Alice an Bob die Zahl gm schickt, dann Bob die Potenz (gm)n = gmn bildet und an Alice zurücksendet, die wiederum die m′–te Potenz bildet: ′ ′ (gmn)m = gmm n gn mod p. ≡ 72 Schließlich potenziert Bob diese Zahl nochmals mit der n′–ten Potenz und erhält ′ ′ (gn)n = gnn g mod p. ≡ Alice hat also erfolgreich das „Geheimnis” g an Bob geschickt. Unter- wegs tauchten die Zahlen gm, gmn und gn auf, aus denen man aber g nicht ohne großen Aufwand (Durchprobieren) erhalten kann. Mit ähnlichen Methoden kann man auch digitale Signaturen realisieren und die Wahrheit von Aussagen und die Echtheit von Signaturen kontrollieren, ohne die Inhalte zu sehen. Blockchains Die faszinierende neue Technologie von Blockchains basiert ebenfalls auf Hashfunktionen. Dabei werden kommerzielle Hashfunktionen wie SHA–256 oder dgl. benutzt, die sich allerdings sehr von den oben betrachteten Hashfunktionen unterscheiden. Blockchains wurden von Satoshi Nakamoto erfunden. Diese Name ist jedoch ein Pseudonym und man weiß nicht, wer sich dahinter verbirgt. In der Arbeit schreibt der Autor selbst: A purely peer-to-peer version of electronic cash would allow online payments to be sent directly from one party to another without going through a financi- al institution. Digital signatures provide part of the solution, but the main benefits are lost if a third party is still required to prevent double-spending. We propose a solution to the double-spending problem using a peer-to-peer network. The network ti- mestamps transactions by hashing them into an on- going chain of hash-based proof-of-work, forming a record that cannot be changed without redoing the proof-of-work.87 Eine Blockchain ist eine lange Liste von Einträgen, die finanzielle Transaktionen beschreiben. Der Witz dabei ist, dass jede Transak- tion mit den vergangenen Ereignissen verbunden ist, d.h. die Daten

73 vorangegangener Transaktionen und die Identität der Geschäftspart- ner sind in jedem Schritt in Form von Werten von Hashfunktionen erhalten. Es gibt keine Organisation wie eine Bank, die auf die Kor- rektheit der Geschäfte und die Abwehr von Angriﬀen achtet. Dies Rolle übernimmt ein „Proof of Work” oder „Proof of Stake” Konzept. Blockchains ﬁnden in Communities von Rechnern statt, die einem gemeinsamen Netz beitreten und jeweils eigene Identitäten in Form von public keys haben.

Transaction Transaction Transaction Owner 1’s public key Owner 2’s public key Owner 3’s public key

Hash Verify Hash Verify Hash

Owner 0’s signature Owner 1’s signature Owner 2’s signature Sign Sign Owner 1’s private key Owner 2’s private key Owner 3’s private key

Typisches Blockchain Ablaufschema

Wenn ein Teilnehmer eine Transaktion durchführen will, dann erfahren dies auch alle anderen Teilnehmer und sie können durch eine Rechnung am eigenen Computer eine Rechenaufgabe lösen, die aus einem Durchprobieren einer Art von Hashfunktion besteht. Der Teil- nehmer, der zuerst die Aufgabe löst, bekommt einen Anteil an der Transaktionsgebühr ab, zum Beispiel eine Kryptowährungen wie Bit- coins. Diese Leistung wird „Schürfen”, oder auch „Mining” genannt. Im Lauf der Zeit entsteht immer mehr von der Kryptowährung und die Rechenaufgabe wird immer schwerer. Bis zum Jahr 2140 dürfen bzw. können nach bisherigen Festlegungen nur 21 Millionen Bitcoins hergestellt werden. Der gegenwärtige Kurswert eines Bitcoins liegt in der Nähe von 10.000 Euro (Stand April 2020). Oft bekommt man die Frage gestellt, was der Gegenwert von Bitcoins und anderen Kryptowährungen ist, da sie letztlich nur als Daten vorliegen und der Energieeinsatz bei der Herstellung in Form von Wärme 74 verloren ging. Nun, die Antwort ist wie beim Bargeld. Vielleicht ent- sprach bei einer historischen Münze der Ausgabewert noch ungefähr dem Metallwert. Spätestens die Geldscheine haben aber diese Tradi- tion abgelöst und der Wert eines sorgfältig hergestellten und schwer zu fälschenden Scheins besteht darin, dass man mit ihm andere Dinge problemlos kaufen kann. Mit anderen Worten, der Wert des Geldes enspricht am Ende nur dem Vertrauen, das man damit verbindet. Genauso ist es mit den Bitcoins oder anderen Kryptowährungen. Faktorisierung und Quantencomputer Klassische digitale Computer rechnen mit Bits, das sind Elemente der Menge 0, 1 , eine Idee, die letztlich auf Leibniz zurückgeht. Sie berechnen Funktionen,{ } die Vektoren auf m Bits auf Vektoren aus n Bits abbilden: f : 0, 1 m 0, 1 n. { } −→ { } Solche Funktionen können praktisch beliebig sein. Jedoch mit die Be- rechnung durch Verwendung weniger, normierter sogenannter Gatter realisiert, die logische Operationen nachbilden. Die AND–, OR– und NOT–Gatter bilden dabei eine Erzeugendenmenge, aus denen jede andere Funktion f erzeugt werden kann. Alleine das NAND–Gatter reicht allerdings auch schon aus. Quantencomputer rechnen mit sogenannten q–bits und benutzen die Regeln der Quantenmechanik. Physikalische Zustände in der Quan- tenmechanik sind Elemente (Vektoren) in einem Hilbertraum endlicher oder unendlicher Dimension. Die zeitliche Dynamik von Pro- zessen der Quantenmechanik wird durch die Schrödingergleichung beschrieben. Aus der Theorie der Quantenmechanik folgt, dass die physikalisch zulässigen Operationen f, die zwischen solchen Hilber- täumen erfolgen können, entweder Projektionsabbildungen sind oder unitäre Operatoren. Projektionen entsprechen dabei Messungen im quantenmechanischen System. Ein einzelnes q–Bit ist ein Element eines ganz speziellen zweidimen- sionalen Hilbertraums, den wir mit H bezeichnen wollen. Die Basis

75 von H wird in der Physik gerne mit 0 , 1 | i | i bezeichnet. Ein Vektor in H wird durch eine Linearkombination α 0 + β 1 | i | i gegeben, wobei α und β komplexe Zahlen sind. Wenn man n solcher q–bits gemeinsam betrachten will, dann ist der geeignete Hilber- traum, der die Gesamtsituation beschreibt, das n–fache Tensorpro- dukt H⊗n = H H H . ⊗ ⊗···⊗ n Mal Diese Raum hat die Dimension 2n und eine Basis wird durch die Vektoren | {z } 00 ... 0 ,..., 11 ... 1 | i | i gegeben, die als Einträge binäre Strings der Länge n haben. Diese große Dimension ist der eigentliche Grund, warum Quantencomputer so leistungsfähig sein können. Die Zustände eines Quantencomputers, der mit n q–bits rechnet ist sind also Linearkombinationen der Form v = λ 00 ... 0 + + λ 11 ... 1 . 00...0| i ··· 11...1| i Ein Zustand v heisst „verschränkt”, falls er nicht als Tensorprodukt von Vektoren geschrieben werden kann, sondern eine Linearkombina- tion mit mindestens zwei Summanden notwendig ist. Verschränkung von Teilchen (wie Photonen, Ionen oder Elektronen) führ zu inter- essanten Phänomenen, die in der Quanteninformationstheorie ausge- nutzt werden, um zum Beispiel abhörsichere Übertragungskanäle zu schaﬀenund kryptographische Protokolle zu realisieren. Quantengatter sind die nötigen Gatter, die man in dem Kontext von Quantencomputern braucht. Anders als bei digitalen Computern sind dabei Gatter notwendig, die unitäre Operationen induzieren. Beispie- le für solche Gatter sind das Hadamardgatter und das CNOT–Gatter

76 (Controlled NOT): 1000 1 1 1 0100 ,   . √2 1 1 0001 − 0010   Peter Shor hat 1994 einen Algorithmus für Quantencomputer gefunden, der die Leistungsfähigkeit besonders hervorhebt, den Shor– Algorithmus. Dieser ist in der Lage, natürliche Zahlen in Primfak- toren zu zerlegen, sofern ein Quantencomputer weitgehend fehlerfrei mit einer hinreichend großen Zahl von q–bits rechnen kann. Shor hat diese Aufgabe gelöst, indem er die sogenannte Diskrete Fourier- transformation als Quantenalgorithmus umgesetzt hat und das Aus- lesen der Informationen, d.h. Koeffizienten in der Basisdarstellung in H⊗n, im Endzustand des Systems durch eine geschickte Mischung von quantenmechanischer Messung und Postprocessing mit Hilfe elementarer Zahlentheorie realisierte. Mathematische Physik Bernhard Riemann hat ein vergleichsweise kleines Oevre. Umso einflussreicher waren seine Arbeiten. Darunter ist die Formulierung der Riemannschen Vermutung in einer unveröffentlichten Arbeit mit weniger als sieben Seiten. Die Riemannsche Vermutung ist eine Aussage über die komplexwertige Riemannsche ζ–Funktion ∞ ζ(s)= n−s, s eine komplexe Zahl n=1 X und besagt, dass ihre Nullstellen neben den „trivialen” Nullstellen bei den negativen geraden Zahlen n = 2, 4, 6,... auf der Ge- 1 − − − rade mit Realteil Re(s) = 2 liegen. Diese Vermutung ist noch nicht bewiesen worden, obwohl es sehr viel Evidenz dafür gibt. Die Lage 1 dieser „nichttrivialen” Nullstellen auf Re(s) = 2 zu vermuten, war eine große Einsicht von Riemann. In der erwähnten kurzen Arbeit bewies er einen Zusammenhang der Lage der Nullstellen von ζ(s)

77 mit der Verteilung aller Primzahlen, indem er die Methode der Fou- rieranalyse auf die ζ–Funktion anwandte. Dies resultierte in einer analytischen Formel für die Anzahl π(x) aller Primzahlen unter einer Schranke x, die mit Hilfe der „nichttrivialen” Nullstellen ausgedrückt werden kann. Im Nachlass von Riemann hat man erst 1932 weitere Aufzeichnungen gefunden, unter anderem die Riemann–Siegel For- mel, mit der man Nullstellen der ζ–Funktion sehr genau berechnen kann. In seiner Habilschrift hat Riemann die mathematische Theorie der Mannigfaltigkeiten und ihrer differenzialgeometrischen Struktur entwickelt. Diese Theorie war enorm erfolgreich in der Folge und hat insbesondere in der Allgemeinen Relativitätstheorie zur Entdeckung der Einsteinschen Feldgleichungen beigetragen. Mannigfaltigkeiten sind – bildlich gesprochen – geometrische Räume mit guten Glattheitseigen- schaften. Insbesondere kann man in jedem Basispunkt einen Tangen- tialraum definieren. In der mathematische Physik wird der Begriff der Raum–Zeit auf solchen Mannigfaltigkeiten modelliert. Es ist üblich, dort eine Mannig- faltigkeit und ihre differentialgeometrische Struktur mit Hilfe von Ko- ordinaten zu beschreiben. Natürlich hängt die gesamte Physik, die beschrieben werden soll, nicht von den konkret gewählten Koordinaten ab. In der Physik heißt diese Eigenschaft „Kovarianz”. Noch genauer operiert auf jeder Mannigfaltigkeit Σ eine Gruppe von sogenannten Diffeomorphismen, die in der Physik manchmal auch Eichtransfor- mationen genannt werden. Die Kovarianz ist daher ein weiteres Bei- spiel dafür, dass mathematische Objekte nur bis auf Isomorphie bzw. Äquivalenz interessant sind. Die Idee der Kovarianz geht offenbar auf Leibniz zurück, der in seinem Briefwechsel mit Samuel Clarke aus den Jahren 1715–1716 die Struktur des physikalischen Raumes diskutiert hatte. Leibniz schrieb in einem Brief vom 25. Februar 1716: Was mich anbetrifft, so habe ich mehr als einmal betont, dass ich den Raum ebenso wie die Zeit für etwas rein Relatives gehalten, für eine Ordnung des

78 Miteinanders der Existenzen, so wie die Zeit eine Ordnung ihres Nacheinanders ist ... Ich habe mehrere Beweise, mit denen ich die Einbildung derer widerlegen kann, die den Raum für eine Substanz oder zumindest für ein absolut Seiendes halten.88 Im selben Brief erwog Leibniz die Möglichkeit einer Vertauschung der Himmelsrichtungen Osten und Westen im Raum und schrieb dann weiter: Aber wenn der Raum nichts anderes als diese Ord- nung oder Beziehung ist und wenn er ohne die Kör- per nichts als die Möglichkeit, sie zu plazieren, ist, dann sind diese beiden Zustände, nämlich der eine, so wie er wirklich ist, und der andere, der ganz umgekehrt angenommene, in nichts voneinander verschieden. Leibniz hat also seinen Raumbegriff mit dem Begriff der Identität bzw. Isomorphie in Verbindung gebracht. Albert Einstein hat das Prinzip der Kovarianz folgendermaßen formuliert: Die allgemeinen Naturgesetze sind durch Gleichun- gen auszudrücken, die für alle Koordinatensysteme gelten, d.h. die beliebigen Substitutionen gegenüber kovariant (allgemein kovariant) sind.89 Die Einsteinschen Feldgleichungen beschreiben die allgemeine Relati- vitätstheorie. Eine entscheidende Gleichung darunter beschreibt den Zusammenhang der Krümmungstensoren mit den Massenverhältnis- sen im Raum und lautet: 1 8πG R g R +Λg = T . µν − 2 µν µν c4 µν Die Relativitätstheorie hat in der gegenwärtigen GPS–Navigation eine Anwendung gefunden, die etwa 150 Jahre nach den Entdeckungen von Riemann liegt. Die Entfernungsberechnungen mit Hilfe der Funk- signale mehrerer Satelliten wären signifikant unpräzise, wenn man die

79 Gesetze der Relativitätstheorie bei der Ortsbestimmung nicht berück- sichtigen würde. Ein paar weitere Bemerkungen aus der Habilschrift von Riemann sind erwähnenswert. Im letzten Abschnitt schrieb er: Die Frage über die Gültigkeit der Voraussetzungen der Geometrie im Unendlichkleinen hängt zusammen mit der Frage nach dem innern Grunde der Massenverhältnisse im Raum. Bei dieser Frage, welche wohl noch zur Lehre vom Raume gerechnet werden darf, kommt die obige Bemerkung zur Anwen- dung, dass bei einer discreten Mannigfaltigkeit das Prinzip der Massenverhältnisse schon in dem Be- griffe dieser Mannigfaltigkeit einhalten ist, bei einer stetigen aber anders woher hinzukommen muss. Es muss also entweder das dem Raume zu Grun- de liegende Wirkliche eine discrete Mannigfaltigkeit bilden, oder der Grund der Massenverhältnisse ausserhalb, in darauf wirkenden bindenden Kräften, gesucht werden.90 Diese bemerkenswerten Sätze zeigen tiefe Einsichten in Bezug auf die mathematische Modellierung von Physik. Bis heute sind diskrete Raum–Zeit Modelle nicht in abschließender Weise gefunden worden und die stetige (d.h. differenzierbare) Raum–Zeit ist immer noch die dominierende Vorstellung, obwohl offenbar damit im Unendlichklei- nen Schwierigkeiten verbunden sind, wie Riemann bemerkte. Nur Ro- ger Penrose hat mit seiner Erfindung der Spinnetzwerke eine Grundla- ge dafür gelegt.91 Ein weiteres und eventuell damit zusammenhängen- des Desiderat in der mathematischen Physik ist die mathematische Grundlage der Quantenfeldtheorie, die bis heute nicht vollständig ge- klärt ist. Die Quantenfeldtheorie ist eine enorm erfolgreiche Theorie.

80 Das Standardmodell der Teilchenphysik, zusammen mit dem Higgs– Teilchen, ist experimentell höchst präzise verifiziert worden. Die Be- rechnungen der Feynmanamplituden, die zu Graphen des Standards- modells gehören, können dazu dienen, Wirkungsquerschnitte in Expe- rimenten zu berechnen und sind mit Hilfe von Methoden der Analy- sis und der algebraischen Geometrie erfolgreich berechenbar. Jedoch ist die Genese dieser Feynmanamplituden aus den Grundlagen der Quantenfeldtheorie noch mysteriös. Künstliche neuronale Netze und Deep Learning Künstliche Intelligenz ist ein Oberbegriff für viele Arten von Algo- rithmen, die ein menschenähnliches Verhalten simulieren oder Men- schen unterstützen und in vielen Fällen auch ersetzen können. Dieser Oberbegriff ist nicht ganz wohldefiniert und man kann sowohl Ma- schinen, wie zum Beispiel Roboter, als auch geeignete mathematische Algorithmen dazu zählen. Nach den Anfängen der Künstlichen Intelli- genz in den Zeiten von Alan Turing und Norbert Wiener hat es über viele Jahrzehnte zwar viele Ideen gegeben, aber es gab kaum Ent- wicklungen wirklich intelligenter Systeme. Jedoch sind in dieser Zeit viele nützliche Konzepte und Algorithmen entworfen worden. Darun- ter fallen statistische Lernalgorithmen wie der PAC–Lernalgorithmus von Leslie Valiant, Optimierungsalgorithmen diverser Art, genetische und evolutionäre Algorithmen und viele andere. Etwa seit dem Jahr 2006 sind enorme Durchbrüche in einem Bereich erzielt worden, den man heute Deep Learning oder etwas allgemeiner Maschinelles Ler- nen nennt. Das Deep Learning bezieht sich dabei ganz explizit auf das Trainieren von künstlichen neuronalen Netzen.92 Graphartige funktionale Netze kommen in der Natur vor. Bereits im 19. Jahrhundert konnte man Teile des Gehirns so genau sezieren, dass man verbundene Strukturen von Neuronen (Nervenzellen) und Gliazellen entdeckte, wobei sich die Neuronen über Synapsen austauschen und elektrische Aktivierung aufweisen können. Um 1943 wurde eine vereinfachtes mathematisches Modell dieses Systems in der Form

81 eines künstlichen neuronalen Netzes von Warren McCulloch und Wal- ter Pitts entworfen.93 Wie kann man damit rechnen? Ein künstliches neuronales Netz besteht aus einem endlichen gerichteten Graphen, der Eingabeknoten E•, Ausgabeknoten A•, Knoten von verborgenen Schichten V• und alle ihre Verbindungskanten symbolisiert.

E1 V1 E2 . . A1 E3 ...... A26 E 100. VN

Schematisches Modell eines künstlichen neuronalen Netzes.

Im folgenden Bild haben wir ein Beispiel illustriert, das die Buchsta- benerkennung beschreiben soll. Man kann ein solches Netz sehr gut darauf trainieren, in einem digitalen quadratischen Bild mit 10 10 Pixeln mit Grauwerten zwischen 0 (weiß) und 1 (schwarz) einen Buchstaben× (hier ein Y) zu erkennen. Die Eingaben bestehen aus den Grauwerten der 100 Pixel des Bildes, so dass der auf dem dargestellte Buchstabe an der Eingabe Ei einen Wert ei zwischen 0 (weiß) und 1 (schwarz) liefert. Die verborgenen Schichten des Netzes werden durch die Knoten V1,...,VN symbolisiert, wobei N eine Anzahl ist, die man beim Design des Netzes wählen muss. Es kann mehr als eine verborgene Schicht geben. Die Ausgabewerte sind Vektoren mit 26 Komponenten, die den Buchsta- ben des Alphabets entsprechen. Wichtig ist die folgende „Feedforward” Struktur im Netz. Die Über- gänge zwischen den Knoten E1,...,E100 und der nächsten Schicht 82 10 10 Array von Grauwertpixeln. ×

V1,...,VN werden für jedes i zwischen 1 und N durch Formeln v = σ(L b ) i i − i realisiert, wobei Li eine geeignete Funktion ist. Im einfachsten Fall kann Li eine lineare Funktion L = L (e ,...,e )= w e + + w e i i 1 100 i1 1 ··· i100 100 sein, wobei die Koeﬃzienten wij positive oder negative rationale Zah- len sind, bi ein ein (rationaler) Schwellwert und σ eine nichtlineare Abschneidefunktionen der Form 0 für x 0, σ(x) = max(x, 0) = ≤ x für x 0. ( ≥ Es gibt aber davon abweichende nichtlineare Wahlmöglichkeiten für Li, die in gewissen Fällen besser sein können. Neben diesem einfachen Fall gibt es auch sogenannte „rekurrente Netze”, bei denen auch Kanten rückwärts Informationen weitergeben. Analoge Formeln gelten für die Übergänge in den verborgenen Schich- ten und beim letzten Schritt zu A1,...,A26. Es gibt Netze, bei denen zwischen den Schichten ausnahmslos alle Übergänge betrachtet werden, aber auch solche, bei denen auf kluge Art und Weise „Filter” in manchen Schichten beutzt werden. Diese letzteren Netze werden

83 ConvNets (Convolutional Neural Nets) genannt. Besonders bei der Bildverarbeitung sind sie sehr effektiv, denn es werden dort kleinere Bildausschnitte in gewissen Schichten einzeln betrachtet und dann in weiteren Schichten wieder zusammengefasst und mit anderen Tei- len der Bilder verglichen, wie es bei beweglichen Objekten, wie bei Tieren und dgl., natürlich sehr sinnvoll ist. Solche Filter können fle- xibel durch das Training erzeugt werden aufgrund von vorhandenen Farben oder Kanten im Bild. Am Anfang des Trainings werden die Gewichte und die Schwellwerte mehr oder weniger zufällig festgelegt. Das Netz, in Form der Ge- wichte und Schwellwerte, wird dann durch Eingabedaten „trainiert”, indem für jedes eingegebene Bild eine „Kostenfunktion” K(w, b) in Abhängigkeit der Gewichte und Schwellwerte berechnet wird, die im einfachsten Fall aus der Summe der Quadrate der Abweichungen der Ausgabewerte (a1,...,a26) von dem Wert, der durch den tatsächli- chen Buchstaben auf dem Bild repräsentiert wird, besteht. Die suk- zessive Anpassung der Gewichte wi auf den Verbindungsstrecken und der Schwellwerte b erfolgt dadurch, dass die Kostenfunktion K(w, b) langsam minimiert wird. Diese Methode nennt man Rückwärtspro- pagation. Mathematisch gesehen besteht dieser Vorgang aus einem (negativen) Gradientenabstieg, ähnlich der Art und Weise, wie man möglichst schnell von einem Berg absteigt, indem man immer entgegen der Richtung der stärksten Steigung hinuntergeht. Auf diese Weise gelangt man zu einem lokalen Minimum der Kostenfunktion und kann hoffen, dass man damit dem Ziel näher ist. Damit man bei dieser Methode nicht in unsinnigen und realitätsfernen lokalen Minima der Kostenfunktion gefangen wird, die der Lösung des Pro- blems nicht nahekommen, wird der Gradientenabstieg meist stochastisch gemacht, d.h. der Gradient wird aus einer endlichen Anzahl von Stichproben gemittelt. Alternativ gibt es auch die Methode der genetischen Algorithmen, mit der man unsinnige lokale Minima durch „evolutionäre” Sprünge in den Parametern vermeidet. Durch die Eingabe großer Datenmengen kann das Netz so lange an- gepasst werden, bis es die Gewichte und Schwellwerte so abgeändert

84 hat, dass es aus beliebigen neuen Daten mit sehr großer Wahrschein- lichkeit diejenigen Eigenschaften ablesen kann, die das System dann zur Erkennung von strukturellen Mustern befähigen. Damit wird das System zu einem guten Prädiktor für gewisse Probleme. Im Grunde besteht die Methode des Deep Learning also darin, aus einem sehr hochdimensionalen Problem eine Reduktion (bzw. ein Fitting) auf wenige „essentielle” Parameter zu machen, wobei die „richtige” Re- duktion durch das Training mittels Approximation gefunden wird. Man weiß nicht genau, warum diese Methode so erfolgreich ist, wie sie in vielen Fällen ist. Dafür fehlt noch ein echter mathematischer Beweis. Weiterentwicklungen der künstlichen Intelligenz Es gibt einige grundsätzliche Probleme und Fehlerquellen der künstli- chen Intelligenz, die zuweilen übersehen werden. Dazu gehört erstens das Problem des sogenannten „Overfitting”. Dies tritt zum Beispiel auf, wenn man dem System zu wenige Daten gibt, was leider in vielen Anwendungssituationen passiert. In diesem Fall passt sich der Algo- rithmus aufgrund der vielen möglichen Freiheitsgrade so optimal an die gegebenen wenigen Fälle an, dass er in den vorgegebenen Fällen perfekt entscheiden kann, aber unter Umständen in vielen anderen Fällen völlig falsche Ergebnisse produziert. Das Problem des Over- fitting tritt beim Deep Learning seltsamerweise nicht oft auf. Die Absenz dieses Phänomens sind noch recht unverstanden und können genausowenig wie der Erfolg des Deep Learning mit mathematischen Methoden noch nicht gut erklärt werden. Ein zweites Problem ist, dass Teile des Algorithmus stochastisch sind und sehr von den Einga- bedaten abhängen und außerdem die Ergebnisse wenig Rückschlüsse zulassen auf das eigentliche Problem. Man bekommt also Lösungen (sogenannte Prädiktoren), die einen unerwünschten Bias aufweisen, schlichtweg falsche Lösungen oder solche, für die man keine vernünf- tige Erklärung besitzt und die somit unter Umständen zu wenig Ak- zeptanz finden bei betroffenen Personen. Die Forschung zu diesem Problem ist allerdings sehr aktiv und sollte am Ende zu gewissen

85 Konfidenzbereichen für „gute” Lösungen führen. Ein drittes Problem ist, dass es auch für das Deep Learning unentscheidbare Probleme gibt, ebenso wie für gewöhnliche Turingmaschinen.94 Kritik an der künstlichen Intelligenz wird nicht nur bezüglich ihrer innermathematischen Struktur geübt. Die größte Gefahr geht vermutlich von falschen Anwendungen aus, die durch Unkenntnis der Fallstricke der Methoden entstehen. Aus diesen Gründen ist es notwendig, die künstliche Intelligenz weiterzuentwickeln. Ein wichtiger Aspekt davon ist die Erforschung des Lernens an und für sich. Lernen steht hier als Oberbegriff für die Erkundung von Strukturen. Zum Beispiel ist das Deep Learning nur eine Form der Strukturerkennung. Ganz allgemein sind Lernen und Strukturerkennung auf gewisse Weise identische Begriffe, denn wer lernt erfasst Strukturen und wer Strukturen erkennt, der lernt. Diese Frage ist viel allgemeiner als die Methode des Deep Learning und umfasst viele weitere bereits entdeckte Algorithmen. Auf diesem Gebiet ist aber noch viel Potenzial für neue Entdeckungen. Ist künstliche Intelligenz wirklich eine Form der Intelligenz? Dies ist eine schwierige Frage. Einerseits ist künstliche Intelligenz zumindest in der Form des Deep Learning eine Methode, die aus sehr komplexen Problemen und großen Datenvorkommen Schlussfolgerungen ziehen kann, d.h. eine Reduktion der Komplexität und ein Verständ- nis in Form von Prädiktoren erzielen kann. Besonders in den Anfän- gen des Deep Learning hat man herausgefunden, dass die Systeme auch ziemlich idiotische Prädiktoren lernen. Zum Beispiel haben Bil- derkennungsmethoden beim Erkunden von selbstfahrenden Autos oft den Strassenrand nur erkannt, wenn er grün war, wie in den meisten Beispielbildern oder bestimmte Automarken wurden nur durch den Schnee auf dem Bild erkannt, weil die Werbung der Marke oft damit spielte. Diese Beispiele sind natürlich extrem, aber unsere For- schung kann bis dato noch schlecht beurteilen, wann Vorhersagen des Deep Learning „intelligent” sind und wann nicht. Die menschliche Intelligenz ist sicherlich auch in der Lage, sich in sehr komplexen

86 Situationen zurechtzufinden und gute Entscheidungen zu treffen. Je- doch scheint unsere Intelligenz noch mehr Eigenschaften zu besitzen als nur die Fähigkeit zur Reduktion von Komplexitäten in besonders komplizierten Situationen. Viele Sätze der Mathematik oder andere Entdeckungen in den Wissenschaften sind ebenfalls Leistungen der menschlichen Intelligenz, die damit jedenfalls nicht erklärbar sind. Damit will ich aber nicht sagen, dass all diese Lücken nicht geschlos- sen werden kann. Wir wissen es alle noch nicht. Es bleibt also noch viel zu tun in diesem Gebiet der künstlichen Intelligenz, damit erstens die Methoden weiter verbessert werden und auch zum Wohl des Menschen genutzt werden können und nicht mehr Schaden als Nut- zen anrichten. Das muss man als Mathematiker besonders deutlich sagen. Topologische Datenanalyse in der Bioinformatik Die Lebenswissenschaften wenden zunehmend Methoden aus der Ma- thematik und Informatik an. Dabei ist die Fülle von Daten, die aus Gensequenzen von Organismen, aus molekularen Daten, aus Bildda- ten bei hochauflösenden Bildgebungsverfahren, aus Konfigurationen von neuronalen Netzen in Modellorganismen oder aus anderen Ver- fahren entstehen können, enorm und nur mit raffinierten Methoden in den Griff zu bekommen. Wir wollen hier auf das Problem der Da- tenanalyse eingehen, dass man mit mathematischen Methoden aus der algebraischen Topologie angehen kann. Mathematisch gesehen geht es dabei darum, aus einer großen Men- ge von diskreten Datenpunkten in einem hochdimensionalen Raum ein „geometrisches Muster” zu erkennen. Nun sind topologische Räu- me und ihre Invarianten gerade die Objekte, die man erkennen will. In diesen Anwendungen sind große Ansammlungen von Datenpunk- ten mit einem gegebenen Abstandsbegriff relevant, der auch Metrik genannt wird. Ein solcher Abstandsbegriff kann in unterschiedlichen

87 Problemen der Lebenswissenschaften jeweils verschieden sein. Bei genetischen Daten könnte dies der Hamming-Abstand zwischen kombi- natorischen genetischen Sequenzen sein, bei neuronalen Netzen ergibt der Kehrwert der Stärke der synaptischen Verbindungen eine Metrik. Es gibt neuartige Methoden, um aus Datenpunktwolken topologische Informationen zu gewinnen. Sie wird persistente Homologie oder topologische Datenanalyse genannt. Dazu verwendet man die metrische Struktur auf dem Raum der Daten, um einen Kettenkomplex zu definieren. Es gibt zwei populäre Methoden, erstens den sogenannten Vietoris–Rips Komplex und zweitens den Čech–Komplex. Wir betrachten zuerst den Vietoris–Rips Komplex. Wenn man alle Punkte betrachtet, die „nahe” an einem festen Datenpunkt P sind, so erhält man metrische Kugeln U = UP,ε mit Radius ε> 0 um den Punkt P . Man kann nun zwei Punkte P und Q durch eine Kante verbinden, wenn ihr Abstand echt kleiner als ε ist, d.h. wenn Q in UP,ε enthalten ist. Gegeben drei Punkte P , Q und R, so definiert man im Vietoris–Rips Fall einen 2–Simplex, falls die drei Punkte alle untereinander einen Abstand kleiner als ε besitzen, d.h. wenn jeder Punkt in der ε–Kugel der beiden anderen liegt. Im Fall des Čech–Komplex definiert man einen k–Simplex für k +1 paarweise verschiedene Punkte P1,...,Pk+1, falls der Durchschnitt U U = P1,ε ∩···∩ Pk+1,ε 6 ∅ nicht die leere Menge ist. Auf beide Weisen bekommt man für jedes ε eine simpliziale Menge V (ε)•, d.h. eine Kollektion von abelschen Gruppen V (ε)n für jedes n N und jedes ε> 0. Der zugeordnete Komplex abelscher Gruppen ∈ ZV (ε)• nennt man den Vietoris–Rips Komplex oder Čech–Komplex. Die persistente Homologie entsteht, wenn man die Homologie der Komplexe ZV (ε)• berechnet und untersucht, welche Homologiegrup- pen bzw. Bettizahlen diese Komplexe haben, wenn man ε variiert. Diese Bettizahlen bn = bn(ε) können durch Methoden der linearen Algebra berechnet werden. Man trägt diese Bettizahlen in Abhängig- keit von ε gerne in einer Tabelle auf, was man aus offensichtlichen Gründen auch „Barcodes” nennt. Die persistente Homologie ist dann 88 ...... ε

Persistente Simplices bei wachsendem ε für eine kreis- förmige Punktwolke. Die Bettizahlen b0 und b1 stabili- sieren sich ab dem dritten Bild zu 1. das Ergebnis aller „Barcodes”, die über längere Strecken auftreten (siehe Figur). Man kann auch diese „Barcodes” effizient berechnen, auch wenn der Aufwand stark anwächst. Wenn man über diese Methode etwas reflektiert, dann sieht man, dass hier die Homologie von filtrierten Komplexen berechnet wird, die über den Parameter ε filtriert sind. Dies ist eine neuartige mathematische Theorie, die auch innermathematisch interessante Entwicklungen ver- spricht. Die topologische Datenanalyse hat bereits viele interessante Anwendungen in den Lebenswissenschaften gezeigt, zum Beispiel in der Onkologie, jedoch bleibt abzuwarten, wie erfolgreich sie ist. Herausforderungen für die Mathematik Moderne Wissenschaften werden immer interdisziplinärer. Das ist keine Modeerscheinung, sondern entsteht aus der Notwendigkeit, immer komplexere Systeme und Phänomene zu erforschen. Das gilt in den Natur– und Lebenswissenschaften, aber auch in den Geistes–, Kultur– und Sozialwissenschaften. Warum ist das so? Die reinen Disziplinen in den Wissenschaften erzeugen historisch be- dingt sehr fundamentale Annahmen und ihre Ergebnisse sind häufig stark auf die Theorien bezogen. Wenn es an Anwendungen geht, dann sind die einzelnen Disziplinen bei komplexen Fragestellungen nicht mehr alleine kompetent. Man muss sich immer öfter zusammentun, um gewisse Fragen anzugehen und dazu Methoden zu finden. Ein gutes Beispiel sind komplexe Systeme, wie sie dem Leben zugrundeliegen. Es reicht nicht die biologischen und chemischen Grundlagen

89 der Zellen und Gene zu verstehen, sondern das Zusammenspiel dieser Grundlagen aus den beiden Naturwissenschaften muss durch Metho- den der Mathematik, Informatik und Physik ergänzt werden. Man braucht dazu Forscher, die von sich aus interdisziplinär forschen wollen und die Umgangssprache mehrerer Fachdisziplinen beherrschen. Nur wenige Gebiete wie die Mathematik und die Physik werden in Teilen noch viele Jahre grundlagenorientiert arbeiten können. Gleich- zeitig spielen aber die Physik und die Mathematik, zusammen mit der Informatik, bei fast allen interdisziplinären Forschungsprojekten eine wichtige Rolle. Für die Mathematik bildet dies eine spannende Herausforderung, die aber auch neue Impulse mit sich bringt. Ein besonderer Aspekt komplexer Systeme ist, dass an räumlichen und zeitlichen Schnittstellen unterschiedliche Phänomene aufeinan- dertreffen. Das können physikalische Grenzflächen sein, an denen Ma- terialien unterschiedlicher Qualität zusammenstoßen. Ein gutes Bei- spiel dafür sind Luftschichten in der Meteorologie. Auch wenn man in jeder Schicht die vorkommenden Differentialgleichungen gut lösen kann und man damit die Dynamik versteht, dann muss man noch den Grenzübergang verstehen und modellieren. Man spricht dabei von Multiskalenmethoden. Herausforderungen dabei sind die enorme Komplexität der Rechnungen, bei denen sogar High Performance Computer überfordert sind und man auf Tricks wie das „Coarse Grai- ning” zurückgreifen muss. Eine weitere große Herausforderung besteht in der Anwendung von Technologien in verteilten Systemen. Man denke dabei an Transaktio- nen und Kommunikation im Bereich Mobilität, Energie und Gesund- heit. Dabei sind Anforderungen wie Transparenz, Sicherheit und Pri- vatheit gleichzeitig zu erfüllen. Mit geeigneten mathematischen Pro- tokollen lässt sich dies realisieren. Die Optimierung der Möglichkeiten solcher Anwendungen ist noch nicht abgeschlossen. Kryptowährungen aus Blockchains zum Beispiel sind aufgrund des Rechenaufwands und des damit verbundenen Verbrauchs von Energie nicht mehr zeitge- mäß. Nachfolger sind bereits auf dem Weg in Form besser geeigneter Distributed Ledger Techniken, die Blockchains verallgemeinern und

90 die entsprechenden Kryptowährungen bzw. andere dezentrale Kon- sensprotokolle. Häuﬁg werden bei diesen Techniken die Bäume aus den Blockchains durch gerichtete Graphen ersetzt. Jede Transaktion beinhaltet eine Bestätigung von anderen Transaktionen im Netzwerk im Verlauf des Transaktionsprotokolls, wodurch der Konsens hergestellt wird. Komplexe und verteilte Systeme sind nur zwei bedeutende Beispiele. Es gibt viele andere. Mathematik ist heute eine der wichtigsten Wis- senschaften geworden, da sie die grundlegende Sprache der meisten Wissenschaften darstellt und mit Hilfe der Informatik in allen inter- disziplinären Projekten abstrakte Modelle für Systeme liefern und berechnen kann. Um dieser Rolle gerecht zu werden, müssen die Mathematiker begreifen, dass ihre Wissenschaft sich zu einer fundamentalen „Wis- senschaft der Systeme” entwickelt, die universelle Modelle entwickelt und im Mittelpunkt vieler Forschungen steht.95 Es ist ein Irrtum zu glauben, dass viele moderne Phänomene wie der Klimawandel oder die vermeintliche Unberechenbarkeit von seltenen Ereignissen in der Natur oder an der Börse, mathematisch nicht mehr greifbar sind. Dies erfordert auch, bessere und leichtere Zugänge zur Mathematik zu ﬁnden und die Verbreitung damit zu unterstützen. Das falsche Vorurteil, dass Mathematik nur quantitatives Verständnis aufzeigen kann, ist vielleicht die größte Obstruktion bei diesem Prozess der Wissenschaftskommunikation.

KAPITEL 5

Berechenbarkeit und Entscheidbarkeit

In diesem Kapitel kommen wir zum Begriff der Berechenbarkeit. Ma- thematisch gesehen kann man sich dabei auf Funktionen von N nach N beschränken. Ein Beispiel für eine berechenbare Funktion ist eine rekursiv definierte Funktion wie die Fakultätsfunktion. Die Idee der Rekursion ist sehr alt und es stellt sich heraus, dass berechenbare Funktionen im Wesentlichen mittels Rekursion und einem Suchoperator aus elementaren Funktionen konstruiert werden kön- nen. In den 1930er Jahren wurden verschiedene Berechenbarkeitsmo- delle entwickelt, die sich alle als gleichwertig herausstellten. Daraus leitete sich die Churchsche These ab, also die Frage, ob jeder Bere- chenbarkeitsbegriff mit den bereits gefundenen übereinstimmt, oder ob es darüber hinaus stärkere Berechenbarkeitsmodelle gibt, die man physikalisch realisieren kann. Bis heute sind alle solchen Versuche, die gerne als Hypercomputing bezeichnet werden, fehlgeschlagen. Die Methode der Rekursion Richard Dedekind hat mit seinen Büchern „Stetigkeit und Irrational- zahlen”96 und „Was sind und was sollen die Zahlen?” den Aufbau des Zahlsystems in der Mathematik auf ein solides Fundament gestellt. Insbesondere hat er Axiome für die natürlichen Zahlen aufgestellt und die ganzen, rationalen und reellen Zahlen daraus definiert. Für die natürlichen Zahlen hat er den Rekursionssatz bewiesen. Dieser Satz besagt, dass man jede Abbildung f von der Menge der natürli- chen Zahlen in eine beliebige andere Menge konstruieren kann, indem man das Bild von 0 festlegt und eine Vorschrift, wie man für jedes n> 0 den Wert von f(n) aus f(m) für ein m < n gewinnen kann.

93 Wir haben die Methode der Rekursion im Grunde bereits in Form des euklidischen Algorithmus gesehen, bei dem im entscheidenden Schritt dieses Algorithmus das Problem auf kleiner werdende Zahlen zurück- geführt wird. Ein anderes schönes Beispiel dafür ist die Berechnung der Fakultätsfunktion, die durch die Formel f(n)= n! := 1 2 (n 1) n · ··· − · definiert ist. Bei dieser Funktion gilt offenbar f(1) = 1 und f(n)= n f(n 1). · − Die Berechnung der Funktion f am Argument n benutzt also einfach das Produkt von n mit dem Wert der Funktion am Argument n 1. Ein solcher Aufruf eines Funktionswertes an einem kleineren Argu-− ment wird rekursive Definition genannt. In den meisten Program- miersprachen kann man rekursive Programme schreiben, so dass die Definition der Fakultätsfunktion im Wesentlichen die Zeile return n f(n 1) ∗ − enthält, d.h. die Funktion f ruft sich selbst im Programmiercode auf. Zur besseren Illustration des Prinzips der Rekursion wollen wir auch noch das ganz anschauliche und auf den ersten Blick unmathemati- sche Beispiel der Türme von Hanoi geben. Es sind drei Stäbe und n gelochte Scheiben gegeben, die am ersten Stab aufeinander liegen. Die Aufgabe besteht darin, dass man die Scheiben des Turms nacheinan- der auf einem der beiden anderen Stäbe stapelt, so dass niemals eine größere Scheibe auf einer kleineren liegt. Der dritte Stab darf als Hilfe benutzt werden. Wir nennen die Lösung L = L(n) für n Scheiben. Die Lösungsstrategie L(n) besteht darin, die obersten n 1 Scheiben auf dem Hilfsstapel mit Hilfe der Lösungsstrategie L(n− 1) abzu- legen, dann die größte Scheibe auf den dritten Stab abzulege− n und dann nochmals die Lösungsstrategie L(n 1) anzuwenden, um die Scheiben auf dem Hilfsstab zum dritten Stab− zu transportieren. Die Abbildung illustriert den Fall n =4. Bei der Lösung für n Scheiben wird also zweimal die Lösung für n 1 angewandt und die größte Scheibe bewegt. Zur vollständigen Lösung−

94 Rekursive Lösung im Fall n =4. müssen somit 1+2(1+2(1+ ...)...)=1+2+4+8+ +2n−1 =2n 1 ··· − Scheiben bewegt werden und man kann sogar zeigen, dass es mit weniger Bewegungen nicht funktioniert. Dedekind zeigte mit dem Rekursionssatz, dass die natürlichen Zahlen eindeutig bis auf Isomorphie sind. Er verwendete jedoch Quantoren über alle Teilmengen der natürlichen Zahlen, so dass er in moderner Sicht die Prädikatenlogik zweiter Stufe in seinen Beweisen zugrundelegte. Thoralf Skolem hat später gezeigt, dass in der Prädikatenlogik erster Stufe (viele) sogenannte Nichtstandardmodelle der natürlichen Zahlen existieren, die ganz andere Eigenschaften haben als wir üb- licherweise annehmen. Die Skolemsche ausschließliche Verwendung von Logik erster Stufe wurde nach einiger Zeit ein vorherrschender Standard. Dedekinds Herangehensweise an die Mathematik kann man als den Beginn des Strukturalismus sehen, einer mathematik–philosophischen Sichtweise. Er benutzte den Abbildungsbegriﬀ in einem modernen 95 Sinne und nahm damit die Entstehung der Kategorientheorie im 20. Jahrhundert voraus, die die Struktureigenschaften der mathematischen Objekte mehr betont als die Objekte selbst, die austauschbar sind. Darauf werden wir noch ausführlich eingehen. Rekursive Berechnungen und Beweise mit vollständiger Induktion sind bereits vor Dedekind bekannt gewesen, zum Beispiel bei Fran- ziskus Maurolicus, Blaise Pascal und Jakob Bernoulli. In England hatte Charles Babbage zusammen mit Lady Ada Lovelace den Bau einer Rechenmaschine geplant und dazu rekursive Berechnungen von Bernoullizahlen als den ersten darauf zu realisierenden Algorithmus vorgesehen. Auch Herbert Grassmann, Charles S. Peirce und Giusep- pe Peano haben die Axiome der natürlichen Zahlen betrachtet, ohne aber den Rekursionssatz ganz zur Verfügung zu haben. Zwischen 1900 und 1930 wurde die von Dedekind streng begründete Rekursi- onstheorie langsam weiterentwickelt und es entstand eine Theorie der primitiv rekursiven Funktionen, die man in den Arbeiten von David Hilbert, Thoralf Skolem, Rósza Péter und anderen ﬁnden kann. Primitiv rekursive Funktionen entstehen aus elementaren Funktionen (wie Konstanten und Projektion) durch Anwendung der Rekursions- regel f(0,y)= g(y), f(x +1,y)= h(f(x, y),x,y), wobei g und h ebenfalls primitiv rekursive Funktionen sind.97 Mit anderen Worten sind die primitiv rekursiven Funktionen die kleinste Klasse, die elementare Funktionen enthält und unter der Rekursions- regel abgeschlossen ist. Man kann leicht einsehen, dass sehr viele elementare Funktionen primitiv rekursiv sind. Erstaunlicherweise ist auch die Funktion

f(n)= pn (die n-te Primzahl) eine primitiv rekursive Funktion. Am Beispiel der Rekursionstheorie und in den Anfängen der beweis- theoretischen Arbeiten von Hilbert sieht man sehr gut, wie eng Be- weistheorie und Berechenbarkeitstheorie zusammenhängen. 96 Wilhelm Ackermann und Rósza Péter haben sich mit Funktionen auseinandergesetzt, die berechenbar aber nicht primitiv rekursiv sind. Dazu gehört die Ackermann–Péter Funktion A(m, n), die in der Dar- stellung von Péter von 1935 gegeben ist durch A(0, n)= n +1 A(m +1, 0) = A(m, 1) A(m +1, n +1)= A(m, A(m +1, n)). Diese Funktion ist nicht primitiv rekursiv, weil ihr Wachstum stärker ist als jeder primitiv rekursive Funktion. Man kann grundsätzlich berechenbare Funktionen durch Ordinalzahlen mittels der Löb–Wainer Hierarchie klassifizieren, die ihr Wachstum messen. Dabei wird die Ackermann–Péter Funktion A durch die Ordinalzahl ω charakterisiert. Die Entdeckung sehr stark wachsender Funktionen geht bereits auf Hardy zurück. Gödel hat diese Art der Charakterisierung in seinem berühmten System T benutzt, um die Widerspruchsfreiheit der Dedekind–Peano Arithmetik zu studieren. Die Theorie der Berechenbarkeit Die ersten genuin mathematisch–theoretischen Modelle für den Leib- nizschen Berechenbarkeitsbegriff wurden um 1910 von Axel Thue erfunden und werden heute Thuesysteme98 genannt. Thues Standpunkt war, dass jede Form der Berechnung oder des Beweises als Folge von Termersetzungen entsteht. Seine Ideen hatten später enormen Ein- fluss auch außerhalb der Mathematik und Informatik in der Linguis- tik durch Noam Chomsky und Richard Montague. Nachdem Kurt Gödel und Jaques Herbrand sich bereits vor 1931 in ihrem Briefwechsel mit einer Verallgemeinerung der primitiv rekursiven Funktionen beschäftigt hatten, brachte das Annus Mirabilis 1936 eine bemerkenswerte Situation, in die mehrere Personen verwickelt waren: Zum einen wurde das Konzept der Turingmaschine und damit der Begriff der Turingberechenbarkeit von Alan Turing erfunden. In der Figur wird die Funktionsweise einer Turingmaschine skizziert. Die mit „Programm” beschriftete Einheit enthält alle Vorschriften,

97 Band ...... Lese–/Schreibkopf Programm wie aus den Zuständen und den Beschriftungen des Bandes mit einem Alphabet weiterverfahren wird, d.h. wie das Band beschriftet wird und wie sich der Lese–/Schreibkopf weiterbewegt. Turing erkannte auch, dass universelle Turingmaschinen existieren, die jede andere Turingmaschine simulieren können. Damit war zumindest theoretisch das Konzept eines programmierbaren Computers geboren. Emil Post, der Thues Arbeiten kannte, erfand ebenfalls eine mathematische Theorie von Automaten, die den Thuesystemen und den Turingmaschinen ähneln. Alonzo Church begründete den λ–Kalkül – eine dritte alternative Berechenbarkeitstheorie und heute die Grundlage funktionaler Pro- grammiersprachen – und erfand eine Typentheorie, die „Simple Theo- ry of Types” genannt wird. Schließlich deﬁnierte Stephen C. Kleene die rekursiven Funktionen (alias µ–rekursive Funktionen) als Erweiterung der primitiv rekursiven Funktionen und zeigte die Äquivalenz all dieser vier Deﬁnitio- nen.99 Dazu benutzte er den µ–Operator µ(k< , f(k)=0), ∞ auch unbeschränkter Suchoperator genannt, der die kleinste Nullstel- le k der (rekursiven) Funktion f(k) sucht. Diesen Operator kann man in Programmiersprachen mit Hilfe von WHILE–Schleifen schreiben. Auch Nullstellen von Ausdrücken in mehreren Variablen, zum Bei- spiel von diophantischen Gleichungen wie x2 y3 =1, − kann man durch verschachtelte Anwendung des µ– bzw. WHILE– Operators berechnen. In diesem Beispiel sucht man am besten auf

98 allen Geraden der Form x + y = n, wobei n alle natürlichen Zahlen durchläuft. Es gibt nur die Lösung (x, y)=(3, 2), wenn man sich auf positive ganze Zahlen x, y beschränkt. Die sogenannte Churchsche These, die auf Alonzo Church zurück- geht, besagt, dass alle überhaupt möglichen realistischen Berechen- barkeitsmodelle immer zu jeder von diesen vier Modellen von Church, Kleene, Post und Turing äquivalent sind. Diese These wurde vielfach bestätigt, gilt jedoch als unbeweisbar. Man sollte die Begriffe Algorithmus und Berechenbarkeitsmodell unterscheiden. Alle Berechenbarkeitsmodelle können in deterministischer oder in nichtdeterministischer Form auftreten. Klassische Bere- chenbarkeitsmodelle sind die theoretischen Turingmaschinen, die sich in praktischer Form als digitale Computer manifestieren. Meist wird dies durch die von Neumann Architektur realisiert, mittels der die meisten modernen Computer gebaut sind. Varianten der Turingma- schinen sind Automaten, die auf Emil Post zurückgehen, oder Ter- mersetzungsmodelle nach Axel Thue sowie die Registermaschinen. Daneben gibt es aber weitere Berechenbarkeitsmodelle. Künstliche neuronale Netze, ebenso wie die bislang noch fiktiven Quantencom- puter, sind gegenwärtig sehr populäre Berechenbarkeitsmodelle. Bei- de Modelle erfüllen die Churchsche These, denn Quantencomputer und neuronale Netze können immer durch Turingmaschinen simu- liert werden, wobei bei Quantencomputern ein exponentieller Over- head zu bezahlen ist. Künstliche neuronale Netze erfüllen die Church- sche These zumindest, falls die Synapsengewichte rationale oder berechenbare Zahlen sind. Eine Widerlegung der Churchschen These wäre nur durch neue und leistungsfähigere Berechenbarkeitsmodelle möglich. Auf solche alternativen Berechenbarkeitsmodelle werden wir noch eingehen. Die zu Berechenbarkeitsmodellen gehörenden Algorithmen werden oft in einer Weise klassifiziert, die teilweise an die Berechenbarkeitsmo- delle erinnern. Man spricht von deterministischen, nichtdeterministischen, stochastischen und quantenmechanischen Algorithmen.

99 Beispiel von stochastischen Algorithmen – auch randomisierte oder probabilistische Algorithmen genannt – sind Las–Vegas Algorithmen und Monte–Carlo Algorithmen. Ein Beispiel dafür ist die Monte– Carlo Integration, bei der hochdimensionale Integrale durch zufäl- lige Wahl von Stützstellen näherungsweise ausgewertet werden. Die Auswahl der Stützstellen spielt dabei eine besondere Rolle, denn sie bestimmt das Konvergenzverhalten der Näherung. Stochastische Al- gorithmen sind oft eﬃzienter als deterministische Algorithmen. Ein Beispiel dafür sind Primzahltests. So ist der AKS Primzahltest ein deterministischer Test, der beweisbar in Polynomzeit abläuft. Jedoch sind probabilistische Primzahltests wie der Miller–Rabin Test oder der Solovay–Strassen Test in der Praxis viel schneller als der AKS Test, obwohl sie nicht beweisbar in Polynomzeit ablaufen. Beispiele für quantenmechanische Algorithmen sind der Shor Algo- rithmus von Peter Shor für die Faktorisierung von natürlichen Zahlen, der Deutsch–Jozsa Algorithmus und der Groversche Suchalgorithmus. Nichtdeterministische Algorithmen werden durch nichtdeterministische Turingmaschinen in der Theorie repräsentiert, was der Existenz eines Orakels im Konzept der Turingmaschine entspricht. Man kann Algorithmen auch nach Verfahren oder Zielsetzungen klas- siﬁzieren. So gibt es Optimierungsalgorithmen, evolutionäre Algorith- men und probabilistische Algorithmen. Ganz konkrete Ziele werden durch Sortier– und Suchalgorithmen realisiert. Bekannte Sortieralgo- rithmen sind Quicksort und Bubblesort. Eine weitere Klasse von Algorithmen sind kryptographische Algorith- men und kryptographische Protokolle, wie die symmetrischen Proto- kolle AES und DES oder die asymmetrischen Public–Key Protokolle wie RSA, ECC und ElGamal. Es gibt unzählige weitere Algorithmen, die jeweils an die Situation angepasste Lösungen liefern. Zur Steigerung der Leistungsfähigekit von Algorithmen bietet sich die Parallelisierung von Algorithmen an, die Teile des Ablaufs so aufteilt, dass sie parallel ausgeführt werden kännen. Nicht jeder Algorithmus eignet sich jedoch zur Parallelisie- rung.

100 Komplexitätstheorie Selbst wenn für ein gegebenes Problem ein Algorithmus existiert, kommt es sehr darauf an, wie schnell der Algorithmus arbeitet und wieviel Speicherplatz er benötigt. Eine sinnvolle Methode kann es oft sein, Algorithmen zu parallelisieren und dadurch zu beschleunigen. Der Aufwand, den ein Algorithmus benötigt, wird in der Komple- xitätstheorie betrachtet, die ein eigenes Forschungsgebiet mit sehr aktuellen offenen Fragen darstellt. Man kann berechenbare Funktio- nen danach messen, welches Wachstum sie haben oder in sogenannte Komplexitätsklassen einteilen. Die erste Einteilung nach Größe wird durch die Grzegorczykhierarchie geleistet. Die untersten Stufen dieser Hierarchie sind sogenannte elementar berechenbare Funktionen und sind für die meisten Probleme relevant. Komplexitätsklassen messen - grob gesprochen - den Aufwand, den ein Algorithmus verursacht. Eine sehr bekannte Komplexitätsklasse ist P, die Klasse der Poly- nomzeitalgorithmen. Diese sind dadurch definiert, dass die Laufzeit (und damit auch der Speicherbedarf) polynomiell im Aufwand der Eingabedaten sind.100 Man beachte, dass die Eingabe einer natürli- chen Zahl n in eine berechenbare Funktion (oder eine Turingmaschi- ne) einen Aufwand von O(log(n)) Eingabedaten bedeutet, denn die Anzahl der Ziffern von n ist proportional zu log(n). Eine weitere berühmte Komplexitätsklasse ist NP, die Klasse der nichtdeterministischen Turingmaschinen, die in Polynomzeit laufen. Alternativ kann man diese auch definieren als die Klasse derjenigen Algorithmen, deren Lösung in Polynomzeit verifizierbar ist. Eines der Milleniumsprobleme der Clay Foundation fragt, ob P = NP? Bemerkenswert an dieser Frage ist, dass es Probleme gibt, die in NP liegen und die NP–vollständig sind. Dies bedeutet, dass wenn eines dieser Probleme in P liegt, die Vermutung schon für alle Probleme erfüllt ist. Man muss also die P=NP Vermutung nur an einem Pro- blem testen und einen Algorithmus dafür suchen, der in P liegt, oder

101 dessen Existenz widerlegen. Darunter sind die folgenden Probleme: SAT, das Problem des Handlungsreisenden, das Cliquenproblem usw. Das SAT–Problem, auch Erfüllbarkeitsproblem der Aussagenlogik genannt, besteht darin, für jede Formel der Aussagenlogik zu entscheiden, ob es Wahrheitswerte (WAHR oder FALSCH) der Variablen gibt, so dass die ganze Formel nach Einsetzen dieser Werte auch WAHR wird. Oﬀenbar ist jede Lösung dieses Problems in Polynom- zeit veriﬁzierbar. Stephen Cook und Leonid Levin haben unabhängig voneinander gezeigt, dass SAT NP–vollständig ist. Man kann zeigen, dass Quantencomputer, die mit q–bits arbeiten, die Churchsche These erfüllen. Die Komplexitätsklasse von Quanten- computern wird mit BQP bezeichnet und liegt in PSPACE, d.h. den berechenbaren Funktionen mit polynomiellem Speicheraufwand. Sie sind jedoch potenziell viel leistungsfähiger als digitale klassische Computer (Turingmaschinen). In den letzten Jahren wurden Quan- tencomputer mit etwa 50 q–bits gebaut, die bestimmte Rechnungen wesentlich schneller ausführen können als klassische Computer. Ver- mutungsweise gibt es algorithmische Probleme, die mit klassischen Computern immer einen exponentiell grösseren Aufwand benötigen. Diese gegenwärtig sehr populäre Vermutung verfeinert die Church- sche These und wird „Supremacy” von Quantencomputern genannt. Unentscheidbare Probleme Überraschenderweise gibt es sogar Probleme, die man algorithmisch gar nicht lösen kann und die man unentscheidbar nennt. David Hilbert und Wilhelm Ackermann formulierten 1928 das Ent- scheidungsproblem. Es fragt, ob man für jede Aussage in einer formalen Sprache (innerhalb der Logik erster Stufe) entscheiden kann, ob sie universell erfüllbar ist oder nicht, also wegen Gödels Vollstän- digkeitssatz, ob sie beweisbar ist oder nicht. Alan Turing und Alonzo Church101 zeigten 1936 unabhängig voneinander, dass das Entschei- dungsproblem nicht lösbar ist: Es gibt keine Turingmaschine, die mit der Ausgabe 1 anhält, wenn die Aussage erfüllbar ist und mit der Ausgabe 0, wenn sie nicht erfüllbar ist.

102 Es gibt viele weitere bedeutende Probleme in der Mathematik, für die kein allgemeiner Lösungsalgorithmus existiert. Darunter sind das Halteproblem für Turingmaschinen, das 10. Hilbertsche Problem und das Wortproblem für Halbgruppen und Gruppen besonders hervorzuheben. Das Halteproblem ist eng verwandt mit dem Entscheidungsproblem und fragt danach, ob es einen Algorithmus gibt, der für einen gegebene (Gödel)Nummerierung Tn von Turingmaschinen, die partiell deﬁnierte Funktionen f = f : N N berechnen, entscheidet, ob n → die Funktion fn am Argument n deﬁniert ist. Der Beweis für die Unentscheidbarkeit des Halteproblems, den Alan Turing ebenfalls in seiner Arbeit von 1936 gab, benutzt im Wesentlichen eine Variante des Cantorschen Diagonalverfahrens. Hilbert formulierte das 10. Hilbertsche Problem, welches nach der Existenz eines Algorithmus fragt, der für jede diophantische Glei- chung (mit einem ganzzahligen Polynom F )

F (x1, ..., xn)=0 entscheidet, ob die Gleichung eine ganzzahlige Lösung besitzt oder nicht. Nach Vorarbeiten von Martin Davis, Julia Robinson und Hilary Putnam hat Yuri Matiyasevich 1970 gezeigt, dass das 10. Problem unentscheidbar ist, d.h. es gibt keinen solchen Algorithmus. Der naive Suchalgorithmus, den wir in Kapitel 5 betrachtet haben, besitzt zum Beispiel keine Abbruchbedingung, weil es keine a priori Abschätzung für die Größe der Lösungen gibt. Somit ist der Suchalgorithmus auch nicht geeignet. Von heutiger Warte aus gesehen, folgt die negative Lösung des 10. Hilbertschen Problems aus einem Satz von Davis, Matiyasevich, Ro- binson und Putnam, der besagt, dass jede rekursiv aufzählbare Men- ge durch eine diophantische Gleichung gegeben ist. Die Umkehrung dieses Satzes gilt trivialerweise, denn jedes Polynom ist eine berechenbare Funktion. Davis, Putnam und Robinson haben im Wesentlichen bewiesen, dass man zum Beweis dieses Satzes zeigen muss, dass gewisse exponentielle

103 Gleichungen, wie z.B. die Gleichung xy = z im (x, y, z)–Raum, diophantisch sind, obwohl das in diesem Beispiel auf den ersten Blick nicht so aussieht. Julia Robinson hatte die Idee, dazu die klassische Pellsche Gleichung x2 dy2 = 1 − ± im Fall von d = a2 1 zu verwenden, deren unendlich vielen Lösungen geeignetes Wachstumsverhalten− haben. Der Beweis von Matiyasevich verlief etwas anders, denn er benutzte eine Gleichung der Form

x = F2y, im (x, y)–Raum wobei Fm die Fibonaccizahlen durchläuft, also die Folge 1, 1, 2, 3, 5, 8, 13, 21,... die durch Fm+2 = Fm +Fm+1 deﬁniert wird. Moderne Beweise benutzen oft die Pellsche Gleichung wie bei Julia Robinson.102 Das Wortproblem für endlich präsentierte Gruppen oder Halbgrup- pen G = a1,...,as r1,...,rt , { | } 103 die durch endlich viele Erzeuger a1,...,as und Relationen r1,...,rt gegeben sind, besteht darin, zu entscheiden, ob ein beliebiges Wort w in G gleich einem vorgegebenen Wort w0 ist:

w = w0. Mit anderen Worten sucht man einen Algorithmus, der endlich viele Relationen ﬁndet, so dass das Wort w nach Anwendung dieser Rela- tionen (als Termersetzungen) in das Wort w0 übergeht. Das Wortproblem wurde zum ersten Mal von Axel Thue in seinen bereits erwähnten Arbeiten zur Berechenbarkeit formuliert und Thue erkannte auch die Schwierigkeit dieses Problems. Max Dehn, der als einer der ersten eines der Hilbertschen Probleme gelöst hatte, hat das Wortproblem ebenfalls kurze Zeit später unabhängig von Thue aufgestellt. Die Präsentation von Halbgruppen und Gruppen hat sehr

104 viel mit dem Berechenbarkeitsmodell der Thuesysteme durch Termer- setzung zu tun, die wir ebenfalls schon besprochen haben, denn die Relationen rj kann man als Termersetzungen verstehen. Der Beweis für die Unentscheidbarkeit des Wortproblems für Halb- gruppen wurde von Emil Post und Andrei Markov unabhängig voneinander 1947 erbracht. In der Tat kann man den Zusammenhang mit Berechnungsmodellen benutzen, um die Unentscheidbarkeit zu zeigen.104 Pyotr S. Novikov und William Boone lösten einige Jahre später auch das Wortproblem für Gruppen. Es gibt viele wichtige Klassen von Halbgruppen und Gruppen für die das Wortproblem lösbar ist, aber man kann auch ganz konkrete endlich präsentierte Gruppen hinschreiben, für die das Problem keine Lösung hat. Ein schönes Beispiel hat Gregory Tseytin gefunden. Für die Halbgruppe G = a, b, c, d, e ac = ca, ad = da, bc = cb, bd = db, ce = eca, h | de = edb, cdca = cdcae, caaa = aaa, daaa = aaa i ist das Problem unentscheidbar, ob ein beliebiges Wort mit w = aaa übereinstimmt. Künstliche Intelligenz und Hypercomputing Wir haben uns mit der (platonischen) Welt der Gedanken und ihrem Zusammenhang mit abstrakten Begriffen und der Wahrheit beschäf- tigt. All dieses Nachdenken darüber findet in unserem Kopf statt. Es ist eine sehr interessante ungelöste Frage, ob die menschliche Intelli- genz einem Computer überlegen ist. Gödel war überzeugt, dass das der Fall ist. Sein Argument werden wir in Kapitel 8 besprechen. Es benutzt Ideen rund um seinen eigenen Unvollständigkeitssatz. Das Lucas–Penrose Argument und John Searles Gedankenexperimente, auf die wir ebenfalls eingehen werden, gehen in die gleiche Richtung. Alan Turing hat in einem Artikel105 einen damit verwandten Test vorgeschlagen, den man heute Turingtest nennt. Dabei geht es im Grunde darum, ob man nur durch ein Frage- und Antwortspiel einen Menschen von einem Computer unterscheiden kann. Die Antwort war zu Turings Zeiten nicht ganz offensichtlich, heute ist sie ziemlich

105 sicher mit einem klaren Nein zu beantworten. Die Geschwindigkeit des Gehirns und auch seine Fehlerhaftigkeit machen es den heutigen Computern in vielerlei Hinsicht deutlich unterlegen. Der Test berück- sichtigt jedoch nicht Fragen zum Bewusstsein des Menschen, dessen Vorhandensein ihn sicherlich von einer Maschine unterscheidet. In den letzten Jahren hat sich die sogenannte Künstliche Intelligenz sehr weiterentwickelt. Ein Prophet auf diesem Gebiet war der von Leibniz inspirierte Mathematiker Norbert Wiener, der bereits in den 1950er Jahren entscheidende Ideen für künstliche Intelligenz entwickelte und gleichzeitig einen kritischen, vorausschauenden Blick auf die Zukunft richtete.106 Erst in den letzten Jahren hat es entscheidende Durchbrüche in der Umsetzung gegeben. Die heutige Technologie beruht in erster Linie auf dem Trainieren von künstlichen neuronalen Netzen mit Hilfe großer Datenmengen als Eingabe. In vielen Berei- chen, beispielsweise in der Bilderkennung, hat diese Methode jeden anderen Ansatz wesentlich überholt. In Kapitel 4 haben wir die Me- thode am Beispiel der Buchstabenerkennung erläutert. Es ist umstritten, ob es neben dem digitalen Computer, den Quanten- computern oder den künstlichen neuronalen Netzen andere analoge Berechenbarkeitsmodelle gibt, die entweder die Funktion des Gehirns besser simulieren oder strikt leistungsfähiger sind als digitale Com- puter. Solche Modelle werden als Neuromorphic Computing bzw. als Hypercomputing bezeichnet. Hypercomputing wurde bis heute noch nicht realisiert und es ist sehr zweifelhaft, ob es überhaupt möglich ist. Neuromorphic Computing dagegen erscheint vielversprechender.

106 KAPITEL 6

Kategorientheorie

Richard Dedekind war der erste Vorläufer der Strömung des Struk- turalismus. Seine mathematischen Arbeiten basieren zwar noch auf einer naiven, materiellen Mengenlehre, die elementorientiert ist. Er hat aber als Erster gesehen, dass mathematische Objekte, wie zum Beispiel die Zahlen, viele isomorphe Mengenrealisierungen besitzen können. Es sind nur ihre Operationen und strukturellen Eigenschaf- ten, denen eine Eindeutigkeit zukommt. Dedekind hat beispielsweise die natürlichen Zahlen in seinem Buch „Was sind und was sollen die Zahlen” als Ketten axiomatisch charakterisiert und ihre Eindeutigkeit bis auf Isomorphie mit dem Rekursionssatz bewiesen.107 Emmy Noether hat viel dazu beigetragen, diese Ideen von Dedekind in die Grundlagen der modernen Algebra und auch in der Topologie einzuführen, wo sie besonders fruchtbar sind. In Form der Kategori- entheorie als Grundlage der Mathematik wurde der Strukturalismus von Saunders MacLane und Samuel Eilenberg ab etwa 1945 entwickelt und hielt dann Einzug in die Arbeiten von Alexander Grothendieck, Daniel Kan, William Lawvere, Myles Tierney, Peter Freyd und vielen anderen.108 Eine der wichtigsten Kategorien ist die Kategorie der Mengen, bezeichnet mit Set. Wir werden aber viele weitere Beispiele von Katego- rien erläutern und auch Varianten davon, die man höhere Kategorien nennt. Dieses Kapitel ist abstrakter als die vorangegangenen und damit wesentlich schwerer zu lesen. Der Leser sollte versuchen, soviel als mög- lich davon verstehen, denn heute ist die Kategorientheorie eine der

107 drei möglichen Grundlagen der Mathematik. Sie ist besonders wertvoll für ein strukturelles Denken und für die Begründung der Seman- tik innerhalb der Mathematik. Kategorien Eine Kategorie besteht aus einer Kollektion von Objekten und einer Kollektion von strukturerhaltenden Pfeilen A B −→ zwischen jeweils zwei Objekten A und B, die auch Morphismen genannt werden. Weder die Kollektionen von Objekten noch die der Morphismen müssen dabei Mengen bilden. Wenn das der Fall ist, nennt man eine Kategorie „klein”. Kategorientheorie ist also eine Theorie der strukturerhaltenden Morphismen zwischen Objekten, die durch Pfeile repräsentiert werden. Veröﬀentlichungen in diesem Teil der Mathematik sind daher voll mit Diagrammen, die aus lauter Pfei- len bestehen. Die Pfeile erfüllen weitere Rechenregeln. So kann man Morphismen durch Komposition verketten:

f g A B C

g f ◦

Komposition von Morphismen.

Dafür gilt – ähnlich wie bei der Multiplikation – das Assoziativgesetz h (g f)=(h g) f. ◦ ◦ ◦ ◦ In manchen Fällen kann man Pfeile auf verschiedene Art miteinander verknüpfen. Eine bekannte Situation ist ein kommutatives Diagramm für das δ γ = β α ◦ ◦ gilt, d.h bei dem es egal ist auf welchem Weg man das (viereckige) Diagramm durchläuft. Dies resultiert dann in einem eindeutigen neuen Pfeil, der gestrichelt als Diagonale eingezeichnet ist (siehe Figur). 108 α A B

γ β

CD δ

Kommutatives Diagramm.

Es gibt viele unterschiedliche Kategorien in der Mathematik. Wichti- ge Beispiele sind die Kategorie der Mengen Set und die Kategorie der topologischen Räume Top. In Set sind die Objekte Mengen und die Morphismen die mengentheoretischen Abbildungen. In Top sind die Objekte die topologischen Räume und die Morphismen die stetigen Abbildungen. Eine spezielle Kategorie ist jedem topologischen Raum X zugeordnet, nämlich die Kategorie Off(X) der offenen Mengen auf X. Die Objekte darin sind die offenen Mengen U X und die Morphismen die Inklusionen V U. ⊂ Eine andere wichtige Kategorie ist⊂ die Kategorien von Kettenkomple- xen abelscher Gruppen, die mit Ch bezeichnet wird und Objekte wie die singulären Kettenkomplexe zu der simplizialen Menge Sing•(X) eines topologischen Raums X enthält. Man kann in einer gegebenen Kategorie alle Pfeile „umdrehen” und bekommt dadurch die sogenannte entgegengesetzteC Kategorie, die mit op bezeichnet wird. C Gruppoide Eine sehr einfache Kategorie ist jeder Gruppe G zugeordnet. Sie hat nur ein Objekt und für jedes g G einen Pfeil, der auch mit g bezeichnet wird:∗ ∈

109 g hg h ∗ g−1

Kategorie einer Gruppe.

Diese Kategorie ist ein sogenanntes Gruppoid, denn jeder Morphis- mus ist invertierbar. Der Begriﬀ eines Gruppoids bezeichnet viel allgemeiner eine Kategorie, in der jeder Homomorphismus p ein Isomor- phismus ist, dessen Inverses mit p−1 bezeichnet wird. Ein Gruppoid ist daher eine weitreichende Verallgemeinerung einer Gruppe. Ein interessantes Gruppoid, das nicht von einer Gruppe in dieser Form kommt, ist das Fundamentalgruppoid π≤1(X) für einen topologischen Raum X. Es ist deﬁniert als die Kategorie, deren Objekte die Punkte von X sind und deren Morphismen zwischen a und b die Homotopieklassen der Wege von a nach b sind. Aus diesem Funda- mentalgruppoid π≤1(X) kann sowohl die Menge π0(X) der Zusam- menhangskomponenten von X als auch für jeden Basispunkt die ∗ Fundamentalgruppe π1(X, ) leicht rekonstruiert werden. Dieses Gruppoid enthält alle∗ Homotopieklassen von allen Wegen in X und damit schon mehr Information als die Fundamentalgruppe π1(X, ). Um von Homotopieklassen von Pfaden zu allen Pfaden überzugehen,∗ ist noch ein weiterer Abstraktionsschritt notwendig, der uns aus dem Reich der Kategorien in die Unendlichkategorien führen wird. Funktoren Kategorien können miteinander verglichen werden. Dazu benutzt man Funktoren. Ein kovarianter Funktor zwischen zwei Kategorien und ist ein Pfeil A B F : , A −→ B

110 der Objekte A in zu Objekten B = F (A) in schickt und Mor- A B phismen f : A1 A2 auf Morphismen F (f): F (A1) F (A2). Ein kontravarianter→ Funktor dreht die Pfeile um, d.h. es gil→t F (f): F (A2) F (A1). Ein Beispiel→ ist der (kovariante) Funktor F : Top Set, der einen topologischen Raum auf die unterliegende Menge→ und stetige Ab- bildungen auf die unterliegende Abbildung schickt, d.h. die Stetig- keit ignoriert. Andere Beispiele sind die (kovarianten) Funktoren der Homologie– und Homotopiegruppen, die Funktoren Top Gr in die Kategorie der Gruppen darstellen. Betrachtet man liebe→ r den unterliegenden Kettenkomplex abelscher Gruppen, so wie es Emmy Noether getan hat, so kann man den Funktor Top Ch betrachten, der jedem topologischen Raum X den singulären→ Kettenkomplex Z Sing•(X) zuordnet. Durch geeignete Funktoren kann man Äquivalenzen von zwei Katego- rien C und D deﬁnieren, die in gewisser Weise durch zwei Funktoren F : C D und G : D C ununterscheidbar sind. Also gibt es auch bei Kategorien→ die Grundfrage→ nach der Gleichheit bzw. Identität. Funktoren kann man miteinander vergleichen. Eine natürliche Trans- formation T zwischen zwei Funktoren F und G ordnet jedem Objekt A von einen Morphismus TA : F (A) G(A) zu, so dass das entsprechendeA Diagramm kommutiert (siehe→ Figur).

F (f) F (A) F (B)

TA TB

G(A) G(B) G(f)

Natürliche Transformation.

111 Garben Mit Hilfe von Funktoren kann man Garben und Prägarben als neue Objekte auf topologischen Räumen definieren. Solche Objekte sind wichtig als Strukturgarben auf topologischen Räumen und als Ko- effizienten für Kohomologietheorien. In der Entwicklungsgeschichte der Mathematik sind sie innerhalb der komplexen Analysis in Form von Garben von holomorphen Funktionen auf analytischen Räumen durch Henri Cartan und Kiyoshi Oka um das Jahr 1950 eingeführt worden. Eine Prägarbe ist dabei ein kontravarianter Funktor von der Ka- tegorie der offenenF Mengen Off(X) auf einem topologischen Raum X mit Werten in der Kategorie Set. Dies bedeutet, dass es für zwei offene Mengen V U eine Einschränkungsabbildung ⊂ (U) (V ) F →F gibt, die gewisse Rechenregeln erfüllen, die aus der Funktoreigen- schaft folgen: Die triviale Inklusion U U induziert als Einschrän- kungsabbildung die Identität id : (U)⊂ (U) und für drei offene Mengen W V U gilt die Kompositionsregel,F → F d.h. die Einschrän- kungsabbildungen⊂ ⊂ kommutieren:

(U) (V ) (W ) F F F

Funktoreigenschaft der Einschränkungsabbildungen.

Garben sind spezielle Prägarben, die eine zusätzliche Eigenschaft er- füllen.109 Garben auf X definieren eine neue Kategorie, die mit Sh(X) bezeichnet wird (vom englischen Begriff „sheaf” für Garbe). Eine Gar- be ist – vereinfacht gesprochen – eine Familie von Mengen über dem topologischen Raum X, denn für jeden Punkt x X kann man den sogenannten Halm der Garbe als Menge definieren.∈ 110 Fx

112 Mit Hilfe von Prägarben und Garben kann man zwei für uns sehr interessante Kategorien definieren. Das erste Beispiel ist die Funk- op torkategorie aller Funktoren ˆ = SetC mit Werten in Set auf einer C gegebenen Kategorie . Nimmt man für die Kategorie ∆• der endlichen geordneten MengenC ∆ = 0 < 1C< < n mit monotonen n { ··· } Abbildungen, so erhält man als Funktorkategorie ∆ˆ • die Kategorie der simplizialen Mengen SSet. Ein zweites Beispiel ist die Kategorie von Garben von Mengen Sh(X) auf einem topologischen Raum X, oder allgemeiner auf einem Situs. Topoi William Lawvere in den 1960er Jahren und viel später Jeremy Avigad und andere haben die Kategorie der Mengen axiomatisch gefasst und den Begriff des Elementartopoi geprägt. Damit haben sie die strukturelle Mengenlehre axiomatisch definiert, die nicht in der selben Weise elementorientiert ist wie die naive, materielle Mengenlehre.111 Dafür gibt es zwei Kandidaten, ETCS (von Lawvere) und SEAR (von Avi- gad). ETCS steht dabei für „Elementary theory of the category of sets” und SEAR für „Sets, elements and relations”. Ein Statement der Form x M wird in ETCS ersetzt durch einen Pfeil ∈ 1 M −→ von einem kanonischen 1–elementigen Objekt 1 nach M. In SEAR wird die Elementrelation wie in der Typentheorie behandelt, d.h. ein Statement der Form x M macht nur Sinn bei gegebenem M. In SEAR kann eine Menge∈ nicht Element einer anderen Menge sein, d.h. Elemente sind von einem anderen Typ als Mengen.112 Ein Elementartopos ist definiert als eine Kategorie mit mehreren Eigenschaften. Die erste Gruppe von EigenschaftenC besagt, dass eine kartesisch abgeschlossene Kategorie ist. Das bedeutet zunächst,C dass für je zwei Objekte A, B in das Produkt A B existiert. Etwas C × allgemeiner fordert man die Existenz von Pullbackobjekten A X B für je zwei Pfeile A X und B X (siehe Diagramm). × → →

113 A B B ×X g

A X f

Pullbackdiagramm.

Ferner gibt es ein sogenanntes Exponentialobjekt CA in , dass die „Funktionen” von A nach C repräsentiert. Dafür gilt, dassC der natür- liche Pfeil B HomC(A B,C) HomC(A, C ) × −→ eine Identifikation ist. Weiterhin soll ein terminales Objekt 1 existieren mit Abbildungen A 1 für alle A in . Ein Elementartopos ist eine→ kartesisch abgeschlosseneC Kategorie, die zusätzlich noch einen sogenannten Subobject Classifier Ω und ein Ob- jekt N natürlicher Zahlen113 zusammen mit Pfeilen (Null und Nach- folgerabbildung) besitzt: 1 N, S : N N. −→ −→ Der Subobject Classifier Ω dient dazu, Unterobjekte B A als eindeutige Pullbacks zu charakterisieren. Dies bedeutet, das⊂s der Pfeil 1 Ω eine universelle Einbettung ist (siehe Diagramm). → B 1

true

A Ω

Subobject Classiﬁer.

114 Die Idee hierbei ist, dass Ω eine Ansammlung von Wahrheitswerten ist mit einem ausgezeichneten Element 1, dass dem Wert „wahr” entspricht. Im Beispiel des Topos Set gilt Ω = 0, 1 mit den üblichen op klassischen Wahrheitswerten. In den Beispielen{ Set} C und Sh(X) besteht Ω aus einer viel größeren Menge von bestimmten Garben.114 Das Objekt Ω besitzt interessante Eigenschaften, insbesondere bildet es eine sogenannte Heyting Algebra. Es gibt zwei wichtige Beispiele für Elementartopoi, die wir bereits op kennengelernt haben, nämlich die Funktorkategorien ˆ = SetC und die Kategorie von Garben Sh(X) auf einem topologischenC Raum X. Diese beiden Arten von Elementartopoi werden auch Grothendieck- topoi genannt.115 Dieser Begriﬀ wurde bereits früher erfunden und geht auf Alexander Grothendieck zurück. Die Kategorie Set selbst insbesondere ist auch ein Grothendiecktopos. Höhere Kategorien Höhere Kategorien, –Kategorien und –Gruppoide sind Verall- gemeinerungen von Kategorien∞ und von∞ Gruppoiden, die auf zwei verschiedene Arten entstehen. Die erste Spezies von höheren Kategorien erlaubt Morphismen höhe- rer Ordnung, d.h. Pfeile zwischen Pfeilen (siehe Figur).

Aα B g

Höherer Morphismus α zwischen zwei Morphismen f,g.

Die Komposition von Pfeilen verallgemeinern sich ebenfalls in geeigneter Weise. Traditionelle Kategorien sind in dieser Terminologie 1–Kategorien. Allgemeiner gibt es 2–, 3–Kategorien usw., die man allgemein n–Kategorien nennt. Alle diese Varianten werden wir als strikte höhere Kategorien bezeichnen oder als –Kategorien bzw. ∞

115 Unendlichkategorien, was dem Grenzfall n entspricht und wir kein konkretes n angeben wollen oder können.→ ∞ Diese Variante ist aber eigentlich ein Spezialfall von gewöhnlichen Kategorien, die auch 2–Morphismen und höhere Morphismen zulässt. Interessanter ist die zweite Version von sogenannten schwachen hö- heren Kategorien, bei denen die Rechenregeln von Kategorien abge- schwächt werden. Zum Beispiel dürfen Diagramme der Form α A B

γ β

CD δ

Kommutatives Diagramm bis auf Homotopie. in (schwachen) höheren Kategorien nur bis auf einen 2–Morphismus kommutativ sein, d.h. es gibt einen (invertierbaren) 2–Morphismus β α δ γ, ◦ ⇒ ◦ oder – mit anderen Worten – eine Äquivalenz zwischen δ γ und β α. Der doppelte gestrichelte Pfeil im Diagramm ist also in der◦ Tat nicht◦ eindeutig, sondern entspricht einem invertierbaren 2–Morphismus

β α ◦ AD

δ γ ◦ Höherer Morphismus zwischen zwei Kompositionen.

Höhere Morphismen werden auch oft in einer geometrischen Art und Weise beschrieben, die an simpliziale Strukturen erinnert. Zum Bei- spiel besitzen 2–Kategorien und ihre höheren Verallgemeinerungen

116 B f g h A C

2–dimensionale Objekte, die man auch „Füllungen” nennt. Solche 2– dimensionalen Objekte entsprechen Kompositionen (siehe Figur). Die Komposition g f von zwei Morphismen f und g existiert dabei, wenn man ein 2–dimensionales◦ Objekt als „Füllung” ﬁndet, dessen dritte Seite die Komposition h = g f repräsentiert. Da die Füllung nicht eindeutig sein muss, ist die Komposition◦ in einer solchen Un- endlichkategorie in der Regel nicht eindeutig deﬁniert, sondern nur bis auf eine Art von Äquivalenz, wie man durch „Füllungen” mit 3– dimensionalen Objekten beweisen kann. Das Dreieck in der Figur bestimmt also ein 2–dimensionales Objekt der höheren Kategorie. Rekursiv erhält man n–Kategorien, wenn man neue n–dimensionale Objekte postuliert, die die Kommutativität in Diagrammen zwischen gewissen (n 1)–dimensionalen Objekten beschreiben. Auch die höherdimensionalen− Objekte können durch Pfeile verbunden werden, was Relationen zwischen diesen Objekten entspricht.

f h◦g C g◦f h A h◦g◦f D

Tetraeder zum Assoziativgesetz

117 Die Assoziativität der Komposition gilt in höheren Kategorien mög- licherweise nur modulo „höherer” Ausdrücke. Dies kann man graphisch durch eine 2–dimensionale Figur darstellen, die mehreren 2– dimensionalen und einer 3–dimensionalen „Füllung” entspricht (siehe Figur). Der Tetraeder hat vier Seiten, die jeweils 2–Morphismen von Kom- positionen entsprechen. Der ganze Tetraeder entspricht einem invertierbaren 3–Morphimus (h g) f h (g f), ◦ ◦ ⇒ ◦ ◦ der – auch wenn das Assoziativgesetz nicht in Form einer Gleichheit gilt – einen expliziten Pfeil darstellt, durch den die Assoziativität ersetzt wird. Höhere Morphismen in höheren Kategorien kann man somit als kombinatorische Daten sehen, die ganz präzise Äquivalen- zen beschreiben, die nicht per se, d.h. in Form einer Gleichheit oder Identität gelten. Dies ist eine wichtige Eigenschaft, die höhere Kate- gorien zusammen mit ihrer ﬂexibleren Behandlung von Rechenregeln wertvoll für die Mathematik und gewisse Anwendungen macht. Beispiel höherer Kategorien Höhere Kategorien entstehen auf natürliche Weise, wenn man Kate- gorien miteinander vergleicht. Als Beispiel dafür kann man die Ka- tegorie CAT aller Kategorien betrachten. Das Objekt CAT kann in einem gewissen Sinne mathematisch präzise deﬁniert werden und ist eine 2–Kategorie mit Funktoren zwischen Kategorien als Morphismen und den natürlichen Transformationen als 2–Morphismen. Ein gutes Beispiel für eine 2–Kategorie ist die Kategorie der Gruppen Grp, wobei die Morphismen die Gruppenhomomorphismen f, f ′ : G H sind und die 2–Morphismen zwischen f und f ′ die Konjuga- tionen→ mit Elementen der Gruppe: f f ′, wobei f ′(g)= hf(g)h−1, mit h H. ⇒ ∈

118 Ein anderes – und vielleicht das wichtigste – Beispiel für eine „nor- male” Kategorie, die auch eine höhere Struktur aufweist, ist die Ka- tegorie Top. Neben den üblichen Objekten und Morphismen der Ka- tegorie Top hat man die Homotopien H zwischen zwei stetigen Ab- bildungen f,g : X Y , die durch eine stetige Abbildung → H : I X Y × −→ deﬁniert sind als 2–Morphismen. Weiter gibt es Homotopien zwischen Homotopien usw., so dass man ganz natürlich eine Unendlichkatego- rie erhält. Ein weiteres sehr wichtiges Beispiel einer Unendlichkategorie ist die Verallgemeinerung des Fundamentalgruppoids π≤1(X), das sogenannte –Fundamentalgruppoid Π(X). Dieses Objekt ist eine höhere Ka- tegorie,∞ deren Objekte aus den Punkten eines topologischen Raums X bestehen und die Morphismen aus den Pfaden. Die 2–dimensionalen höheren Objekte (oder 2–Morphismen) sind Daten, die die Homoto- pien zwischen den Pfaden kodieren, die für die Rechenregeln benutzt werden, d.h. die Regeln für den inversen Pfad p−1, sowie für die Kom- position von Pfaden mit dem Assoziativgesetz (p q) r = p (q r), ◦ ◦ ◦ ◦ die alle nur bis auf Homotopie gelten. Die 3– und höherdimensionalen Objekte werden erzeugt durch die Homotopien zwischen den Homo- topien usw.. Alle Homotopien sind invertierbar, daher ist Π(X) tat- sächlich ein Unendlichgruppoid, auch als ( , 0)–Kategorie bezeichnet, wobei der zweite Index 0 ausdrücken∞ soll, dass alle (auch die höheren) Morphismen invertierbar sind.116 Als Modell für die Unendlichkategorie Π(X) wird häuﬁg die simpliziale Menge Sing•(X) benutzt. Dazu muss man erklären, dass Sing•(X) zwar durch stetige Abbildungen ∆n X für alle n entsteht, dass aber beispielsweise Homotopien zwischen→ Pfaden eigentlich durch stetige Abbildungen I I X gebildet werden, also durch stetige Abbildungen eines Quadrats× → 2 nach X. Nun kann man aber ein Quadrat mittels seiner Diagonale in zwei Dreiecke zerlegen. Dieser Trick sorgt dafür, dass sich Homotopien zwischen Pfaden und deren

119 höhere Verallgemeinerungen wieder auf stetige Abbildungen ∆n X zurückführen lassen. → Man sollte jedoch bedenken, dass Sing•(X) streng betrachtet nur ein Modell von Π(X) in simplizialen Mengen ist. Emily Riehl und Do- minic Verity haben ein Projekt gestartet117, die Theorie der höheren Kategorien intrinsisch zu definieren, d.h. ohne auf irgendwelche Mo- delle zu rekurrieren. Dies ist der richtige Ort, um Objekte wie Π(X) zu betrachten. Unendlichkategorien, genauer gesagt ( , 1)–Kategorien, nennt man manchmal auch Quasikategorien nach∞ André Joyal oder schwache Kan–Komplexe. Kan–Komplexe sind als simpliziale Mengen dadurch definiert, dass die Existenz gewisser „Füllungen” von Abbildungen i garantiert ist, die auf Teilmengen Λn definiert sind, bei denen aus einem n–Simplex die i–Seite entfernt wurde. Diese Bedingung sorgt dafür, dass alle Morphismen der Dimension n 1 invertierbar sind, so dass ein Unendlichgruppoid, d.h. eine ( , 0)≥–Kategorie, vorliegt. Daher definierte Jacob Lurie eine ( , 1)–Kategorie∞ als eine simpliziale Menge, die ein schwacher Kan–Komplex∞ ist, bei dem sozusagen nur „fast alle” „Füllungen” existieren müssen, genauer gesagt betrifft das i die Teilmengen Λn für 0 n ist, und sie werden Äquivalenzen, d.h. invertierbar, falls k>r. Insbe- sondere stimmen die obigen n–Kategorien mit den (n, n)–Kategorien überein. Man kann nun n nach Unendlich gehen lassen und erhält auf diese Weise insbesondere ( ,r)–Kategorien für alle r 0. ∞ ≥

120 Insgesamt ergibt sich folgendes Schema, in dem sich der Begriff der Menge (bzw. Klasse) und der partiell geordneten Menge (engl. Poset) verallgemeinern: n =0 n =1 n =2 ... n = r=0 Menge Gruppoid 2–Gruppoid ... ( , 0)∞–Kategorie r=1 Poset Kategorie (2, 1)–Kategorie ... (∞, 1)–Kategorie r=2 2–Poset 2–Kategorie ... (∞, 2)–Kategorie − ∞ Man kann auch höhere (n, r)– oder ( ,r)–(Elementar–)Topoi definieren. Für ( , 1)–Kategorien ist dies∞ zum Teil verstanden und man kann in der Tat∞ durch eine geeignete „Komplettierung”, d.h. eine geeigneten Erweiterung einer ( , 1)–Kategorie, zu einem Elementarto- pos gelangen.119 ∞ Topologische höhere Kategorien Die Unendlichkategorie an der wir später besonders interessiert sind, ist die Kategorie aller Homotopietypen aller topologischer Räume. Für diese Frage und viele neueren Entwicklungen der Kategorien- theorie in der Mathematik ist ein fast 600–seitiges Manuskript120 von Alexander Grothendieck ausschlaggebend, das als Anfangssegment einen Brief an Daniel Quillen enthält, der vom 19. Februar 1983 da- tiert ist. Durch dieses Manuskript wurde die Weiterentwicklung der Homotopietheorie und der (höheren) Kategorientheorie stark beeinflusst. In der Homotopietheorie waren die Entwicklung der Modell- kategorien durch Daniel Quillen und die etwas spezielleren Pfadkate- gorien von Kenneth Brown wichtige weitere Schritte. Ein besonderer Aspekt der Ideen von Grothendieck ist seine Vermu- tung, dass die Unendlichgruppoide genau die Homotopietypen von topologischer Räume klassifizieren – die sogenannte „Homotopiehy- pothese”. Diese Vermutung ist zwar noch nicht ohne Zusatzannah- men bewiesen worden, aber wenn man sie mal annimmt, so ergibt sich für uns die Frage, ob wir die Kategorie aller Unendlichgruppoide beschreiben können, offenbar eine ( , 1)–Kategorie. ∞

121 Wir haben bereits gesehen, dass die Kategorie Top eine Unendlich- kategorie ist. Sie ist eigentlich eine ( , 1)–Kategorie, da alle Homoto- pien und damit alle n–Morphismen∞ mit n 2 invertierbar sind, und stimmt im Wesentlichen mit Grpd überein,≥ d.h. mit der Kategorie der Gruppoide, gemäß der Homotopiehypothese∞ von Grothendieck. Top ist damit also die prototypische ( , 1)–Kategorie, so wie Set die prototypische Kategorie ist. ∞ Etwas allgemeiner kann man statt Top die eben erwähnten Modell- kategorien von Quillen betrachten, die für den formalen Aufbau der Homotopietheorie so nützlich sind. Bei den Modellkategorien werden gewisse Typen von Morphismen axiomatisch vorgegeben – die Faserungen, Kofaserungen und schwache Äquivalenzen. Ähnlich wie bei Top entspricht jede solche Modellkategorie jeweils einer ( , 1– ∞ Kategorie, zumindest wenn man nach den schwachen Äquivalenzen eine sogenannte Dwyer–Kan Lokalisierung vornimmt, denn schwache Äquivalenzen sind im Gegensatz zu den Homotopieäquivalenzen nicht a priori immer invertierbar.121 Später in diesem Text, wenn wir in Kapitel 9 die Typentheorie untersuchen, wird eine fest gewählte Typentheorie als ein „Universum” aller Typen eine ähnliche Rolle spielen und die Semantik dieser Ty- pentheorie ist dann – zumindest in jeder topologisch motivierten In- terpretation – eine ( , 1)–Kategorie, bei der die n–Morphismen ab n = 2 invertierbar sind.∞ Wir werden uns also besonders auf ( , 1)– Kategorien konzentrieren, denn nach allem was wir gerade be∞spro- chen haben, sollte das die richtige Wahl sein.

122 KAPITEL 7

Deduktive Systeme und ihre Semantik

Nach der Wende zum 20. Jahrhundert kamen neuartige Sichtwei- sen auf die Mathematik auf, wie der Formalismus von Hilbert und der Intuitionismus.122 Hilberts Arbeiten, die er zum Teil zusammen mit Wilhelm Ackermann entwickelte, ließen eine Metasprache entstehen, mit der man über die Mathematik reden konnte. Dies war die Grundlage für eine Weiterentwicklung der Logik und der Beweistheo- rie durch viele andere Mathematiker, unter denen Thoralf Skolem, Kurt Gödel und Alfred Tarski besonders hervorzuheben sind. Formale Sprachen und deduktive Systeme In diesem Abschnitt werden wir die Hilbertsche Beweistheorie genauer kennenlernen. Der Formalismus von Hilbert wird so genannt, weil die axiomatische Methode einen formaleren Umgang mit mathematischen Objekten zugrundelegte als die Mathematik vor dieser Zeit, die in der Regel nicht die formalen oder syntaktischen, sondern die semantischen Gesichtspunkte in den Vordergrund stellte. Beispiele axiomatischer Theorien sind die Euklidische Geometrie, die Mengen- lehre von Zermelo–Fraenkel und die Dedekind–Peano Arithmetik. Ein System, das aus einer formalen Sprache besteht, das Axiome und Schlussregeln enthält und in dem man daher Beweise in einem logischen Kalkül durchführen kann, nennt man ein deduktives System. Die Idee deduktiver Systeme geht offensichtlich auf den Einfluss von Leibniz zurück und wurde auch von Bolzano in seiner „Wissenschafts- lehre” angedeutet.123 Frege war vermutlich der Erste, der diese Idee in seiner „Begriffsschrift” praktisch in die Tat umgesetzt hat. Axel

123 Thues in Kapitel 5 beschriebenes Berechenbarkeitsmodell ist so allgemein formuliert, dass man es auch als deduktives System interpretieren kann. Er hat seine Modelle bildhaft in Form von Bäumen dargestellt. In der Tat werden wir gleich sehen, dass jeder Beweis eine Baumstruktur hat und eine Wurzel, die der zu beweisenden Aussage entspricht. Die mathematische Beweistheorie wurde aber erst am Anfang des 20. Jahrhunderts von David Hilbert in der heutiger Weise formalisiert. Hilbert hat sich ab etwa 1900 und verstärkt ab 1917 (mit Ackermann und Bernays) mit der Beweistheorie in axiomatischen mathematischen Theorien beschäftigt und u.a. den Hilbertkalkül entwickelt. Zu diesem Zweck hatte er die Beweisführung mathematisiert und erkannte, wie Leibniz und Frege bereits wussten, dass Beweise im Grunde Berechnungen in einem speziellen Kalkül sind. Berechenbarkeit wird dabei mit der Verwendung rekursiver Funktionen in Verbindung gebracht. Eine formale Sprache erster Ordnung124 besteht aus einen Reservoir aus Zeichen für Konstanten, freie und gebundene Variablen, Funktio- nen und Relationen (Prädikate), sowie aus den logischen Symbolen , , , , und , die wir in Kapitel 2 bereits kennengelernt haben. Aus¬ ∧ diesen∨ ⇒ Symbolen∀ ∃ kann man Terme bilden, wobei alle Konstanten und freien Variablen Terme sind und auch die Werte von Funktionen f(t1,...,tn), in die man Terme t1,...,tn eingesetzt hat. Aus Termen können Formeln gebildet werden, wobei atomare Formel durch Ein- setzen von Termen in Prädikate R entstehen als R(t1,...,tn). Allge- meine Formeln entstehen aus atomaren Formeln durch Verwendung der logischen Zeichen, d.h. wenn A und B Formeln sind, dann sind auch A, A B etc. Formeln. Ist A eine Formel, die eine freie Va- riable¬a enthält∧ (d.h. A = A(a) hängt als Formel insb. von a ab), so sind x A(x) und x A(x) ∃ ∀ wieder Formeln. Schließlich ist eine logische Aussage eine Formel ohne freie Variablen. In einer axiomatischen mathematischen Theorie

124 werden endlich oder unendlich viele logische Aussagen Γ=Γ1, Γ2,... als Axiome vorausgesetzt. Wir wollen ein Beispiel dafür geben und betrachten die formale Spra- che der Dedekind–Peano Arithmetik. Sie besteht neben den logischen Zeichen , , , , , aus den Zeichen 0 (Null), S (Nachfolgerabbil- dung N ∧ ∨N),¬+⇒(Addition),∀ ∃ (Multiplikation) sowie = (Gleichheit). Die Nachfolgerabbildung→ kann· man auch als S(n)= n +1 schreiben, wenn man die Addition vermöge vollständiger Induktion deﬁniert hat. Also gilt: 1 := S(0), 2 := S(S(0)), usw. Die Axiome der Dedekind–Peano Arithmetik sind von der Form

n S(n)=0 ¬∃ m n S(m)= S(n) m = n, ∀ ∀ ⇒ n n +0= n ∀ m n m + S(n)= S(m + n) ∀ ∀ n n 0=0 ∀ · m n m S(n)= m n + m ∀ ∀ · · y P (0,y) n (P (n, y) P (S(n),y)) nP (n, y). ∀ ∧ ∀ ⇒ ⇒ ∀

Das wichtigste Axiom ist das letzte Axiom der vollständigen Induk- tion. Es drückt für jede Eigenschaft P natürlicher Zahlen folgende Aussage aus (der Einfachheit halber ohne die Hilfsvariable y): Falls P (0) gilt und falls aus P (n) immer P (S(n)) folgt, so ist P für jede natürliche Zahl erfüllt.

125 Beweise in deduktiven Systemen Nach dem Hilbertkalkül hat insbesondere Gerhard Gentzen neue Kal- küle in der Beweistheorie eingeführt, den „Sequenzenkalkül” und den „Kalkül des natürlichen Schließens”. Ein Beweis in einem deduktiven System benutzt die Axiome und Schlussregeln in beliebiger Reihenfolge, bis das gewünschte Ergebnis erreicht ist. Das natürliche Schließen benutzt auf intuitive Weise mehrere Schritte, in denen aus gegebenen logischen Aussagen A1,...,An eine neue Aussage A mit Hilfe gewisser Schlussregeln abgeleitet wird. Man schreibt dafür auch A ...A 1 n . A Die Aussagen A1,...,An enthalten die Axiome, bzw. sind Aussagen, die schon vorher aus den Axiomen gefolgert werden konnten. Wir beschreiben hier nicht alle Schlussregeln des natürlichen Schließens. Zu den logischen Operationen , , , , gehören „Einführungsregeln” ∧ ∨ ⇒ ∀ ∃ A B A B B P (t/x) , , , , A B A B A B A B xP (x) ∧ ∨ ∨ ⇒ ∃ und „Eliminationsregeln” A B A B xP (x) A A B ∧ , ∧ , ∀ , ⇒ (Modus Ponens) A B P (t/x) B zusammen mit Fallunterscheidungen, wenn zum Beispiel eine Aussa- ge wie A B untersucht werden soll. Ein natürlicher Beweis einer logischen∨ Aussage ∆ besteht aus einem Herleitungsbaum mit einer Wurzel, der am oberen Ende in den Blättern beginnt und an jeder Ecke eine Schlussregel benutzt (siehe Figur). Im Sequenzenkalkül von Gerhard Gentzen wird dies etwas anders gemacht. Hier werden von Anfang an Sequenzen betrachtet. Diese werden durch Pfeile A B −→ dargestellt und symbolisieren zwei logische Aussagen A und B und einen Beweis (eine Deduktion), die aus A die Aussage B folgert. Dabei

126 A∧(B∧C) B∧C

A∧(B∧C) B∧C A∧(B∧C) A B B∧C

A B B∧C A∧B C

A∧B C (A∧B)∧C

Herleitungsbaum von A (B C) (A B) C. ∧ ∧ ⇒ ∧ ∧ ist A die Voraussetzung und B die Folgerung. Eine einfache Aussage ohne Voraussetzung (z.B. ein Axiom) kann auch als A −→ geschrieben werden. Um die Sequenz Γ C zu bewiesen, wobei Γ=Γ Γ ..., fängt man mit den Axiomen−→ 1 ∧ 2 ∧ Γ −→ i an und wendet die Schlussregeln des Sequenzenkalküls solange an, bis die Aussage folgt. Eine dieser Regeln ist die der Schnittelimination mit Schnitt D Γ A DD B ∆ −→ ∨ ∧ −→ . Γ B A ∆ Gerhard Gentzen benutzte die∧ Schnitteliminationsregel,−→ ∨ um die Kon- sistenz, d.h. die Widerspruchsfreiheit, der Dedekind–Peano Arithme- tik zu zeigen. Das Axiom der vollständigen Induktion wird zur folgenden Schlussregel des Sequenzenkalküls: Γ P (a) ∆ P (S(a)) ∧ → ∨ . P (0) Γ ∆ sP (s) ∧ → ∨ ∀

127 Wir wollen zur Illustration folgendes Theorem im Sequenzenkalkül beweisen: Theorem. Für jede natürliche Zahl n gilt die folgende Eigenschaft P (n): n ist entweder gerade oder ungerade. Dabei deﬁnieren125 wir: n ist gerade, falls eine natürliche Zahl ℓ existiert mit n = 2ℓ und ungerade, falls eine natürliche Zahl ℓ existiert mit n =2ℓ+1. Deﬁnitionen sind Abkürzungen, die der Vereinfachung dienen und sind in der Mathematik grundsätzlich sehr wichtig. Der Beweis des Theorems im Sequenzenkalkül ist dann wie folgt: Aus den Axiomen folgt sehr schnell P (0), d.h. die 0 ist gerade und wir haben somit Γ P (0). Aus den Axiomen folgt weiterhin Γ n (P (n) P (S(n)))→. Jetzt benutzen wir vollständige Induktion: → ∀ ⇒ Γ P (0), Γ n (P (n) P (S(n))) −→ −→ ∀ ⇒ . Γ nP (n) −→ ∀ Die Semantik deduktiver Systeme Die Semantik deduktiver Systeme in der Mathematik spielt sich tra- ditionell innerhalb der Mengenlehre ab. Formal gesehen bildet eine Semantik eine Möglichkeit, ein gegebenes deduktives System mengen- theoretisch zu realisieren, so dass alle Schlussregeln in der Sprache der Mengen erfüllt bleiben. Man nennt dies auch eine Interpretation. In der Regel wurde dafür in der klassischen Literatur nur die sogenannte naive (materielle) Mengenlehre benutzt und kein axiomatisches oder kategorielles System der Mengenlehre oder dergleichen. Etwas allgemeiner kann man Interpretationen eines deduktiven Sys- tems in einem übergeordneten deduktiven System betrachten wie zum Beispiel bei der Henkinsemantik und wir nennen dies ebenfalls eine Semantik. Dadurch kann kann man Interpretationen von mathematischen Theorien auch in der allgemeineren Kategorientheorie oder anderen deduktiven Systemen wie der Typentheorie erhalten und die unterschiedlichen Grundlagen der Mathematik miteinander vergleichen.126

128 Ein gutes Beispiel dafür ist die Definition der natürlichen Zahlen von John von Neumann als Mengen: 0= , 1= , 2= , ,...,n +1= 0, 1,...,n ,... ∅ {∅} {∅ {∅}} { } Alternativ könnte man die Definition 0= , 1= , 2= ,...,n +1= n ,... ∅ {∅} {{∅}} { } machen. Keine dieser möglichen Definitionen ist aber vor irgendeiner anderen zu bevorzugen. Dedekind hat aus dem Nichteindeutigkeits- problem den Ausweg benutzt, jede mögliche Folge von Elementen in einer unendlichen Menge X mit einem Anfangselement und einer injektiven Selbstabbildung ∗ S : X X −→ zur Definition einer Menge der natürlichen Zahlen zu machen durch 0 := , 1 := S( ), 2 := S(S( )),..., ∗ ∗ ∗ um dann in einem Eindeutigkeitssatz zu zeigen, dass all diese „Avat- are” der natürlichen Zahlen isomorph zueinander sind. Bis heute ist die Mengenlehre die bevorzugte Grundlage mathematischer Untersuchungen und die meisten Mathematiker betrachten die Mengenlehre als die „Standardsemantik” der Mathematik. Darüber hinaus sehen sie die mathematischen Objekte (in einer platonischen Welt) genau dann als existent an, wenn sie in der Sprache der Men- genlehre definiert werden können. In der Geschichte gab es jedoch auch Mathematiker und Philosophen, die die platonische Sichtweise zumindest für unendliche Mengen abgelehnt haben, darunter ganz prominent Aristoteles (im Gegensatz zu Platon) und Carl–Friedrich Gauß oder Vertreter des Konstruktivismus oder des Intuitionismus. In Wirklichkeit ist alles etwas komplizierter und es gibt einen Stand- punkt, der den platonischen Realismus gar nicht benötigt und den wir in diesem Text einnehmen wollen. Die Mengenlehre ist eine axiomatisch gegebene Theorie, die selbst unterschiedliche Modelle besitzt, welche durch die Axiome nicht eindeutig festgelegt sind. Es gibt andere fundamentale Strukturen in der Mathematik, wie die Kategorientheorie oder die Typentheorie, 129 die nicht auf Mengenlehre aufbauen. Die Kategorie der Mengen oder jedes andere übergeordnete deduktive System kann im Prinzip als kategorielle Semantik dienen. Jedoch impliziert dies noch lange nicht die Existenz von Mengen oder anderer Objekte in einem platonischen Sinne, wie für jedes andere abstrakte Konzept der Mathema- tik auch.127 Die Postulierung unendlicher Mengen wie N als abstrakte syntaktische oder semantische Objekte ohne irgendeine materielle oder platonische Existenz stellt weder ein existentielles noch ein anderes Problem dar, solange keine Widersprüche auftauchen, die von der Verwendung solcher Objekte herrühren. Meiner Meinung nach berühren einige weit verbreitete Ansichten eher ein psychologisches Problem, bei dem Semantik mit Existenz gleichgesetzt wird. Dieses Problem hat dazu geführt, dass manche Mathematiker den Begriff der Semantik in der Mathematik gänzlich zugunsten reiner Syntax ablehnen, was aber eine überzogene Reaktion darstellt. In der mengentheoretischen „Standardsemantik” versteckt sich ein zweites Problem, denn die Mengenlehre selbst ist auch eine axiomatische Theorie, die dann von sich selbst semantisch beschrieben werden soll. Die Kontinuumshypothese ist ein wunderbares Beispiel dafür, wie die Wahrheit einer Aussage wie Es gibt eine Kardinalzahl κ mit <κ< 2ℵ0 ℵ0 von Axiomen abhängt, die in diesem Fall mit der Forcingkonstruktion zusammenhängen. Diese Schwierigkeiten hängen auch mit Benacer- rafs Dilemma zusammen, welches besagt, dass die Mathematik nicht zugleich eine gute Semantik und eine vernünftige Epistemiologie haben kann. Benacerrafs Dilemma wird oft als Argument gegen den platonischen Realismus verwendet.128 Benötigt die Mathematik eine Semantik? Nach dieser Diskussion stellt sich die Frage, ob es überhaupt eine Se- mantik in der Mathematik geben muss. Es gibt drei fundierte Argu- mente, die für eine mathematische Semantik sprechen. Erstens gibt es – nach Resultaten von Löwenheim, Skolem und Gödel, auf die

130 wir noch eingehen werden – rein syntaktische axiomatische deduktive Systeme, die unterschiedliche mengentheoretische Modelle haben, zum Beispiel die Dedekind–Peano Arithmetik129 selbst. Also können rein syntaktische deduktive Systeme Nichteindeutigkeiten hervorru- fen, die erst in der Semantik aufgelöst werden können. Solche Proble- me können auch durch Hinzunahme endlich vieler weiterer Axiome nicht behoben werden. Zweitens können semantische Modelle zeigen, dass mathematische Theorien konsistent sind. Die Existenz von Mo- dellen der Mengenlehre setzt allerdings weitere Axiome über sogenannte unerreichbare Kardinalzahlen voraus (siehe Kapitel 3). Drit- tens können Wahrheitstheorien, wie die von Alfred Tarski (siehe Ka- pitel 8), nur mit Hilfe von geeigneten semantischen Interpretationen funktionieren. Sind diese drei Argument stichhaltig? Die Tarskische Semantik für den Wahrheitsbegriﬀ taugt nur begrenzt als Argument, denn eine Interpretation einer Syntax in einer Metasprache (oder einem anderen deduktiven System wie zum Beispiel der Kategorie der Mengen) ist nur eine relative Lösung der Situation, die die Probleme in die Metasprache (bzw. in die Kategorientheorie) verschiebt. Ähnliches gilt für die Konsistenzfrage. In einem bemerkenswerten Vortrag von 2010 hat Vladimir Voevodsky die Konsistenz der Dedekind–Peano Arithmetik und damit der Mengenlehre in Zweifel gezogen. Dies pas- sierte etwa gleichzeitig als sein inzwischen verstorbener Kollege Ed- ward Nelson aus Princeton vergeblich einen Beweis der Inkonsistenz der Dedekind–Peano Arithmetik versucht hatte. Nelson hat übrigens auch eine mathematische Syntax entwickelt, um die Leibnizschen in- ﬁnitesimalen Zahlen rein syntaktisch zu beschreiben. Nelson war ein dezidierter Gegner des platonischen Realismus und der Semantik ganz allgemein. Er lehnte – ähnlich wie viele andere – auch die Existenz unendlicher Mengen als eigene Objekte ab. Man beachte, dass der Konsistenzbeweis der Dedekind–Peano Arithmetik von Gerhard Gentzen auf der Wohlordnung der Ordinalzahl ε0 beruht. Die Existenz solcher aktual–unendlicher Mengen führt zu inkon- struktiven Aussagen wie zum Beispiel Königs Lemma.130 Voevodsky

131 bezweifelte die benötigten Eigenschaften von ε0 in seinem Vortrag und damit die Konsistenz der Dedekind–Peano Arithmetik. Einen konkreten Widerspruch hat aber bisher noch niemand gefunden.

132 KAPITEL 8

Gödel und Tarski: Unvollständigkeit und Wahrheit

In diesem Kapitel beschäftigen wir uns mit der Suche nach dem Wahrhheitsbegriff und untersuchen, ob man den Begriff der Wahrheit für die Mathematik und andere Wissenschaften formalisieren kann. Beweisbare Aussagen werden dabei wahre Aussagen sein, aber die Umkehrung ist nicht immer erfüllt. Im Mittelpunkt werden die beiden Unvollständigkeitssätze von Gödel und die Wahrheitstheorie von Tarski stehen. Als Konsequenzen ergeben sich, dass der Begriff der Wahrheit mit dem Begriff der Semantik eng verbunden ist und Se- mantik mit Hilfe von Interpretationen von einer formalen Sprache in eine andere entsteht. Die Suche nach der Wahrheit Die Suche nach der Wahrheit ist sehr alt. In einem seiner Bücher131 hat Carlo Rovelli sehr anschaulich geschildert, wie die Entwicklung der Naturwissenschaften um 600 v. Chr. durch Anaximander von Milet einen enormen Aufschwung nahm, weil er religiöse Annahmen durch naturwissenschaftliche Denkweisen ersetzte. Dies wurde besonders anschaulich dokumentiert in Anaximanders Betrachtungen der Himmelskörper. Seine logischen Argumente stützen die im Wesent- lichen kugelförmige Form der Erde und ihre frei schwebende Lage im Raum durch Beobachtungen und präzise Schlussfolgerungen. Die Mathematik als Wissenschaft hatte sich schon vor dieser Zeit in baby- lonischen und sumerischen Kulturen zur Blüte entwickelt, aber auch in der Zeit von Anaximander und danach besonders in der einfluss- reichen Schule von Pythagoras.

133 Rovellis Beispiel illustriert wunderbar die Kompliziertheit des Wahr- heitsbegriffs. Denn wenn man sagt, dass die Erde eine Kugel ist, so ist diese Aussage nicht wörtlich wahr, nicht einmal die Abschwächung, dass die Erde ein Ellipsoid sei. Die Pole der Erde sind nämlich ab- geflacht, aber auf unterschiedliche Weise. Wenn man noch genauer hinsieht, dann erkennt man, dass die Erde an der Oberfläche recht unregelmäßig ist und auch im Inneren mit Materie gefüllt ist, die wir in ihrer innersten Struktur noch nicht vollständig verstehen und deren Zusammensetzung Lücken im Raum beinhaltet. Daher ist die beste Form dieser Aussage nur, dass die Erde annähernd kugelförmig ist. Auch wenn die Aussage, dass die Erde annähernd kugelförmig ist, etwas unpräzise erscheinen mag, so möchte ich sie dennoch eine „stabile Wahrheit” nennen. Man könnte alternativ auch „Wahrheit im We- sentlichen” sagen. Anaximanders Argumente liefern einen strengen Beweis dafür. Diese Aussage schließt inbesondere alle Behauptungen klar aus, die die Erde als eine Scheibe bezeichnen. Ein anderes illustrierendes Beispiel ist die Aussage, dass die Arten auf der Erde in ihrer Vielfalt durch eine Form der Darwinschen Evo- lution entstanden sind. Dafür gibt es ebenfalls Beweise, auch wenn wir den genauen Mechanismus am Anfang dieses Prozesse vielleicht nicht genau verstehen und die Darwinsche Theorie in der Folgezeit häufig modifiziert werden musste und in der Zukunft sich womöglich noch ändern wird. Sie bildet - nach allem was wir derzeit wissen – ebenfalls eine stabile Wahrheit. Im Gegensatz zu gängigen Meinun- gen stellt diese Aussage übrigens keinen Widerspruch zur möglichen Existenz eines göttlichen Wesens dar. Stabile Wahrheiten sind dadurch definiert, dass sie absoluten Cha- rakter haben und einen Sachverhalt so treffend beschreiben, dass die Aussage auch bei kleinen Störungen der Situation oder Weiterent- wicklungen des Wissens erhalten bleibt. Die Existenz beweisbarer (stabiler) Wahrheiten ist – im Gegensatz zu unbelegten Behauptun- gen und Mythen – eine wichtige Voraussetzung für die Wissenschaft

134 und für das Gelingen unseres Zusammenlebens. Neben den stabilen Wahrheiten gibt es natürlich auch die „gewöhnlichen” absoluten Wahrheiten, wozu ich insbesondere mathematische Sätze zählen wür- de, die aus gewissen Voraussetzungen, bezeichnet mit Γ, eine Aussage A behaupten. In der Regel sind sie also von der Form Γ A. ⊢ Die Voraussetzungen in Γ können auch Axiome beinhalten. Es darf nicht unerwähnt bleiben, dass nicht alle Philosophen in der Geschichte und besonders in der Gegenwart von solchen absoluten Wahrheiten überzeugt sind, seien sie stabil oder nicht. Vielmehr behauptet die Strömung des Relativismus, bzw. Wahrheitsrelativismus, dass die Wahrheit in der Wissenschaft keine Letztbegründung hat. Damit schließt der Relativismus absolute stabile Wahrheiten explizit aus. In unseren Beispielen wäre die Position der Relativisten vermutlich, dass zur Erklärung der Form der Erde oder des Verlaufs der Evolution noch mehr Annahmen, d.h. weitere Wahrheiten über die Physik oder die Biologie, zugrunde liegen, auf die verwiesen werden müsste. In unserer Gesellschaft ist die Diskussion eines komplexen Sachver- haltes einer stabilen Wahrheit in der Regel schwer zu vermitteln und daher gelangen die Erkenntnisse oft nicht in das Bewusstsein der Gemeinschaft. In der Öﬀentlichkeit war es auch lange schwer zu vermitteln, dass der Wahrheitsbegriﬀ in der Wissenschaft ständig hinter- fragt werden darf und muss, und wir der stabilen Wahrheit manchmal nur in vielen Einzelschritten näher kommen. Während der Coronakri- se wurde diese Einsicht jedoch durch geschickte Wissenschaftskom- munikation einzelner Personen zumindest in Deutschland positiv in den Fokus gerückt.

135 Das Gegenteil von Wahrheit Was ist eigentlich das Gegenteil von Wahrheit? Nun ja, Unwahrheit. Diese Antwort macht es sich aber etwas zu leicht, besonders in An- betracht der Wichtigkeit von Wahrheit. Natürlich sind alle falschen Aussagen, d.h. das Gegenteil von wahren Aussagen, unwahr. Bereits Philosophen der Aufklärung wie zum Beispiel Leibniz, Hob- bes, Locke, Hume und Kant haben sich Gedanken über die Entste- hung von unwahren Aussagen gemacht und führten dies auf das Feh- len oder das Ignorieren von Beweisen und andere Fehler zurück. Leib- niz schrieb dazu: Nachdem wir genugsam von allen den Mitteln, welche uns die Wahrheit erkennen oder ahnen lassen, gesprochen haben, wollen wir noch etwas von unseren Irrtümern und unrichtigen Urteilen sagen. Die Menschen müssen sich wohl oft irren, weil es so viele Mißhelligkeiten unter ihnen gibt. Die Ursachen davon können auf folgende vier zurückgeführt werden: 1) den Mangel an Beweisen, 2) die geringe Geschick- lichkeit, sich derselben zu bedienen, 3) den Mangel an gutem Willen, davon Gebrauch zu machen, 4) die falschen Wahrscheinlichkeitsregeln.132 Unter Wahrscheinlichkeitsregeln verstand Leibniz den Anteil von Ein- schätzung, den die Menschen in ihrem Urteil verwenden. In der Tat ist der Mensch ein häufig irrational handelndes Wesen, dessen Einschät- zungen immer wieder durch falsche Vorurteile beeinflusst werden.133 Falsche Aussagen können durch Fehler entstehen, die letztlich Nach- lässigkeiten sind. Mit dem Fehler eng verwandt ist der Begriff des Trugschlusses, der eine fehlerhafte Implikation in Sinne der Logik meint und bei der die handelnde Person sich im Recht fühlt. In der Umgangssprache und der dort verwendeten Logik werden oft Trugschlüsse gemacht. Besonders auffällig ist, dass die Implikation A B in vielen Fällen grundlos „umgedreht” wird. Machen wir zwei Beispiele⇒ dazu und betrachten die Implikationen:

136 Ich esse eine Suppe Ich bin lebendig ⇒ und Mein Chef schätzt meine Leistungen nicht Mein Gehalt wird nicht erhöht. ⇒ In beiden Fällen sind die Implikationen ziemlich offensichtlich korrekt. Dies ist übrigens unabhängig davon, ob ich gerade eine Suppe esse oder der Chef meine Leistungen wirklich nicht schätzt, denn eine Implikation A B ist auch immer wahr, wenn die Aussage A falsch ist. Bei der ersten⇒ Implikation ist die Umkehrung Ich bin lebendig Ich esse eine Suppe ⇒ in der Regel unsinnig. Jedoch wird diese Art von Umkehrung bei der zweiten Implikation ständig angewandt, auch wenn es offenbar viele andere Gründe geben kann, warum Gehälter nicht erhöht werden. Ein anderer Trugschluss ist die Verknüpfung von Korrelationen mit Kausalitäten. Ein sehr berühmtes Beispiel dafür ist die Korrelation von Geburtenrate und dem Vorkommen von Störchen in bestimmten Wohngebieten. Daraus die Kausalität zu schließen, dass Babys von Störchen gebracht werden, ist offenbar unsinnig. Die Wahrheit ist, dass es andere Parameter gibt, die beides begünstigen oder verhindern, wie möglicherweise die ländliche oder städtische Lage. Ein über Fehler und Trugschlüsse hinaus gehender länger andauern- der Zustand ist der Irrtum – jedenfalls werden wir das in diesem Text so nennen. Dies ist ein Zustand in den Gedanken eines Menschen, bei dem er oder sie die Wahrheit gewisser Aussagen glaubt, weil die Situation zur Zeit des Irrtums in den Gedanken des Menschen viel vermeintliche Evidenz aufweist. Selbst in einer so exakten Wissenschaft wie der Mathematik kommen solche Dinge nicht selten vor. Russells Antinomie, die in Freges Werk auftauchte kann als der fundamentale Irrtum der naiven Mengenlehre betrachtet werden und ist einer der bedeutensten Irrtümer der Ma- thematik. Albert Einstein hat mit seinen bedeutenden Arbeiten im Annus Mirabilis 1905 mit einigen Irrtümern der Physik aufgeräumt.

137 Irrtümer in der Wissenschaft führen nach ihrer Aufdeckung in der Folge oft zu neuen Erkenntnissen. Zum Beispiel hat die Russellsche Antinomie zu den Zermelo–Fraenkel Axiomen der Mengenlehre und zur Russellschen Typentheorie geführt. Letztlich hat sie dadurch die Entwicklung der Martin–Löf Typentheorie und ihre heutigen Vari- anten ermöglicht. Einsteins Arbeiten im Jahr 1905 waren allesamt Durchbrüche der Physik. Vollständigkeit und Modelltheorie Zwei Mathematiker, nämlich Leopold Löwenheim und Thoralf Sko- lem, haben im 20. Jahrhundert eine mathematische Theorie der Se- mantik begründet und haben damit die Grundlage für die Modell- theorie und die Arbeiten von Tarski und Gödel gelegt. Der Satz von Löwenheim–Skolem ist nach diesen beiden Mathematikern benannt und wurde 1915 von Löwenheim zuerst bewiesen. Um 1920 gab Sko- lem einen weiteren allgemeineren Beweis. Die Methode von Skolem beweist dabei auch gleichzeitig den Vollständigkeitssatz von Gödel, den Gödel 1929 in seiner Dissertation bewiesen hatte. Gödel verwies in seiner Dissertation auf den Beweis von Skolem: Ein ähnliches Verfahren hat Th. Skolem zum Be- weise des bekannten nach ihm und Löwenheim be- nannten Satzes verwendet.134 Der Vollständigkeitssatz besagt, dass jede Aussage, die in einer axiomatischen Theorie der Prädikatenlogik erster Stufe formuliert wurde genau dann beweisbar ist, wenn sie in jedem mengentheoretischen Modell erfüllt (also wahr) ist. Dabei ist es klar, dass jede beweisbare Aussage auch immer in jedem Modell erfüllt ist. Nur die Umkehrung ist der schwierige Teil dieses Satzes. Man nennt ein gegebenes Mo- dell auch eine Interpretation des gegebenen deduktiven Systems. Der Satz von Löwenheim–Skolem besagt, dass die Existenz eines unendlichen Modells einer endlich oder abzählbar axiomatisierten mathematischen Theorie formuliert in der Prädikatenlogik erster Stufe für jede (unendliche) Kardinalzahl κ immer ein Modell der Mächtigkeit κ impliziert. Dieser Satz, der heute meist aus dem Vollständigkeitssatz

138 als Korollar hergeleitet wird, zeigt, dass deduktive Systeme immer Modelle unterschiedlicher Kardinalität besitzen und somit sind Mo- delle in der Logik erster Stufe niemals eindeutig. Dies ist ein über- aus bemerkenswertes Resultat. Es zeigt, dass deduktive Systeme ein mathematisches Objekt durch die Logik erster Stufe nicht eindeutig charakterisieren können. Der Satz impliziert viele scheinbar paradoxe Aussagen, wie zum Bei- spiel die Existenz abzählbarer Nichtstandardmodelle der reellen Zah- len und abzählbare oder überabzählbare Nichtstandardmodelle der natürlichen Zahlen. Ein Nichtstandardmodell von N kann dabei einfach durch eine Art von Adjunktion konstruiert werden. Man wählt dazu ein neues Element c, das von allen natürlichen Zahlen verschieden vorausgesetzt wird und die fordert unendlich viele Bedingungen (ausdrückbar in der Prädikatenlogik erster Stufe) c > n für jedes n N. ∈ Der Satz von Löwenheim–Skolem ergibt dann ein neues Modell mit mindestens einer unendlich großen Zahl c. Jedes Modell von N enthält jedoch die sogenannten „Numerale”, d.h. die „gewöhnlichen” natür- lichen Zahlen der Form n¯ = Sn(0), die durch n–fache Anwendung des Nachfolge–Operators S entstehen. Nur das Standardmodell der Numerale ist in allen Modellen bis auf Isomorphie eindeutig. Solche Aussagen und Konstruktionen widersprechen nicht den in den Lehrbüchern vorkommenden Eindeutigkeitssätze für die natürlichen und reellen Zahlen, denn diese sind stets in der Prädikatenlogik zweiter Stufe formuliert. So hat Dedekind die Eindeutigkeit (bis auf Iso- morphie) der natürlichen Zahlen mit Hilfe seines Rekursionssatzes gezeigt. Der Satz von Löwenheim–Skolem ergibt auch abzählbare Mo- delle der reellen Zahlen. Die Überabzählbarkeit der reellen Zahlen ist solchen in abzählbaren Modellen eine in gewissem Sinne korrekte Aussage, die auch das Skolemparadoxon135 genannt wird. Diese beiden Sätze bilden den Beginn des Gebiets der Modelltheorie innerhalb der Mathematik. Es untersucht, welche mengentheoretischen Interpretationen für axiomatische mathematische Strukturen

139 existieren und was man darüber aus Kenntnis der logischen Grund- lagen aussagen kann. Zu den wichtigsten Resultaten dieses Gebiets gehört neben den erwähnten Theoremen auch der Kompaktheitssatz, der von Kurt Gödel in seinem Beweis des Vollständigkeitssatzes gefunden wurde. Alfred Tarski gilt heute neben Kurt Gödel, Leopold Löwenheim und Thoralf Skolem als Mitbegründer der Modelltheorie, da er selbst Re- sultate wie den Satz von Tarski–Seidenberg über Quantorenelimina- tion erzielt hat und seine semantische Wahrheitstheorie ist natürlich eng mit der Modelltheorie verwandt. Interessanterweise gilt Skolem auch als Vorreiter der Idee der Forcing– Methode in der Mengenlehre, die von Paul Cohen gefunden wurde. Skolem schrieb in einer Arbeit von 1922: Es würde ja auch ein weit grösseres Interesse haben, wenn man beweisen könnte, dass eine neue Un- termenge Z0 adjungiert werden könnte, ohne dass Widersprüche aufträten; dies wird wohl aber sehr schwer werden.136 In diesem Text werden wir über die mengentheoretische Semantik allerdings weit hinausgehen. Unsere Untersuchungen zur Typentheorie ab Kapitel 9 wird uns die Welt der kategoriellen Modelle nahebrin- gen, die in vielerlei Hinsicht eine natürlichere Sichtweise darstellen. Die Kategorie der Mengen ist das kanonische Beispiel für eine Katego- rie schlechthin und die Mengenlehre wird damit zu einem Spezialfall dieser neuen Sichtweise. Der Gödelssche Unvollständigkeitssatz Kurt Gödel hat sich in seinem Leben auch sehr intensiv mit Leibniz und der Idee der Scientia Generalis beschäftigt. Er steigerte sich der- art in die Lektüre hinein, dass er zeitweise sogar der Meinung war, dass die Editionen Leibnizscher Werke bewusst diese entscheidenden Ideen in der Veröﬀentlichung zurückhalten würden.

140 Gödel revolutionierte die mathematische Logik um 1930 bereits in seiner Dissertation (unter Hans Hahn) mit dem Beweis des Vollständig- keitssatzes. Dieser besagt, dass beweisbare Aussagen in erster Stufe genau die Tautologien sind, d.h. die in allen Modellen wahren Aus- sagen. Dies ist eine Aussage zur Semantik der logischen Aussagen. Es gelang ihm wenig später, innerhalb einer (konsistenten) axiomatischen Theorie, die mindestens so ausdrucksstark ist wie die Dedekind– Peano Arithmetik, eine selbst–referentielle, formal–sprachliche Aus- sage (Gödelaussage) Q zu bilden, die von der Form Ich bin nicht beweisbar ist und damit ähnlich zum Lügnerparadoxon ist. Dazu benutzte er seine Methode der Gödelisierung von Formeln der Dedekind–Peano Arithmetik mit Hilfe von elementarer Zahlentheorie. Es gibt viele verschiedene Möglichkeiten, Gödelnummern von Zeichenfolgen zu deﬁ- nieren. So kann man zum Beispiel die Folge der Primzahlen

p1 =2, p2 =3, p3 =5,... benutzen und die betrachteten Zeichen mit natürlichen Zahlen kodieren, beispielsweise durch A 1, B 2,C 3,...,H 8,... → → → → und dann ein Wort wie BACH mit der Gödelnummer 22 31 53 78 = 8647201500 · · · versehen. Solche Nummerierungen von Ausdrücken in formalen Spra- chen kommen bereits bei Leibniz vor. Die Gödelnummer einer Formel A wird oft mit pQq bezeichnet. Die eindeutige Primfaktorzerlegung von ganzen Zahlen macht es dann möglich, aus der Gödelnummer 8647201500, die Zeichenfolge BACH wieder zu rekonstruieren. Zusätzlich musste er zeigen, dass Opera- tionen im deduktiven System der Dedekind–Peano Arithmetik (wie zum Beispiel Beweise) berechenbaren Funktionen der Gödelnummern entsprechen. Diese Art von Nummerierung erlaubte es Gödel, mit Hilfe eines sogenannten Diagonallemmas eine neue geschlossene For- mel Q zu bilden, die der Gödelaussage auf eine syntaktische Weise

141 entspricht, im Gegensatz zum semantischen Problem des Lügnerpa- radoxons. Das Diagonallemma von Gödel besagt, dass jede Formel P = P (x) mit genau einer freien Variable x in einer axiomatischen Theorie innerhalb der Prädikatenlogik erster Stufe, die rekursive Funktionen beschreiben kann, eine Aussage Q als Fixpunkt besitzt, für die die folgende Äquivalenz beweisbar ist: Q P (pQq). ⇔ Der Beweis des Diagonallemmas benutzt, dass die Funktion f mit der Eigenschaft f(pϕq)= pϕ(pϕq)q berechenbar ist und damit eine Darstellung als zweistelliges Prädikat in der Theorie besitzt. Für die Formel P benutzt man die Eigenschaft der Nichtbeweisbarkeit P = Bew, ¬ d.h. P (n) ist genau dann 1, falls n die Gödelnummer einer beweisbaren Formel ist. Die Eigenschaft P (pQq)=0 ist daher gleichbedeutend damit, dass Q nicht beweisbar ist. Einen kürzeren Beweis dieses Satzes hat Raymond Smullyan gefunden. Er konstruierte dazu ein minimale logische Sprache, in der die selbstbezügliche Gödelformel Q formuliert werden kann.137 Mit dieser Methode zeigte Gödel die Existenz weder beweisbarer noch widerlegbarer Aussagen in formalen Sprachen, die die Dedekind– Peano Arithmetik umfassen – der sogenannte erste Unvollständig- keitssatz.138 Soweit haben wir uns nur die syntaktischen Aspekte des Unvollstän- digkeitssatzes angesehen. Es gibt aber auch einen semantischen Blick darauf. Wenn man ein mengentheoretisches oder kategorielles konsis- tentes Modell der betrachteten formalen Sprache benutzt, so können darin die natürlichen Zahlen im Standardmodell der Numerale vorliegen oder in einem Nichtstandardmodell. Die semantische Version des ersten Unvollständigkeitssatzes besagt dann, dass die Formel Q

142 in denjenigen Modellen wahr ist, für die natürlichen Zahlen im Stan- dardmodell vorliegen. In diesen Fällen ist Q also wahr, aber gleichzeitig weder beweisbar noch widerlegbar. Die Aussage Q kann auch durch einen konkreten mathematischen Satz ersetzt werden. Ein schönes Beispiel dafür, welches später gefunden wurde, ist der Satz von Goodstein, der im Standardmodell der natürlichen Zahlen gilt und mittels transfiniter Induktion bewiesen werden kann. In den Nichtstandardmodellen sind solche Sätze aber nicht mehr gültig wegen des Gödelschen Vollständigkeitssatzes. Die Begriffe Wahrheit und Beweisbarkeit sind also im Allgemeinen ganz verschieden! Der zweite Unvollständigkeitssatz sagt aus, dass der Beweis der Kon- sistenz (d.h. der Widerspruchsfreiheit) mathematischer Theorien, die die Dedekind–Peano Arithmetik enthalten, nicht innerhalb derselben möglich ist. Wir haben bereits erwähnt, dass starke Versionen des platonischen Realismus die Existenz der mathematischen Objekte als Mengen behaupten, was die Konsistenz der Mengenlehre und damit auch der Arithmetik beweist. Wenn man dies nicht akzeptiert, dann muss man Konsistenzbeweise mittels „höherer” Methoden durchfüh- ren, wie es Gerhard Gentzen ab 1940 mit Hilfe von transfiniter In- duktion für die Dedekind–Peano Arithmetik gemacht hat. Die Widerspruchsfreiheit der Zermelo–Fraenkel Mengenlehre ist also ebensowenig bewiesen wie die Widerspruchsfreiheit der Dedekind– Peano Arithmetik. Auch der erste Gödelsche Unvollständigkeitssatz lässt sich auf die Mengenlehre anwenden, da man die Dedekind–Peano Arithmetik innerhalb der Mengenlehre realisieren kann. Per Martin–Löf hat die Unvollständigkeit mit den Kantschen synthetischen Urteilen und die Vollständigkeit mit den Kantschen analytischen Urteilen in Verbindung gebracht.139 Die Unvollständigkeit entspricht als gewissermaßen der in einem synthetischen Begriff fehlen- den Information, die analytisch nicht gewonnen werden kann. Gödel hatte eine ähnliche Einstellung: Durch Hinzunahme weiterer Axiome wird die Unvollständigkeit teilweise aufgehoben, weil neue Aussagen

143 abgeleitet werden können, mit dem Preis weiterer neuer Unvollstän- digkeit. Die Unvollständigkeitssätze von Gödel kann man benutzen, um zu untersuchen, ob das menschliche Denken einem Computer, d.h. einer universellen Turingmaschine überlegen ist oder nicht. Diese Frage stellte sich bereits Alan Turing, ohne allerdings eine Antwort zu finden. Er formulierte den Turingtest, ein hypothetisches Experiment, bei dem mit Hilfe von gezielten Fragen unterschieden werden soll, ob ein Gegenüber ein Mensch oder ein Computer ist.140 Mit Hilfe der Gödelschen Unvollständigkeitssätze hat John Randolph Lucas 1961 ein Argument gefunden, das zeigen soll, dass das menschliche Denken tatsächlich jedem Computer überlegen ist. Nehmen wir an, dass dies nicht der Fall ist, d.h. das Gehirn eine universelle Tu- ringmaschine ist. Dann benutzt Lucas die formale mathematische Theorie, die durch die Berechnungen dieser universellen Turingma- schine erzeugt wird. Offenbar umfasst diese Theorie die Arithmetik, da der Mensch rechnen kann. Man muss auch die zweifelhafte An- nahme machen, dass das menschliche Denken konsistent ist. Dieser Theorie entspricht eine korrespondierende Gödelaussage, die die Tu- ringmaschine, die dem menschlichen Gehirn entspricht, nicht als wahr erkennen kann, der Mensch aber schon, weil er die Gödelsche Theorie kennt und weiß, dass die Gödelaussage wahr ist. Dieser Widerspruch beweist die Behauptung von Lucas. Auch wenn man der universellen Turingmaschine die Unvollständigkeitssätze zur Verfügung stellt, so dass sie diese endlich oft anwenden kann, so ist nach Lucas das Argument immer noch gültig.141 Im Nachlass von Gödel hat man dazu passend einen unveröffentlich- ten Artikel von 1951 gefunden, in dem er schrieb: Either mathematics is incompletable in this sense, that its evident axioms can never be comprised in a finite rule, that is to say, the human mind (even wi- thin the realm of pure mathematics) infinitely sur- passes the powers of any finite machine, or else there

144 exist absolutely unsolvable diophantine problems of the type specified.142 Man kann an diesem Argument kritisieren, dass die Gödelaussage, die dem menschlichen Gehirn entspricht, so kompliziert ist, dass sie auch dem Menschen selbst gar nicht zur Verfügung steht. Dies zerstört im Prinzip das Argument. Roger Penrose hat Varianten des Arguments von Lucas publiziert143 und zudem behauptet, dass das menschliche Gehirn auch Quanten- physik benutzt, um das Phänomen des Bewusstseins zu erzeugen. Einige Mathematiker und auch Neurowissenschaftler haben versucht, diese Behauptungen zu widerlegen. Das Argument von Penrose unterscheidet sich nur leicht vom Lucasschen Beweis. Auch John Searle hat mit seinem Gedankenexperiment des Chinesischen Raums ein Ar- gument gefunden, um die Überlegenheit des menschlichen Denkens gegenüber jeglichen Maschinen zu zeigen.144 Alle diese Argumente sind ziemlich umstritten und greifen die populäre neurowissenschaft- liche Theorie an, die „Computational theory of the mind” genannt wird. Die Gödelschen Unvollständigkeitssätze gelten auch in einer intuitionistischen Version, d.h. auch der intuitionistische Wahrheitsbegriff unterscheidet sich vom Beweis– oder Berechenbarkeitsbegriff. Die Wahrheitstheorie von Alfred Tarski In diesem Abschnitt wollen wir den Wahrheitsbegriff weiter untersuchen. Alfred Tarski war der erste, der eine formal korrekte Wahr- heitsdefinition geben konnte. Vom heutigen Standpunkt aus kann man sagen, dass Tarski viele neuere Wahrheitstheorien beeinflusst hat, neben den Theorien von Kripke insbesondere die axiomatischen, syntaktischen, deflationären, disquotationalen oder minimalistischen Wahrheitstheorien.145 Tarski wollte eine Wahrheitstheorie schaffen, die die aristotelische Korrespondenztheorie weiterentwickelt und präzisiert. In einer be- rühmten Arbeit von 1933 schrieb er selbst:

145 Vorliegende Arbeit ist fast gänzlich einem einzigen Problem gewidmet, nämlich dem der Definition der Wahrheit; sein Wesen besteht darin, dass man – im Hinblick auf diese oder jene Sprache – eine sachlich zutreffende und formal korrekte Definition des Ter- minus „wahre Aussage” zu konstruieren hat. Dieses Problem, welches zu den klassischen Fragen der Phi- losophie gezählt wird, verursacht bedeutende Schwie- rigkeiten. Obgleich nämlich die Bedeutung des Ter- minus „wahre Aussage” in der Umgangssprache recht klar und verständlich zu sein scheint, sind alle Ver- suche einer genaueren Präzisierung dieser Bedeu- tung bis nun erfolglos geblieben und manche Unter- suchungen, in welchen dieser Terminus verwendet wurde und welche von scheinbar evidenten Prämis- sen ausgingen, haben oft zu Paradoxien und Anti- nomien geführt (für welche sich übrigens eine mehr oder weniger befriedigende Lösung finden liess). Der Begriff der Wahrheit teilt in dieser Hinsicht das Schick- sal anderer analoger Begriffe aus dem Gebiet der sog. Semantik der Sprache.146 Tarski gelang dies im Kontext von Sprachen, die er „ärmere” Sprachen nannte. Zu diesen gehören insbesondere die formalen Sprachen der Logik und der Mathematik. Er schrieb dazu: Im weiteren Verlaufe der Abhandlung werde ich aus- schließlich die einzigen nach wissenschaftlichen Me- thoden aufgebauten in Betracht ziehen, welche heute bekannt sind, d.i. die formalisierten Sprachen der deduktiven Wissenschaften; ihre Charakterisierung wird am Anfange des §2 gegeben ... In Bezug auf die „ärmeren” Sprachen findet das Problem der De- finition der Wahrheit eine positive Lösung.147 Sein Hauptresultat formulierte Tarski in dieser Arbeit wie folgt:

146 Für jede formalisierte Sprache endlicher Ordnung können wir in der Metasprache eine formal korrekte und sachlich zutreﬀende Deﬁnition der wahren Aussage konstruieren, indem wir ausschließlich Aus- drücke von allgemein–logischem Charakter verwenden, ferner Ausdrücke der Sprache selbst, sowie Ter- mini aus dem Gebiete der Morphologie der Spra- che, d.h. die Namen der Sprachausdrücke und der zwischen ihnen bestehenden strukturellen Relatio- nen.148 In den von ihm so genannten „reicheren” Sprachen, zu denen man auch die natürlichen Sprachen zählen könnte, kann man diese Kon- struktion nicht direkt anwenden. Tarskis Methode kann man auch so interpretieren, dass er für bestimmte „ärmere” Sprachen eine Se- mantik mittels einer Metasprache konstruierte, die die Wahrheit von Aussagen beschreibt. Bei den formalen Sprachen der Mathematik, die auf der Logik aufbauen, ist die Metasprache meist durch die „Stan- dardsemantik” der Mengenlehre gegeben. Ganz konkret verwendete Tarski für seine Wahrheitstheorie eine formale Sprache L1 (eine „ärmere” Sprache) und eine zweite sogenannte Metasprache L2, die L1 enthält. Er benutzte für seine neue Theorie ein Wahrheitsprädikat T (das T steht für True oder für Tarski), mit dem die Wahrheit von Aussagen aus L1 innerhalb von L2 überprüft werden kann. Es gibt dafür das berühmte Beispiel von Tarski für sein Wahrheitskriterium: Der Satz „Schnee ist weiß” ist wahr Schnee ist weiß. ⇔ Diese Äquivalenz wird in der Literatur auch Tarskisches Bikonditio- nal genannt. Hierbei ist der linke Satz in Anführungsstrichen eine atomare Aussage der formalen Sprache L1 und sie ist genau dann wahr, wenn dies innerhalb der Metasprache L2 nachgewiesen werden kann, d.h. wenn jemand z.B. mit einem physikalischen Argument wie einer Spektralanalyse argumentiert und damit nachweisen kann, dass die Farbe des Schnees tatsächlich weiß ist.

147 Die Wahrheit nichtatomarer Aussagen, die durch logische Zeichen wie UND oder ODER verknüpft sind, wird bei Tarski mittels Induk- tion über die Länge der Komposition der darin enthaltenen atomaren Aussagen festgestellt. Eine Schwierigkeit ergab sich aber bei Aussa- gen der Form xP (x) oder xP (x), ∃ ∀ denn diese Art von Aussagen lassen sich nicht weiter zerlegen in Teile, bei denen man Wahrheit überprüfen kann, da die Formel P (x) mit einer Variablen x für sich genommen weder wahr noch falsch ist. Tarski hat daher mit dem Begriff der Erfüllbarkeit von Aussagen statt mit dem Wahrheitsbegriff gearbeitet. Eine andere Möglichkeit, dieses Problem zu umgehen, ist die Methode der Quantorenelimination, die ebenfalls auf Tarski zurückgeht.149 Mit solchen Methoden gelang es Tarski, den Begriff Wahrheit zu definieren. Wenn man mathematisch Theorien wie die Dedekind–Peano Arith- metik betrachtet und sich an die Gödelnummern erinnert, so kann man arithmetische Aussagen ϕ auch dadurch als wahr charakterisieren, indem man T als Funktion der Gödelnummer interpretiert: ϕ ist wahr T (pϕq)=0. ⇔ Tarski betrachtete etwas allgemeiner endliche oder unendliche Hier- archien von formalen Sprachen L L , 1 ⊂ 2 ⊂··· so dass Li jeweils ein Wahrheitsprädikat in Li+1 besitzt. Diese Me- thode ist nützlich, um viele „etwas reichere” Sprachen zu erreichen. Ein anderer Satz von Tarski, der auch Gödel bekannt war, besagt, dass die Teilmenge der natürlichen Zahlen, die aus den Gödelnum- mern wahrer Aussagen in der formalen Sprache der Dedekind–Peano Arithmetik besteht, nicht arithmetisch ist, d.h. das Tarskische Wahr- heitsprädikat T ist innerhalb der Dedekind–Peano Arithmetik nicht definierbar. Insbesondere ist die Menge der wahren arithmetischen Sätze nicht rekursiv aufzählbar. Diesen Satz bezeichnet man oft als „Undefinierbarkeit” der Wahrheit. Man beachte, dass dieser Satz nicht im Widerspruch zu Tarskis Wahrheitsdefinition ist, aber er besagt,

148 dass man in der Tat echt reichhaltigere Sprachen benötigt, um ein Wahrheitsprädikat zu definieren. Um diesen Satz zu beweisen, nimmt man an, dass Wahrheitsbegriff durch eine einstellige Formel Wahr gegeben ist und wendet das Gödelsche Diagonallemma wie im Beweis des ersten Gödelschen Unvollständigkeitssatzes auf die Formel Wahr = „Ich bin nicht wahr” ¬ an. Der Fixpunkt ergibt dann einen Widerspruch.150 Aus dem korrekten mathematischen Beweis von Tarskis Satz folgt, dass die Menge der Gödelnummern von beweisbaren arithmetischen Formeln nicht mit der Menge der Gödelnummern von wahren Formel übereinstimmt, woraus eine Variante des ersten Gödelschen Unvoll- ständigkeitssatzes folgt.151 Wahrheitstheorie der Modallogik und der intuitionistischen Logik Einen Begriff einer Semantik gibt es auch für die intuitionistische Logik. Zum Beispiel hat Alfred Tarski eine Interpretation der intuitionistischen Logik in topologischen Räumen betrachtet, so dass eine logische Aussage genau dann wahr ist, wenn die Interpretation in allen topologischen Räumen erfüllt ist. Diese Interpretation von Tarski benutzt die Heyting Algebra Off(X) der offenen Mengen auf einem topologischen Raum X. Eine Heyting Algebra ist eine Verallgemei- nerung einer Booleschen Algebra, die auch die Operationen , , und besitzt, für die aber die Negation nicht den Satz vom∧ ∨ aus-⇒ geschlossenen¬ Dritten erfüllt.152 Im Fall der¬ Heyting Algebra Off(X) ist der Negationsoperator U angewandt auf eine offene Menge U durch den offenen Kern (X¬ U)◦ der Komplementmenge von U in X gegeben. Daher ist in diesem\ Beispiel die doppelte Negation U in der Regel nicht wieder U selbst. ¬¬ Noch allgemeiner als die intuitionistische Logik ist die Modallogik. Diese ist sehr alt und hängt mit der Theorie der möglichen Wel- ten von Leibniz zusammen. Die möglichen Welten bilden sogenannte

149 „Possibilia”, d.h. mögliche semantische Realisierungen, die einer Theo- rie in ähnlicher Form wie Modelle zukommen können. Die zugehörige Logik, die Modallogik war in Teilen schon vor Leibniz bekannt, zum Beispiel bei Jean Buridan, einem mittelalterlichen Philosophen. Die Modallogik enthält neben den beiden üblichen Wahrheitswerten wahr und falsch auch die möglichen und notwendigen Aussagen kennt, in Zeichen: ♦p : Es ist möglich dass p, p : Es ist notwendig, dass p. Ruth Barcan, verheiratete Ruth Marcus, legte in ihrer Doktorarbeit von 1946 die Grundlagen der modalen Prädikatenlogik dar, aufbauend auf dem modallogischen Kalkül von Clarence Irving Lewis.153 Dabei bewies (bzw. postulierte) sie Formeln, die heute als Barcansche Formeln bekannt sind: ♦ xF x x♦F x ∃ ⇒ ∃ und xF x xF x, ∀ ⇒ ∀ von denen die zweite Formel etwas mehr Akzeptanz besitzt als die erste, da die erste eine Existenzaussage in der wirklichen Welt impliziert für alle Objekte, auf die man die Formel anwenden kann. Der Leser möge sich selbst ein gutes Beispiel dafür überlegen. Daneben existieren auch die beiden sogenannten Buridanschen For- meln ♦ xF x x♦F x ∀ ⇒ ∀ und x♦F x ♦ xF x. ∀ ⇒ ∀ Saul Kripke bewies im Alter von 18 Jahren einen Vollständigkeitssatz für die Modallogik vor.154 Ihm gelang es auch, die Wahrheitsprä- dikate in Tarskischen Hierarchien von formalen Sprachen besser zu uniformisieren, so dass der Wahrheitsbegriﬀ nicht von der Stufe der formalen Sprache in der Hierarchie abhängt, und er untersuchte den Grenzwert.155 Neben Evert Willem Beth und Andrzej Grzegorczyk

150 führte er 1963 auch eine Semantik für die Modallogik ein, die die Se- mantik der klassischen und intuitionistischen Logik verallgemeinert. Diese sogenannte Kripke–Semantik verallgemeinert Tarskis Theorie der Semantik. Darin gibt es auch Aussagen, die kontingent genannt werden, weil sie möglich, aber nicht notwendig sind. Die möglichen semantischen Realisierungen hängen – wie bereits erwähnt – mit der Theorie möglicher Welten von Leibniz zusammen. Diese beiden Arten von Interpretationen wurden später von Saul Kripke, André Joyal und vielen anderen weiterentwickelt und führ- ten in der Folge zum Begriﬀ einer kategoriellen Semantik, welche die Typentheorie (auch Logik höherer Ordnung genannt) mit Ka- tegorientheorie in Verbindung bringt. Wir werden diese sogenannte Kripke–Joyal Semantik in Kapitel 9 noch besser kennenlernen. Um Saul Kripke und Ruth Barcan gab es einen lange währenden und bis heute nicht endgültig geklärten Prioritätenstreit um die Einfüh- rung einiger Begriﬀe in die Philosophie, inbesondere über die Ideen, die der Namenstheorie zugrundliegen, wie sie in dem berühmten Buch „Naming and Necessity” von Saul Kripke behandelt werden.156

151

KAPITEL 9

Typentheorie und ihre Semantik

Bertrand Russell hat ab 1902 nach seiner Entdeckung der Russell- schen Antinomie versucht, durch eine Typentheorie die Antinomien der naiven Mengenlehre zu vermeiden. Diese Ideen gingen in das Buch „Principia Mathematica” zusammen mit Alfred Whitehead ein. Diese Theorie war jedoch kompliziert und setzte sich zunächst nicht durch, zumal auch das Ansinnen, damit eine Begründung des Logizismus zu liefern, aus dem Grunde scheiterte, dass die unendliche Menge der natürlichen Zahlen als existent und unendlich angenommen werden musste. Leon Chwistek und Frank P. Ramsey machten einen Versuch, einige dieser Probleme zu beheben und schufen die „Simple Theory of Types”. Jedoch machte erst ein Artikel von Alonzo Church157 diesen Ansatz wirklich populär. Die „Simple Theory of Types” wurde in den folgenden Jahrzehnten zu einer Typentheorie mit abhängigen Typen weiterentwickelt und hat dadurch den Status einer potenziellen Grundlage der Mathema- tik erreicht. Dazu hat insbesondere Per Martin–Löf beigetragen. In der Folge wurde die Theorie von Martin–Löf noch zur Homotopy Type Theory von Vladimir Voevodsky et al. erweitert, die neben allgemeineren neuen Typkonstruktionen der Typentheorie eine topologische Semantik verleiht, als ob Typen topologischen Räumen entsprechen würden. Dies führt zu einer sehr anschaulichen Beschrei- bung der Typentheorie und gleichzeitig zu vielerlei Inspiration für die Weiterentwicklung der Typentheorie. Eine andere Konsequenz der Martin–Löfschen Typentheorie ist die Möglichkeit, maschinelle und veriﬁzierbare Beweise mathematischer Sätze zu generieren. Dies

153 eröffnet interessante Zukunftsperspektiven für die Mathematik und ihre Anwendungen. Martin–Löf Typentheorie Per Martin–Löf hat die „Simple Theory of Types” ab etwa 1971 weiterentwickelt und die sogenannte intuitionistische abhängige Typen- theorie als äquivalente Grundlage der Mathematik neben der Men- genlehre und der Kategorientheorie aufgebaut. Nachdem die erste im- prädikative Version von 1971 noch unter einem Paradoxon litt, das von Jean–Yves Girard gefunden wurde, entwickelte Martin–Löf auch prädikative 158 Versionen. Anfängliche Versionen waren extensional159 formuliert und dadurch war der Identitätsbegriff sehr eng gefasst. Die intensionale Version mit dem philosophisch wichtigen (und nichttrivialen) Begriff des Identitätstyps ist jedoch viel interessanter. Per Martin–Löf hat auch philosophische Arbeiten geschrieben, in denen er zum Beispiel die Kantsche Theorie der synthetischen Urteile mit Gödels Unvollständigkeitssätzen in Verbindung brachte.160 Wie wir bereits gesehen haben, hat die Mengenlehre einige schlech- te Eigenschaften. Insbesondere verhalten sich die drei intensionalen mengentheoretischen Beziehungen A B, A B und A B nicht gut unter Isomorphie. Sie sind in der Typentheorie⊆ ∩ in dieser∪ Form nicht vorhanden. Typen in der Typentheorie sind somit anders geartete Ansammlungen von Elementen als Mengen. Wie sieht die grundlegende Notation der Typentheorie aus? Ist A ein Typ und „bewohnt” durch ein a, so schreibt man a : A und will damit sagen, dass a dem Typ A angehört. Im Gegensatz zur Men- genlehre kann ein Bewohner a nur einem Typ angehören, d.h. jedes a hat einen festen Typ. Ähnlich wie in der Mengenlehre gibt es grundlegende Typen, wie zum Beispiel den Typ 0 (leerer Typ), der keine Bewohner besitzt, oder den Typ 1 (einelementiger Typ), der aus einem Bewohner besteht, sowie den Typ der klassischen Wahrheitswer- te Boolean = wahr, falsch . { }

154 Aus gegebenen Typen kann man folgende neue Typen machen. Da gibt es zunächst (für je zwei Typen A, B) den Abbildungstyp A B, −→ der aus „Abbildungen” f : A B besteht. Dies ist ein sogenannter primitiver Typ, der von der−→ betrachteten Typentheorie abhängt. Primitive Typen kann man nicht innerhalb der Theorie deﬁnieren, sondern sind durch diese vorgegeben. Jede solche Abbildung f beinhaltet auf gewisse Weise eine Vorschrift, mit der man für gegebenes a : A ein f(a): B erhalten kann. In der intuitionistischen Version der Typentheorie erwartet man, dass diese Vorschrift immer konstruktiv gegeben ist. Man kann in der Tat zeigen, dass f im Fall A = B = N eine berechenbare Funktion ist.161 Wie in der Mengenlehre hat man auch den Typ des (binären) Pro- duktes A B × und die (binäre) Summe A + B. Im ersteren Fall sind die Elemente durch Paare (a, b) mit a : A und b : B gegeben, im zweiten Fall erfüllt ein Element c : A + B entweder c : A oder c : B. Binäres Produkt und binäre Summe lassen sich wesentlich verallgemeinern, was zum Begriﬀ der abhängigen Typen führt. Das binäre Produkt verallgemeinert sich zum Produkt B(x). x:A Y Dabei ist B(x) ein sogenannter abhängiger Typ, der von x : A ab- hängt. Dies nennt man auch eine Familie von Typen und sie entspricht einer Abbildung F : B A mit den Typen B(x) als Fasern. −→ Ein Element im Produkt Πx:AB(x) interpretiert man als Abbildung s, die jedem x : A ein s(x): B(x) zuordnet. Die Abbildung s ist also ein Schnitt gegen die Abbildung F : B A. Somit sind die −→ Bewohner des Typs Πx:AB(x) die Schnitte der Abbildung F .

155 Abhängiger Typ (Faser) B(x) für drei Werte von x : A.

Die binäre Summe verallgemeinert sich zur direkten Summe B(x) x A X: Elemente darin sind einzelne Paare (x, y) mit y : B(x) für ein x : A. Die binären Typen sind jeweils Spezialfälle der allgemeineren Typen im Fall von Familien über dem Booleschen Typ. Der Identitätstyp IdA(a, b) ist ebenfalls ein primitiver Typ wie der Abbildungstyp. Falls er von einem Element p „bewohnt” wird, drückt p eine „propositionelle Gleich- heit” oder „Identität” a = b aus, im Gegensatz zur definitorischen Gleichheit. Wir schreiben die Begriffe „propositionelle Gleichheit” und „Identität” dabei in Anführungszeichen, da die Bewohner dieses Typs von der Typentheorie abhängen, also intensional sind und es mit anderen Worten keine allgemeingültige Definition für propositionelle Gleichheit gibt. Man schreibt einfach a = b oder

isidA(a, b), wenn der Typ IdA(a, b) bewohnt ist. Der Typ IdA(a, a) ist immer bewohnt. Der Identitätstyp IdA ohne vorgegebenes Paar (a, b) kann

156 als abhängiger Typ Id = Id (a, b) A A A A −→ × × (a,bY):A A aufgefasst werden und wird auch Pfadraum von A genannt. Er ist ein Beispiel für das Konzept eines sogenannten Polymorphismus der theoretischen Informatik, denn dieser Typ hängt zwar vom Typ A ab, tut dies aber auf universelle Weise. Wir werden nun einige wichtige Beispiele für sogenannte „induktive” Typen geben, die in anderer Form bereits in vorangegangenen Kapi- teln vorkamen, und die gewissermaßen aus der „puren Logik” geboren sind und durch ihre Rechenregeln bzw. universellen Eigenschaften determiniert werden. Induktive Typen werden in verallgemeinerter Form manchmal auch als W –Typen bezeichnet. Beginnen wir mit dem Typ der natürlichen Zahlen N. Dies ist ein rekursiver Typ gegeben durch den Konstruktor 0 : N, N := S : N N (Nachfolgerabbildung). ( −→ Ähnlich wie bei Dedekind wird also bei diesem Typ nur das An- fangselement 0 und die Nachfolgerabbildung S vorgegeben und die Existenz von N als unendliches Objekt wird dadurch postuliert. Die natürlichen Zahlen werden dann durch die unendliche Folge 0, 1= S(0), 2= S(S(0)),... gegeben. Ein weiteres Beispiel ist der „Kreis” S1, den man durch 0 : S1 (Basispunkt), S1 := (loop : IdS1 (0, 0) (Schleifenerzeuger), d.h. durch Postulation eines Basispunkts und eines neuen Pfades („Schleife”), der den Kreis deﬁniert, einführt. Man beachte, dass dieser „Kreis” nur einen Punkt 0 enthält. In ähnlicher Weise kann man

157 das „Intervall” I definieren durch 0, 1 : I (Anfangs- und Endpunkt), I := (path : IdI(0, 1). Man beachte, dass man das Intervall aus der Existenz primitiver Ob- jekte wie Pfade folgert und nicht umgekehrt, wie in der Topologie, wo zuerst das Intervall da ist und Pfade als Abbildungen auf dem Intervall definiert werden. Die Existenz dieser drei Typen N, S1 und I wird durch ihre Definiti- on nicht garantiert, sondern sie sind „freie” induktive Konstruktionen, deren Existenz man postuliert. Man muss dazusagen, dass der Begriff der Existenz für eine einzelne Typentheorie eigentlich gegenstandslos ist. Dagegen ist die Konsistenz, d.h. die Widerspruchsfreiheit, solcher deduktiven Systeme die entscheidende Frage. In semantischen Mo- dellen muss man die Existenz der konstruierten Typen in allen drei Fällen hingegen zeigen und stößt dort gegebenenfalls auf Bedingun- gen, wie zum Beispiel auf die Existenz unendlicher Mengen. Man beachte, dass die Konstruktoren induktiver Typen selbst eine offensichtliche Einfachheit und damit eine Eindeutigkeit besitzen. Bei- spielsweise stimmt der Konstruktor für N im Wesentlichen mit De- dekinds Definition der natürlichen Zahlen überein. Dies kann man als eine partielle Lösung des Nichteindeutigkeitsproblems sehen und es käme daher dem platonischen Realismus entgegen, wenn nicht die Existenzfrage so unbedeutend wäre. Typentheorie als deduktives System Auch in der Typentheorie kann man Urteile fällen. Als Grundlage dient ein sogenannter Kontext Γ, der aus einer Reihe von Termen

x0 : A0, x1 : A1(x0),...,xn : An(x0,...,xn−1).

Dabei sind die Ai abhängige Typen und die xi Variablen, die für Ter- me stehen, die man einsetzen kann. Diese Sequenz bildet somit die Ausgangssituation, um das Urteil zu fällen. Die Kontexte einer Ty- pentheorie bilden eine Kategorie, die sogenannte syntaktische oder

158 klassiﬁzierende Kategorie, die einer abhängigen Typentheorie auf na- türliche Weise zugeordnet ist. Ihre Morphismen entstehen aus naheliegenden Zuordnungen zwischen Kontexten, die auf Pfeile zwischen Typen zurückgehen.162 Die Urteile in einer Typentheorie sind bei Verwendungen von Kon- texten von der Form Γ A Typ ⊢ Γ A = B ⊢ Γ a : A ⊢ Γ a = b : A. ⊢ Typentheorie kann als deduktives System aufgefasst werden, wenn man geeignete Schlussregeln zugrundelegt.163 Ein Beispiel ist die Re- gel von Martin–Löf, auch Pfadinduktion genannt, die eine Variante des Leibnizschen Invarianzregel darstellt. Für jede Eigenschaft R(a, b) von Typen a, b : X gilt nach dieser Regel: a = b R(x, x) . R(a, b) Hierbei ist R eine zulässige Relation, d.h. ein von zwei Variablen abhängiger Typ, der Boolesche Werte annimmt. Die Gültigkeit von R(a, b) bedeutet hier, dass ein Beweis für die Gültigkeit von R(a, b) existiert.164 Wir wollen eine kleine Anwendung der Leibnizschen Invarianzregel geben, die zeigt, dass die Regel nichttriviale Implikationen hat. Sie impliziert nämlich, dass die propositionelle Gleichheit die schwächste Gleichheitsrelation ist, die alle Strukturen in einer gegebenen Ty- pentheorie erhält. Der Beweis ist wie folgt. Angenommen a b ist eine weitere Äquivalenzrelation der Gleichheit. Wir benutzen∼ dann die Relation R(x, y) = isidA(x, y)=(x = y).

159 Nun gilt immer auch x = x, d.h. R(x, x) für alle x : A. Also impliziert die Leibnizsche Invarianzregel für diese Relation R letztlich a b ∼ , a = b woraus die Behauptung folgt. Die Typentheorie wird oft auch als Logik höherer Stufe bezeichnet und verallgemeinert damit die Logik erster, zweiter, dritter Stufe usw. In der Logik zweiter Stufe können die Quantoren im Gegensatz zur Logik erster Stufe über beliebige Teilmengen von Individuenbereichen variieren, d.h. über Prädikatenvariablen ϕ, die solche Teilmengen A durch die Formel A = x ϕ(x) { | } beschreiben, wobei die Variable x einem Individuenbereich angehört. Die Logiken dritter und höherer Stufe verallgemeinern dies zu allgemeineren Iterationen solcher Situationen.165 Wir gehen darauf nicht im Detail ein, aber diese Art von mathematischer Logik ist in der intuitionistischen Variante der Typentheorie durch die Curry–Howard Korrespondenz eingebaut. Bei dieser werden logische Aussagen durch Typenkonstruktionen interpretiert.

Typen 0 1 A + B A B A B B(a) B(a) × → a:A a:A Logik A B A B A B a:AB(a) a:AB(a) ⊥ ⊤ ∨ ∧ ⇒ P∃ Q∀ In der Typentheorie muss man also keine Form der Logik zugrun- delegen. Stattdessen sind die logischen Begriﬀe in der Typentheorie eingebaut. Logik höherer Stufe und damit die Typentheorie ist ein sehr mächtiges Instrument durch diese Möglichkeiten. Die Modell- theorie bzw. Semantik unterscheidet sich aber von der Logik erster Stufe sehr stark. Insbesondere sind Nichtstandardmodelle der natür- lichen Zahlen ab der zweiten Stufe nicht mehr vorhanden, wie wir bereits an Dedekinds Eindeutigkeitssatz gesehen haben. Wir werden sehen, dass die Typentheorie dennoch eine interessante kategorielle Semantik besitzt.

160 Als eine Anwendung dafür gibt es ein wichtiges Prinzip, das als „Pro- positionen sind Typen” bezeichnet wird. Es besagt, dass jeder Pro- position P auch ein Typ zugeordnet ist, der bewohnt ist, wenn es einen konstruktiven Beweis von P gibt. Ein Beweis p : P von P wird auch manchmal „Zeuge” (engl. „witness”) genannt. Zum Beispiel ist ein Identitätstyp IdA(a, b) bewohnt, wenn es einen Beweis von a = b gibt und ein solcher Beweis ist der „Bewohner”. Die intuitionistische Martin–Löf Typentheorie erlaubt es, große Tei- le der Mathematik wie in einer Programmiersprache abzubilden. Es gibt Softwaretools und Programmiersprachen wie AGDA, COQ, ISA- BELLE und andere, um die Typentheorie praktisch einzusetzen und damit Beweise formal zu veriﬁzieren. Deshalb heißen diese Sprachen auch oft Beweisassistenten. In diesem Buch werden wir nicht ausführlich auf solche Programmier- sprachen eingehen, weil dies dem Stil dieses Buches nicht entspricht. Die Beschäftigung mit solchen Sprachen über wenige Tage ermöglicht einer interessierten Person, ein Level zu erreichen, bei dem man viele Beweise selbst durchführen kann. Die Softwareumgebung hilft eine bei sehr einfachen Probleme durch sinnvolle Befehle, in COQ auch „Tactics” genannt. Die logische Struktur eines komplizierten Bewei- ses muss man dem System jedoch selbst beibringen, d.h. der Mensch muss den Beweis selbst in Einzelteile zerlegen. Wenn der Beweis dann vollständig verstanden und durch den Computer erfolgreich ausge- führt wurde, dann kann man sicher sein, dass der gegebene Beweis auch korrekt ist. In der (ferneren) Zukunft ergeben sich durch solche Softwareum- gebungen durchaus realistische Möglichkeiten, nachweislich korrekte Beweise für große Teile der Mathematik zur Verfügung zu haben und vielleicht werden sogar noch intelligentere Systeme entwickelt, die uns bei Beweisen noch mehr als bisher unterstützen. Topologische Interpretation Martin Hofmann und Thomas Streicher waren die ersten, die be- merkten, dass in der Martin–Löf Typentheorie die Identitätstypen

161 eine tiefere mathematische Bedeutung aufweisen. Sie benutzen dazu die Theorie der Gruppoide. Viele Jahre später haben Steve Awodey und Michael Warren, Vladimir Voevodsky und andere Mathemati- ker zu dieser Entwicklung der Typentheorie weiter beigetragen, die häufig auch „Homotopy Type Theory” (HoTT) genannt wird.166 Typen A werden in der Homotopy Type Theory, anschaulich als topologische Räume interpretiert, in der ein a : A einen Punkt bildet. Die Homotopieäquivalenz von topologischen Räumen führt zum Be- griff der Äquivalenz von Typen, die eine entscheidende Rolle spielt. Es ist aber wichtig zu verstehen, dass diese topologische Vorstellung nur eine Interpretation ist und erst in topologisch orientierten semantischen Modellen Realität wird. Die Typentheorie kann natürlich ohne solche Vorstellungen definiert und benutzt werden. Trotzdem ist die Vorstellung, dass alle Typen keine Mengen sondern Räume sind ein wichtiger Paradigmenwechsel. Die Interpretation einer Funktion f : B A zwischen zwei Typen B und A ist topologisch gesehen eine stetige−→ Abbildung zwischen den beiden topologischen Räumen, die den Typen entsprechen. Abhängi- ge Typen können topologisch als Faserungen B A interpretiert werden. Dies sind spezielle stetige Abbildungen, die−→ wir noch genauer betrachten werden. Den Identitätstyp IdA(a, b) in der Typentheorie interpretiert man in der HoTT als Raum von Pfaden zwischen a und b und den Typ

IdA = IdA(a, b) × (a,bY):A A als Pfadraum von A. Wenn man konstante Pfade betrachtet und die Anfangs- und Endpunkte unterscheidet, so bekommt man eine Se- quenz von Pfeilen X Id A A. −→ A −→ × Der iterierte Identitätstyp

IdIdA(a,b)(p, q) zwischen zwei Pfaden p, q : IdA(a, b) besteht in dieser Interpretati- on aus einer Homotopie zwischen p und q, also aus einem Pfad im 162 Pfadraum. Die beiden abhängigen Typen x:A B(x) und x:A B(x) entsprechen topologischen Konstruktionen: Schnitten in Faserungen und Paaren, d.h. einzelne Elemente in Fasern.Q P Der konstante Pfad, die Verknüpfung von Pfaden und der inverse Pfad existiert auch in der Martin–Löf Typentheorie selbst: 1 Id (a, a), −→ A Id (a, b) Id (b, c) Id (a, c), A × A −→ A Id (a, b) Id (b, a). A −→ A Die Formeln p−1 p =1 , ◦ a p p−1 =1 , ◦ b (p q) r = p (q r), ◦ ◦ ◦ ◦ gelten hier natürlich ebenfalls nicht, sondern nur wenn man die For- meln durch gewisse höhere Terme ausgleicht. Diese Art von höheren Bedingungen kann man zur Deﬁnition einer Struktur auf den Identi- tätstypen nutzen, die man auch schwaches –Gruppoid nennt.167 Schwache –Gruppoide sind sehr reichhaltig∞ an Struktur. Zum Bei- spiel trägt∞ das (schwache) Fundamentalgruppoid Π(X) eines topologischen Raumes X wesentlich mehr Information als die gewöhnli- che Fundamentalgruppe π1(X). Alexander Grothendieck hat sogar vermutet, dass Π(X) die vollständige Homotopieinformation von X trägt und damit den Homotopietyp von X beschreibt.168 Unter An- nahme dieser Vermutung von Grothendieck können wir lernen, dass die Homotopietypen von topologischen Räumen durch die Gesamt- heit aller – Gruppoide (oder alternativ aller ( , 0)–Kategorien) gegeben sind.∞ Diese Kategorie der –Gruppoide∞ ist gemäß unseren Überlegungen in Kapitel 6 eine ( ∞, 1)–Kategorie. ∞

163 Isomorphie und Äquivalenz Der Begriff des Isomorphismus in der Mathematik ist äußerst wichtig und omnipräsent. Zwei Objekte A und B in einer gegebenen Kate- gorie sind isomorph, wenn es Morphismen, d.h. strukturerhaltende Pfeile, f : A B −→ und g : B A −→ gibt, so dass die Kompositionen f g und g f mit der Identitätsab- ◦ ◦ bildung idB bzw. idA übereinstimmen. Wenn das der Fall ist, nennt man f und g dann Isomorphismen. Um ein einfaches Beispiel zu geben, betrachten wir Gruppen mit 2 Elementen innerhalb der Kategorie der Gruppen. Davon gibt es bis auf Isomorphie nur eine. Es ist aber üblich, diese Gruppe entweder als additive Gruppe Z/2Z = 0, 1 mit 1+1=0 { } oder als multiplikative Gruppe µ = 1 mit ( 1) ( 1) = +1 2 {± } − · − zu schreiben. Der Isomorphismus f : Z/2Z µ −→ 2 wird gegeben durch die Zuordnung f(a)=( 1)a, denn es gilt ( 1)0 = +1 und ( 1)1 = 1. − − In vielen− Konstruktionen− der Mathematik sind mit der Existenz von Isomorphismen jedoch Probleme verbunden. Dies gilt zum Beispiel beim Studium von Mengen, die als Quotienten entstehen. Denn die Elemente solcher Quotientenmengen sind selbst Äquivalenzklassen von gleichartigen Objekten. Dieses Phänomen tritt bereits bei Brü- chen auf, aber weitaus unangenehmere Schwierigkeiten kommen in der aktuellen modernen Mathematik auf. Dort müssen häufig isomorphe Objekte identifiziert werden, ohne dass die konkrete Identi- fikation bekannt oder eindeutig und dgl. ist. Ein Beispiel dafür sind

164 die Probleme, die in derivierten Kategorien auftreten. Andererseits ist die zusätzliche Information, die in solchen Komplikationen steckt oft auch sehr wichtig, wie wir bei den –Fundamentalgruppoiden gesehen haben. ∞ Beim Studium solcher Dinge wird klar, dass der Begriﬀ der Gleichheit bzw. der Identität eine viel weiter reichende philosophische Bedeu- tung hat. In der Martin–Löf Typentheorie drückt sich dies in erster Linie in der Existenz der Identitätstypen aus. Vladimir Voevodsky hat aber die Bedeutung dieser Dinge wesentlich weiter vorangetrie- ben. Beim Studium von simplizialen Mengen als Modelle der Ty- pentheorie entdeckte er das Univalenzaxiom für die Typentheorie.169 Dieses Axiom gilt nicht in allen Modellen und seine Bedeutung für die ganze Theorie ist zur Zeit noch nicht ganz klar. Wir wollen dennoch versuchen, dieses Axiom zu erklären. Univalenz Gegeben zwei Typen A, B kann man den Identitätstyp Id(A, B) betrachten. Dies kann auf den obigen Identitätstyp zurückgeführt werden mittels sogenannter Universen170 U, d.h. Klassen von Typen, in denen A : U und B : U gilt. Universen wurden von Alexander Gro- thendieck eingeführt, um mengentheoretische Probleme in der Ka- tegorientheorie anzugehen. Ihre Existenz innerhalb der Mengenlehre basiert auf der Existenz von großen Kardinalzahlen. Die Existenz von Universen berührt also ganz wesentlich die Grundlagen der Mathe- matik. Universen werden in einer gegebenen Typentheorie häuﬁg aufsteigend nach Größe in einer unendlichen Folge iteriert: U : U : U : , 0 1 2 ··· d.h. Ui ist ein Typ innerhalb des Universums Ui+1. Sind die Typen A und B identisch in einem Universum U, so schreibt man auch A = B dafür. Oft wird der Typ IdU (A, B) auch mit (A = B) bezeichnet.

165 Mit Hilfe iterierter Identitätstypen kann man innerhalb der Martin– Löf Typentheorie (oder in HoTT) spezielle Typen auszeichnen, die man als „Mengen” in der Typentheorie ansehen kann. Etwas allgemeiner hat Vladimir Voevodsky eine Hierarchie für Typen X deﬁniert, die nach Homotopieniveaus geordnet ist. Er beginnt damit, im Level h = 2 einen Typ A als „punktförmig” zu bezeichnen, in Zeichen iscontr(−A), falls

IdA(x, y) bewohnt ist. x A y A X: Y: Mit anderen Worten, es gibt ein x : A, so dass für alle y : A bereits x = y gilt. Man kann überraschenderweise zeigen, dass dies A 1 impliziert, d.h. A ist kontrahierbar.171 ≃

Punktförmige Menge zentriert in x.

Damit deﬁniert man dann im Level h = 1 die „echten Propositio- nen” A durch die Bedingung −

Für alle x, y : A ist IdA(x, y) punktförmig. Aus dieser Deﬁnition folgt, dass A 0 oder A 1 gilt.172 Topolo- gisch ist A also entweder leer oder punktförmig.≃ ≃ Auf ähnliche Weise deﬁniert man Mengen A in der Typentheorie im Niveau h =0 durch die Bedingung

Für alle x, y : A ist IdA(x, y) eine echte Proposition. Mengen entsprechen also genau den Typen, deren Identitätstypen alle leer oder punktförmig sind. Diese Komponenten würde man dann die Elemente der Menge nennen.

166 Als Nächstes kann man Gruppoide deﬁnieren durch die Bedingung

Für alle x, y : A ist IdA(x, y) eine Menge. Durch Induktion kann man dann leicht die h-Niveaus für alle h N definieren und bekommt eine h–Stratifikation auf allen Typen. ∈ Etwas allgemeiner kann man neue Typen Iso(A, B) (Isomorphietyp) bzw. Eq(A, B) (Äquivalenztyp) für gegebene Typen A, B definie- 173 ren. Manchmal werden diese Typen mit (A ∼= B) bzw. (A B) bezeichnet. Der Isomorphietyp Iso(A, B) wird – wie wir es am Anfang≃ dieses Kapitels für Kategorien gemacht haben – durch die Existenz inverser Abbildungen f : A B und g : B A definiert. Die natür- liche Abbildung → → Id(A, B) Iso(A, B). −→ zwischen Identitätstyp und Isomorphietyp ist im Fall von Mengen (im Sinne der Typentheorie) ein Isomorphismus.174 Eine Äquivalenz entspricht einer schwachen Homotopieäquivalenz in der topologischen Interpretation. Für zwei Typen A, B in einem Universum U gibt es immer eine Ab- bildung175 Id(A, B) Eq(A, B). −→ Das Univalenzaxiom besagt, dass diese Abbildung selbst eine Äqui- valenz (in einem höheren Universum) ist, d.h. Id(A, B) Eq(A, B). ≃ Sind A und B Mengen im Sinne der Typentheorie, so stimmt der Äquivalenzbegriff mit dem Begriff des Isomorphismus, d.h. der Bi- jektion von Mengen überein. Für jede Eigenschaft P (d.h. P ist vom Typ U Bool) gilt dann → bezüglich der Äquivalenz eine Verallgemeinerung der Leibnizschen Invarianzregel: A B P (A) ≃ , P (B) d.h. die Eigenschaft P bleibt bei der Ersetzung äquivalenter Typen erhalten. Dies folgt aus dem Univalenzaxiom, da die Invarianzregel

167 für die Identität (wie bei Leibniz) gilt und dann unter der Abbildung Id(A, B) Eq(A, B). −→ weiterhin erhalten bleibt.176 Umgekehrt impliziert die Invarianzregel auch das Univalenzaxiom, indem man die Eigenschaft

P (X) = isidU (A, X) betrachtet. Die Hierarchie der Identitäts-, Isomorphie- und Äquivalenztypen bietet Raum für einige offene Fragen. So ist zum Beispiel nicht klar, ob diese drei Begriffe erschöpfend sind, oder ob es nicht weitere verallgemeinerte Äquivalenzen gibt. Eine wichtige offene Frage ist auch, wie man in einer kategoriellen semantischen Interpretation der Ty- pentheorie das Univalenzaxiom definieren kann und für welche kategoriellen Semantiken es gilt. Das Univalenzaxiom steht auch im Zusammenhang mit dem Nichtein- deutigkeitsproblem und damit mit der Frage nach dem platonischen Realismus. Oft wird in diesem Zusammenhang gesagt, dass man mit Univalenz isomorphe oder äquivalente Objekte der Mathematik identifizieren kann, so als ob man nur noch mit Äquivalenzklassen isomorpher oder äquivalenter abstrakter Objekte arbeiten würde, wie es Frege bei den Zahlen versucht hat. Diese Sichtweise ist nicht in Ordnung. Das Univalenzaxiom dient eher dazu, den Begriff der Äquivalenz einen logischen Charakter zu verleihen. Dies soll bedeuten, dass die Äquivalenzen genau die Transfor- mationen abstrakter mathematischer Objekte sind, die alle logischen Wahrheiten in der Typentheorie im Sinne der Leibnizschen Regel A B P (A) ≃ P (B) erhalten. Die neue Erkenntnis von Voevodsky et al. ist, dass solche Transformationen nicht nur die Isomorphismen sind. Univalenz ist somit ein logisches Prinzip, was dem Traum vom Logizismus wieder etwas Leben einhaucht.177 Viele Probleme des Logizismus – wie die

168 Existenz unendlicher Mengen – bleiben in der Typentheorie jedoch erhalten. Ein offenes Problem der Typentheorie ist – ähnlich wie beim Logizis- mus – die Rolle der natürlichen Zahlen. Alle numerische Berechnun- gen, die auf eine Anzahl hinauslaufen, müssen am Ende des Tages einen Bewohner n des Typs N liefern, den man auswerten kann. Da- zu sind unter Umständen viele Identifikationen notwendig. Es ist ein offenes und von Voevodsky selbst thematisiertes Problem, ob dies immer möglich ist und aus dem Univalenzaxiom folgt. Kategorientheorie als Semantik der Typentheorie Die Kategorientheorie bildet eine dritte Alternative zur Begründung der Mathematik neben der Mengenlehre und Typentheorie. Sie ist der natürliche Ort für eine Semantik der Typentheorie als Variante der Henkinsemantik. Dafür gibt es diverse Ansätze. Die Welt der –Kategorien von Jacob Lurie oder die Pfadkategorien bzw. die Modellkategorien∞ von Kenneth Brown, Denis–Charles Cisinski und Daniel Quillen, die C–Systeme von John Cartmell und Vladimir Voevodsky, die sogenannten Tribes von André Joyal oder die Ideen von Emily Riehl und Dominic Verity bilden andere Optionen. Wir werden hier in erster Linie die Varianten von Brown und Joyal studieren, um eine Semantik der Typentheorie zu konstruieren, denn die Theorie von Lurie ist unseres Erachtens allzusehr an das Modell SSet der simplizialen Mengen gebunden. Wir wollen nun beschreiben, wie man eine Semantik der Typentheorie in gewissen (höheren) Kategorien entwickeln kann. Semantische Mo- delle dieser Art können in der Kategorie der Mengen erzeugt werden, aber auch in anderen verfeinerten Kategorien. So hat Vladimir Voe- vodsky ein Modell der Typentheorie in simplizialen Mengen gefunden und studiert. Leon Henkin hat einen Vollständigkeitssatz für die Typentheorie, also für die die Semantik der Logik höherer Stufe bewiesen. Dieser Beweis schwächt die naheliegenden mengentheoretischen Modelle so ab, dass man letztlich keine Modelle in der Kategorie der Mengen, sondern

169 in allgemeineren Kategorien bekommt.178 Diese Semantik nennt man Henkinsemantik. Oft wird gesagt, dass die Henkinsemantik nachteilig sei, weil die Mo- delle weniger in den Griff zu bekommen seien, und man bevorzugt aus diesem und anderen Gründen die Logik erster Stufe. Unser Aus- gangspunkt ist jedoch, dass die Henkinsemantik in Richtung einer kategoriellen Semantik geht, die wir für sehr geeignet halten, um Ma- thematik strukturalistisch zu betrachten. Um die kategorielle Semantik von Typentheorien zu erklären, folgen wir Ideen von Kenneth Brown und André Joyal. Die dabei entste- henden Kategorien nennt man nach Kenneth Brown Pfadkategorien oder – in der davon leicht abweichenden Variante von Joyal – auch Tribe. Eine aktuelle Darstellung der Pfadkategorien und Tribes findet man in den Arbeiten von André Joyal, Benno van den Berg und Ieke Moerdijk, denen wir im Weiteren folgen. 179 Eine Pfadkategorie ist eine Kategorie, in der zwei Arten von Morphis- men ausgezeichnet werden, die Faserungen und (schwache) Äquiva- lenzen genannt werden. Letztere kann man auch Homotopieäquiva- lenzen nennen, weil diese beiden Begriffe im Fall der Pfadkategorien zusammenfallen. Den Begriff einer Homotopieäquivalenz von topologischen Räumen, also auch den einer schwachen Homotopieäquiva- lenz, haben wir bereits definiert. Ein Morphismus f : B A von topologischen Räumen heisst Fa- serung, wenn er eine bestimmte−→ Hochhebungseigenschaft von Pfaden erfüllt. Mit anderen Worten, ein Pfad γ in A kann jederzeit zu einem Pfad γ˜ in B „geliftet” werden, sofern ein Anfangspunkt γ˜(0) B angegeben wird. ∈ Solche Pfadkategorien dienten ursprünglich eigentlich dazu, die Ho- motopietheorie axiomatisch zu modellieren und wurden zuerst von Kenneth Brown betrachtet, in Anlehnung an Daniel Quillen, dessen Modellkategorien ein ähnliches Ziel verfolgen, aber noch eine weitere Klasse von Morphismen beinhalten. Pfadkategorien erfüllen für diese beiden Klassen von Morphismen diverse Axiome, die wir hier nicht

170 0 B { } f γ˜

Iγ A

Hochhebungseigenschaft einer Faserung f für Pfade. alle nennen wollen (vgl. loc. cit.). Wichtig ist aber, dass Pfadkate- gorien sogenannte Pfadobjekte besitzen sollen. Dies sind für jedes Objekt X ein Pfadobjekt Pfad(X) zusammen mit einer Komposition von Abbildungen X Pfad(X) X X, −→ −→ × so dass die erste Abbildung eine Homotopieäquivalenz ist und die zweite Abbildung eine Faserung. Diese beiden Eigenschaften sind im Fall der topologischen Räume erfüllt, denn der Pfadraum Pfada(X) der Pfade mit festem Anfangspunkt a ist kontrahierbar (durch Repa- rametrisation zum Punktweg) und daher ist die natürliche Abbildung X Pfad(X) −→ für jeden topologischen Raum X eine Homotopieäquivalenz. Die Pro- jektionsabbildung auf Anfangs– und Endpunkt p : Pfad(X) X X −→ × ist eine Faserung, in der alle Fasern den Pfadräumen mit festem Anfangs- und Endpunkt entsprechen. Mit Hilfe von Pfadobjekten kann man den Homotopiebegriff definieren, denn zwei Abbildungen f,g : Y X sind homotop, falls es eine Liftung h gibt wie folgt: Die syntaktische→ bzw. klassifizierende Kategorie einer abhängigen Ty- pentheorie ist eine Pfadkategorie. Die Faserungen entsprechen dabei speziellen Projektionen von Kontexten. Die Pfadobjekte Pfad(A) sind gegeben durch die Kontexte

x : A, y : A, p : IdA(x, y)

171 Pfad(X)

p h Y X X (f,g) ×

Homotopie mit Pfadobjekten und die Abbildungen A Pfad(A) A A −→ −→ × sind dann offensichtlich. Andere Beispiele für Pfadkategorien sind die Kategorie SSet der simplizialen Mengen, die Kategorie Grpd der Gruppoide, die Kategorie Top der topologischen Räume oder gewisse Unterkategorien von „ge- faserten” Objekten in manchen Quillenschen Modellkategorien. Wenn man nun noch bei diesen Beispielen nach den schwachen Äqui- valenzen die Dwyer–Kan Lokalisierung bildet, so bilden solche Pfad- kategorien eine natürliche Semantik für Typentheorien in Form einer ( , 1)–Kategorie mit einem Identitätstyp. Weiterhin trägt jeder Typ auch∞ in dieser Semantik mittels der Folge der Identitätstypen die Struktur eines –Gruppoids. Es ist möglich,∞ mit Hilfe solcher Kategorien durch Erweiterungen auch (höhere) Elementartopoi als semantische Modelle zu finden, die Verallgemeinerung des Begriffs des Elementartopos aus Kapitel 3 darstellen, wie wir es erwarten würden, wenn Typentheorie alle Homo- topietypen erfassen soll.180 Jedem höheren Elementartopos liegt eine (syntaktische) Typentheo- rie – Mitchell–Bénabou Sprache genannt – zugrunde, der unterliegende interne Logik überraschenderweise nicht notwendig den Satz vom ausgeschlossenen Dritten erfüllen muss. Ein gutes Beispiel dafür ist die Kategorie Sh(X) der Garben auf einem topologischen Raum X, wobei X die Bedingung erfüllt, dass es offene Mengen U gibt, die

172 nicht mit dem oﬀenen Kern ihres Abschlusses übereinstimmen. Die- se Bedingung ist für die meisten topologischen Räume erfüllt, z.B. für das Intervall [0, 1] oder die reelle Gerade R. Die interne Logik ist daher die intuitionistische Logik. Die Kategorie Set hingegen als interne Logik die klassische Logik.

x ϕ(x) 1 { | } true

U X Ω

Die Forcing–Relation.

Diese Beziehung zwischen Typentheorien und Elementartopoi Typentheorien Elementartopoi ←→ wird oft auch als Kripke–Joyal Semantik bezeichnet, da Kripke und Joyal die Semantik der intuitionistischen Logik durch Beth, Grze- gorczyk und Tarski damit wesentlich verallgemeinert haben, bis hin zu modalen Varianten, auf die wir hier aber nicht eingehen werden. Dabei ist die grundlegende Regel, dass eine Formel ϕ in der formalen Sprache der Syntax genau dann erfüllt ist, wenn für jeden Morphismus U X im Topos das in der Figur abgebildete Dia- gramm kommutiert.−→ Damit ergibt sich die Möglichkeit Formeln (wie ϕ hier) in der Logik als Unterobjekte (hier von X) einer Kategorie zu interpretieren. Ist U in diesem Fall eine offene Menge einer Gro- thendiecktopologie, so lässt sich mit diesem Diagramm ein Begriff einer „lokalen Wahrheit” definieren, weil U als offene Menge immer „kleiner” gewählt werden kann. Forcing kann mit Hilfe dieses Zusammenhangs gut erklärt werden, wie William Lawvere und Myles Tierney ab etwa 1970 erkannt hatten.181

173

KAPITEL 10

Mathematik und Wahrheit

Das Ende des Buches ist fast erreicht. Die Dinge, die wir gesehen und gelernt haben, weisen in die Zukunft. Dabei sind aber noch jede Menge Herausforderungen verbunden und es gibt noch Vieles zu ent- decken und zu beweisen. Daher wollen wir zum Schluss die Relevanz dieser neuen Theorien und mögliche Weiterentwicklungen erklären. Die drei Grundlagen der Mathematik Aus den Dingen, die wir bisher besprochen haben, geht hervor, dass es drei ganz unterschiedliche Sichtweisen auf die Grundlagen der Ma- thematik gibt, die Mengenlehre, die Typentheorie und die (höhere) Kategorientheorie. Von diesen ist die Mengenlehre die elementorientierte Methode, die die Standardsichtweise der meisten Mathematiker darstellt. Die Ty- pentheorie ist eher die beweis– und berechenbarkeitsorientierte Me- thode und sie besteht im Wesentlichen aus Syntax, insbesondere ist ihre Notation für den Anfänger sehr anstrengend zu lesen. Informa- tiker sind damit sehr viel häuﬁger vertraut und verwenden Teile der Typentheorie in ihrer Arbeit sehr oft, weil sie wissen, dass die Elemen- trelation in der Mengenlehre nicht gut zu den Instanzen von Objekten in Programmiersprachen entsprechen. Die (höhere) Kategorientheo- rie ist eine strukturorientierte Methode, die sehr elegant ist, aber für einen Anfänger auch sehr abstrakt und damit unzugänglich wirken kann. Selbst dieses Bild ist noch viel zu einfach, denn es gibt nicht nur eine Mengenlehre oder eine Typentheorie oder eine Kategorientheorie. So

175 zeigt etwa die Unentscheidbarkeit der Kontinuumshypothese, dass gewisse Eigenschaften einer Mengenlehre, wie etwa die Kardinalität der reellen Zahlen, vom gewählten Modell abhängt, selbst wenn man die gleichen Axiome zugrundelegt. Die zugrundeliegenden Axiome kann man ebenfalls variieren, so dass letzlich ein ganzer Zoo unterschiedlicher Mengenlehren vorhanden ist. Das Gleiche gilt auch für die beiden anderen Grundlagen. Funktorielle Übergänge zwischen der Mengenlehre, der Typentheo- rie und der Kategorientheorien, bei denen eine der drei Theorien in einer der anderen Theorie interpretiert werden, sind im Prinzip bekannt und im Grunde sehr einfach, denn Mengen, Typen und Objekte in Kategorien entsprechen dabei einander ebenso wie die Pfeile, d.h. Morphismen, in allen drei Varianten. Das ist auch einleuchtend, denn die Objekte entsprechen natürlicherweise den Begriffen des menschlichen Denkens und die Pfeile den Beziehungen zwischen den Begriffen. Die drei Varianten der Grundlagen der Mathematik sind somit nur drei verschiedene Spielarten des Umgangs mit mathematischen Be- griffen. Verknüpft man diese funktoriellen Übergänge im Kreis, so erhält man äquivalente (aber angereicherte) Theorien.182 Die dreiteilige Struktur kann man gut mit der Beschreibung eines Hauses vergleichen. Die Typentheorie entspricht dabei der Planung eines Hauses mit Bauplänen und Architektenzeichnungen. Der Men- genlehre entspricht der eigentliche Bau des Hauses mit Baumateria- lien und Arbeitsstunden. Die kategorielle Sichtweise ist unter diesem Blickwinkel das „Wohnen” im Haus, d.h. die Nutzung der Eigenschaf- ten des Hauses. Bei allen drei Sichtweisen erkennt man die Einzelteile und Eigenarten des Hauses mit einiger Mühe, aber die Sichtweise ist jeweils eine andere. Um ein ganzheitliches Bild des Hauses zu bekommen, muss man am besten alle drei Zugänge ansehen. Wenn man genauer hinsieht, dann gibt es weitere Feinheiten zu ent- decken. Wir sind intensiv auf den Zusammenhang zwischen Typen- theorie (Syntax) und Kategorientheorie (Semantik) eingegangen, eine

176 Korrespondenz die letztlich zwischen gewissen Martin–Löf Typen- theorien und ( , 1)–Kategorien vermittelt: ∞ ML–Typentheorien ( , 1) Kategorien ←→ ∞ − Dies steht im Gegensatz zur Mengenlehre, die ihre eigene semantische Interpretation in sich selbst trägt. Die Forschung zu den Grundlagen der Mathematik ist noch lange nicht abgeschlossen. Ein Grundproblem aller drei Zugänge zu den Grundlagen der Mathematik bildet die Rolle der Arithmetik, d.h. der Rolle der natürlichen Zahlen zusammen mit dem Rekursionssatz. Die Forderung nach solchen Objekten kommt immer einem unbe- weisbaren Axiom gleich und die vollständige Induktion wird in allen Zugängen am Anfang der Theorie benötigt. Zudem, – und viel wichtiger – ist die Konsistenz der Arithmetik, bzw. der Dedekind–Peano Arithmetik, in allen drei Theorien weiterhin unklar, was vermutlich ein größeres Problem darstellt als die zweifelhafte Frage nach der platonischen Existenz solcher Theorien. Unsere Überlegungen ergeben für das Konsistenzproblem keine Fortschritte, zumal die Sätze von Gödel und Tarski in allen drei Welten gelten und eher pessimistische Aussichten bieten. Die „neue” Typentheorie löst die Probleme der Grundlagen der Ma- thematik nicht, da sie wie die Mengenlehre Universen – und damit Axiome für unerreichbare Kardinalzahlen – benutzt. Eine weitere Herausforderung ist das Verständnis des Univalenzaxioms von Voevodsky und seine Bedeutung in allen drei Welten. Das Univa- lenzaxiom kann prinzipiell die Probleme der Mathematik mit der Identiﬁkation isomorpher oder äquivalenter Objekte in den Griﬀ zu bekommen. Grundsätzlich ist die semantische, d.h. die kategorielle, Seite bis auf das Univalenzaxiom etwas besser verstanden, denn einige Eigenschaften (semi–)simplizialer Mengen mit unendlich vielen Kohärenzbedingungen und damit einige Homotopietypen lassen sich innerhalb der Typentheorie bisher noch nicht realisieren. Es ist nicht ausgeschlossen, dass erst noch weitere Entwicklungen in Form von Erweiterungen der Typentheorie kommen müssen, bevor ein gutes

177 Verständnis erreicht ist. Die Rolle der Logik, die in der axiomatischen Mengenlehre üblich ist, manifestiert sich in den beiden anderen Sichtweisen auf die Grundlagen unterschiedlich, kann aber mit der sogenannten Curry–Howard–Lambek Korrespondenz183 gut verstanden werden. Die Modallogik und die konstruktive und die intuitionistische Sichtweise können darin bei Bedarf integriert werden. Von einem modernen Standpunkt aus ist die Mengenlehre nicht die dominante Theorie, sondern man sollte alle drei Theorien in gewisser Weise als verschiedene Seiten ein und derselben Sache ansehen und alle drei Sichtweisen in das eigene mathematische Repertoire integrieren. Maschinelles Beweisen Die Entwicklung der Typentheorie in den letzten Jahren hat dazu geführt, dass Teile der Mathematik in der Typentheorie vollständig in Form eines Programms formalisiert werden können. Auf diese Weise manifestiert sich natürlich ein Teil der Ziele der Leibnizschen Scientia Generalis innerhalb der Mathematik. Es ist allerdings noch unklar, welche Art von Mathematik damit erfasst werden kann. Insbesondere kann die Typentheorie dazu dienen, mathematische Be- weise mittels Computern maschinell durch Beweisassistenten wie AG- DA, COQ, ISABELLE und andere nachweislich auf Korrektheit zu überprüfen. Diese Möglichkeit war eine der Motivationen von Voe- vodsky, sich mit Typentheorie zu beschäftigen und ergibt völlig neue Möglichkeiten für alle Wissenschaften in der Zukunft, da die Mathe- matik Grundlage für viele alle andere Wissenschaften ist. Für einige Beweise bekannter Sätze mit komplizierten Beweisen (zum Beispiel des Vierfarbensatzes184) wurde dies schon durchgeführt. Die Interpretation der Martin–Löf Typentheorie in der Homotopietheo- rie hat viele Anwendungen in der Homotopietheorie selbst. Dies zeigt auch auf verblüﬀende Weise die Verbindung zwischen Homotopie- theorie und den Grundlagen der Mathematik, was eine frappierende Einheit innerhalb der Mathematik aufzeigt.

178 Beweise in der Mathematik, besonders bei schwierigeren Problemen, sind häufig Gemeinschaftsleistungen. Es ist denkbar, dass in der Zu- kunft auch das maschinelle Beweisen und die Aufarbeitung der Ma- thematik in diesem Zusammenhang ein großes „Community Projekt” werden könnte. In gewisser Weise wäre ein solches Vorgehen sogar dem Bourbaki–Programm von Grothendieck ähnlich, das dies in Form von Texten versucht hatte. Andere beliebte Community Projekte sind MathOverflow, nLab, n–Category Café, Stacks Project und Stack Exchange. Bei diesen Plattformen kommt die Idee sozialer Netzwerke in sinnvoller Wei- se mit den Anforderungen der Forschung in der Mathematik zusammen. Wahrheitsbegriff Wir haben die Korrespondenz– und Kohärenztheorie der Wahrheit besprochen, die beide recht weit auseinander liegen. Dabei haben wir uns durch die Behandlung der Typentheorie der Kohärenztheo- rie genähert. Die Korrespondenztheorie ist andererseits eng mit dem Begriff der Semantik verwandt. Alfred Tarski hat nach eigenen Anga- ben versucht, die Korrespondenztheorie der Wahrheit mit Hilfe einer guten Semantik weiterzuentwickeln. In den neueren Forschung, die wir hier besprochen haben, ist die kategorielle Semantik – eine Variante der Henkinsemantik – die bevorzugte Option. Semantik in der Mathematik ist auch in dieser Va- riante keine Ontologie, sondern ein Interpretationsraum mathematischer und anderer Strukturen und verliert damit die Anbindung an die Wirklichkeit aus den ursprünglichen Formulierungen der Korre- spondenztheorie. Diese Orientierung an der Wirklichkeit ist in der Tat ein Trugschluss. Die Natur und die physikalische Realität, d.h. die sogenannte „Wirk- lichkeit”, kommen den meisten Menschen wie ein Ort vor, der sehr weit entfernt von abstrakten Begriffen ist. Beim Studium physikali- scher Theorien stellt man jedoch fest, dass den dabei betrachteten

179 Objekten, wie den elektromagnetischen Feldern, den Elementarteil- chen, den Quarks und dgl., nur eine sehr abstrakte Realität zukommt. Nur mit abstrakten mathematischen Methoden sind sie begreifbar. Hinzu kommt, dass in vielen physikalischen Theorien Äquivalenzen eine Rolle spielen, die auch in der mathematischen Forschung, die wir hier besprochen haben, wichtig sind. Bereits Kurt Gödel hat darauf hingewiesen, dass die physikalischen Theorien mit ihren Annahmen zwar potentiell experimentell nach- weisbar sind, wobei auch dies im Hochenergiebereich immer schwerer wird, dass diese Theorien aber kein bisschen weniger abstrakt sind, als Axiome in mathematischen Theorien. Auch in den Lebenswis- senschaften stellt man immer wieder fest, dass ohne mathematische Hilfsmittel die kleinsten Bausteine des Lebendigen kaum begreifbar sind. Ludwig Wittgenstein hat dazu passend die berühmten Sätze in seinem „Tractatus” geprägt: Die Welt ist alles, was der Fall ist. Die Welt ist die Gesamtheit der Tatsachen, nicht der Dinge.185 Wir kommen also zum Schluss, dass es einen naiven Realitätsbegriﬀ nicht gibt. Daher ist es auch ein Trugschluss, die Wahrheit durch Vergleich der Bewusstseinsinhalte, der Gedanken oder der Aussagen unserr Gedanken mit einer „Wirklichkeit” vergleichen zu wollen. Die Wirklichkeit ist – mit aller Vorsicht gesagt – gewissermaßen eine eigene Spielart einer Semantik. Unter dem Strich kann man sagen, dass in einem gewissen Sinne die Korrespondenztheorie der Wahrheit eine Art semantische Version der Kohärenztheorie ist. Ohne die Konsistenz der zugrundeliegenden Mathematik ist alles jedoch wenig zufriedenstellend. Dies bleibt ein großes und wichtiges oﬀenes Problem. Alles war wir in diesem Text über den Relativismus der Wahrheit, den Nominalismus oder den Platonismus, sowie analytische und syn- thetische Urteile gesagt haben bleibt auch in diesem Licht bestehen.

180 Anmerkungen

1. Sie baut nicht einmal auf der Philosophie auf, denn die Logik ist ein Teil der Mathematik. 2. Vgl. §17 in der Leibnizschen Monadologie [Leibniz2014].

3. Wir verwenden die Bezeichnung „Begriﬀ” – und viele weitere auch – auf etwas informelle Weise und verweisen auf das Büchlein [Reclam2019] für tiefergehende Erklärungen zu Bezeichnungen der Philosophie und Wissenschaftstheorie. 4. Vgl. die neurowissenschaftlichen Forschungen von Stanislas Dehaene. 5. Vgl. [Frege1962].

6. Vgl. [Leibniz2000] und das Buch [Lolli2017] von Gabriele Lolli.

7. Vgl. [Heidegger1957].

8. Im Aufsatz „Of personal identity” [Hume1739].

9. Das Buch [Blom2011] von Philipp Blom beschreibt das abwechslungsreiche Le- ben und Denken in diesem Salon. 10. Der Satz besagt, dass für jede Aussage A entweder A selbst oder ihr Gegenteil A wahr ist. Vergleiche die historischen Bemerkungen in [LambekScott1986]. Es¬ gibt Sätze der Mathematik, wie den Satz von Thue–Siegel–Roth oder Königs Lemma, die nur indirekte Beweise besitzen. 11. Vgl. sein unveröﬀentlichtes Werk [Leibniz1982], sowie den Kommentar von Franz Schupp darin und die Sekundärliteratur wie [Lenzen2004]. Das Buch [Jost2019] von Jürgen Jost geht auf dies ein, wie auch auf viele andere Leistungen von Leib- niz. 12. Die Standardliteratur dazu ist [Łukasiewicz1957] und [Patzig1969].

13. Vgl. [Aristoteles2009]. 181 14. Vgl. [Aristoteles2009].

15. Vgl. [vonAquin1259].

16. Vgl. [Halbach1996, S. 219–221].

17. Vgl. das Buch von Michael Balaguer [Balaguer1998] und den Artikel von Pierre Cassou–Noguès [Cassou–Noguès2011].

18. Zum Formalismus und Nominalismus siehe auch [Linnebo2017].

19. Vgl. Band III der Gesammelten Werke [Gödel2001].

20. Vgl. [Leibniz1677].

21. Dies ist der Standpunkt von Paul Benacerraf in [Benacerraf1965].

22. Vgl. den Artikel zu Wissenschaft in [Reclam2019].

23. Vgl. [Eco1993].

24. Vgl. [Couturat1901].

25. Vgl. [Blanke1996], [Eco1993], [Krämer1992], [Lenzen2004] und [Scholz1942].

26. Vgl. [Leibniz1666].

27. Vgl. die kürzere Version „Ars Brevis” [Llull1290] der „Ars Magna” und das Werk „Logica Nova” [Llull1985].

28. Vgl. [Hobbes1655].

29. Original und Übersetzung in [Blanke1996, CouturatLeau1903]. Louis Cou- turat war ein bedeutender Leibnizforscher. 30. Historisch sind noch Johann Joachim Becher, George Dalgarno, Athanasius Kir- cher und Philippe Labbé zu erwähnen, siehe [Blanke1996, Eco1993]. Interlin- guistische Plansprachen gehen u.a. auf Johann Martin Schreyer (Volapük), Giu- seppe Peano (Latino sine ﬂexione), Louis Couturat (Ido) und Ludwik Zamenhof (Esperanto) zurück.

31. In [Jost2019] wird der Standpunkt eingenommen, dass Leibniz zum Beispiel als einziger von den genannten Wissenschaftlern das Konzept des Isomorphismus in seinem Kalkül zur Verfügung hatte.

182 32. Die deutsche Übersetzung des Briefes ﬁndet man in [Leibniz1989, Band V,2].

33. Vgl. [Krämer2009].

34. Das erste Buch dazu ist [Leibniz1684].

35. Vgl. [Krämer2009, S. 103].

36. Vgl. [Leibniz1677].

37. Vgl. [Krämer2009, S. 105] und die Monadologie [Leibniz2014].

38. Vgl. [Krämer2009, Scholz1942].

39. Vgl. dazu auch den Artikel [Martin–Löf1994] von Per Martin–Löf.

40. Vgl. [Linnebo2017, Chap 1].

41. Vgl. [Krämer2009, S. 108].

42. Vgl. [Linnebo2017, S. 15-16].

43. Boolesche Algebren im modernen Sinn werden in [MacLaneMoerdijk1992] er- klärt. Historisch sind noch John Venn, William Stanley Jevons und insbesondere Charles S. Peirce und Ernst Schröder zu nennen. Peirce hat viele unterschiedliche Beiträge auch zur Arithmetik und Mengenlehre geleistet. Schröder entwickelte die Boolesche Logik in seinem Buch „Algebra der Logik” vollständig. Frege hat zumindest anfangs seine Vorläufer und Zeitgenossen nicht zitiert. Vgl. [Boole1847], [deMorgan1847], [Schröder1890].

44. Die Umkehrung A A gilt immer. ⇒ ¬¬ 45. Vgl. [Frege1983, S. 139].

46. Vgl. [Frege1879].

47. Vgl. [Frege1879].

48. Formale Sprachen erster Stufe deﬁnieren wir in Kapitel 9. Es gibt Logiken beliebiger höherer Ordnungen, die in der Summe auch manchmal Typentheorie genannt werden. In der Tat gibt es eine Beziehung zwischen Logiken höherer Ordnung und der Typentheorie, mit der wir uns in Kapitel 9 auseinandersetzen werden. 49. Der Beitrag [Vossenkuhl2013] von Wilhelm Vossenkuhl zu Freges Philosophie ist sehr lesenswert.

183 50. Vgl. [Frege1983, S. 189].

51. Vgl. [Frege2003, S. 39].

52. Vgl. [Frege2003, S. 41].

53. Vgl. [Frege2003, S. 50].

54. Vgl. §61 in [Frege1879].

55. Vgl. [Frege1879].

56. Vgl. [Frege1893].

57. Vgl. §46 in [Frege1879].

58. Vgl. §72 in [Frege1879].

59. Vgl. §72 in [Frege1879].

60. Abgedruckt in [Frege1976].

61. Abgedruckt in [Frege1976].

62. Vgl. [Henkin1962].

63. Vgl. [Linnebo2017] für eine Diskussion dazu.

64. Vgl. [Poincaré1902, Erster Teil, Kap. 1, §VI]. Die Übersetzung stammt von Elisabeth Küssner–Lindemann aus der digital verfügbaren deutschen Ausgabe von 1904 im Teubner Verlag. Siehe auch [Skolem, S. 151].

65. Vgl. [Hardy1940].

66. Mein Kollege Michael Harris hat 2017 ein Buch mit dem Titel „Mathematics without Apologies” veröﬀentlicht, das im Titel auf Hardys Buch [Hardy1940] Bezug nimmt, siehe [Harris2017]. Er philosophiert dabei u.a. über das Wort „Kunstgriﬀ”, das als Platzhalter für eine mathematische Technik in vielerlei Spra- chen und Kulturen vorkommt. Dies geht auf einen Hinweis von mir zurück, was er aber nicht anmerkt. 67. Aufgrund der allgemeinen Relativitätstheorie ist der Raum gekrümmt, so dass diese Aussage nur näherungsweise richtig ist.

184 68. Mathematisch gesehen wird das so definiert, dass die Urbilder offener Mengen wieder offen sind. In einem metrischen Raum wird diese Eigenschaft durch die bekannte ε-δ–Definition gegeben.

69. Zwei stetige Abbildungen f,g : X Y heißen homotop, falls es eine stetige Abildung h : I X Y gibt mit h(0→, )= f und h(1, )= g. Zwei Räume X, Y heißen dann homotopieäquivalent,× → falls− es stetige Abbildu− ngen F : X Y und G : Y X gibt, so dass G F bzw. F G jeweils homotop zur Identität→ auf X bzw. Y→sind. ◦ ◦ 70. Vgl. [Müller–Stach2013, HuberMüller–Stach2017]. Als Beispiel in der mathematischen Physik sei die algebraische Behandlung von Feynmanamplituden in der Quantenfeldtheorie genannt. 71. In der Programmiersprache PYTHON sieht das wie folgt aus: def ggt(a,b): while b>0: a,b=b,a%b; return a. 72. Ein Widerspruchsbeweis: Angenommen man hat nur endlich viele Primzahlen p1 < p2 < < pn, so betrachtet man die Zahl N := p1p2 pn +1 und zeigt, dass jeder··· der Primfaktoren von N nicht in der endlichen··· Liste auftaucht, ein Widerspruch.

73. Der Beweis erfolgt, indem man Fm 2 betrachtet und die dritte binomische Formel − anwendet. Damit bekommt man zuerst die Gleichung Fm 2= Fm−1(Fm−1 2). Weiter geht es mit vollständiger Induktion. − − 74. Vgl. [Bolzano1851].

75. Vgl. die Gesammelten Werke [Dedekind1930].

76. Die erste Konstruktion wird Grothendieckgruppe genannt und die zweite ist die Konstruktion des Quotientenkörpers. 77. Vgl. die Gesammelten Werke [Dedekind1930].

78. Vgl. die Gesammelten Werke [Cantor1932].

79. Ein moderner, kürzerer Beweis von Cohens Satz geht auf Bill Lawvere und Myles Tierney zurück. Er ﬁndet sich in [MacLaneMoerdijk1992].

185 80. Moderne Beweise für den Vollständigkeitssatz gehen in der Regel auf die Disser- tation von Leon Henkin zurück. Henkins Beweis ergibt auch eine Version dieses Satzes in der Typentheorie. Vgl.[Henkin1949, Henkin1950, Awodey2020].

81. Natürlich muss die „Acht” nicht unbedingt liegen und die Lage spielt bei der Fragestellung auch keine Rolle. 82. Vgl. [Awodey2020].

83. Vgl. [HuberMüller–Stach2017].

84. Es gibt ein berühmtes Buch von Hans Rademacher und Otto Toeplitz mit dem Titel „Von Zahlen und Figuren” [RademacherToeplitz1930].

85. Der kleine Satz von Fermat besagt, dass gp g mod p für p prim und alle g ist. Hieraus folgt gp−1 1 mod p für alle g teilerfremd≡ zu p. ≡ 86. Der Wert der Eulerschen ϕ–Funktion ϕ(N) an der Stelle N gibt die Anzahl der zu N teilerfremden Zahlen zwischen 1 und N 1 an. − 87. Die unveröﬀentlichte Arbeit liegt auf www.bitcoin.org. 88. Deutsche Übersetzung des Briefes in [Leibniz1989, Band V,2].

89. Vgl. [Einstein1916].

90. Vgl. Riemanns Gesammelte Werke [Riemann1990].

91. Vgl. [Penrose2006].

92. Gute Einführungen dazu ﬁndet man in [Valiant2013, Wigderson2019].

93. Vgl. [McCullochPitts1943].

94. Vgl. [Ben–David2019].

95. Vgl. [Jost2017].

96. Vgl. [Dedekind1930].

97. Die Variablen x, y sind selbst vektorwertige Ausdrücke, d.h. x = (x1,...,xm) usw. 98. Vgl. [Thue1977].

186 99. Vgl. [Church1940, Turing1936, Post1936] für die drei Originalarbeiten und das berühmte Buch [Kleene1952] von Kleene.

100. Es gibt auch andere Charakterisierungen von rekursiven Funktionen in P durch prädikative Rekursion, siehe [BellantoniCook1992] und die Literatur darin.

101. Vgl. die Originalartikel [Church1936, Turing1936] sowie Abdrucke weiterer Artikel im Buch [Davis1965] von Martin Davis.

102. Vgl. [Manin2010, Chap. V].

103. Jede Relation r ist gegeben durch eine Gleichung u = v, wobei u und v Worte in den Erzeugern sind. Im Fall von Gruppen kann man v =1 annehmen. 104. Vgl. [Post1947].

105. Vgl. [Turing1950].

106. Besonders in seinem zweiten Buch [Wiener1950].

107. Vgl. [Dedekind1930] und [Müller–Stach2017].

108. Zu Emmy Noether und ihren Einﬂuss auf die genannten Mathematiker vgl. [Müller–Stach2020].

109. Die Garbeneigenschaft bezieht sich auf Überdeckungen. Ist eine Prägarbe, U eine offene Menge in X und f (U) ein Element, soF kann man offene ∈ F Überdeckung U = i Ui betrachten. Bezeichnet man mit fi die Einschränkung von f auf Ui, dann stimmen offenbar die Einschränkungen von fi und fj auf die S Teilmenge Ui Uj überein für alle Paare von Indices i, j. Eine Prägarbe ist ∩ F eine Garbe, falls man umgekehrt auch aus gegebenen Funktionen fi (Ui) mit ∈F übereinstimmenden Einschränkungen auf Ui Uj ein Schnitt f (U) existiert, ∩ ∈F der auf jedem Ui die Funktion fi liefert. Die Garbeneigenschaft wird häufig durch die Exaktheit der folgenden Sequenz symbolisiert:

(U) (Ui) ⇒ (Ui Uj ). F → F F ∩ i i,j Y Y

110. Um den Halm x zu deﬁnieren, muss man den Limes aller (U) mit x U F F ∈ betrachten und erhält x als eine Menge, die von x abhängt. Dieses Limesobjekt empfängt eingehendeF Pfeile von allen (U) mit x U und ist ein universel- les Objekt mit dieser Eigenschaft, d.h.F für jedes andere∈ Objekt mit solchen G eingehenden Pfeilen gibt es einen Pfeil von x nach . F G

187 111. Vgl. [Lawvere1964, LambekScott1986].

112. Letztere Eigenschaft macht es in SEAR etwas schwieriger, die Potenzmenge P (M) für eine Menge M zu deﬁnieren. Da Relationen, und damit Funktionen, in SEAR aber natürliche Objekte sind, wird P (M) in SEAR durch eine Relation zwischen M und einer geeigneten, axiomatisch deﬁnierten künstlichen Potenzmenge P (M) eingeführt, ohne dass die Elemente von P (M) Teilmengen von M sind. Elemente aller Mengen in SEAR haben keine interne Struktur oder Semantik, so dass eine solche Axiomatik der Potenzmenge in SEAR zwar etwas umständlich, aber ganz natürlich ist. 113. Vgl. [LambekScott1986].

114. Vgl. [MacLaneMoerdijk1992, Chap. I, §4] für solche Aussagen und eine Deﬁ- nition von Elementartopoi, die keine Mengen benutzt, sondern ΩB axiomatisiert. 115. Vgl. [Illusie2004].

116. Vgl. [Lurie2008] für Beschreibungen solcher Beispiele.

117. Vgl. [RiehlVerity2020].

118. Vgl. [Lurie2008, Lurie2009].

119. Vgl. [vdBergMoerdijk2018].

120. Vgl. „A la poursuite des champs” [Grothendieck1983].

121. Die Dwyer-Kan Lokalisierung ist ein Operation, die eine Klasse von Morphismen invertiert, d.h. zu Äquivalenzen im Sinne von ( , 1–Kategorien macht, auch wenn sie es a prori nicht waren. Diese Methode ist∞ etwas allgemeiner als die Gabriel– Zisman Lokalisierung von Kategorien und hat ihren Ursprung in der Konstruktion der Brüche aus den ganzen Zahlen heraus, bei der man alle von Null verschiedenen ganzen Zahlen invertiert. 122. Das Buch [Linnebo2017] erklärt all diese Strömungen.

123. Vgl. [Bolzano1837].

124. Vgl. [Takeuti2013] für alle Notationen.

125. A priori ist nicht klar, dass diese Deﬁnition in Ordnung ist, denn es könnte sein, dass es natürliche Zahlen gibt, die weder gerade noch ungerade sind oder gleichzeitig gerade und ungerade. Das Theorem schließt Ersteres aus und mit etwas

188 mehr Aufwand kann man auch Letzteres ausschließen. Im Wesentlichen muss man dafür zeigen, dass die 1 nicht gerade sein kann. 126. Vgl. [Awodey2011].

127. Vgl. dazu die Diskussion über Benacerrafs Dilemma in [Benacerraf1965] und [Linnebo2017].

128. Vgl. dazu den Originalartikel [Benacerraf1965] von Paul Benacerraf und das Buch [Linnebo2017].

129. Letztere wird auch nach Giuseppe Peano benannt, weil dieser die Logik stärker in den Blickpunkt rückte als Dedekind. Dedekinds Arbeiten entstanden aber viele Jahre vor Peanos Publikation von 1889. 130. Königs Lemma, das keinen konstruktiven Beweis hat, besagt, dass ein Graph, bei dem nur endlich viele Kanten aus jedem Knoten entspringen, genau dann unendlich ist, wenn es in ihm einen unendlichen Pfad gibt, der sich selbst vermeidet. 131. Vgl. [Rovelli2009].

132. Vgl. [Leibniz1996].

133. Viele verblüﬀende Beispiele dafür ﬁnden sich in [Rosling2019].

134. Vgl. [Gödel2001, Vol. I].

135. Paradoxerweise hat Skolem die Existenz überabzählbarer Mengen abgelehnt. 136. Vgl. die Arbeit „Einige Bemerkungen zur axiomatischen Begründung der Men- genlehre” [Skolem, S. 149].

137. Diese Beweise werden in [Smullyan2013] und in [Manin2010] erläutert.

138. Vgl. [Gödel1931, LambekScott2011].

139. Vgl. [Martin–Löf1994].

140. Vgl. [Turing1950].

141. Die Originalarbeit ﬁndet sich in [Lucas1961].

142. Vgl. Gesammelte Werke [Gödel2001], Band III, Seite 310.

143. Vgl. [Penrose1989, Penrose1994].

189 144. Vgl. [Searle1992].

145. Diese Weiterentwicklungen bauen in der Regel auf den Tarskischen Bikonditio- nalen auf. Eine Beschreibung solcher Theorien ﬁndet man in [Halbach1996].

146. Vgl. [Tarski1935], erschien zuerst 1933 in polnischer Sprache in [Tarski1933].

147. Vgl. [Tarski1935].

148. Vgl. [Tarski1935].

149. Vgl. [Tarski1931] und [TarskiVaught1956] sowie [Tarski1969].

150. Vgl. [Manin2010, S. 256]. Tarskis Satz wird in [Smullyan2013] bewiesen.

151. Vgl. dazu [Manin2010, Ch. II, §11].

152. Vgl. [MacLaneMoerdijk1992] und die Originalarbeit [Tarski1938].

153. Vgl. ihre Arbeiten im Journal of Symbolic Logic, beginnend mit [Barcan1946].

154. Vgl. [Kripke1959].

155. Vgl. [Kripke1975].

156. Vgl. [Kripke1980]. In diesen Streit waren viele andere Personen involviert.

157. Vgl [Church1940, LambekScott1986].

158. Vgl. [Martin–Löf1984].

159. Eine Eigenschaft eines Begriffes ist intensional, wenn der Begriffsinhalt oder der Inbegriff, also die Merkmale des Begriffs eine Rolle spielen. Sie ist extensional, wenn es nur auf den Begriffsumfang ankommt. 160. Vgl. [Martin–Löf1994].

161. Vgl. [LambekScott1986].

162. Vgl. [vdBerg2018].

163. Die Schlussregeln ﬁndet man in [Voevodsky2013, Appendix A].

164. Vgl. [Awodey2015, vdBerg2018, Grayson2018].

165. Vgl. [Andrews2002, §50].

190 166. Vgl. [HofmannStreicher1998], [AwodeyWarren2009] und [Voevodsky2013].

167. Ein Resultat von van den Berg und Garner, siehe [vdBergGarner2011].

168. Vgl. [Grothendieck1983, KapranovVoevodsky1991].

169. Vgl. [Voevodsky2013].

170. Oﬀenbar eine Idee von Paul Bernays, siehe [Grayson2018].

171. Der Beweis ﬁndet sich in [Voevodsky2013, Remark 3.11.2].

172. Vgl. [Voevodsky2013, Remark 3.11.2].

173. Beide Deﬁnitionen ﬁndet man in [Voevodsky2013].

174. Vgl. [Awodey2014, §5].

175. Vgl. [Voevodsky2013, Chap. 4].

176. Für einen Beweis siehe [Awodey2014].

177. Dieses logische Prinzip hängt mit Ideen von Carnap, Tarski und Grothendieck zur Invarianz logischer Wahrheiten zusammen, vgl. [Carnap1998, Awodey2017, Awodey2018].

178. Vgl. [Henkin1950]. Wenn Typen A, B mit Hilfe von Mengen A und B interpretiert werden, so wird Hom(A, B) i.A. mittels einer geeigneten| | Teilmenge| | von HomSet( A , B ) interpretiert. Siehe [LambekScott1986] für einen anderen Beweis dieses| Vollständigkeitsatzes| | | neben [Henkin1950]. In solchen Verallgemei- nerungen gibt man aber andere Sätze der Logik, wie den Kompaktheitssatz und den Satz von Löwenheim–Skolem in der ursprünglichen Formulierung auf. 179. Vgl. [vdBergMoerdijk2018, vdBerg2018] und [Shulman2019b] für eine Va- riante mit Quillenschen Modellkategorien. 180. Van den Berg und Moerdijk haben eine exakte Komplettierung der syntaktischen Kategorie untersucht, in der man ein Modell der konstruktiven Mengen- lehre CZF von Peter Aczel ﬁnden kann, was die Stärke der Konstruktion belegt. Vgl. [vdBergMoerdijk2018]. Mike Shulman hat in einem Blog vom 4. April 2017 im n–Category Café (https://golem.ph.utexas.edu/category) Axiome für ( , 1)–Elementartopoi skizziert. ∞ 181. Vgl. Chap. VI in [MacLaneMoerdijk1992].

191 182. Vgl. [Awodey2011] für einen Vergleich aller drei Theorien. Es gibt auch Ar- beiten über Vergleiche der Beweisstärke der drei Theorien. Zum Beispiel ist die Beweisstärke von ETCS mit der konstruktiven Mengenlehre CZFC bekannt und der Vergleich zwischen CZFC mit der Typentheorie von Martin-Löf, vgl. [Shulman2019] und [vdBergMoerdijk2018].

183. Dies ist eine trivalente Beziehung zwischen Typen, logischen Propositionen und Objekten in höheren Elementartopoi, die die Curry–Howard Korrespondenz verallgemeinert, indem sie noch die kategorielle Sichtweise hinzufügt.

184. Der Satz besagt, dass man jede Landkarte so mit 4 Farben einfärben kann, dass angrenzende Länder unterschiedliche Farben haben. Für einen Beweis mit Hilfe von COQ siehe [Gonthier2008].

185. Vgl. [Wittgenstein1989].

192 Literaturverzeichnis

[Andrews2002] Peter B. Andrews: An introduction to mathematical logic: to truth through proof, Kluwer Academic Pu- blisher, Applied Logic Series, VOl. 27 (2002). [vonAquin1259] Thomas von Aquin: Quaestiones disputatae de veritate, Quaestio I, Philosophische Bibliothek, Band 384, Felix Meiner Verlag, Hamburg (1986). [Aristoteles2009] Aristoteles: Metaphysik, Philosophische Bibliothek, Band 308, Felix Meiner Verlag, Hamburg (2009). [AwodeyWarren2009] Steve Awodey, Michael A. Warren: Homotopy theoretic models of identity types, Math. Proc. Cambridge Philos. Soc., Vol. 146, 45–55 (2009). [Awodey2011] Steve Awodey: From sets to types to categories to sets, in: Sommaruga G. (ed.) Foundational Theories of Classical and Constructive Mathematics, The Wes- tern Ontario Series in Philosophy of Science, Vol. 76, Springer Verlag (2011). [Awodey2012] Steve Awodey: Type theory and homotopy, in: Epis- temology versus Ontology (Dybjer, Lindström, Palm- gren, Sundholm eds.), 183–201 (2012). [Awodey2014] Steve Awodey: Structuralism, invariance, and univalence, Philosophia Mathematica, Vol. 22, 1–11 (2014). [Awodey2015] Steve Awodey: Homotopy type theory, in: M. Baner- jee and S. N. Krishna (Eds.), ICLA 2015, Lecture No- tes in Computer Science 8923, Springer Verlag, 1–10 (2015). [Awodey2017] Steve Awodey: Carnap and the invariance of logical truth, Synthese, Vol. 194, 65-78 (2017). [Awodey2018] Steve Awodey: Univalence as a principle of logic, Indagationes Mathematicae, Vol. 29(6), 1497–1510 (2018).

193 [Awodey2020] Steve Awodey: Sheaf representations and duality in logic, arXiv:2001.09195 (2020). [Balaguer1998] Michael Balaguer: Platonism and Anti–Platonism in mathematics, Oxford Univ. Press (1998). [Barcan1946] Ruth Barcan: A functional calculus of ﬁrst order based on strict implication, Journal of Symbolic Logic, Vol. 11(1), 1–16 (1946). [BellantoniCook1992] Stephen Bellantoni, Stephen Cook: A new recursi- on theoretic characterization of the polytime functi- ons, Computational Complexity, Volume 2(2), 97–110 (1992). [Benacerraf1965] Paul Benacerraf: What numbers could not be, The Philosophical Review, Vol. 74, 47–73 (1965). [Ben–David2019] Shai Ben–David, Pavel Hrubeš, Shay Moran, Amir Shpilka, Amir Yehudayoﬀ: Learnability can be undecidable, Nature Machine Intelligence, Vol. 1, 44–48 (2019). [vdBerg2018] BennovandenBerg:Pathcategoriesandpropositio- nal identity types, ACM Transactions on Computa- tional Logic, Vol. 19(2), Article No. 15, 1–32 (2018). [vdBergGarner2011] Benno van den Berg,Richard Garner:Types are weak ω–groupoids, Proceedings of the London Mathemati- cal Society, Vol. 102(3), 370–394 (2011). [vdBergMoerdijk2018] Benno van den Berg, Ieke Moerdijk: Exact completion of path categories and algebraic set theory: Part I, Journal of Pure and Applied Algebra, Vol. 222(10), 3137–3181 (2018). [Blanke1996] Detlev Blanke: Leibniz und die Lingua Universalis, Sitzungsberichte der Leibniz-Sozietät, Band 13, Heft 5, 27–35 (1996). [Blom2011] Philipp Blom: Böse Philosophen: Ein Salon in Paris und das vergessene Erbe der Aufklärung, Hanser Ver- lag, München (2011). [Bolzano1837] Bernhard Bolzano: Wissenschaftslehre, 4 Bände, Sulzbach (1837). [Bolzano1851] Bernhard Bolzano: Paradoxien des Unendlichen, Re- clam Verlag, Leipzig (1851). [Boole1847] George Boole: The mathematical analysis of logic: being an essay towards a calculus of deductive rea- soning, Macmillan, Cambridge (1847).

194 [Bournez2017] Olivier Bournez, Daniel S. Graça, Amaury Pouly: Po- lynomial time corresponds to solutions of polynomial ordinary differential equations of polynomial length, Journal of the ACM, Vol. 64(6), Article 38 (2017). [Cantor1932] Georg Cantor: Gesammelte Werke, Springer Verlag (1932). [Carnap1998] Paul Rudolf Carnap: Der logische Aufbau der Welt, Philosophische Bibliothek, Band 514, Felix Meiner Verlag, Hamburg (1998). [Cassou–Noguès2011] Pierre Cassou–Noguès: On Gödel’s ”Platonism”, Phi- losophia Scientae, Vol. 15(2), 137–171 (2011). [Church1936] Alonzo Church, An unsolvable problem of elementary number theory, American Journal of Mathematics, Vol. 58, 345–363 (1936). [Church1940] Alonzo Church: A formulation of the simple theory of types, Journal of Symbolic Logic, Vol. 5, 56–68 (1940). [Cohen2005] PaulJ.Cohen:Skolemandpessimismaboutproof in mathematics, Phil. Trans. of the Royal Society, Ser. A, Vol. 363, 2407–2418 (2005). [Couturat1901] Louis Couturat: La loqique de Leibniz, Paris (1901). Nachdruck Olms Verlag, Hildesheim (1966). [CouturatLeau1903] Louis Couturat, Léopold Leau: Histoire de la langue universelle, Hachette, Paris (1903). Nachdruck Olms Verlag, Hildesheim (1976). [Davis1965] Martin Davis (ed.): The Undecidable, Raven Press (1964). [Dedekind1930] Richard Dedekind: Gesammelte Werke in 3 Bänden, Vieweg Verlag (1930). [Eco1993] Umberto Eco: La ricerca della lingua perfetta nella cultura europea, Editori Laterza (1993). [Einstein1916] Albert Einstein: Die Grundlage der allgemeinen Re- lativitätstheorie, Ann. Physik, Band 49, 769–822 (1916). [Feferman1977] Solomon Feferman: Review of first edition of Takeu- ti’s book “Proof theory”, Bull. of the AMS, Vol. 83(3), 351–361 (1977). [Frege1879] Gottlob Frege: Begriffsschrift, Louis Nebert Verlag (1879).

195 [Frege1893] Gottlob Frege: Grundgesetze der Arithmetik, Pohle Verlag Jena (1893). [Frege1962] Gottlob Frege: Funktion, Begriff, Bedeutung, Van- denhoeck und Ruprecht, Göttingen (1962). [Frege1976] Gottlob Frege: Wissenschaftlicher Briefwechsel, Felix Meiner Verlag, Hamburg (1976). [Frege1983] Gottlob Frege: Nachgelassene Schriften, zweite erweiterte Auflage, Felix Meiner Verlag, Hamburg (1983). [Frege2003] Gottlob Frege: Logische Untersuchungen, Vanden- hoeck und Ruprecht, 5. Auflage, Göttingen (2003). [Gandy1980] Robin Gandy: Church’s thesis and principles for me- chanisms, in: The Kleene Symposium (Barwise, Keis- ler, Kunen eds.), North–Holland, 123–148 (1980). [Gödel1931] Kurt Gödel: Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I, Monatshefte für Mathematik und Physik, Band 38(1), 173–198 (1931). [Gödel2001] KurtGödel:Collectedworks,BandI–V,OxfordUni- versity Press (2001). [Gonthier2008] Georges Gonthier: Formal Proof – The Four-Color Theorem, Notices of the AMS, Vol. 55(11), 1382–1393 (2008). [Grayson2018] Daniel Grayson: An introduction to univalent foundations for mathematicians, Bull. Amer. Math. Soc., Vol. 55, 427–450 (2018). [Grothendieck1983] Alexander Grothendieck: A la poursuite des champs (inkl. Brief an Daniel Quillen vom 19. Februar 1983), unveröffentlichtes Manuskript (1983). [Halbach1996] Volker Halbach: Axiomatische Wahrheitstheorien, Akademie Verlag (1996). [Hardy1940] Godfrey Harold Hardy: A mathematician’s apology, Cambridge Univ. Press (1940). [Harris2017] Michael Harris: Mathematics without apologies: Por- trait of a problematic vocation, Princeton Univ. Press (2017). [Heidegger1957] Martin Heidegger: Identität und Differenz, Klett- Cotta Verlag (1957). [Henkin1949] Leon Henkin: The completeness of the first-order functional calculus, Journal of Symbolic Logic, Vol. 14(3), 159–166 (1949).

196 [Henkin1950] Leon Henkin: Completeness in the theory of types, Journal of Symbolic Logic, Vol. 15(2), 81–91 (1950). [Henkin1962] Leon Henkin: Are logic and mathematics identical?, Science, Vol. 138, 788–794 (1962). [Hobbes1655] Thomas Hobbes: Elementorum philosophiae sectio prima de corpore, London (1655). [HofmannStreicher1998] Martin Hofmann, Thomas Streicher: The groupoid interpretation of type theory, in: Twenty-five years of constructive type theory (Venice, 1995), Oxford Lo- gic Guides, Vol. 36, 83–111 (1998). [HuberMüller–Stach2017] Annette Huber, Stefan Müller–Stach: Ergebnisse der Mathematik und ihrer Grenzgebiete, 3. Folge, Vol. 65, Springer Verlag (2017). [Hume1739] David Hume: Of personal identity, in: A Treatise of Human Nature, Book I, Section 6 (1739). [Illusie2004] Luc Illusie: What is a topos?, Notices of the AMS, Vol. 51(9), 1060–1061 (2004). [Jost2017] JürgenJost:Objectorientedmodelsvs.dataanalysis - Is this the right alternative?, In: Mathematics as a tool : tracing new roles of mathematics in the sciences (Eds. Johannes Lenhard and Martin Carrier), Boston studies in the philosophy and history of science, Vol. 327, Springer Verlag, 253–286 (2017). [Jost2019] Jürgen Jost: Leibniz und die moderne Naturwissen- schaft, Reihe Wissenschaft und Philosophie, Springer Verlag (2019). [Joyal2017] André Joyal: Notes on clans and tribes, arXiv:1710.10238 (2017). [Kant1986] Immanuel Kant: Kritik der reinen Vernunft, Reclam Verlag (1986). [Kleene1952] Stephen Cole Kleene: Metamathematics, first edition, North Holland (1952). [KapranovVoevodsky1991] Mikhail Kapranov, Vladimir Voevodsky: - groupoids and homotopy types, Cahiers de topologie∞ et géometrie differéntielle, Vol. XXXII-1 (1991). [Kapulkin2017] Krzysztof Kapulkin: Locally cartesian closed categories from type theory, Journal of Topology, Vol. 10(4), 1029–1049 (2017). [Kripke1959] Saul Kripke: A completeness theorem in modal logic, Journal of Symbolic Logic, Vol. 24(1),1–14 (1959).

197 [Kripke1975] Saul Kripke: Outline of a theory of truth, The Journal of Philosophy, Vol. 72, 690–716 (1975). [Kripke1980] Saul Kripke: Naming and Necessity, Blackwell, Ox- ford (1980). [Krämer1992] Sybille Krämer: Symbolische Erkenntnis bei Leibniz, Zeitschrift für philosophische Forschung, Band 46, 224–237 (1992). [Krämer2009] Sybille Krämer: Tatsachenwahrheiten und Vernunft- wahrheiten, in: Monadologie (Hrsg. Hubertus Bu- sche), (Klassiker Auslegen: Gottfried Wilhelm Leib- niz) Berlin: Akademie, 95–113 (2009). [LambekScott1986] Joachim Lambek, Philip J. Scott: Introduction to higher-order categorical logic, Cambridge Studies in Advanced Mathematics, Vol. 7 (1988). [LambekScott2011] Joachim Lambek, Philip J. Scott: Reﬂections on the categorical foundations of mathematics, in: Founda- tional Theores of Classical and Constructive Mathe- matics (G. Sommaruga ed.), The Western Ontario Se- ries in Philosophy, Vol. 76, Springer Verlag, 171–186 (2011). [Lawvere1964] William Lawvere: An elementary theory of the category of sets, Proceedings of the National Academy of Science of the U.S.A, Vol. 52, 1506–1511 (1964). [Leibniz1666] Gottfried Wilhelm Leibniz: Dissertatio de arte combinatoria, Leipzig (1666). [Leibniz1677] Gottfried Wilhelm Leibniz: Dialogus de connexione inter res et verba (1677). [Leibniz1684] Gottfried Wilhelm Leibniz: Nova methodus pro ma- ximis et minimis, Acta Eruditorum (1684). [Leibniz1982] Gottfried Wilhelm Leibniz: Algemeine Untersuchun- gen über die Analyse der Begriﬀe und Wahrheiten, Philosophische Bibliothek, Band 338, Felix Meiner Verlag, Hamburg (1982). [Leibniz1989] Gottfried Wilhelm Leibniz: Philosophische Schriften, Hrsg. Werner Wiater, Wissenschaftliche Buchgesell- schaft, Darmstadt (1989). [Leibniz1996] Gottfried Wilhelm Leibniz: Neue Abhandlungen über den menschlichen Verstand, Philosophische Biblio- thek, Band 498, Felix Meiner Verlag (1996).

198 [Leibniz2000] Gottfried Wilhelm Leibniz: Die Grundlagen des logischen Kalküls, Philosophische Bibliothek, Band 525, Felix Meiner Verlag, Hamburg (2000). [Leibniz2014] Gottfried Wilhelm Leibniz: Monadologie und andere metaphysische Schriften, Philosophische Bibliothek, Band 537, Felix Meiner Verlag, Hamburg (2014). [Lenzen2004] Wolfgang Lenzen: Calculus universalis, Mentis Ver- lag, Paderborn (2004). [Linnebo2017] Øystein Linnebo: Philosopy of mathematics, Prince- ton Foundations of Contemporary Philosophy, Prin- ceton University Press (2017). [Llull1985] Ramón Llull: Die neue Logik, Philosophische Bi- bliothek, Band 379, Felix Meiner Verlag, Hamburg (1985). [Llull1290] Ramón Llull: Ars Brevis, Philosophische Bibliothek, Band 518, Felix Meiner Verlag, Hamburg (2001). [Lolli2017] Gabriele Lolli: Ambiguità, un viaggio fra letteratura e matematica, Il Mulino (2017). [Lucas1961] J.R. Lucas: Minds, Machines and Gödel, Philosophy, Vol. 36, 112–127 (1961). [Łukasiewicz1957] Jan Łukasiewicz: Aristotle’s syllogistic from the standpoint of modern formal logic, Oxford Clarendon Press (1957). [Lurie2008] JacobLurie:Whatisan –category?, Notices of the AMS, Vol. 55(8), 949–950∞ (2008). [Lurie2009] Jacob Lurie: Higher topos theory, Annals of Mathe- matical Studies, Vol. 170, Princeton University Press (2009). [MacLaneMoerdijk1992] Saunders MacLane, Ieke Moerdijk: Sheaves in geome- try and logic, Springer Universitext (1992). [Manin2010] Yuri I. Manin: A course in mathematical logic for mathematicians, second edition, with collaboration by Boris Zilber, Springer GTM 53 (2010). [Martin–Löf1984] Per Martin–Löf: Intuitionistic type theory, Bibliopo- lis, Neapel (1984). [Martin–Löf1994] Per Martin–Löf: Analytic and synthetic judgements in type theory, in: Kant and Contemporary Episte- mology (Paolo Parrini (Hrsg.)), Kluwer Acad. Publis- hers, 87–99 (1994).

199 [McCullochPitts1943] Warren McCulloch, William Pitts: A logical calculus of the ideas immanent in nervous activity, Bulletin of Mathematical Biophysics, Vol. 5, 115–133 (1943). [deMorgan1847] Augustus de Morgan: Formal logic, Taylor and Wal- ton, London (1847). [Müller–Stach2013] Stefan Müller–Stach: What is a period?, Notices of the AMS, Vol. 61(8), 898–899 (2013). [Müller–Stach2017] Stefan Müller–Stach (Hrsg.): Richard Dedekind: „Was sind und was sollen die Zahlen?” und „Stetigkeit und Irrationalzahlen”, Springer Verlag (2017). [Müller–Stach2020] Stefan Müller–Stach: Emmy Noether und ihre Bedeu- tung für die moderne Mathematik, Preprint (2020). [Patzig1969] Günther Patzig: Die aristotelische Syllogistik, 3. Auf- lage, Vandenhoeck und Ruprecht, Göttingen (1969). [Penrose1989] Roger Penrose: The Emperor’s New Mind, Oxford Univ. Press (1989). [Penrose1994] Roger Penrose: Shadows of the Mind, Oxford Univ. Press (1994). [Penrose2006] RogerPenrose:Aroadtoreality:acompleteguide to the laws of the universe, Vintage Books (2006). [Poincaré1902] Henri Poincaré:La scienceet l’hypothése, Flammari- on (1902). [PourEl–Richards1981] Marian B. Pour–El, Ian Richards: The wave equati- on with computable initial data such that its unique solution is not computable, Vol. 39, Adv. in Math., 215–239 (1981). [Post1936] Emil Post: Finite combinatory processes, Journal of Symbolic Logic, Vol. 1, 103–105 (1936). [Post1947] Emil Post: Recursive unsolvability of a problem of Thue, The Journal of Symbolic Logic, Vol. 12, 1–11 (1947). [RademacherToeplitz1930] Hans Rademacher, Otto Toeplitz: Von Zahlen und Figuren, Springer Verlag (1930). [Reclam2019] Stefan Jordan, Christian Nimtz: Grundbegriﬀe der Philosophie, zweite Auﬂage, Reclam Verlag (2019). [RiehlVerity2020] Emily Riehly, Dominic Verity: Elements of – category theory, Buchmanuskript (2020). ∞ [Riemann1990] Bernhard Riemann: Gesammelte Werke, Springer Verlag (1990).

200 [Rosling2019] Hans Rosling: Factfulness, Ullstein Taschenbuch (2019). [Rovelli2009] Carlo Rovelli: Anaximandre de Milet ou la naissance de la pensée scientifique, Dunod Verlag, Paris (2009). [Scholz1942] Heinrich Scholz: Leibniz und die mathematische Grundlagenforschung, Vortrag in der Kaiser– Wilhelm–Gesellschaft am 21. Januar 1942, Jahresbe- richt der DMV, Band 52, 217–244 (1943). [Schröder1890] Ernst Schröder: Algebra der Logik, 3 Bände, Teubner Verlag, Leipzig (1890–1905). [Searle1992] John Searle: The rediscovery of the mind, MIT Press (1992). [Shannon1941] Claude Shannon: Mathematical theory of the differential analyzer, Journal of Mathematics and Physics of the MIT, Vol. 20, 337–354 (1941). [Shulman2019] Mike Shulman: Comparing material and structural set theories, Annals of Pure and Applied Logic, Vol. 170(4), 465–504 (2019). [Shulman2019b] Mike Shulman: All ( , 1)–toposes have strict univalent universes, Preprint,∞ arXiv:1904.07004v2 (2019). [Skolem] Thoralf Skolem: Selected works in logic, J. E. Fen- stadt (ed.), Universitetsforlaget Oslo (1970). [Smullyan2013] Raymond M. Smullyan: Truth and provability, The Mathematical Intelligencer, Vol. 35(1), 21–24 (2013). [Takeuti2013] Gaisi Takeuti: Proof theory, second edition, reprinted by Dover Publications Inc. (2013). [Tarski1931] Alfred Tarski: Sur les ensembles définissables de nom- bres réels I, Fundamenta Mathematicae, Vol. 17, 210– 239 (1931). [Tarski1933] Alfred Tarski: Pojecie prawdy w jezykach nauk de- dukcyjnych, Warsaw (1933). [Tarski1935] Alfred Tarski: Der Wahrheitsbegriff in den formalisierten Sprachen, Studia Philosophica 1, 261–405 (1935). [Tarski1938] Alfred Tarski: Der Aussagenkalkül und die Topologie, Fundamenta Mathematicae, Vol. 31, 103–134 (1938). [TarskiVaught1956] Alfred Tarski, Robert Vaught: Arithmetical extensi- ons of relational systems, Compositio Mathematica, Vol. 13, 81–102 (1956).

201 [Tarski1969] Alfred Tarski: Truth and proof, Scientiﬁc American, 63–77 (1969). [Thue1977] Selected mathematical papers of Axel Thue (T. Na- gell, A. Selberg, S. Selberg, K. Thalberg (Eds.)), Uni- versitetsverlaget Oslo (1977). [Tierney1972] Myles Tierney: Sheaf theory and the continuum hy- pothesis, in Springer LNM 274, 13–42 (1972). [Turing1936] Alan M. Turing: On computable numbers with an ap- plication to the Entscheidungsproblem, Proc. London Math. Society, Vol. 42, 230–265 (1936). [Turing1950] Alan M. Turing: Computing machinery and intelligence, Mind, Vol. LIX(236), 433–460 (1950). [Valiant2013] Leslie G. Valiant: Probably approximately correct, Basic Books (2013). [Voevodsky2013] Vladimir Voevodsky et al.: Homotopy type theory: univalent foundations of mathematics, Princeton (2013). [Vossenkuhl2013] Wilhelm Vossenkuhl: Frege – Das Problem der Wahr- heit, SWR2 Aula, Sendedatum 28. Juli 2013 (2013). [Wiener1950] Norbert Wiener: Human use of human beings – cy- bernetics and society, The Riverside Press (1950). [Wigderson2019] Avi Wigderson: Mathematics and computation, Prin- ceton Univ. Press (2019). [Wittgenstein1989] Ludwig Wittgenstein: Tractatus Logico–Philo- sophicus, Werkausgabe Band 1, Suhrkamp Verlag, Frankfurt (1989).

202