Analysis of Large-Scale Metabolic Networks: Organization Theory, Phenotype Prediction and Elementary Flux Patterns

Analysis of Large-Scale Metabolic Networks: Organization Theory, Phenotype Prediction and Elementary Flux Patterns Dissertation zur Erlangung des akademischen Grades doctor rerum naturalium (Dr. rer. nat.) vorgelegt dem Rat der Biologisch-Pharmazeutischen Fakultät der Friedrich-Schiller-UniversitätJena von Diplom-Bioinformatiker Christoph Kaleta geboren am 16. Mai 1983 in Weimar, Deutschland Gutachter: 1. Prof. Dr. Stefan Schuster (UniversitätJena) 2. PD Dr. Peter Dittrich (UniversitätJena) 3. Prof. Dr. Joachim Selbig (UniversitätPotsdam) Tag der öffentlichen Verteidigung: 22.3.2010 Die vorliegende Arbeit wurde am Lehrstuhl fürBioinformatik der Biologisch- Pharmazeutischen Fakultätder Friedrich-Schiller-UniversitätJena unter der Leitung von Prof. Dr. Stefan Schuster und in der Biosystemanalysegruppe unter der Leitung von PD Dr. Peter Dittrich angefertigt. 1 Abstract Understanding the function and control of metabolic networks is one of the central topics in systems biology. The metabolic network allows an organism to recreate all of its components from molecules that can be found in its environ- ment. Due to the inherent complexity of such networks different methods aimed at analysing their structure have been proposed. The methods used here can be broadly divided into two types. The first type comprises flux-centered approaches like elementary mode analysis, the closely related extreme pathway analysis and flux balance analysis. These approaches have in common that they concentrate on possible fluxes through reactions at steady state. The second type, represented by chemical organization theory, additionally explicitly takes into account metabolites. Thus, not only a specific set of reactions but all possible reactions that can be performed by a given set of metabolites is considered. All these methods differ in the size of the networks to which they can be applied and in the type of results that can be obtained. The major focus of this work is the integration of several of these concepts in order to allow a more comprehensive analysis of metabolic networks. Indeed, elementary mode analysis and chemical organization theory can complement each other in two ways. First, the set of chemical organizations of a reaction network allows for a meaningful clustering of elementary modes and helps to identify elementary modes that cannot be operative at steady state. Second, the set of elementary modes can be used as a base for an algorithm to compute chemical organizations. Furthermore, a comparison shows that taking into account the compounds present in a reaction network is of importance since Abstract 2 chemical organization theory allows for more accurate predictions concerning the viability of an organism after a perturbation of its metabolic network. In another direction, the combination of concepts from flux balance analysis and elementary mode analysis helps to overcome the problem that the entire set of elementary modes can only be computed in small or medium size metabolic networks. The framework behind this integration, elementary flux pattern analysis, allows one to identify all possible routes through a subsystem that are part of a pathway in a genome-scale metabolic network. A first important benefit of this concept is that many approaches building on elementary mode analysis can now be applied to genome-scale metabolic networks. Furthermore, using elementary flux patterns, we were able to identify several elementary modes in a subsystem of a metabolic model of Escherichia coli reported in a previous work that are not part of a steady-state flux if the entire network is considered. Additionally, we dis- covered several alternative routes to common metabolic pathways in the central metabolism of E. coli. Using elementary flux pattern analysis in a genome-scale metabolic model of humans we found several pathways that contradict a widely held assumption in biochemistry saying that the conversion of even-chain fatty acids into glucose is infeasible in humans. 3 Zusammenfassung Die Untersuchung und Aufklärung von Zusammenhängen in metabolischen Netz- werken ist eines der zentralen Aufgabengebiete der Systembiologie. Ein metabo- lisches Netzwerk erlaubt es dem Organismus, alle seine Bestandteile aus Stoffen in seiner Umgebung herzustellen. Aufgrund der Komplexität dieser Netzwerke wurden verschiedene Methoden zur Untersuchung ihrer Struktur vorgeschlagen. Die Methoden, die in dieser Arbeit zur Anwendung kommen, können grob in zwei Richtungen unterteilt werden. Einerseits gibt es Methoden die sich auf die Flusse¨ in einem metabolischen Netzwerk konzentrieren. Beispiele fur¨ solche Me- thoden sind die Elementarmodenanalyse, die sehr ähnliche Analyse von Extreme Pathways und die Flussbilanzanalyse (Flux Balance Analysis). Andererseits gibt es Methoden, wie die Theorie der chemischen Organisationen, die zudem die Me- tabolite in einem Netzwerk in die Analyse mit einbeziehen. Dabei werden nicht nur Mengen an Reaktionen, sondern grundsätzlich alle Reaktionen die zwischen einer bestimmten Menge an Metaboliten möglich sind, betrachtet. Alle diese Methoden unterscheiden sich in der Größe der Netzwerke, auf die sie angewendet werden können und in den Ergebnissen, die sie liefern. Das zentrale Ziel dieser Arbeit ist es diese Methoden miteinander in Beziehung zu setzen und zu kombinieren, um eine umfassendere Analyse von Reaktionsnetzwerken zu ermöglichen. So können sich die Elementarmodenanalyse und die Theorie Chemischer Organisationen in zwei- erlei Hinsicht ergänzen. Einerseits erlauben es die chemischen Organisationen eines Reaktionsnetzwerks dessen Elementarmoden zu gruppieren und solche zu identifizieren, die nicht im stationären Zustand des Reaktionsnetzwerks auftreten können. Zusammenfassung 4 Andererseits können Elementarmoden verwendet werden, um chemische Organisa- tionen zu berechnen. Weiterhin kann gezeigt werden, dass die explizite Beachtung von Metaboliten die Genauigkeit der Vorhersage bezuglich¨ der Lebensfähigkeit eines Organismus nach der Störung seines metabolischen Netzwerks verbessert. Ein weiterer zentraler Punkt dieser Arbeit ist die Kombination von Flussbilanzanaly- se mit Elementarmodenanalyse, die es erlaubt, die Problematik zu umgehen, dass Elementarmoden nur in metabolischen Netzwerken kleinerer und mittlerer Größe vollständig berechnet werden können. Das Konzept der Elementary Flux Pat- terns, das dieser Integration zu Grunde liegt, erlaubt es alle möglichen Wege von stationären Flussen¨ durch ein Teilnetwerk eines Ganzzellmodells (genome-scale model) zu bestimmen. Ein erster Vorteil dieses Konzepts liegt darin, dass viele Methoden, die auf Elementarmodenanalyse aufbauen, jetzt auch auf Ganzzellm- odelle angewendet werden können. Weiterhin konnten wir in einem Teilsystem eines Ganzzellmodells des Metabolismus von Escherichia coli mehrere Elemen- tarmoden identifizieren, die die Stationaritätsbedingung zwar in dem Teilmodell erfullen,¨ aber nicht Teil eines stationären Flusses durch das Gesamtmodell sein können. In demselben Modell fanden wir außerdem mehrere Reaktionswege, die als Alternativrouten fur¨ Stoffwechselwege im zentralen Metabolismus von E. coli verwendet werden können. In einem Modell des menschlichen Metabolismus iden- tifizierten wir zudem mehrere Reaktionswege, die der weit verbreiteten Annahme widersprechen, dass die Umwandlung von geradzahligen Fettsäuren in Glucose im Menschen nicht möglich ist. 5 Danksagung Nach nur einem Jahr neigt sich meine Arbeit als Doktorand schon dem Ende zu. Dass ich meine Doktorarbeit in dieser kurzen Zeit fertigstellen konnte, habe ich Peter Dittrich und Stefan Schuster zu verdanken. Durch meine Arbeit in der Biosystemanalysegruppe von Peter Dittrich in den Jahren 2005 – 2008 konnte ich erste wertvolle Erfahrungen in der wissenschaftlichen Praxis sammeln. Mein be- sonderer Dank gilt Stefan Schuster, da er es mir ermöglicht hat einen Teil dieser Arbeit und andere Arbeiten, die schon während meiner Zeit bei der Biosystem- analysegruppe, begonnen haben in seiner Gruppe fortzusetzen. Dem messe ich besondere Bedeutung bei, da ich so meine zuvor gewonnenen Erfahrungen weiter vertiefen konnte. Weiterhin gilt mein Dank auch Reinhard Guthke, bei dem ich im Rahmen meiner Diplomarbeit lernte, wie schwierig es ist Modelle von biologischen Systemen zu konstruieren. Es ist schwer einer Danksagung eine Reihenfolge auf- zuerlegen. Gerade deshalb möchte ich genauso meiner Familie und ganz besonders meiner Freundin Claudia danken, die mich während dieser ganzen Zeit tatkräftig unterstutzt¨ und, wenn notwendig, auch mal abgelenkt haben. Hier möchte ich naturlich¨ auch meinen Mitarbeitern danken, mit denen die Zusammenarbeit im- mer eine sehr große Freude war und sicherlich auch noch sein wird. Dabei möchte ich ganz besonders Lu´ıs,Jörn, Ines, Frank, Florian und Pietro danken. 6 Contents Abstract1 Zusammenfassung3 Danksagung5 1 Introduction8 2 From Metabolic Pathways to Chemical Organizations 18 Analyzing molecular reaction networks: From pathways to chemical organizations. C. Kaleta, F. Centler, and P. Dittrich. Mol. Biotech- nol., 34(2):117-123, Oct 2006. .................... 19 Computing chemical organizations in biological networks. F. Centler, C. Kaleta, P. S. di Fenizio, and P. Dittrich. Bioinformatics, 24(14):1611- 1618, Jul 2008. ............................ 26 3 Predicting Phenotypes of Metabolic Networks 34 Phenotype prediction in regulated metabolic networks. C. Kaleta, F. Centler, P. S. di Fenizio, and P. Dittrich. BMC Syst.

Analysis of Large-Scale Metabolic Networks: Organization Theory, Phenotype Prediction and Elementary Flux Patterns

Metabolic Network Structure Determines Key Aspects of Functionality and Regulation

DISSERTATION PROTEOMIC PROFILING of the RAT RENAL PROXIMAL CONVOLUTED TUBULE in RESPONSE to CHRONIC METABOLIC ACIDOSIS Submitted

A Computational Approach for Defining a Signature of Β-Cell Golgi Stress in Diabetes Mellitus

Grhpr Gene, Full Gene Analysis

Supplement 1 Microarray Studies

Supplementary Materials

Computational Modeling of Genetic and Biochemical Networks. Edited by James M. Bower and Hamid Bolouri Computational Molecular Biology, a Bradford Book, the MIT Press, Cambridge

Supplementary Table S4. FGA Co-Expressed Gene List in LUAD

Supplementary Methods

Mathematical Models for Explaining the Warburg Effect: a Review Focussed on ATP and Biomass Production

Supplementary Information

VIEW Open Access the Role of Ubiquitination and Deubiquitination in Cancer Metabolism Tianshui Sun1, Zhuonan Liu2 and Qing Yang1*