Analysis of Large-Scale Metabolic Networks: Organization Theory, Phenotype Prediction and Elementary Flux Patterns
Total Page:16
File Type:pdf, Size:1020Kb
Analysis of Large-Scale Metabolic Networks: Organization Theory, Phenotype Prediction and Elementary Flux Patterns Dissertation zur Erlangung des akademischen Grades doctor rerum naturalium (Dr. rer. nat.) vorgelegt dem Rat der Biologisch-Pharmazeutischen Fakult¨at der Friedrich-Schiller-Universit¨atJena von Diplom-Bioinformatiker Christoph Kaleta geboren am 16. Mai 1983 in Weimar, Deutschland Gutachter: 1. Prof. Dr. Stefan Schuster (Universit¨atJena) 2. PD Dr. Peter Dittrich (Universit¨atJena) 3. Prof. Dr. Joachim Selbig (Universit¨atPotsdam) Tag der ¨offentlichen Verteidigung: 22.3.2010 Die vorliegende Arbeit wurde am Lehrstuhl f¨urBioinformatik der Biologisch- Pharmazeutischen Fakult¨atder Friedrich-Schiller-Universit¨atJena unter der Leitung von Prof. Dr. Stefan Schuster und in der Biosystemanalysegruppe unter der Leitung von PD Dr. Peter Dittrich angefertigt. 1 Abstract Understanding the function and control of metabolic networks is one of the cen- tral topics in systems biology. The metabolic network allows an organism to recreate all of its components from molecules that can be found in its environ- ment. Due to the inherent complexity of such networks different methods aimed at analysing their structure have been proposed. The methods used here can be broadly divided into two types. The first type comprises flux-centered approaches like elementary mode analysis, the closely related extreme pathway analysis and flux balance analysis. These approaches have in common that they concentrate on possible fluxes through reactions at steady state. The second type, represented by chemical organization theory, additionally explicitly takes into account metabo- lites. Thus, not only a specific set of reactions but all possible reactions that can be performed by a given set of metabolites is considered. All these methods differ in the size of the networks to which they can be applied and in the type of results that can be obtained. The major focus of this work is the integration of several of these concepts in order to allow a more comprehensive analysis of metabolic networks. Indeed, elementary mode analysis and chemical organization theory can complement each other in two ways. First, the set of chemical orga- nizations of a reaction network allows for a meaningful clustering of elementary modes and helps to identify elementary modes that cannot be operative at steady state. Second, the set of elementary modes can be used as a base for an algorithm to compute chemical organizations. Furthermore, a comparison shows that taking into account the compounds present in a reaction network is of importance since Abstract 2 chemical organization theory allows for more accurate predictions concerning the viability of an organism after a perturbation of its metabolic network. In another direction, the combination of concepts from flux balance analysis and elementary mode analysis helps to overcome the problem that the entire set of elementary modes can only be computed in small or medium size metabolic networks. The framework behind this integration, elementary flux pattern analysis, allows one to identify all possible routes through a subsystem that are part of a pathway in a genome-scale metabolic network. A first important benefit of this concept is that many approaches building on elementary mode analysis can now be ap- plied to genome-scale metabolic networks. Furthermore, using elementary flux patterns, we were able to identify several elementary modes in a subsystem of a metabolic model of Escherichia coli reported in a previous work that are not part of a steady-state flux if the entire network is considered. Additionally, we dis- covered several alternative routes to common metabolic pathways in the central metabolism of E. coli. Using elementary flux pattern analysis in a genome-scale metabolic model of humans we found several pathways that contradict a widely held assumption in biochemistry saying that the conversion of even-chain fatty acids into glucose is infeasible in humans. 3 Zusammenfassung Die Untersuchung und Aufkl¨arung von Zusammenh¨angen in metabolischen Netz- werken ist eines der zentralen Aufgabengebiete der Systembiologie. Ein metabo- lisches Netzwerk erlaubt es dem Organismus, alle seine Bestandteile aus Stoffen in seiner Umgebung herzustellen. Aufgrund der Komplexit¨at dieser Netzwerke wurden verschiedene Methoden zur Untersuchung ihrer Struktur vorgeschlagen. Die Methoden, die in dieser Arbeit zur Anwendung kommen, k¨onnen grob in zwei Richtungen unterteilt werden. Einerseits gibt es Methoden die sich auf die Flusse¨ in einem metabolischen Netzwerk konzentrieren. Beispiele fur¨ solche Me- thoden sind die Elementarmodenanalyse, die sehr ¨ahnliche Analyse von Extreme Pathways und die Flussbilanzanalyse (Flux Balance Analysis). Andererseits gibt es Methoden, wie die Theorie der chemischen Organisationen, die zudem die Me- tabolite in einem Netzwerk in die Analyse mit einbeziehen. Dabei werden nicht nur Mengen an Reaktionen, sondern grunds¨atzlich alle Reaktionen die zwischen einer bestimmten Menge an Metaboliten m¨oglich sind, betrachtet. Alle diese Methoden unterscheiden sich in der Gr¨oße der Netzwerke, auf die sie angewendet werden k¨onnen und in den Ergebnissen, die sie liefern. Das zentrale Ziel dieser Arbeit ist es diese Methoden miteinander in Beziehung zu setzen und zu kombinieren, um eine umfassendere Analyse von Reaktionsnetzwerken zu erm¨oglichen. So k¨onnen sich die Elementarmodenanalyse und die Theorie Chemischer Organisationen in zwei- erlei Hinsicht erg¨anzen. Einerseits erlauben es die chemischen Organisationen eines Reaktionsnetzwerks dessen Elementarmoden zu gruppieren und solche zu identifi- zieren, die nicht im station¨aren Zustand des Reaktionsnetzwerks auftreten k¨onnen. Zusammenfassung 4 Andererseits k¨onnen Elementarmoden verwendet werden, um chemische Organisa- tionen zu berechnen. Weiterhin kann gezeigt werden, dass die explizite Beachtung von Metaboliten die Genauigkeit der Vorhersage bezuglich¨ der Lebensf¨ahigkeit ei- nes Organismus nach der St¨orung seines metabolischen Netzwerks verbessert. Ein weiterer zentraler Punkt dieser Arbeit ist die Kombination von Flussbilanzanaly- se mit Elementarmodenanalyse, die es erlaubt, die Problematik zu umgehen, dass Elementarmoden nur in metabolischen Netzwerken kleinerer und mittlerer Gr¨oße vollst¨andig berechnet werden k¨onnen. Das Konzept der Elementary Flux Pat- terns, das dieser Integration zu Grunde liegt, erlaubt es alle m¨oglichen Wege von station¨aren Flussen¨ durch ein Teilnetwerk eines Ganzzellmodells (genome-scale model) zu bestimmen. Ein erster Vorteil dieses Konzepts liegt darin, dass viele Methoden, die auf Elementarmodenanalyse aufbauen, jetzt auch auf Ganzzellm- odelle angewendet werden k¨onnen. Weiterhin konnten wir in einem Teilsystem eines Ganzzellmodells des Metabolismus von Escherichia coli mehrere Elemen- tarmoden identifizieren, die die Stationarit¨atsbedingung zwar in dem Teilmodell erfullen,¨ aber nicht Teil eines station¨aren Flusses durch das Gesamtmodell sein k¨onnen. In demselben Modell fanden wir außerdem mehrere Reaktionswege, die als Alternativrouten fur¨ Stoffwechselwege im zentralen Metabolismus von E. coli verwendet werden k¨onnen. In einem Modell des menschlichen Metabolismus iden- tifizierten wir zudem mehrere Reaktionswege, die der weit verbreiteten Annahme widersprechen, dass die Umwandlung von geradzahligen Fetts¨auren in Glucose im Menschen nicht m¨oglich ist. 5 Danksagung Nach nur einem Jahr neigt sich meine Arbeit als Doktorand schon dem Ende zu. Dass ich meine Doktorarbeit in dieser kurzen Zeit fertigstellen konnte, habe ich Peter Dittrich und Stefan Schuster zu verdanken. Durch meine Arbeit in der Biosystemanalysegruppe von Peter Dittrich in den Jahren 2005 – 2008 konnte ich erste wertvolle Erfahrungen in der wissenschaftlichen Praxis sammeln. Mein be- sonderer Dank gilt Stefan Schuster, da er es mir erm¨oglicht hat einen Teil dieser Arbeit und andere Arbeiten, die schon w¨ahrend meiner Zeit bei der Biosystem- analysegruppe, begonnen haben in seiner Gruppe fortzusetzen. Dem messe ich besondere Bedeutung bei, da ich so meine zuvor gewonnenen Erfahrungen weiter vertiefen konnte. Weiterhin gilt mein Dank auch Reinhard Guthke, bei dem ich im Rahmen meiner Diplomarbeit lernte, wie schwierig es ist Modelle von biologischen Systemen zu konstruieren. Es ist schwer einer Danksagung eine Reihenfolge auf- zuerlegen. Gerade deshalb m¨ochte ich genauso meiner Familie und ganz besonders meiner Freundin Claudia danken, die mich w¨ahrend dieser ganzen Zeit tatkr¨aftig unterstutzt¨ und, wenn notwendig, auch mal abgelenkt haben. Hier m¨ochte ich naturlich¨ auch meinen Mitarbeitern danken, mit denen die Zusammenarbeit im- mer eine sehr große Freude war und sicherlich auch noch sein wird. Dabei m¨ochte ich ganz besonders Lu´ıs,J¨orn, Ines, Frank, Florian und Pietro danken. 6 Contents Abstract1 Zusammenfassung3 Danksagung5 1 Introduction8 2 From Metabolic Pathways to Chemical Organizations 18 Analyzing molecular reaction networks: From pathways to chemical or- ganizations. C. Kaleta, F. Centler, and P. Dittrich. Mol. Biotech- nol., 34(2):117-123, Oct 2006. .................... 19 Computing chemical organizations in biological networks. F. Centler, C. Kaleta, P. S. di Fenizio, and P. Dittrich. Bioinformatics, 24(14):1611- 1618, Jul 2008. ............................ 26 3 Predicting Phenotypes of Metabolic Networks 34 Phenotype prediction in regulated metabolic networks. C. Kaleta, F. Centler, P. S. di Fenizio, and P. Dittrich. BMC Syst.