Developing Computational Tools for Organic and Medicinal Chemistry
Total Page:16
File Type:pdf, Size:1020Kb
From Desktop to Benchtop – Developing Computational Tools for Organic and Medicinal Chemistry Mihai Burai-Patrascu A thesis submitted to McGill University in partial fulfillment of the requirements for the degree of Doctor of Philosophy. Department of Chemistry McGill University Montréal, Québec, Canada April 2020 © Mihai Burai-Patrascu, 2020 Abstract Organic and medicinal chemistry research contribute extensively to the discovery, optimization, and ton-scale production of numerous small molecules, such as novel drugs that treat life-threatening diseases. This research can be put in the context of the COVID-19 global pandemic, which has claimed many lives, shut down the entire planet, and made humanity reliant on chemistry (amongst which organic and medicinal chemistry play a key role) and biochemistry research to come up with innovative solutions in a short amount of time. A major hurdle in organic and medicinal chemistry research is the production of these complex life-saving small molecules and the tedious and time-consuming syntheses they require. To offset this, these two fields of chemistry make use of a different branch of chemistry, namely computational chemistry. Over the years, computational chemistry has become a trusted partner of experimental chemistry and has significantly contributed to the discovery of novel drugs. However, computational chemistry often requires expertise in both chemistry and coding, the latter of which most experimentalists do not possess. As such, in this thesis I seek to develop and interface computational tools with organic and medicinal chemistry to improve the molecular discovery rate. The majority of the tools that we have developed have been implemented in our drug discovery platform FORECASTER and in our asymmetric catalyst design platform VIRTUAL CHEMIST, to enable chemists to use powerful software developed by chemists for chemists. In only a few clicks, the user can interact with our platforms without the need for expertise in computational chemistry. This thesis begins with a short but comprehensive introduction (Chapter 1) into computational chemistry and its various applications. Following this, I developed a computational protocol that allows the accurate modeling of nucleoside conformations (Chapter 2), which in turn ii enables the synthesis of only those nucleosides that exhibit desirable properties. This work was done in relation to the current methodology of developing nucleosides, which entails the synthesis of multiple analogues until one with desirable properties is found, since this contributes to an increased cost, waste production and energy expenditure. Then, using this protocol, I quantified the various effects that contribute to the different nucleoside conformations, and we were able to provide plausible explanations of why non-natural nucleosides behave in certain ways (Chapter 3). As a change of pace, I turned my attention to Cytochrome P450-mediated drug metabolism and toxicity, which constitutes one of the main interests of medicinal chemists (Chapter 4). In this chapter I developed a novel tool based on quantum mechanics, docking and machine learning that enables the identification of Cytochrome P450 inhibitors in silico. This allows medicinal chemists to test whether a compound or drug of interest presents inhibitory activity against a Cytochrome P450 isoform before attempting synthesis. Finally, we provided organic chemists with a computational platform – VIRTUAL CHEMIST – that allows them to undertake an asymmetric synthesis project virtually from A-Z (Chapter 5). Such a platform facilitates organic chemists to test thousands of molecules at the click of a button and to select only those catalysts that show excellent stereoselectivity and reactivity. The thesis then concludes with the overall obstacles I have overcome in my research, as well as possible future avenues for research. iii Résumé La recherche en chimie organique et médicinale contribue largement à la découverte, à l'optimisation et à la production à l'échelle de la tonne de nombreuses petites molécules, telles que les nouveaux médicaments qui traitent des maladies mortelles. Cette recherche peut être placée dans le contexte de la pandémie mondiale COVID-19, qui a fait de nombreuses victimes, a fermé la planète entière et a rendu l'humanité dépendante de la capacité de la recherche en chimie (organique et médicinale) et biochimie à trouver des solutions innovantes en peu de temps pour ceux qui en ont besoin. L'un des principaux obstacles à la recherche en chimie organique et médicinale est la production de ces petites molécules complexes qui sauvent des vies et le développement des synthèses fastidieuse qu'elles nécessitent souvent. Pour y remédier, ces deux domaines de la chimie font appel à une branche différente de la chimie, à savoir la chimie computationnelle. Au fil des ans, la chimie computationnelle est devenue un partenaire de confiance de la chimie expérimentale et a contribué de manière significative à la découverte de nouveaux médicaments. Cependant, la chimie computationnelle requiert souvent une expertise à la fois en chimie et en programmation, cette dernière n'étant pas du ressort de la plupart des expérimentateurs. C'est pourquoi, dans cette thèse, nous cherchons à développer et interfacer les outils informatiques avec la chimie organique et médicinale afin d'améliorer le taux de découverte moléculaire. La majorité des outils que nous avons développés ont été intégrés dans notre plateforme de découverte de médicaments FORECASTER, et dans notre plateforme de conception de catalyseurs asymétriques VIRTUAL CHEMIST, pour permettre aux chimistes d'utiliser des logiciels puissants développés par des chimistes pour des chimistes, qui peuvent être utilisés en quelques clics seulement, sans avoir besoin d'une expertise en chimie computationnelle. iv Dans l'ensemble, cette thèse commence par une introduction complète mais concise (Chapitre 1) à la chimie computationnelle et à ses diverses applications. Ensuite, nous présentons un protocole de calcul que nous avons développé et qui permet la modélisation précise des conformations de nucléosides (Chapitre 2), qui à son tour permet la synthèse des seuls nucléosides qui présentent des propriétés souhaitables. Ce travail a été effectué en relation avec la méthodologie actuelle de développement des nucléosides, qui implique la synthèse de multiples analogues jusqu'à ce qu'un seul présentant des propriétés souhaitables soit trouvé. La synthèse d'analogues multiples contribue à augmenter les coûts, la production de déchets et la dépense énergétique. Ensuite, grâce à ce protocole, nous avons quantifié les divers effets qui contribuent aux différentes conformations des nucléosides, et nous avons pu fournir des explications plausibles sur les raisons pour lesquelles des nucléosides non naturels se comportent de certaines manières (Chapitre 3). Par la suite, nous avons porté notre attention sur le métabolisme et la toxicité des médicaments par les cytochromes P450, qui constituent l'un des principaux intérêts des chimistes médicinaux (Chapitre 4). Dans ce chapitre, nous avons développé un nouvel outil basé sur la mécanique quantique, l'arrimage et l'apprentissage machine qui permet l'identification in silico des inhibiteurs de cytochromes P450. Cela permet aux chimistes de tester si un composé ou un médicament d'intérêt présente une activité inhibitrice contre une isoforme des cytochromes P450, sans avoir besoin de synthèses coûteuses ou d'acheter des kits de test. Enfin, nous nous efforçons de fournir aux chimistes organiciens une plateforme de calcul - VIRTUAL CHEMIST - qui leur permet d'entreprendre un projet de synthèse asymétrique virtuellement de A à Z (Chapitre 5). Une telle plateforme permet aux chimistes organiciens de tester des milliers de molécules en un clic et de ne sélectionner que les catalyseurs qui présentent une excellente stéréosélectivité et réactivité. La v thèse se termine ensuite par les obstacles que nous avons surmontés dans nos recherches, ainsi que les développements futurs de nos travaux. vi Acknowledgements First of all, I would like to thank my supervisor, Dr. Nicolas Moitessier, for his unwavering support, mentorship and friendship during my PhD. Brainstorming sessions, code implementations, fixing memory leaks, petting dogs in the office, Zoom meetings, getting overpriced and tasteless Tim Horton’s coffee, you name it, we did it. Also, lest we forget – backing up your code is essential, if you do not want to spend thousands of $$$ to recover it from a 15- year old HDD. I would also like to thank my family – you were always there for me and I couldn’t have done it without you. Mulţumesc! I would also like to thank my roommate and BFF Patrick Outhwaite for putting up with me for 4 years – I have no idea how I would have stayed sane during my PhD without watching the Premier League and supporting Crystal Palace (which you made me a fan of). Also ordering food, taking care of dogs together and watching Impractical Jokers and laughing so much that I would stop breathing … also of course being QUARANTINED together during a pandemic. I want to thank Sharon Pinus – I have to admit, I didn’t really like you at the beginning, but you soon turned into one of my favorite people ever. You made my days in the office so much better, including but not limited to Haribo, cookies, Hamantaschen and stories of Israel and Germany. Our daily ritual of looking at the “Rate My Dogs” dog of the day was something I always looked forward