Property-Enriched Fragment Descriptors for Adaptive QSAR Fiorella Ruggiu

Total Page:16

File Type:pdf, Size:1020Kb

Load more

Property-enriched fragment descriptors for adaptive QSAR Fiorella Ruggiu To cite this version: Fiorella Ruggiu. Property-enriched fragment descriptors for adaptive QSAR. Cheminformatics. Uni- versité de Strasbourg, 2014. English. NNT : 2014STRAF037. tel-01130689 HAL Id: tel-01130689 https://tel.archives-ouvertes.fr/tel-01130689 Submitted on 12 Mar 2015 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. UNIVERSITÉ DE STRASBOURG ÉCOLE DOCTORALE DES SCIENCES CHIMIQUES [ UMR 7140 ] THÈSE présentée par : [ Fiorella RUGGIU] soutenue le : 22 septembre 2014 pour obtenir le grade de : Docteur de l’université de Strasbourg Discipline/ Spécialité : Chimie/Chémoinformatique Property-enriched fragment descriptors for adaptive QSAR THÈSE dirigée par : [M. VARNEK Alexandre] Professeur, Université de Strasbourg [M. HORVATH Dragos] Directeur de Recherche, CNRS, UMR 7140 RAPPORTEURS : [M. AIRES DE SOUSA João] Professeur, Université de Lisbonne [M. TABOUREAU Olivier] Professeur, Université Paris Diderot AUTRES MEMBRES DU JURY : [M. ERTL Peter] Docteur, HDR, société Novartis [Mme. KELLENBERGER Esther] Docteur, HDR, Université de Strasbourg Fiorella RUGGIU Property-enriched fragment descriptors for adaptive QSAR Résumé Les descripteurs ISIDA enrichis par propriété ont été introduit pour encoder les structures moléculaires en chémoinformatique en tant que nombre d’occurrence de sous-graphes moléculaires spécifiques dont les sommets représentant les atomes sont colorés par des propriétés locales tel que les pharmacophores dépendant du pH, les identifiants de champs de force, les charges partielles, les incréments LogP ou les propriétés extraites d’un modèle QSAR. Ces descripteurs, par leurs large choix d’option, permettent à l’utilisateur de les adapter au problème à modéliser. Ils ont été utilisés avec succès dans une étude de criblage virtuel sur des inhibiteurs de protéases et plusieurs modèles QSAR sur le coefficient de partage octanol-eau, l’index d’hydrophobicité chromatographique, l’inhibition du canal hERG, la constante de dissociation acide, la force des accepteurs de liaison hydrogène et l’affinité de liaison des GPCR. Résumé en anglais ISIDA property-enriched fragment descriptors were introduced as a general framework to numerically encode molecular structures in chemoinformatics, as counts of specific subgraphs in which atom vertices are coloured with respect to a local property - notably pH-dependent pharmacophore, force field, partial charges, logP increments and QSAR model extracted properties. The descriptors leave the user a vast choice in terms of the level of resolution at which chemical information is extracted into the descriptors to adapt them to the problem. They were successfully tested in neighbourhood behaviour and QSAR modelling challenges, with very promising results. They showed excellent results in similarity-based virtual screening for analogue protease inhibitors, and generated highly predictive octanol-water partition coefficient, chromatographic hydrophobicity index, hERG channel inhibition, acidic dissociation constant, hydrogen-bond acceptor strength and GPCR binding affinity models. Acknowledgements First and foremost, I would like to express my gratitude to my advisers, Pr. Alexandre Varnek and Dr. Dragos Horvath for their kindness, patience and advice. Besides my advisers, I am particularly grateful to Dr. Gilles Marcou for his advice in my research and for his kindness as well. Without them, this thesis would have never come into existence. I would like to thank all the members of the jury, Pr. Jo˜ao Aires de Sousa, Pr. Olivier Taboureau, Dr. Peter Ertl, Dr. Esther Kellenberger and Dr. Jean-Luc Galzi as an invited member, for accepting to judge and revise my work. I am thankful to all my collaborators on the different projects, Dr. Vitaly Solov’ev, Dr. Patrick Gizzi, Dr. J.B. Brown, Dr. Jean-Luc Galzi, Dr. J´erˆome Graton et Pr. Jean-Yves Le Questel for their help and advice. A particular thanks to Pr. Okuno and to the Japan Society for the Promotion of Science for enabling me to do research in Japan. I am thankful to my colleagues, Dr. Fanny Bonachera, Dr. Ioana Oprisiu, Dr. Olga Klimchuk, Grace Delouis, H´el´ena Gaspar, Pr. Igor Baskin, Dr. Tetiana Khristova, Dr. Christophe Muller, Dr. Laurent Hoffer and Aur´elie De Luca for their advice and support. I would like to thank my students, Jacques Ehret, Guillaume Charbonnier, Julien Denos and Jiangyue He, for working together. Thank to Sandrine Garcin, Dani`ele Ludwig and Soumia Hnini for their help on administrative tasks. i Résumé en français : Descripteurs fragmentaux enrichis par propriété pour QSAR adaptif Cette thèse présente des développements méthodologiques dans le domaine de la relation structure-activité et leurs applications à la modélisation de certaines propriétés chimiques et activités biologiques. L’objectif principal de cette thèse était l’extension des descripteurs développés au Laboratoire de Chémoinformatique (UMR 7140, Chimie de la Matière Complexe, Université de Strasbourg, France), les descripteurs fragmentaux ISIDA. ISIDA est le nom de la suite de logiciels du laboratoire et est l’abréviation de « In Silico Design and data Analysis » (Conception et analyse de données in silico). Comme présenté dans la Figure 1, les Triplets Pharmacophoriques Flous (TPF) et les Fragments Moléculaires Sous-structuraux (FMS) avaient été développés précédemment. Ces types différents de descripteurs ont été unifiés et étendus dans ce travail. Trois différents types de descripteurs sont proposés dans ce travail (en bleu sur la Figure 1) : les fragments avec projection de propriétés, les fragments locaux et les fragments avec projection d’incréments QSAR. Le manuscrit est divisé selon les sections suivantes: Une première section introductive au sujet et une partie bibliographique pour la méthodologie, une deuxième section de présentation des nouveaux descripteurs développés dans cette thèse, une troisième section présentant les différentes études d’applications des descripteurs effectuées, une section présentant les développements logiciels, et finalement une section pour la conclusion et les perspectives de ce travail. Figure 1. Graphe représentant les différents types de descripteurs fragmentaux ISIDA. Les descripteurs existants avant la thèse sont en vert (à gauche) et ceux développés durant la thèse sont en bleu (à droite). Les cadres bleus incluent les propriétés sur lesquels les différents descripteurs ont été testés. ii 1 1. Descripteurs fragmentaux : état de l’art La chémoinformatique utilise des outils informatiques afin de gérer, interpréter et extraire des connaissances de l’information chimique. Celle-ci fait abondamment appel à la notion de graphe moléculaire (par exemple des structures de Lewis. Or les graphes sont des structures de données compliquées ce qui rend mal aisée leur utilisation direct pour analyser et extraire des connaissances par des moyens informatiques. Une représentation sous forme de descripteurs moléculaires leurs est préférée. Les descripteurs moléculaires consistent à extraire l’information du graphe moléculaire et de l’encoder dans des vecteurs, D, où chaque composant i représente une caractéristique de la molécule (D i). Ces vecteurs de descripteurs sont bien adaptés pour l’analyse mathématique des relations structure- activité, en particulier pour (a) le Criblage Virtuel par Similarité (CVS) reposant sur le principe de similarité classique : « des molécules similaires présenteront probablement des propriétés similaires ». D’un point de vue mathématique, une mesure de similarité est définie en fonction des vecteurs de descripteurs Ainsi, le calcul de similarité entre un vecteur référence décrivant une molécule d’intérêt, par exemple active en se liant à une protéine, et des vecteurs d’autres molécules d’une base de données permet de sélectionner les molécules les plus probablement intéressantes. (b) les Relations Quantitative Structure-Activité ou propriété (Quantitative Structure- Activity Relationship - QSAR), où les techniques d’apprentissage automatique sont employées pour chercher des équations empiriques qui expriment une propriété moléculaire Y comme une fonction des composants D i des vecteurs de descripteurs. Si une telle fonction est établie et qu’elle retourne des approximations proches de la valeur Y de molécules connues, elle peut être utilisée pour estimer cette valeur pour des composés virtuels n’ayant pas été synthétisés ou testés. En effet, les termes Di peuvent être calculés préalablement à la synthèse et ainsi des composés avec des valeurs de Y intéressantes pourront être privilégiées pour la synthèse et les tests. L’art de concevoir des descripteurs moléculaires consiste à décider sur quels types de caractéristiques de la molécule doivent se concentrer les vecteurs. Evidemment, le CVS et le QSAR ne fonctionne qu’à condition que des informations pertinentes pour la propriété soient inclus dans le vecteur D. Par exemple, le laboratoire de Chémoinformatique de l’université de Strasbourg, a développé des descripteurs
Recommended publications
  • 1 Abietic Acid R Abrasive Silica for Polishing DR Acenaphthene M (LC

    1 Abietic Acid R Abrasive Silica for Polishing DR Acenaphthene M (LC

    1 abietic acid R abrasive silica for polishing DR acenaphthene M (LC) acenaphthene quinone R acenaphthylene R acetal (see 1,1-diethoxyethane) acetaldehyde M (FC) acetaldehyde-d (CH3CDO) R acetaldehyde dimethyl acetal CH acetaldoxime R acetamide M (LC) acetamidinium chloride R acetamidoacrylic acid 2- NB acetamidobenzaldehyde p- R acetamidobenzenesulfonyl chloride 4- R acetamidodeoxythioglucopyranose triacetate 2- -2- -1- -β-D- 3,4,6- AB acetamidomethylthiazole 2- -4- PB acetanilide M (LC) acetazolamide R acetdimethylamide see dimethylacetamide, N,N- acethydrazide R acetic acid M (solv) acetic anhydride M (FC) acetmethylamide see methylacetamide, N- acetoacetamide R acetoacetanilide R acetoacetic acid, lithium salt R acetobromoglucose -α-D- NB acetohydroxamic acid R acetoin R acetol (hydroxyacetone) R acetonaphthalide (α)R acetone M (solv) acetone ,A.R. M (solv) acetone-d6 RM acetone cyanohydrin R acetonedicarboxylic acid ,dimethyl ester R acetonedicarboxylic acid -1,3- R acetone dimethyl acetal see dimethoxypropane 2,2- acetonitrile M (solv) acetonitrile-d3 RM acetonylacetone see hexanedione 2,5- acetonylbenzylhydroxycoumarin (3-(α- -4- R acetophenone M (LC) acetophenone oxime R acetophenone trimethylsilyl enol ether see phenyltrimethylsilyl... acetoxyacetone (oxopropyl acetate 2-) R acetoxybenzoic acid 4- DS acetoxynaphthoic acid 6- -2- R 2 acetylacetaldehyde dimethylacetal R acetylacetone (pentanedione -2,4-) M (C) acetylbenzonitrile p- R acetylbiphenyl 4- see phenylacetophenone, p- acetyl bromide M (FC) acetylbromothiophene 2- -5-
  • Agilent Technologies, Inc

    Agilent Technologies, Inc

    SOLICITATION: RFB 10850 I OPENING DATE: Thursday, April 22, 2021 PROJECT: LIQUID CHROMATOGRAPHY SYSTEM BIDDER BASIS OF AWARD PREFERRED VENDOR ADJUSTED PRICE Aligent $378,035.10 NIA Water Technologies $314,644.43 NIA Bid Officer: Bid Clerk: This Notice oflntent to Award I Abstract ONLY indicates the APPARENT low bidder. Conditions that may displace an apparent low bidder include, but are not limited to: math errors, conditioning of bid, mistake in bid, failing pre-award Survey, and the bid being non responsive. Bids Received Agilent Technologies, Inc. 800 227 9770 telephone LSCA Customer Sales and Service 302 993 5941 facsimile 2850 Centerville Road, MS 3J7 www.agilent.com Wilmington, DE 19808 Email: [email protected] April 21, 2021 County of San Diego 5560 Overland Avenue, Suite 270 San Diego, CA 92123-1204 Attn: Lina Kim Re: RFB - 10850 Dear Lina, Agilent Technologies, Inc. (hereinafter, “Agilent”) is pleased to respond to the subject Request for Quote. Agilent (NYSE: A) is a preeminent leader in the life sciences, diagnostics, and applied chemical markets worldwide. The company provides laboratories all over the world with exceptional instruments, services, consumables, applications and expertise, enabling its customers to gain the insights and knowledge that they seek. Agilent’s expertise and trusted collaboration provide its customers with the highest confidence in our solutions. Agilent is bidding in accordance with Agilent’s Quotation # 3545728 (the “Quotations”) with 1290 Infinity II / G6230BA in lieu of the specified Water’s instrumentation in response to the attached Request for Quote RFB – 10850 the “RFQ”), and is in full compliance with the requirements of the RFQ and any amendments thereto.
  • Treball Final De Grau

    Treball Final De Grau

    Tutor/s Dr. Martí Rosés Pascual Dr. Xavier Subirats Vila Departament d’Enginyeria Química i Química Analítica Treball Final de Grau Characterization of HILIC systems: underivatized silica as stationary phase. Caracterització de sistemes HILIC: sílice sense derivatitzar com a fase estacionària. Sílvia Cortés Valle July 2020 Aquesta obra esta subjecta a la llicència de: Reconeixement–NoComercial-SenseObraDerivada http://creativecommons.org/licenses/by-nc- nd/3.0/es/ It was like a new world opened to me, the world of science, which I was at last permitted to know in all liberty. Marie Curie Moltes gràcies als meus pares i al meu germà per estar sempre recolzant-me i animant-me en tot moment; al Miguel Ángel per alegrar-me els dies i fer que sigui tot més fàcil (sobretot per aguantar-me) i als meus tutors, al Xavier i al Martí, per la gran ajuda i suport que m’han donat durant tot el treball. REPORT Characterization of HILIC systems: underivatized silica as stationary phase 1 CONTENTS 1. SUMMARY 3 2. RESUM 5 3. INTRODUCTION 7 3.1. Chromatography 7 3.1.1. Chromatographic techniques classification 7 3.1.2. Retention parameters 9 3.2. Liquid chromatography 10 3.3. Hydrophilic interaction liquid chromatography 10 3.4. Retention mechanism in HILIC 11 3.5. Conditions in HILIC 13 3.5.1. Mobile phase 13 3.5.2. Stationary phase 14 3.6. Hold-up time in HILIC. Methods of measurement 14 3.6.1. Homologous series method 15 4. OBJECTIVES 18 5. EXPERIMENTAL SECTION 19 5.1. Materials 19 5.2.
  • Nicolet Vapor Phase

    Nicolet Vapor Phase

    Nicolet Vapor Phase Library Listing – 8,654 spectra This library is one the most comprehensive collections of vapor phase FT-IR spectra. It is an invaluable tool for scientist involved in investigations on gas phase materials. The Nicolet Vapor Phase Library contains 8654 FT-IR spectra of compounds measured in gas phase. Most spectra were acquired by the Sigma-Aldrich Co. using product samples. Additional spectra were collected by Hannover University, University of Wurzburg and Thermo Fisher Scientific applications scientists. Spectra were collected using sampling techniques including heated or room temperature gas cell or a heated light-pipe connected to the outlet of a gas chromatograph. Nicolet Vapor Phase Index Compound Name Index Compound Name 8402 ((1- 5457 (-)-8-Phenylmenthol; (-)-(1R,2S,5R)-5- Ethoxycyclopropyl)oxy)trimethylsilane Methyl-2-(2-phenyl-2-propyl)cyc 4408 (+)-1,3-Diphenylbutane 1095 (-)-Carveol, mixture of isomers; p- 4861 (+)-1-Bromo-2,4-diphenylbutane Mentha-6,8-dien-2-ol 2406 (+)-3-(Heptafluorobutyryl)camphor 3628 (-)-Diisopropyl D-tartrate 2405 (+)-3-(Trifluoroacetyl)camphor 1427 (-)-Limonene oxide, cis + trans; (-)-1,2- 281 (+)-3R-Isolimonene, trans-; (1R,4R)- Epoxy-4-isopropenyl-1-methyl (+)-p-Mentha-2,8-diene 1084 (-)-Menthol; [1R-(1a,2b,5a)]-(-)-2- 289 (+)-Camphene; 2,2-Dimethyl-3- Isopropyl-5-methylcyclohexanol methylenebicyclo[2.2.1]heptane 2750 (-)-Menthoxyacetic acid 3627 (+)-Diisopropyl L-tartrate 1096 (-)-Myrtanol, cis-; (1S,2R)-6,6- 2398 (+)-Fenchone; (+)-1,3,3- Dimethylbicyclo[3.1.1]heptane-2-metha
  • Download Download

    Download Download

    ADMET & DMPK 9(2) (2021) 151-165; doi: https://dx.doi.org/10.5599/admet.929 Open Access : ISSN : 1848-7718 http://www.pub.iapchem.org/ojs/index.php/admet/index Original scientific paper Biomimetic properties and estimated in vivo distribution of chloroquine and hydroxy-chloroquine enantiomers Klara L Valko*1 and Tong Zhang2 1-Bio-Mimetic Chromatography Ltd, Business & Technology Centre, Bessemer Drive, Stevenage, Herts SG1 2DX UK 2Chiral Technologies Europe, Parc d'Innovation 160, Bd Gonthier d'Andernach CS 80140 67404 ILLKIRCH CEDEX France *Corresponding Author: E-mail: [email protected]; Tel.: +44-7521-989558; Received: November 16, 2020; Revised: January 10, 2021; Published online: January 25, 2020 Abstract Chloroquine and hydroxy-chloroquine already established as anti-malarial and lupus drugs have recently gained renewed attention in the fight against the Covid-19 pandemic. Bio-mimetic HPLC methods have been used to measure the protein and phospholipid binding of the racemic mixtures of the drugs. The tissue binding and volume of distribution of the enantiomers have been estimated. The enantiomers can be separated using Chiralpak AGP HPLC columns. From the α-1-acid-glycoprotein (AGP) binding, the lung tissue binding can be estimated for the enantiomers. The drugs have a large volume of distribution, showed strong and stereoselective glycoprotein binding, medium-strong phospholipid-binding indicating only moderate phospholipidotic potential, hERG inhibition and promiscuous binding. The drug efficiency of the compounds was estimated to be greater than 2 % which indicates a high level of free biophase concentration relative to dose. The biomimetic properties of the compounds support the well-known tolerability of the drugs.
  • Setup and Validation of Shake-Flask Procedures for The

    Setup and Validation of Shake-Flask Procedures for The

    1 Setup and validation of shake-flask procedures for the 2 determination of partition coefficients (log D) from low drug 3 amounts 4 5 Axel Andrésa, Martí Rosésa, Clara Ràfolsa, Elisabeth Boscha, Sonia Espinosab, Víctor 6 Segarrab, Josep M. Huertab 7 aDepartament de Química Analítica and Institut de Biomedicina (IBUB), Universitat de Barcelona 8 Martí i Franquès 1-11, 08028 Barcelona (Spain) 9 b Computational and Structural Drug Discovery Department, R&D Centre, Almirall S.A. 10 Laureà Miró 408-410, 08980 Sant Feliu de Llobregat, Barcelona (Spain) 11 12 13 14 15 16 17 18 Correspondence to: 19 Clara Ràfols 20 Departament de Química Analítica 21 Universitat de Barcelona 22 Martí i Franquès 1-11 23 E-08028 Barcelona (Spain) 24 Tel: +34 93 403 48 12 25 Fax: +34 93 402 12 33 26 E-mail: [email protected] 27 28 ABSTRACT 29 Several procedures based on the shake-flask method and designed to require a 30 minimum amount of drug for octanol-water partition coefficient determination have 31 been established and developed. The procedures have been validated by a 28 32 substance set with a lipophilicity range from -2.0 to 4.5 (log D7.4). 33 The experimental partition is carried out using aqueous phases buffered with 34 phosphate (pH 7.4) and n-octanol saturated with buffered water and the analysis is 35 performed by liquid chromatography. In order to have accurate results, four 36 procedures and eight different ratios between phase volumes are proposed. Each 37 procedure has been designed and optimized (for partition ratios) for a specific range of 38 drug lipophilicity (low, regular and high lipophilicity) and solubility (high and low 39 aqueous solubility).
  • Integrated Biological-Chemical Approach for the Identification of Polyaromatic Mutagens in Surface Waters

    Integrated Biological-Chemical Approach for the Identification of Polyaromatic Mutagens in Surface Waters

    Integrated Biological-Chemical Approach for the Identification of Polyaromatic Mutagens in Surface Waters Von der Fakultät für Mathematik, Informatik und Naturwissenschaften der RWTH Aachen University zur Erlangung des akademischen Grades einer Doktorin der Naturwissenschaften genehmigte Dissertation vorgelegt von D.E.A Christine Gallampois aus Châtillon sous Bagneux (Frankreich) Berichter: Universitätsprofessor Dr. Henner Hollert Universitätsprofessor Dr. Andreas Schäffer Tag der mündlichen Prüfung: 11.07.2012 Diese Dissertation ist auf den Internetseiten der Hochschulbibliothek online verfügbar. A Mamée SUMMARY Surface waters are essential for human life, to supply of drinking water and as an important resource for agricultural, industrial and recreational activities. However, tonnes of pollutants enter these surface waters every year. Amongst the substances discharged into the environment, a large number are known to be mutagenic, forming part of a complex mixture of effluents found in municipal waste waters from domestic and industrial waste water treatment plants and in surface runoff from agricultural land . Moreover, these surface waters contain many unknown compounds. Consequently, water pollution can be a serious problem for public and aquatic ecosystem health. Effect-directed analysis (EDA) is a tool to identify chemicals responsible for the observed toxic effects. It is based on a combination of chemical and biological analysis. The chemical analysis enable the separation and isolation of toxicants from complex samples, while the biological analysis enables the “tracking” of the toxicants during the separation of the chemicals, which allows decreasing the complexity of the sample in focusing only on chemicals causing the biological effects. Among planar aromatic compounds such as azaarenes, polyaromatic hydrocarbons (PAHs), keto-, nitro-keto-, hydroxyl-, amino- and nitro-PAHs, as well as quinones and hydroxy- quinones there are many known environmental mutagens often present in surface waters in complex mixtures and at low concentrations.
  • Prediction of Herg Inhibition of Drug Discovery Compounds Using

    Prediction of Herg Inhibition of Drug Discovery Compounds Using

    ADMET & DMPK X(Y) (2021) pp-pp; doi: https://doi.org/10.5599/admet.995 Open Access : ISSN : 1848-7718 http://www.pub.iapchem.org/ojs/index.php/admet/index Original scientific paper Prediction of hERG inhibition of drug discovery compounds using biomimetic HPLC measurements Chrysanthos Stergiopoulos1*, Fotios Tsopelas1 and Klara Valko2 1Laboratory of Inorganic and Analytical Chemistry, School of Chemical Engineering, National Technical University of Athens 2Bio-Mimetic Chromatography Ltd. Stevenage, Herts, United Kingdom *Corresponding Author: Chrysanthos Stergiopoulos; E-mail: [email protected]; Tel.: +302107724022 Received: April 06, 2021; Revised: May 20, 2021; Available online: June 06, 2021 Abstract article The major causes of failure of drug discovery compounds in clinics are the lack of efficacy and toxicity. To reduce late-stage failures in the drug discovery process, it is essential to estimate early the probability of adverse effects and potential toxicity. Cardiotoxicity is one of the most often observed problems related to a compound's inhibition of the hERG channel responsible for the potassium cation flux. Biomimetic HPLC methods can be used for the early screening of a compound's lipophilicity, protein binding and phospholipid partition. Based on the published hERG pIC50 data of 90 marketed drugs and their measured biomimetic properties, a model has been developed to predict the hERG inhibition using the measured binding of compounds to alpha-1-acid-glycoproteinonline (AGP) and immobilised artificial membrane (IAM). A representative test set of 16 compounds was carefully selected. The training set, involving the remaining compounds, served to establish the linear model. The mechanistic model supports the hypothesis that compounds have to traverse the cell membrane and bind to the hERG ion channel to cause the inhibition.