MASARYKOVA UNIVERZITA F}w¡¢£¤¥¦§¨  AKULTA INFORMATIKY !"#$%&'()+,-./012345

Vizualizace parciálních atomových náboj ˚uv molekulách

BAKALÁRSKÁPRÁCEˇ

Jakub Vá ˇna

Brno, podzim 2010 Prohlášení

Prohlašuji, že tato bakaláˇrskápráce je mým p ˚uvodnímautorským dílem, které jsem vypracoval samostatnˇe.Všechny zdroje, prameny a literaturu, které jsem pˇrivypracování používal nebo z nich ˇcerpal,v práci ˇrádnˇecituji s uvedením úplného odkazu na pˇríslušnýzdroj.

Jakub Váˇna

Vedoucí práce: RNDr. Radka Svobodová Vaˇreková,Ph.D.

ii Podˇekování

Rád bych podˇekovalpaní RNDr. Radce Svobodové Vaˇrekové,Ph.D. za vedení mé práce. Pˇre- devším bych rád vyzdvihl její peˇclivost,trpˇelivosta obˇetavost.Dále bych rád podˇekovalsvým rodiˇc˚umza d ˚uvˇeru a podporu ve studiu.

iii Shrnutí

V pˇrírodovˇednýchi dalších oborech je v posledních desetiletích experiment jako metoda ˇcasto doplnˇennebo nahrazen matematickými výpoˇcty, pˇrípadnˇesimulacemi. Klíˇcovýmobjektem v tˇechtovýpoˇctechje molekula, protože je nositelem chemických vlastností látek. Pro práci chemik ˚uˇcibiolog ˚ujsou rovnˇežvelmi d ˚uležitéinformace o parciálních nábojích na atomech v rámci molekuly. Tyto náboje jsou reálná ˇcísla,která popisují, jakou ˇcást elektron ˚uz molekuly (tzv. elektronové hustoty) si daný atom pˇritáhnuldo své blízkosti nebo naopak odevzdal jiným atom ˚um.Ideálním zp ˚usobem,jak zprostˇredkovatinformace o nábojích, je jejich vizualizace. Díky vizualizaci jsme napˇríkladschopni posoudit, kde je náboj na molekule koncentrován a která místa jsou nábojovˇeneutrální. Právˇetématem vizualizace parciálních náboj ˚use zabývá má bakaláˇrskápráce. V rámci této práce jsem se nejdˇríveseznámil se zp ˚usobemreprezetace molekuly v poˇcítaˇcia s formáty pro zápis struktury molekuly a jejích parciálních náboj ˚u.Dále jsem nastudoval modely pro vizu- alizaci molekuly a parciálních náboj ˚u.Všechny tyto informace jsem shrnul v textu své práce. Poté jsem vyhledal softwarové nástroje vhodné pro vizualizaci náboj ˚u– VMD, , Chem3D, DSV a Mol2mol. Využitelnost tˇechtonástroj ˚ujsem analyzoval na tˇrechr ˚uznýchtypech molekul (malá organická molekula, peptid a protein) a v práci popsal jejich silné a slabé stránky.

iv Klíˇcováslova

Parciální náboje na atomech, vizualizace náboj ˚u,molekuly, 3D struktury, MOL, MOL2, PDB, VMD, MOE, Jmol, Mol2mol, Chem3D, DSV

v Obsah

1 Úvod ...... 1 2 Teoretická ˇcást ...... 2 2.1 Molekula v poˇcítaˇci ...... 2 2.1.1 Poˇcítaˇcovýzápis molekul ...... 2 2.1.2 Grafické modely molekul ...... 2 2.1.3 Grafické modely povrchu molekul ...... 3 2.1.4 Zp ˚usobyvizualizace povrchu molekul ...... 5 2.2 Základní chemické pojmy ...... 7 2.2.1 Parciální náboj ...... 7 2.3 Vizualizace náboj ˚u ...... 8 2.3.1 Zabarvení atom ˚ua vazeb podle hodnoty parciálního náboje ...... 8 2.3.2 Velikost atom ˚upodle hodnoty parciálního náboje ...... 9 2.3.3 Zabarvení povrchu molekuly podle hodnoty parciálního náboje ...... 9 3 Metodická a implementaˇcníˇcást ...... 10 3.1 Použité datové formáty ...... 10 3.1.1 Formát PDB ...... 10 3.1.2 Formát PDBQ ...... 11 3.1.3 Formát MOL ...... 11 3.1.4 Formát MOL2 ...... 12 3.1.5 Formát ...... 13 3.2 Použité softwarové nástroje ...... 14 3.2.1 ...... 14 3.2.2 VMD ...... 15 3.2.3 Jmol ...... 17 3.2.4 MOE ...... 19 3.2.5 Chem3D ...... 21 3.2.6 DSV ...... 24 3.2.7 Mol2mol ...... 27 3.2.8 Software bez možnosti vizualizace náboje ...... 28 3.3 Implementace programu Import charges ...... 29 3.3.1 Programovací jazyk ...... 29 3.3.2 Funkcionalita ...... 29 3.3.3 Vstup a výstup ...... 29 3.3.4 Volání ...... 30 4 Výsledky a diskuse ...... 31 4.1 Ukázka výpoˇctunáboj ˚u ...... 31 4.2 Vizualizace molekul ...... 32 4.2.1 Vizualizace malé molekuly ...... 33 4.2.2 Vizualizace stˇrednímolekuly ...... 35 4.2.3 Vizualizace velké molekuly ...... 37 4.3 Pˇrehleda srovnání vlastností softwarových nástroj ˚u ...... 38 4.3.1 Komentáˇrek jednotlivým program ˚um...... 38 4.3.2 Pˇrehledvlastností nástroj ˚u ...... 40 5 Závˇer ...... 41 6 Pˇrílohy ...... 43 6.1 Obsah pˇriloženéhoDVD ...... 43

vi 6.2 Skript Jmol ...... 44 6.3 Dodateˇcnévizualizace vytvoˇrenév rámci práce ...... 44 6.4 Vizualizace extra velké molekuly ...... 46 6.5 RasMol ...... 47 6.6 Formát POV ...... 48

vii 1 Úvod

V pˇrírodovˇednýchi dalších oborech je v posledních desetiletích experiment jako metoda ˇcasto doplnˇennebo nahrazen matematickými výpoˇcty, pˇrípadnˇesimulacemi. Takto vznikly nové vˇedníobory, jako tˇrebapoˇcítaˇcováchemie, bioinformatika, chemoinformatika nebo systémová biologie. Klíˇcovýmobjektem v tˇechtovˇedníchdisciplínách je molekula, protože je nositelem chemických vlastností látek. Pro práci chemik ˚uˇcibiolog ˚ujsou velmi d ˚uležitéinformace o par- ciálních nábojích [1] na atomech v rámci molekuly. Tyto náboje jsou reálná ˇcísla,která popisují, jakou ˇcástelektron ˚uz molekuly (tzv. elektronové hustoty) si daný atom pˇritáhnuldo své blíz- kosti nebo naopak odevzdal jiným atom ˚um.Parciální náboje ukazují místa s vysokým a nízkým výskytem elektron ˚uneboli místa, v nichž nejpravdˇepodobnˇejidochází k chemickým reakcím. Navíc jsou náboje také významnými veliˇcinamipro výpoˇctyrealizované bˇehempoˇcítaˇcovˇe chemických simulací [1, 2] a v chemoinformatických modelech [3, 4]. V souˇcasnédobˇeje dostupné velké množství informací o struktuˇreorganických molekul a biomolekul a také máme k dispozici vysoce výkonné poˇcítaˇcea nové softwarové nástroje pro výpoˇcetnáboj ˚u.Proto jsou náboje stále populárnˇejšímicharakteristikami pro popis chemického chování molekuly. Ideálním zp ˚usobem,jak chemik ˚uma biolog ˚umzprostˇredkovatinformaci o nábojích, je tyto náboje vizualizovat. Díky vizualizaci jsme schopni posoudit, kde je náboj na molekule koncentrován a která místa jsou nábojovˇeneutrální. Takto získáme celkový pˇrehledo distribuci náboj ˚uv rámci molekuly pˇrípadnˇejejí studované ˇcásti.Tématem vizualizace náboj ˚u se zabývá má bakaláˇrskápráce. Konkrétní cíle práce jsou:

• Seznámit se se zp ˚usobemreprezentace molekuly v poˇcítaˇcia s formáty pro zápis struk- tury molekuly a náboj ˚ujejích atom ˚u.

• Nastudovat a popsat r ˚uznézp ˚usobyzobrazování náboj ˚u.

• Vyhledat softwarové nástroje pro vizualizaci náboj ˚u.

• Analyzovat využitelnost tohoto softwaru a popsat jeho silné a slabé stránky.

• Ukázat využití vybraného softwaru pro vizualizaci r ˚uzných typ ˚umolekul (malé orga- nické molekuly, biomolekuly, . . . ).

1 2 Teoretická ˇcást

2.1 Molekula v poˇcítaˇci

2.1.1 Poˇcítaˇcovýzápis molekul Molekuly mohou být zapsány v poˇcítaˇcimnoha zp ˚usoby[3], ale základ bývá vˇetšinoustejný. Soubor s informacemi o molekule by mˇelobsahovat alespoˇnnásledující údaje o každém atomu molekuly:

• ID atomu, tj. jeho unikátní identifikátor

• chemickou znaˇckuatomu

• kartézské souˇradniceatomu

• informace o vazbách daného atomu s ostatními atomy

Soubory popisující molekuly mohou pˇrípadnˇeobsahovat další informace, záleží na definici for- mátu použitého pro zápis molekuly. Mohou to být napˇríkladinformace o sekundárních struk- turách, hodnotách parciálního náboje, typech atomových vazeb a jiné.

2.1.2 Grafické modely molekul V poˇcítaˇcovéchemii a dalších souvisejících oborech mohou být molekuly vizualizovány r ˚uz- nými zp ˚usoby[1]. Zde si krátce popíšeme nˇekterénejˇcastˇejipoužívané grafické modely. Ukázky tˇechtomodel ˚unaleznete na obrázku 2.1.

Drátový model (wire-frame): V drátovém modelu jsou atomy zmenšeny do velikosti ma- lých bod ˚ua vazby jsou zobrazeny jako tenké ˇcáryspojující tyto body. Velikosti ˇcarjsou ne- mˇenné.

Tyˇcinkovýmodel (sticks): Obdobné jako drátový model, ale místo ˇcarjsou použity tyˇcinky o r ˚uznémpolomˇeru. Atomy opˇetnejsou viditelné.

Tyˇcinkya kuliˇcky( & sticks): V modelu "tyˇcinkya kuliˇcky"jsou atomy reprezentovány jako malé koule a vazby jako tyˇcinkyspojující tyto kuliˇcky. Velikosti kuliˇceka tyˇcinek se mohou lišit v závislosti na nastavení.

Kalotový model (CPK, spacefill): CPK model je pojmenován po chemicích Robertu Co- reym, Linusi Paulingovi a Walteru Koltunovi. Model vyobrazuje pouze atomy jako velké koule bez propojení, jejichž velikosti atom ˚uodpovídají polovinˇevan der Waalsova polomˇeru. Tento polomˇerje roven vzdálenosti, na kterou se k atomu m ˚užepˇriblížitdruhý atom stejného prvku. OznaˇceníCPK se zároveˇnpoužívá i jako oznaˇcenípro barevné schéma [5]. Šedá barva pro uhlík, ˇcervenákyslík, bílá vodík, oranžová fosfor apod. Toto barevné schéma bylo použito na obrázku 2.1.

2 2. TEORETICKÁ CÁSTˇ

(a) Ukázka drátového modelu (b) Ukázka tyˇcinkovéhomodelu

(c) Ukázka modelu tyˇcinkya kuliˇcky (d) Ukázka kalotového modelu

Obrázek 2.1: Ukázka model ˚umolekul

2.1.3 Grafické modely povrchu molekul Pˇrivizualizaci molekul je velmi d ˚uležitýmtématem vizualizace jejich povrchu. Povrch mo- lekuly lze vyjádˇritrovnˇežpomocí r ˚uznýchgrafických model ˚u.Nejˇcastˇejipoužívané modely povrchu molekuly jsou popsány níže:

Van der Waals ˚uvpovrch [6]: Tento povrch (dále jen vdW povrch) je spojením sférických povrch ˚uatom ˚udefinovaných van der Waalsovým polomˇerem urˇcenýmpro každý atom mole- kuly.

Obrázek 2.2: Ukázka vdW povrchu pro molekulu cilengitidu

3 2. TEORETICKÁ CÁSTˇ

3D izopovrch [7]: Znaˇcípovrch reprezentující body nemˇennéhodnoty, jako jsou napˇríklad tlak, teplota, hustota, elektronegativita a jiné. Jedná se o populární formu vizualizace pro roz- sáhlé molekuly, protože m ˚užoubýt renderovány jediným polygonálním modelem, jehož zob- razení je velice rychlé. Pojem izoplocha vychází z 3D poˇcítaˇcovégrafiky.

Obrázek 2.3: Ukázka 3D izopovrchu pro molekulu cilengitidu

SASA povrch [8]: SASA (solvent accessible surface area) povrch reprezentuje ˇcástmole- kuly, která je pˇrístupnározpouštˇedlu.Velikost a tvar povrchu molekuly zaléží na zvoleném rozpouštˇedlua k jejímu vyjádˇreníse používá jednotka ˇctvereˇcníangström1. Tento model je po- dobný van der Waalsovu povrchu. Ten ale obsahuje množství malých puklin a škvír, které ve skuteˇcnostinemají vliv na celkové chování molekuly. SASA povrch vznikne z vdW povrchu pomocí tzv. "rolling ball" algoritmu, jak je vidˇetna obrázku 2.4. Okolo vˇetšíchkuliˇcek(na ob- rázku ˇcervené),tvoˇrícíchvdW povrch, rotuje menší kuliˇcka(na obrázku modrá) a "zahlazuje" škvíry obsažené ve vdW povrchu. Výsledkem je SASA povrch, který je blíže k reálnému po- vrchu molekuly než pˇredchozípopsané modely.

(a) Schéma algoritmu pro výpoˇcetSASA po- (b) Ukázka SASA povrchu pro molekulu cilen- vrchu na základˇevdW povrchu gitidu

Obrázek 2.4: SASA povrch

1. Angström je 10 -10 m a tato jednotka se velmi ˇcastopoužívá v chemii a biologii pro popis rozmˇer˚umolekul.

4 2. TEORETICKÁ CÁSTˇ

2.1.4 Zp ˚usobyvizualizace povrchu molekul Popsané modely povrchu molekuly lze vizualizovat následujícími pˇrístupy: Pevný povrch: Nejsou vidˇetatomy ani vazby, ale pouze nepr ˚uhlednýpovrch molekuly.

Obrázek 2.5: Ukázka pevného povrchu ˇcástimolekuly DNA

Drátˇenákostra: Povrch je zobrazen jako spojitá sít’ ˇcar. Vhodné pokud se chceme zamˇeˇrit na rysy povrchu a stále mít pˇrehledo atomech a vazbách uvnitˇrstruktury.

Obrázek 2.6: Ukázka drátˇenékostry povrchu ˇcástimolekuly DNA

5 2. TEORETICKÁ CÁSTˇ

Teˇckovanýpovrch: Povrch je zobrazen jako série nespojitých teˇcek.Vhodné, pokud se sou- stˇredímepˇrevážnˇena vnitˇrnístrukturu a chceme mít jen hrubý nástin o povrchu molekuly. Tento zp ˚usobvizualizace je nejménˇenároˇcnýna renderování.

Obrázek 2.7: Ukázka teˇckovanéhopovrchu molekuly cilengitidu

Transparentní povrch: Povrch je zobrazen podobnˇejako v pˇredchozímschématu, ale je ˇcásteˇcnˇetransparentní, což je vhodné, pokud chceme zároveˇns povrchem vidˇetatomy a vazby. Tvoˇríjakýsi kompromis mezi pˇredchozímizobrazovacími metodami.

Obrázek 2.8: Ukázka transparentního povrchu molekuly cilengitidu

6 2. TEORETICKÁ CÁSTˇ

2.2 Základní chemické pojmy

2.2.1 Parciální náboj Parciální (nebo také ˇcásteˇcné)atomové náboje [9] jsou reálná ˇcísla,která popisují, jakou ˇcást elektron ˚uz molekuly (tzv. elektronové hustoty) si daný atom pˇritáhnuldo své blízkosti nebo naopak odevzdal jiným atom ˚um.Parciální náboje vznikají díky asymetrické distribuci elek- tron ˚uv rámci chemické vazby. Když se elektricky neutrální atom váže s jiným neutrálním ato- mem, který má vˇetší elektronegativitu (schopnost pˇritahovatelektrony), jsou elektrony tohoto atomu ˇcásteˇcnˇeodtaženy smˇerem ke druhému (elektronegativnˇejšímu) atomu. Takto vzniká v okolí daného atomu parciální kladný náboj a v okolí druhého atomu parciální záporný náboj. Parciální náboje ukazují místa s vysokým a nízkým výskytem elektron ˚uneboli místa, v nichž nejpravdˇepodobnˇejidochází k chemickým reakcím. Navíc jsou náboje také významnými veliˇcinamipro výpoˇctyrealizované bˇehempoˇcítaˇcovˇechemických simulací [1, 2] a v chemoin- formatických modelech [3, 4]. V souˇcasnédobˇeje dostupné velké množství informací o struk- tuˇreorganických molekul a biomolekul a také máme k dispozici vysoce výkonné poˇcítaˇcea nové softwarové nástroje pro výpoˇcetnáboj ˚u.Proto jsou náboje stále populárnˇejšímicharakte- ristikami pro popis chemického chování molekuly. Pˇrestožejsou parciální náboje velmi d ˚uležitýmiveliˇcinami,jsou v podstatˇepouze teoretic- kým modelem neboli neexistuje metoda pro jejich experimentální stanovení. Z tohoto d ˚uvodu bylo vyvinuto mnoho pˇrístup˚upro výpoˇcetparciálních náboj ˚u.Nejjednodušší je Gasteigerova metoda [10], pˇresnˇejšímijsou semiempirické kvantové metody (napˇr.rozšíˇrenáHückelova me- toda [9] nebo AM1 (Austim model 1) metoda [11]) a nejlepší výsledky poskytují ab-initio kvan- tovˇemechanické metody. Pˇrestožese konkrétní hodnoty náboj ˚uvypoˇcítanýchjednotlivými metodami liší, trendy v tˇechtohodnotách jsou podobné (napˇr.stejné atomy mají nejvyšší zá- porný náboj atd.).

7 2. TEORETICKÁ CÁSTˇ

2.3 Vizualizace náboj ˚u

Pro práci s náboji je velmi užiteˇcnémít možnost si tyto náboje vizualizovat. Díky vizualizaci jsme schopni posoudit, kde je náboj na molekule koncentrován, která místa jsou nábojovˇeneut- rální a získat tak celkový pˇrehledo distribuci náboj ˚uv rámci molekuly, pˇrípadnˇejejí studované ˇcásti.Vizualizace náboj ˚urovnˇežslouží k lepšímu pochopení reaktivity molekuly. Typicky, ˇcím vˇetšíje na atomu parciální náboj, tím je atom náchylnˇejšík nˇekterýmchemickým reakcím. Zp ˚u- soby vizualizace parciálních náboj ˚ulze rozdˇelitdo tˇrískupin [12]:

2.3.1 Zabarvení atom ˚ua vazeb podle hodnoty parciálního náboje Nejˇcastˇejšíformou reprezentace parciálního náboje je použití barevné palety k rozlišení veli- kosti náboje. Jednotlivé atomy molekuly jsou obarveny záporným ˇcikladným nábojem. Im- plicitnˇejsou vˇetšinoupoužity odstíny barev ˇcervenéa modré, viz. obrázek 2.9 [13]. Atomy s vysoce negativním parciálním nábojem jsou tmavˇemodré, naopak atomy s vysoce pozitivním parciálním nábojem jsou tmavˇeˇcervené. Címˇ blíže je hodnota parciálního náboje k nule, tím je barva svˇetlejší.Neutrální náboj je pak zobrazen bíle, šedˇe,nebo zelenˇe.Nejˇcastˇejije rozsah hodnot pro zabarvení parciálního náboje pˇrizp˚usobenminimální a maximální hodnotˇeobsa- žené v souboru s molekulou. Tzn. vždy je minimálnˇejeden atom obarven nejtmavˇejšíˇcervenou a jeden nejtmavˇejšímodrou.

Obrázek 2.9: Pˇríkladbarevné škály pro znázornˇenínáboj ˚u

Castoˇ je možné hodnotu parciálního náboje vyˇcísliti popiskem u každého atomu, což je vhodné pro menší molekuly, ale nepˇrehlednépro složitˇejšímolekulové systémy.

(a) Ukázka zabarvení atom ˚u(navíc jsou zobrazeny (b) Ukázka zabarvení atom ˚ua vazeb podle hodnoty i popisky hodnot náboj ˚u)podle hodnoty parciálních parciálních náboj ˚upro molekulu 2,6-dichlorfenolu náboj ˚upro molekulu 2,6-dichlorfenolu

Obrázek 2.10: Ukázka zabarvení atom ˚ua vazeb podle hodnot parciálních náboj ˚upro molekulu 2,6-dichlorfenolu

Spoleˇcnˇes atomy lze obarvit i atomové vazby podle hodnoty parciálního náboje, jak je vidˇet na obrázku 2.10 b). Zde je zobrazen plynulejší pˇrechodparciálního náboje mezi jednotlivými atomy.

8 2. TEORETICKÁ CÁSTˇ

2.3.2 Velikost atom ˚upodle hodnoty parciálního náboje Nevýhodou pˇredchozíhozp ˚usobuvizualizace je, že nábojové zabarvení atom ˚upˇrekrývábˇežné zabarvení atom ˚upodle jejich chemických znaˇcek.Tuto nevýhodu ˇrešívizualizace náboj ˚upo- mocí velikosti atom ˚u.Tato metoda reprezentace parciálního náboje nám dovoluje ponechat ato- m ˚umbarvu, zmˇeníse pouze velikosti jednotlivých atom ˚u.Vˇetšíatom pak reprezentuje právˇe vˇetšívelikost parciálního náboje. Bohužel velkou nevýhodou je, že nevidíme negativitu, resp. pozitivitu náboj ˚u.Atom s parciálním nábojem 0,500 bude mít stejnou velikost jako atom s ná- bojem -0.500. Zápornost ˇcikladnost náboje pak m ˚užebýt zobrazena opˇetpomocí popisku. Ukázka tohoto zp ˚usobuzobrazení je na obrázku 2.11.

Obrázek 2.11: Ukázka velikosti atom ˚upodle hodnoty parciálních náboj ˚upro molekulu cyto- sinu

2.3.3 Zabarvení povrchu molekuly podle hodnoty parciálního náboje Reprezentuje celkovou distribuci náboje v molekule a zároveˇnmapuje parciální náboj na po- vrch molekuly. Tato reprezentace je vhodná zejména pro složitˇejšímolekuly (50 – 100 atom ˚u a více), bohužel bývá výpoˇcetnˇenároˇcnˇejšía je proto obtížné ji využívat pro molekuly o tisíci a více atomech. Casovouˇ nároˇcnostlze snížit, pokud snížíme kvalitu vizualizace nastavením menšího rozlišení (tím se zároveˇnzmenší nároky na renderování). Na obrázku 2.12 jsou ukázky této metody vizualizace náboj ˚upro r ˚uznézp ˚usobyvizualizace povrchu molekul.

(a) Pevný povrch (b) Drátˇenákostra (c) Transparentní povrch

Obrázek 2.12: Ukázka zabarvení povrchu molekuly podle hodnoty parciálního náboje

9 3 Metodická a implementaˇcníˇcást

3.1 Použité datové formáty

Datových formát ˚uobsahujících informace o chemických strukturách molekul je velmi mno- ho [14]. Nejznámˇejšímiz nich jsou formáty PDB [15] (používaný pro zápis struktury molekul protein ˚u)a MOL (používaný v databázích organických látek). Pro nás bude nejd ˚uležitˇejšífor- mát MOL2, který je obdobou formátu MOL, ale obsahuje nˇekteréinformace navíc – napˇríklad informace o parciálních atomových nábojích. Náboje lze ukládat rovnˇežve formátu PDBQ [16], který je velmi blízký formátu PDB. Mezi formáty lze snadno pˇrevádˇetpomocí programu Open Babel [17] nebo pˇrímopro- stˇrednictvímnˇekterýchprogram ˚umolekulárního modelování, jako jsou Mol2mol [18] nebo MOE [19].

3.1.1 Formát PDB

Formát PDB byl vytvoˇrenpro zápis molekul protein ˚uv rámci databáze Protein data bank [20]. Tato databáze byla vyvinuta v roce 1971 v Brookhaven National Laboratory. Pozdˇeji,v roce 1998, se dostala pod správu spoleˇcnostiResearch Collaboratory for Structural Bioinformatics (RCSB [20]). Protein data bank je celosvˇetovˇerozšíˇrený archiv informací o 3D struktuˇreroz- sáhlých molekulových systém ˚ua obsahuje v dnešní dobˇejiž pˇres65000 záznam ˚uo proteinech. Archiv je zpˇrístupnˇenbez poplatk ˚uvšem uživatel ˚um. Protein data bank používá k uschovávání informací o molekulách datový formát PDB nebo jeho XML verzi PDBML. Obˇeverze jsou volnˇestažitelné z webových stránek Protein data bank, pokud známe název molekuly nebo její identifikátor. Každá struktura publikovaná v Protein data bank má sv ˚ujvlastní ˇctyˇrznakovýalfanumerický identifikátor nazývaný jako PDB id, který ji jednoznaˇcnˇeurˇcuje.

PDB soubor je textový formát pevnˇedané struktury. Obsahuje následující ˇrádky:

• HEADER, obsahující název souboru a datum

• COMPND, obsahující název proteinu

• SOURCE, popisuje organismus ze kterého byl soubour odvozen

• AUTHOR, seznam osob, které umístily data do PDB databáze

• REVDAT, seznam úprav provedených na datech v tomto souboru

• REMARK, obsahuje reference ke ˇclánk˚umo struktuˇretohoto proteinu a obecné informace o obsahu souboru

• SPRSDE, seznam starších souˇradnicovýchsoubor ˚us touto strukturou

• SEQRES, popisuje primární proteinovou strukturu

• FTNOTE, obsahuje poznámky

• HET, FORMUL, HELIX, SHEET, TURN, CRYST1, ORIG, SCALE, ˇrádkyobsahují další chemické informace o proteinu

10 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

• ATOM a HETATM ˇrádkypopisují podrobné informace o atomech protein ˚u.Pˇredevším poˇradíatomu, souˇradnicovádata a chemickou znaˇckuprvku. Rádkyˇ oznaˇcenéHETATM jsou strukturnˇeidentické se záznamy ATOM, ale nepopisují pˇrímoatomy proteinu. Po- pisují nestandardní slouˇceninyjako voda nebo cukry.

• CONECT, seznam vazeb mezi neproteinovými atomy v souboru

• MASTER, END ˇrádky, které znaˇcíkonec souboru

Vetšinˇemodelovacích program ˚ustaˇcík zobrazení proteinové struktury jen informace obsa- žené v ˇrádcíchATOM a HETATM. Soubory PDB ale neobsahují údaje o hodnotách parciálního náboje, proto je potˇrebanáboje vypoˇcítata pˇrevéstformát PDB do formátu obsahujícího tyto údaje (napˇr.PDBQ nebo MOL2):

3.1.2 Formát PDBQ Název PDBQ [16] se skládá z "PDB" a písmena "Q", což je bˇežnýsymbol pro parciální náboj v chemii. Tento formát je obdobou formátu PDB s tím rozdílem, že datový záznam pro atom ve sloupcích 71-76 obsahuje údaje o parciálních nábojích. Každý datový záznam má následující tvar (nˇekteréparametry jsou volitelné):

ATOM, atom_id, atom_name, alt_loc, res_name, chain_id, res_num, ins_code, x, y, z, occupancy, temp_factor, partial_charge

Rádekˇ m ˚uževypadat napˇríkladtakto:

ATOM 19 CA GLN 2 16.825 13.952 -9.285 1.00 0.00 -0.003

Kde -0.003 (vždy poslední záznam) je hodnota parciálního náboje.

3.1.3 Formát MOL Formát MOL [21] byl navržen spoleˇcnostíMDL (nyní SYMYX [22]) pro ukládání chemoin- formatických dat o molekulách. MOL soubor je uložen v klasickém textovém ASCII1 formátu, takže je snadno editovatelný. Formát MOL existuje v nˇekolikaverzích. V této práci byla použita nejnovˇejšíverze Molfile V3000. Základem souboru je tzv. Connection table neboli spojovací ta- bulka (CTAB [23]), která obsahuje informace o struktuˇrea vlastnostech skupiny atom ˚u.Pˇríklad takové tabulky je vidˇetv ukázce níže na ˇrádcích5-15. Po spojovací tabulce mohou následovat další sekce s komplexnˇejšímiinformacemi.

Ukázka jednoduchého zápisu molekuly alaninu ve formátu MOL 1 2 SMMXDraw06021015152 3 $ Zápis molekuly alaninu v datovém formátu molfile 4 6 5 0 0 1 0 0 0 0 0999 V3000

1. Anglická zkratka pro American Standard Code for Information Interchange neboli „americký standardní kód pro výmˇenuinformací“. Jde o kódovou tabulku, která definuje znaky anglické abecedy a jiné znaky používané v informatice.

11 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

5 1 N 9.7434 -15.8027 0.0000 0 0 6 2 C 10.7663 -15.2121 0.0000 0 0 7 3 C 11.7891 -15.8027 0.0000 0 0 8 4 O 12.8120 -15.2121 0.0000 0 0 9 5 O 11.7891 -16.9838 0.0000 0 0 10 6 C 10.7663 -14.0310 0.0000 0 0 11 1 2 1 0 0 0 0 12 2 3 1 0 0 0 0 13 3 4 1 0 0 0 0 14 3 5 2 0 0 0 0 15 2 6 1 0 0 0 0 Rádkyˇ 1-3 tvoˇrízáhlaví souboru. Tyto ˇrádkyjsou pˇrevážnˇeinformativní a jejich obsah i po- ˇcetse liší podle nástroje generujícího tento datový soubor. Rádekˇ 4 je úvodní ˇrádeka obsahuje základní údaje o molekule. Molekula obsahuje 6 atom ˚u a 5 vazeb. Další informace na ˇrádkujsou podrobnosti o molekule a o formátu MOL. Rádkyˇ 5-10 tvoˇrítabulku atom ˚u,v níž každý ˇrádekmá následující tvar: [id atomu] [znaˇckaprvku] [souˇradnicex] [souˇradnicey] [souˇradnicez] [dodateˇcnéinformace] Napˇríkladna ˇrádku5 je s indexem 1 uložen atom dusíku se souˇradnicemi9.7434, -15.8027, 0.0000 a je zapsán bez dalších informací o atomu. Rádkyˇ 11-15 tvoˇrítabulku vazeb a mají následující tvar: [první atom vazby] [druhý atom vazby] [typ vazby] Napˇríkladz ˇrádku11 m ˚užemevyˇcíst,že atom s indexem 1 je spojen vazbou s atomem s inde- xem 2 a vazba mezi tˇemitoatomy je jednoduchá vazba. Všechny základní informace o molekule jsou obsaženy právˇena ˇrádcích5-15 a jsou nejpod- statnˇejšíˇcástíkaždého datového souboru odvozeného ze souboru MOL.

3.1.4 Formát MOL2 Formát MOL2 patˇrístejnˇejako pˇredchozíformáty mezi textové ASCII soubory, takže je opˇet snadno editovatelný. Výhodou vzhledem k formát ˚umPDB a MOL je, že MOL2 obsahuje ve svém zápisu hodnoty parciálních náboj ˚u.Struktura soubor ˚uMOL2 je následující:

• MOLECULE obsahuje obecné informace o molekule – napˇríkladnázev molekuly, poˇcet atom ˚u,vazeb, podstruktur, množin a další chemické informace týkající se molekuly jako celku.

• ATOM obsahuje indexy a názvy atom ˚u,x, y a z souˇradnicea hodnotu parciálního náboje

• BOND popisuje vazby mezi atomy

• SUBSTRUCTURE obsahuje popis podstruktur, jsou-li nˇejaké

• Každý ˇrádekzaˇcínajícíznakem "#" je považován za komentáˇr

12 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

# ukazka molekuly H2O ve formatu mol2 # vcetne parcialnich naboju @MOLECULE C:\\h2o.pdb 3 2 0 0 0 SMALL GASTEIGER Energy = 0

@ATOM 1 O 0.0000 0.0000 0.0000 O.3 1 UNK1 -0.4105 2 H -0.7600 -0.5840 0.0000 H 1 UNK1 0.2052 3 H 0.7600 -0.5840 0.0000 H 1 UNK1 0.2052 @BOND 1 1 2 1 2 1 3 1 V této práci je použit formát MOL2 implicitnˇejako vstup pro veškeré programy a to z toho d ˚uvodu,že je akceptován všemi zde použitými aplikacemi, obsahuje hodnoty parciálních ná- boj ˚ua neobsahuje pˇrílišmnoho pˇrebyteˇcnýchinformací.

3.1.5 Formát Gaussian Formát Gaussian [24] je nejjednodušším formátem pro zápis náboj ˚umolekuly. Obsahuje pouze název molekuly, poˇcetatom ˚ua ˇrádkys informacemi o typu atomu a parciálních nábojích. Tento formát je využíván pro zápis náboj ˚una výstupu programu Gaussian, což je jeden z nejˇcastˇeji využívaných program ˚upro výpoˇcetnáboj ˚u. Ukázka souboru Gaussian pro molekulu vody:

H2O 3 1 O -0.4105 2 H 0.2052 3 H 0.2052

13 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

3.2 Použité softwarové nástroje

3.2.1 Open Babel

Open Babel [17] je open-source chemická nástrojová sada pro práci se soubory obsahujícími in- formace o molekulách z oblastí molekulárního modelování, chemie, biochemie apod.. Skládá se z program ˚upro konvertování, úpravu, vyhledávání a analýzu chemických soubor ˚ua kom- pletní sady programátorských nástroj ˚upro jednoduchý vývoj softwaru. V rámci této práce program využíváme proto, že umožˇnujekonverzi mezi více než 110 chemickými datovými formáty. Vychází z programu Babel, který se dˇríve využíval pro pˇrevodmezi chemickými formáty. Pozdˇejivznikla open-source knihovna OELib [25], ze které se postupnˇevyvinul Open Babel naprogramovaný v C++. Open Babel GUI je pak grafické prostˇredípro Open Babel spoleˇcnˇes pˇríkazovouˇrádkou.Poslední verze Open Babel GUI 2.3.0 pro Windows je volnˇešiˇritelnávˇcetnˇe zdrojového kódu. Program lze získat i ve verzi pro Macintosh pod názvem ibabel, což je opˇet grafické prostˇredípro Open Babel. Dále je na domovských stránkách programu ke stažení Win- dows python module (pˇrístupke knihovnám programu Open Babel z Pythonu), Java library (pˇrístupke knihovnám z Javy), .NET assembly (pˇrístupke knihovnám z jazyk ˚u.NET) a roz- sáhlá dokumentace k tˇemtomodul ˚uma k samotným funkcím programu. Právˇedíky pˇrístup- nosti C++ knihoven do dalších programovacích jazyk ˚u(Perl, Python, Java, .NET) umožˇnuje Open Babel jednoduchý vývoj dalšího chemického softwaru. Open Babel je zároveˇnzakládají- cím ˇclenemBlue Obelisk movement, což je skupina sdílející chemoinformatická data, algoritmy a jiné.

Interface: Obsahuje jedno okno rozdˇelenéna tˇriˇcásti.V první ˇcástije zobrazen vstupní sou- bor, v prostˇredníˇcástise nachází nastavení programu a v poslední ˇcástije zobrazen výstupní soubor. Panel nabídek obsahuje klasické položky menu, view a help a navíc i položku plugins popisující napˇríkladchemické deskriptory ˇcifingerprinty. Upˇrednostˇnuje-linˇekdopráci pro- stˇrednictvímpˇríkazovéˇrádky, Open Babel poskytuje rovnˇežtuto možnost.

Obrázek 3.1: Prostˇredíprogramu Open Babel

14 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

3.2.2 VMD Program VMD neboli Visual [26], byl vytvoˇrenv roce 1989 profesorem Klausem Schultenem na Illinoiské univerzitˇe.Primárnˇebyl vyvinut jako nástroj pro zobrazo- vání a analýzu výsledk ˚umolekulárnˇedynamických simulací, ale nyní obsahuje i nástroje pro práci s objemovými daty, sekvenˇcnímidaty a vedlejšími grafickými objekty. VMD byl sice p ˚uvodnˇenavržen pro Unix, ale v dnešní dobˇeje již plnˇefunkˇcníi ve verzi pro Windows, Mac OS–X ˇciSolaris. Jelikož je zdrojový kód volnˇepˇrístupný,vznikla pro program spousta plugin ˚unapsaných v jazycích Tcl/Tk nebo Python, díky nimž se VMD stává stále více používanou aplikací.

Interface: VMD se skládá ze tˇrír ˚uznýchoken, pˇriˇcemžkaždé plní urˇcitoufunkci. První okno obsahuje pˇríkazovýˇrádek,v nˇemžse zobrazuje výpis všech provádˇenýchoperací a které nám zároveˇnumožˇnujezadávat nˇekteréjednoduché pˇríkazyjako jsou -help, -debug a jiné. Další je renderovací – bˇežnépro programy molekulárního modelování. Tˇretíokno, s názvem VMD main, slouží k manipulaci s molekulami. Obsahuje klasické záložky File, help a dále záložky pro vizualizaci jako jsou molecule, graphics, display, mouse, extensions. . . Použití tˇríoken není uživa- telsky pˇrílišpˇrívˇetivé.Na obrázku 3.2 je vidˇetnavíc okno s nastavením grafické reprezentace molekuly.

Obrázek 3.2: Prostˇredíprogramu VMD

Postup zobrazení parciálního náboje: Molekulu m ˚užemenaˇcístdo pamˇetibud’ prostˇred- nictvím okna VMD main a pˇresnabídku file/new molecule zadat cestu k molekule, nebo jedno- duše pˇretáhneme molekulu z prohlížeˇcepomocí metody drag & drop. Molekul m ˚užememít najednou aktivních libovolné množství. Nyní musíme upravit zp ˚usobzobrazení molekuly. V oknˇeVMD main spustíme nabídku graphics/representations. Nastavíme coloring method na charge. Poté je vhodné zmˇenit drawing method napˇríkladna licorice ˇci CPK pro dosažení lepší vizuali-

15 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ zace. Dále je možné zmˇenithodnoty bond radius a bond resolution k nastavení velikosti vazeb a rozlišení. Implicitnˇejsou hodnoty bond radius 0,3 a bond resolution 10. Výsledná scéna m ˚užebýt exportována do renderovacích aplikací jako jsou POV-Ray, Renderman, Tachyon, VRML a jiné, ve kterých lze dále upravovat grafickou vizualizaci molekuly.

Obrázek 3.3: Ukázka zabarvení atom ˚ua vazeb molekuly podle hodnoty parciálního náboje v programu VMD

Postup zobrazení povrchu s mapováním parciálního náboje: Naˇctememolekulu a zmˇe- níme coloring method na charge stejnˇejako v pˇredchozímpˇrípadˇe.Dále zmˇeníme drawing me- thod na Surf ˇci vdW surface. Objem povrchu lze zmˇenitpomocí atributu probe radius, který je implicitnˇenastaven na hodnotu 1,4. Povrch lze zobrazit jako drátˇenoukostru nastavením re- presentation method na wireframe nebo jako transparentní povrch zmˇenouvlastnosti material na transparent ˇci translucent.

16 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

Obrázek 3.4: Ukázka zabarvení povrchu molekuly podle hodnoty parciálního náboje v pro- gramu VMD

3.2.3 Jmol Jmol [27] je open-source prohlížeˇcmolekulových struktur poskytovaný ve dvou verzích. Jed- nak jako klasická desktopová Java aplikace Jmol pro vizualizaci molekul nebo ve verzi Jmol Applet, což je Java applet2 pro webový prohlížeˇc,který m ˚užebýt integrován na webové stránky a tím umožˇnujeprohlížení molekul pˇrímopˇresprohlížeˇc,bez nutnosti kopírovat data na po- ˇcítaˇc.Existuje také Jmol viewer obsahující vývojáˇrskénástroje integrovatelné do jiných Java aplikací. Program má rozsáhlou komunitu uživatel ˚ua pˇrispˇevatel˚u,díky nimž je k dispozici na stránkách Jmol obsáhlá dokumentace. V této práci se zamˇeˇrímena práci s desktopovou apli- kací Jmol. Díky pˇrenositelnostiJava kódu je program spustitelný v systémech Linux/Unix, Max OS X a systémech Windows XP/7/Vista. Výhodou je také jeho dostupnost v nˇekolikajazycích vˇcetnˇe ˇceštiny.

Interface: Jmol se skládá z okna obsahujícího klasickou plochu pro vykreslování molekuly a lišty s následujícími nabídkami: Soubor, Upravit, Zobrazit, Pohled, Nástroje, Makra, Nápovˇeda. Tyto nabídky obsahují pˇrevážnˇejen základní funkce pro vizualizaci molekul. Za zmínku stojí nabídka Makra, ze které m ˚užemejednoduše spouštˇetvlastní skripty, a nabídka Nástroje ob- sahující jednoduché funkce pro animaci, spuštˇenívibrací molekuly, ˇcizobrazení mˇeˇrenímezi atomy a vazbami. Vzhled molekuly lze zmˇenitpˇresnabídku spustitelnou kliknutím pravého tlaˇcítkana renderovací plochu. Tato nabídka obsahuje nástroje pro zmˇenumodelu, obarvení atom ˚ua vazeb, rotaci ˇcipˇriblížení a oddálení molekuly, vytvoˇrenípovrchu a jiné. Tato nabídka tvoˇrízáklad pro vizualizaci molekul v programu Jmol.

2. Softwarová komponenta, která bˇežív kontextu jiného programu (webového prohlížeˇcenebo v panelu pro pˇre- pínání oken v grafickém uživatelském prostˇredí).

17 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

Obrázek 3.5: Prostˇredíprogramu Jmol

Podpora skript ˚u: Manipulovat se strukturou molekuly lze jednak pˇrímomyší prostˇred- nictvím grafického prostˇredíprogramu nebo pomocí pˇríkaz˚u(skript ˚u)pˇreskonzoli. Pomocí tˇechtoskript ˚uje možné dosáhnout rychlejších, pˇresnˇejšícha komplexnˇejšíchvýsledk ˚uvizuali- zace. Kompletní seznam pˇríkaz˚uje dostupný na webových stránkách programu [28]. Konzole je spustitelná z nabídky Soubor/Konzole. Pˇríkazovásyntax: Obecnˇe,pˇríkazyv Jmol zaˇcínajípˇríkazovýmslovem, pokraˇcujímnožinou parametr ˚uoddˇelenýchmezerou a konˇcístˇredníkemnebo pˇríznakem konce ˇrádku.Zpˇetnélo- mítko na konci ˇrádkuznaˇcípokraˇcováníˇrádku,pˇrípadnˇejakákoliv neuzavˇrenázávorka "(, [, {" znaˇcí,že pˇríkazpokraˇcujena další ˇrádek.Program m ˚užetaké naˇcítatskripty, které lze vklá- dat pˇres Soubor/Editor skript˚u nebo naˇcístpˇrímoze souboru pravým kliknutím na renderovací okno a dále kliknutím na Soubor/Otevˇrítskript a zadáním cesty k souboru. Skripty obsahující Jmol pˇríkazyjsou klasické textové soubory s pˇríponou"spt". Popis a ukázka skriptu se nachází v pˇríloháchna stranˇe44.

Postup zobrazení parciálního náboje: Naˇctemesoubor s molekulou bud’ pomocí metody drag & drop nebo pˇresnabídku Soubor/Otevˇrít. Potom zmˇenímemodel molekuly (kliknutím pravého tlaˇcítkana pozadí programu se otevˇrenabídka) pˇresnabídku Vzhled/Schéma na libo- volný model. Nakonec zmˇenímebarevné schéma pˇresnabídku Barva/Atomy/Dle schématu/Cásteˇc-ˇ ný náboj. Pro menší molekuly je vhodné pˇridatpopisek – toho lze dosáhnout pouze pˇreskonzoli pˇríkazem"label %P". Celý proces se dá provést následujícím skriptem (druhý ˇrádekslouží ke zmˇenˇebarvy pozadí a popisk ˚u).Výsledná vizualizace je vidˇetna obrázku 3.6 a). $ spacefill 100; color atoms partialcharge; label %P; background white; $ color label black; background white;

18 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

(a) kalotový model, popisky (b) transparentní izopovrch, kalotový model, popisky

Obrázek 3.6: Ukázka vizualizace parciálního náboje pomocí programu Jmol

Postup zobrazení povrchu s mapováním parciálního náboje: V grafickém prostˇredíJmol není možné zmˇenit model molekuly na povrch obarvený parciálním nábojem.Toho lze dosáh- nout pouze vytvoˇrenímpovrchu jedním z následujících pˇríkaz˚uv závislosti na tom, jaký model povrchu molekuly chceme vytvoˇrit.Na konec pˇríkazuje možné pˇridatparametr "translucent" ˇci"opaque". Výsledná vizualizace je vidˇetna obrázku 3.6 b). isoSurface m1 saSurface 1 colorscheme bwr property partialcharge; isoSurface m2 molecular colorscheme rwb property partialcharge; isoSurface m3 solvent 1 colorscheme rwb property partialcharge;

3.2.4 MOE

Molecular operating environment (dále jen MOE [19]) je software vytvoˇrenýspoleˇcnostíChe- mical Computing Group [29]. Je využíván v celé ˇradˇeobor ˚ujako jsou chemoinformatika, mole- kulární modelování ˇcibioinformatika. MOE má vnoˇrenýsv ˚ujvlastní programovací jazyk SVL (Scientific Vector Language [30]), který podporuje skriptování a vytváˇrenívlastních funkcí ˇci podprogram ˚uv rámci MOE. Zdrojový kód MOE je napsán právˇepomocí SVL a je poskytován spoleˇcnˇes distribucí. K programu je možné pˇristupovatpˇresgrafické prostˇredí,pˇríkazovýˇrá- dek ˇciz internetového prohlížeˇce.Zde si popíšeme grafické prostˇredí. MOE je multiplatformní program, spustitelný v operaˇcníchsystémech Windows 2000/XP, Windows Vista/7, SGI UNIX/NT, SUN, DEC Alpha NT a HP-UX. Nejnovˇejšíverze nese poˇra- dové ˇcíslo2010.10.

Interface: Hlavní okno programu po spuštˇeníobsahuje menu, pˇríkazovýˇrádekpro SVL pˇrí- kazy a boˇcnílištu na pravé stranˇeokna. Menu kromˇebˇežnýchpoložek obsahuje položky Ren- der, Compute a GizMOE. Nabídka Render obsahuje nástroje pro práci s obrázkem (skrytí nebo vykreslení nˇekterýchatom ˚u,zmˇenabarvy atom ˚u,zmˇenamodelu molekuly, vystˇredˇenímole- kuly, zobrazení vykreslovací plochy ve full-screen režimu a jiné). D ˚uležitouˇcástítéto nabídky je podnabídka Render/Setup, kde m ˚užemezvolit jiné vizualizaˇcnítéma (Theme) nebo ruˇcnˇevy- tvoˇritsvé vlastní. Zmˇenitlze napˇríkladsmˇerosvˇetlení,barvu pozadí, materiál atom ˚ua vazeb, pˇridatr ˚uznéefekty, nastavit anti-aliasing apod. Nabídka Compute obsahuje nástroje umožˇnující provádˇetr ˚uznéchemické výpoˇctyna naˇctenémolekule. Lze napˇr.vypoˇcítatparciální náboje jednou z mnoha metod pˇresnabídku Compute/Partial charges nebo vypoˇcítatpovrch molekuly pˇresnabídku Compute/Surfaces and Maps. Poslední položka menu, která stojí za zmínku, je Gi- zMOE, jenž obsahuje nástroje pracující po spuštˇenítak dlouho, dokud nejsou ruˇcnˇeukonˇceny

19 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ tlaˇcítkem cancel v pravém horním rohu programu. Lišta na pravé stranˇeobsahuje tlaˇcítkauleh- ˇcujícípˇrístupk funkcím, které lze vˇetšinouspustit pˇresmenu. Ve spodní ˇcástiokna se nachází lišta s tlaˇcítkypro otáˇcení, zoomování a posunování mo- lekuly. Tˇechtoakcí lze dosáhnout také za použití myši v kombinaci s tlaˇcítkyAlt, Ctrl a Shift, nebo použitím prostˇredníhotlaˇcítkamyši.

Obrázek 3.7: Prostˇredíprogramu MOE

Custom interface: Jedním z nejvˇetšíchklad ˚uprogramu MOE je možnost upravit si vzhled programu pomocí SVL nástroj ˚u.Tím m ˚užemevytvoˇritpro program zcela nové funkce nebo tˇrebajen zjednodušit stávající nástroje pro zaˇcínajícíuživatele.

Obrázek 3.8: Ukázka modifikovaného prostˇredíMOE

20 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

Postup zobrazení popisku parciálního náboje3: Naˇctememolekulu ve formátu MOL2 pˇres nabídku File/Open. Je možné otevˇríti molekulu v jiném formátu, ale musíme pro ni potom vypoˇcítatparciální náboje prostˇrednictvímnabídky Compute/Partial Charges. Hodnoty náboj ˚u zobrazíme pomocí popisk ˚upˇresnabídku Render/Atoms, kde zmˇenímehodnotu atributu label na charge. Ve stejné nabídce m ˚užemezmˇeniti model molekuly pomocí tlaˇcítekvpravo od tlaˇcí- tek label. Na obrázku 3.9 a) je vizualizována molekula cytochromu.

(a) Tyˇcinkya kuliˇcky, popisky

Obrázek 3.9: Ukázka vizualizace parciálního náboje pomocí popisk ˚upomocí programu MOE

Postup výpoˇctuparciálního náboje: Naˇctememolekulu stejnˇejako u pˇredchozíhopostupu. Formuláˇrpro výpoˇcetnáboj ˚uotevˇremepˇresnabídku Compute/Partial charges. V tomto formu- láˇrinastavíme metodu, kterou chceme použít, pˇrípadnˇeklikneme na tlaˇcítko Selected atoms pro výpoˇcetnáboj ˚ujen u momentálnˇeoznaˇcenýchatom ˚u.Pokud bychom chtˇelinastavit hodnotu všech náboj ˚una nula, musíme ve formuláˇrizmˇenitmetodu na ZERO.

3.2.5 Chem3D Program chem3D [31] je souˇcástíbalíku CS ChemOffice od producenta chemického softwaru – spoleˇcnostiCambridgeSoft [32]. Další ˇcástibalíku jsou napˇr.databázový program ChemFin- der, kreslící program ChemDraw a databázový ChemInfo pro ukládání chemických struktur. Chem3D umožˇnujemodelování molekul, jejich vizualizaci ve 3D, vizualizaci orbital ˚u,výpoˇcty parciálního náboje, elektrostatického potenciálu, nábojových hustot a mnoho dalších funkcí. Program podporuje velkou škálu chemických datových soubor ˚u,vˇcetnˇePDB, MOL a MOL2. Celý balík pro komerˇcnípoužítí stojí od 1430 $. Lze sehnat i zjednodušenou trial verzi na mˇesíc zdarma. Jednou z mnoha výhod programu Chem3D je možnost integrovat do nˇejtzv. "add-ons" mo- duly. Existují také tzv. "browser plugins" umožˇnujícípˇristupovatk funkcím Chem3D pˇrímoz

3. MOE v dnešní dobˇeneobsahuje možnost vizualizovat parciální náboj pomocí barev. Podle zdroj ˚una internetu [?] umožˇnovalMOE dˇrívevizualizovat parciální náboj na povrch molekuly. Tato možnost byla pozdˇejinahrazena vizualizací "electrostatics".

21 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ internetového prohlížeˇce.Program je spustitelný pod systémem Windows 2000/XP/Vista/7, Mac (verze 7.0 a novˇejší)a v upravené verzi také z OS Linux.

Interface: Program Chem3D se skládá z panelu nabídek, panelu nástroj ˚ua vykreslova- cího okna. Kromˇetohoto klasického vzhledu lze pomocí nabídky view/cartesian table zobrazit tabulky s r ˚uznýmiinformacemi o molekule (napˇríkladkartézské souˇradniceˇcitabulku vzdále- ností) a záložku model explorer umožˇnujícílepší orientaci ve struktuˇremolekuly. Další volitelné lišty jsou ˇrádekvýstupu a ˇrádeks komentáˇri.Celé prostˇredíje snadno modifikovatelné a m ˚u- žeme si jej upravit podle sebe pro zjednodušení práce. Na obrázku 3.10 jsou vidˇetlišty Output a Cartesian table. Panel nabídek kromˇeklasických položek obsahuje položku Structure umožˇnujícínapˇríklad výpoˇctyvzdáleností mezi atomy, umístˇenímodelu na stˇredgrafického okna, reflexe podle z- osy a jiné úpravy týkající se struktury. V menu se dále nachází položka Calculations obsahu- jící r ˚uznévýpoˇctovéoperace. Pro nás je d ˚uležitázejména nabídka Calculations/Extended Hüc- kel/Calculate Charges ˇci Calculations/MOPAC/Compute Properties k výpoˇctuparciálních náboj ˚u. Chem3D totiž nenaˇcte parciální náboje ze souboru MOL2 a je tudíž potˇrebanáboje nejprve vypoˇcítat.Další d ˚uležitounabídkou je nabídkaSurfaces umožˇnujícízobrazení povrchu pro mo- lekulu a mapování r ˚uznýchvlastností na její povrch. Chem3D také obsahuje nabídku Movie pro vytváˇreníkrátkých videosekvencí a nabídku Online pro komunikaci s internetem. Napˇríklad pˇresnabídku Online/Find Structure From PDB ID m ˚užemestáhnout molekulovou strukturu v PDB formátu bez nutnosti spouštˇetprohlížeˇc.

Obrázek 3.10: Prostˇredíprogramu Chem3D

Postup výpoˇctuparciálního náboje: Chem3D umožˇnujevýpoˇcetparciálních náboj ˚upo- mocí nástroj ˚uMOPAC ˇciExtended hückel pˇresnabídky Calculations/Extended Hückel/Calculate Charges a Calculations/MOPAC/Compute Properties. Pokud jsme použili k výpoˇctunáboj ˚uvíce metod, je možné mezi nimi pˇrepínatnabídkou Calculations/Calculation Results.

22 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

Postup zobrazení parciálního náboje: Naˇctememolekulu pˇresnabídku File/Open, nebo pˇresunemez prohlížeˇcepomocí drag & drop. Poté pˇresnabídku View/Model Display Mode zmˇe- níme model napˇríkladna sticks. Jak bylo ˇreˇcenovýše, Chem3D neumí pracovat s náboji ze sou- boru MOL2, proto musíme vypoˇcítatnáboje, jak je popsáno v postupu výše. Atomy nakonec obarvíme podle parciálního náboje pˇresnabídku View/Color by/Partial Charge. Stejné vizualizace lze dosáhnout pˇresnabídku File/Model settings nebo pˇresnabídkou spustitelnou kliknutím pra- vého tlaˇcítkana vykreslovací okno.

Postup zobrazení parciálního náboje podle velikosti atomu: Naˇctememolekulu a vypo- ˇcítámenáboje stejnˇejako v pˇredchozímpostupu. Otevˇremenabídku File/Model settings a zmˇe- níme v záložce Atom display atribut Atom Spheres Size By na hodnotu Partial Charges. Ve stejné nabídce lze upravit velikost atom ˚uzmˇenouatributu Size na jinou hodnotu. Model musí zobra- zovat atomy jako kuliˇcky, proto musíme zmˇenitmodel na Ball and stick pˇresnabídku View/Model Display Mode/Ball and stick.

Postup zobrazení povrchu s mapováním parciálního náboje: Naˇctememolekulu a vy- poˇcítámenáboje obvyklým zp ˚usobem.Vytvoˇrímepovrch pˇresnabídku Surfaces/Choose Sur- face/Solvent accessible nebo Surfaces/Choose Surface/Connolly molecular. Pokud máme vypoˇcítané náboje, m ˚užemeje nyní mapovat na povrch molekuly pomocí nabídky Surfaces/Color map- ping/Partial charges. Povrch lze dále upravovat dalšími funkcemi obsaženými v nabídce Sur- faces. Lze napˇríkladzmˇenitrozlišení, zmˇenitmodel povrchu jako transparentní ˇciteˇckovaný, zmˇenitpolomˇerpovrchu atd.

(a) Tyˇcinky (b) Tyˇcinkya kuliˇcky

(c) Velikost atom ˚upodle parciálního náboje (d) Povrch

Obrázek 3.11: Ukázka vizualizace parciálního náboje molekuly cholesterolu pomocí Chem3D

23 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

3.2.6 DSV

Discovery Studio Visualizer (dále jen DSV [33]) od spoleˇcnostiAccelrys je nekomerˇcníverze softwarového prostˇredíDiscovery Studio [34]. Program DSV obsahuje mnoho nástroj ˚upro vi- zualizaci a analýzu chemických struktur – podporuje všechny základní molekulové modely vˇcetnˇemodel ˚upovrchu a umožˇnujevizualizovat r ˚uznétypy náboj ˚ujako jsou partial charge, net formal charge, net partial charge, interpolated charge ˇciatom charge. Podporuje vˇetšinu existujících datových formát ˚uvˇcetnˇePDB, MOL a MOL2. Program v nejnovˇejšíverzi 3.0 z roku 2010 je zdarma dostupný v angliˇctinˇe(po vyplnˇení registraˇcníhoformuláˇre).Podporovány jsou operaˇcnísystémy Windows XP/Server/Vista/7 a Linux.

Interface: Program DSV se skládá z panelu nástroj ˚u,grafického okna, prohlížeˇcesoubor ˚u, lišty s nástroji a datové tabulky se základními informacemi o molekule. Kromˇeklasických na- bídek obsahuje panel nástroj ˚unabídku Chemistry, ve které jsou pˇríkazy, jenž pˇrímomˇení(nebo mají potenciál mˇenit)chemické složení struktury. Dále nabídku Structure pro práci se struk- turou molekuly, tvoˇrenípovrch ˚u,popisk ˚uatd., Chart pro tvorbu diagram ˚u, Scripts obsahující nˇekolikpˇreddefinovanýchskript ˚u(napsané v Perlu) a nabídku Tools se sadami nástroj ˚useˇra- zenými do skupin podle oblasti jejich použití (napˇr.macromolecules, small molecules, X-ray, pharmacophores...). Prostˇredíprogramu je snadno modifikovatelné – do hlavního okna pro- gramu lze pˇridávatuživatelem definované panely nástroj ˚u,tlaˇcítka,klávesové zkratky atd.. Zajímavostí je i seznam pˇríkaz˚u Search box, který se nachází na lištˇes nástroji. Po zadání klíˇco- vého slova najde a vykoná v programu pˇríkazˇcifunkci s odpovídajícím názvem, ˇcímžurych- luje práci. Všechny pˇríkazya funkce spustitelné pˇresmenu lze spustit i pˇrestento "seznam". D ˚uležitousouˇcástíprogramu je také tzv. prohlížeˇcsoubor ˚u File explorer, který nám poskytuje hierarchický seznam soubor ˚u,adresáˇr˚ua skript ˚u,jenž jsou viditelné v programu. Umožˇnuje nám vytváˇret,naˇcítatnebo modifikovat soubory ˇciadresáˇrea zjednodušuje tak práci s více molekulami najednou.

Obrázek 3.12: Prostˇredíprogramu DSV

24 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

Postup výpoˇctuparciálního náboje: Program DSV umožˇnujevýpoˇcetparciálních náboj ˚u prostˇrednictvímnabídky Chemistry/Charge/Calculate. Výpoˇcetnímetodu lze zmˇenitpˇresna- bídku Edit/Preferences v záložce Forcefield v kolonce Partial charge estimation method.

Postup zobrazení parciálního náboje: Otevˇrememolekulu ve formátu MOL2 pˇresnabídku File/Open nebo pˇresunemetahem myši z prohlížeˇcepomocí drag & drop. Dále musíme zmˇenit model a barevné schéma pomocí formuláˇre Display Style. Otevˇremetedy formuláˇrpˇresmenu View/Display Style, pravým kliknutím na vykreslovací plochu a vybráním možnosti Display style nebo klávesovou zkratkou Ctrl+D. Formuláˇrobsahuje nˇekolikzáložek sloužících k vizualizaci. V záložce Atom zmˇeníme Display style na libovolný model a Coloring/Color by na hodnotu partial charge (obsahuje i další podobná barevná schémata). Dále je vhodné upravit grafické nastavení pˇreszáložku Graphics, kde m ˚užemezmˇenitkvalitu vizualize, barvu pozadí nebo nastavit vy- kreslování hloubky obrazu Depth cue. Za zmínku stojí další záložky Lighting a Materials, které umožˇnujíupravit zdroj svˇetlaa zmˇenitvlastnosti materiálu tvoˇrícíhomodel molekuly. Ukázka vizualizace ve vysoké kvalitˇes nastavením Depth cue a Materials/Chalk se nachází na obrázku 3.13. K vizualizaci je možné pˇridatpopisek pˇresnabídku Structure/Labels/Add.

Obrázek 3.13: Ukázka zabarvení atom ˚ua vazeb molekuly podle parciálního náboje v DSV

25 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

Postup zobrazení povrchu s mapováním parciálního náboje: Po naˇctenímolekuly s ná- boji musíme vytvoˇritpovrch molekuly. Toho dosáhneme pˇresnabídku Structure/Surface/Add. Zobrazí se nám formuláˇrs parametry pro vytvoˇrenípovrchu. Nastavíme si požadovaný typ povrchu v kolonce Display style a potvrdíme (pˇrípadnˇem ˚užemezmˇenit Surface rendering na Wire mesh pokud chceme zobrazit povrch jako drátˇenoukostru nebo nastavit transparentnost). Poté znovu otevˇremeformuláˇr Display style napˇríkladpomocí klávesové zkratky Ctrl+D, a v záložce Surface nastavíme Color by na Partial charge – toto barevné schéma pˇrivytváˇrenípo- vrchu nebylo pˇrístupné, tzn. bylo nutné znovu otevˇrítformuláˇr Display style. Další užiteˇcnou vlastností je možnost zmˇenitrozsah zobrazovaných hodnot, tj. nastavení min a max v záložce Surface/Coloring/Colors. Další podobná barevná schémata jsou interpolated charge ˇci atom charge. Ukázka vizualizace je vidˇetna obrázku 3.14 .

Obrázek 3.14: Ukázka zabarvení povrchu molekuly podle parciálního náboje v DSV

26 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

3.2.7 Mol2mol

Program Mol2mol [18] je posledním nástrojem pro práci s parciálními náboji, se kterým jsem se v rámci své bakaláˇrsképráce seznámil. Program lze koupit za 39 $, nebo lze stáhnout 30 denní trial-verzi. Po uplynutí této doby se nˇekteréfunkce programu zablokují (nástroje Convert a Uti- lities). Nejnovˇejšíverze 5.6.2 je spustitelná pouze v operaˇcníchsystémech Windows 95SP1, 98, Me, NT, 2000, XP, Vista nebo 7. Tento program je primárnˇeurˇcenpro pˇrevádˇenímezi chemic- kými datovými formáty. Kromˇetéto funkce umožˇnujenˇekterévýpoˇctovéoperace a poskytuje jednoduché grafické prostˇredípro editaci molekulových struktur. V této verzi podporuje pˇres 40 druh ˚uchemických datových formát ˚u.Mol2mol dokáže pracovat s více soubory naráz, tj. sluˇcovatˇcirozdˇelovatsoubory, konvertovat formát nˇekolikasoubor ˚unaráz atd... Protože tento program není schopen sám o sobˇevizualizovat molekuly, je tˇrebajeho výstup pˇredatdo jiného, grafického programu – konkrétnˇeprogramu Persistance of Vision Raytracer (neboli POV-Ray [35]).

POV-Ray: Jedná se o software pro vytváˇreníobrázk ˚u3D poˇcítaˇcovégrafiky pomocí metody sledování paprsku (raytracing). Program používá k popisu scény specializovaný programo- vací jazyk oznaˇcenýSDL (scene description language [36]). Narozdíl od jiných 3D program ˚u neobsahuje žádné modelovací ˇcianimaˇcnínástroje a fotorealistické obrázky poˇcítána základˇe textových soubor ˚us kódem popisujícím objekty ve scénˇe,nastavení svˇetel,kamery, atmosféric- kých efekt ˚ua dalších. Nejnovˇejšístabilní verze 3.6 je zdarma ke stažení pro operaˇcnísystémy Windows, MS-DOS, Macintosh, Amiga a Unix. Ukázka zápisu molekuly ve formátu POV je pˇriloženav pˇrílozena stranˇe48.

Obrázek 3.15: Prostˇredíprogramu Mol2mol

27 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

Interface: Softwarový nástroj Mol2mol se skládá ze dvou oken – Main window a Graphics Window. Okno Graphics window obsahuje nástroje pro upravování ˇcitvorbu molekulových struktur. Druhé, hlavní okno, se skládá z panelu nástroj ˚u,panelu s informacemi o molekule (s tlaˇcítkempro otevˇrení/zavˇrenígrafického okna) a textové ˇcásti,ve které jsou vypsány in- formace o provádˇenýchakcích a naˇctenémolekule. Nabídka Edit obsahuje klasické funkce pro editaci molekuly, z nichž za zmínku stojí funkce Edit/Charges/Create Gasteiger-Marsilli Charges pro výpoˇcetparciálních náboj ˚u.Další nabídka Convert se zpˇrístupníaž po naˇctenínˇejakémo- lekuly. Pomocí této nabídky m ˚užemekonvertovat naˇctenýsoubor do jiného datového formátu (napˇr.formáty MOL2 ˇciPOV4). Poslední menu nabídka, která stojí za zmínku, je Utilities. Ná- stroje v této nabídce posílají na výstup chemické vlastnosti molekuly získané ze vstupního souboru. Napˇr.nabídka Utilities/Selected distances vypíše do výstupního souboru souˇradnicové vzdálenosti mezi všemi vybranými atomy.

Postup zobrazení parciálního náboje: Po spuštˇeníprogramu naˇctememolekulu pˇresna- bídku File/Open Molfile. Pokud vstupní soubor není ve formátu MOL2, musíme dodateˇcnˇe vypoˇcítatparciální náboje pˇresnabídku Edit/Charges/Create Gasteiger-Marsilli charges. Protože Mol2mol sám o sobˇeneumí vykreslovat molekuly (pouze drátˇenýmodel), musíme molekulu pˇrevéstdo renderovacího programu POV-Ray. Spustíme tedy formuláˇrpro konverzi soubor ˚u pˇresnabídku Convert/POV-Ray. Ve formuláˇriv kolonce Model zmˇenímemodel molekuly, dále zmˇeníme Bond color na Atoms, gradietn fill pro "spojité"obarvení vazeb a Color nastavíme na By charges. Dále je možné ve formuláˇriupravit napˇríkladstínování ˇciperspektivitu v panelu Mis- cellaneous nebo použít nˇekterépˇreddefinovanévizualizaˇcnítéma z panelu POV-Ray header and footer sample files. Po uložení souboru jej otevˇremev programu POV-Ray pˇresnabídku File/Open file nebo tahem myši metodou drag & drop a renderujeme tlaˇcítkem Run.

(a) Tyˇcinky (b) Kalotový model

Obrázek 3.16: Ukázka vizualizace parciálního náboje

3.2.8 Software bez možnosti vizualizace náboje V rámci své práce jsem rovnˇežpracoval se softwary Pymol, RasMol, Hyperchem, , SPDBV a gOpenMol. Tyto programy bohužel neumožˇnujínaˇcítatMOL2 soubory a vizualizovat náboje.

4. POV je datový formát s informacemi pro práci s grafikou, ve kterém jsou uloženy informace o tvarech, barvách, texturách, rotacích, nasvíceních, atmosférických efektech a dalších 3D obrazových vlastnostech. Data jsou uložena v textovém souboru v ASCII formátu.

28 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

3.3 Implementace programu Import charges

Tato práce obsahuje jednoduchý program Import charges, který slouží ke vkládání náboj ˚udo chemických datových soubor ˚uMOL2.

3.3.1 Programovací jazyk

K tvorbˇeprogramu byl použit programovací jazyk JAVA ve verzi 1.6.0, aktuální k datu 16.12.2010. Tento programovací jazyk byl vybrán pˇredevšímproto, že je platformovˇenezávislý, takže je možné program jednoduše zavést i na poˇcítaˇces operaˇcnímsystémem UNIX ˇcijiným OS. Díky objektovosti a srozumitelnému kódu JAVA umožˇnujerychlé psaní pˇrehlednýchprogram ˚ua pˇrípadnousnadnou implementaci dodateˇcnýchfunkcí. Proto se jeví jako ideální nástroj pro tvorbu následujícího programu.

3.3.2 Funkcionalita

Program neobsahuje grafické prostˇredía spouští se jednoduchým pˇríkazemz pˇríkazovéˇrádky ˇcikonzole. Program nejprve naˇcteobsah vstupních soubor ˚ua uloží do pamˇeti.Následnˇepo- mocí hodnot parciálních náboj ˚uve druhém vstupním souboru pˇrepíšehodnoty náboje v prv- ním souboru a uloží do nového souboru s názvem podle tˇretíhovstupního parametru. Pokud soubor se stejným názvem již existuje, je pˇrepsán. Vlastnosti programu:

• program je spustitelný ve Windows 7/XP/Vista, Unix a Mac OS X

• pro vˇetšípˇrehlednostprogram za bˇehuvypisuje postup provádˇenýchoperací a usnad- ˇnujetak nalezení pˇrípadnéchyby na vstupu

• program obsahuje ˇraduvyjímek pro ošetˇrenínežádoucího vstupu

3.3.3 Vstup a výstup

Program naˇcítána vstup 2 soubory. První soubor obsahující údaje o molekule musí být v che- mickém datovém formátu MOL2. Druhý soubor obsahující hodnoty parciálních náboj ˚uje ve formátu Gaussian. Výstup se potom ukládá ve formátu MOL2 do souboru zadaného jako tˇretí parametr pˇrivolání programu.

Pˇríkladvstupního MOL2 souboru: @MOLECULE C:\h2o.mol2 3 2 0 0 0 SMALL NO CHARGE Energy = 0

@ATOM 1 O 0.0000 0.0000 0.0000 O.3 1 UNK1 0.0000 2 H -0.7600 -0.5840 0.0000 H 1 UNK1 0.0000 3 H 0.7600 -0.5840 0.0000 H 1 UNK1 0.0000 @BOND

29 3. METODICKÁ A IMPLEMENTACN͡ CÁSTˇ

1 1 2 1 2 1 3 1

Pˇríkladvstupního souboru s náboji: NSC 2870 3 1 O -0.4105 2 H 0.2052 3 H -0.2052

Pˇríkladvýstupního MOL2 souboru: @MOLECULE C:\h2o.mol2 3 2 0 0 0 SMALL GAUSSIAN Energy = 0

@ATOM 1 O 0.0000 0.0000 0.0000 O.3 1 UNK1 -0.4105 2 H -0.7600 -0.5840 0.0000 H 1 UNK1 0.2052 3 H 0.7600 -0.5840 0.0000 H 1 UNK1 0.2052 @BOND 1 1 2 1 2 1 3 1

3.3.4 Volání Program je uložen v klasickém formátu Java ARchive 5 a je spustitelný z pˇríkazovéˇrádkyjed- noduchým pˇríkazemse tˇremiparametry (všechny parametry jsou povinné): java -jar [soubor_mol2] [soubor_mchrg] [výstupní_soubor]

Pˇríklad: java -jar importCharges.jar dna.mol2 dna.mchrg dna_gaussCharges.mol2

5. JAR – archivní soubor programovacího jazyka Java založený na ZIP kompresi

30 4 Výsledky a diskuse

4.1 Ukázka výpoˇctunáboj ˚u

V této ˇcástije na konkrétním pˇríkladumolekuly 4-nitrofenolu ukázáno, jaké hodnoty parciál- ních náboj ˚uje možno získat pomocí r ˚uznýchmetod pro výpoˇcetnáboje a r ˚uznýchsoftwaro- vých nástroj ˚u. Hodnoty náboj ˚upro molekulu 4-nitrofenolu ukazuje tabulka 4.1 a graf 4.2. Z tabulky 4.1 je patrné, že náboje se pro nˇekteréatomy mohou lišit v závislosti na zp ˚usobu,jakým byly získány. Každopádnˇegraf 4.2 dokumentuje, že náboje získané r ˚uznýmimetodami vykazují stejné trendy.

Obrázek 4.1: Molekula 4-nitrofenolu s oˇcíslovanýmiatomy

Tabulka 4.1: Hodnoty náboj ˚upro molekulu 4-nitrofenolu, poˇcítanépomocí r ˚uznýchmetod a r ˚uznýchsoftwar ˚u Software Open Babel Mol2mol MOE Chem3D MOE Chem3D Metoda výpo- Gasteiger Gasteiger Gasteiger Extended Hückel AM1 AM1 ˇctunáboj ˚u 1 O 0,0868 -0,4040 -0,683 -0,36069 -0,5121 -0,2583 2 N 0,3131 -0,3009 1,220 0,52828 0,9206 0,0639 3 O 0,0868 -0,4040 -0,686 -0,36466 -0,5121 -0,2583 4 C 0,3227 0,0518 0,013 -0,19665 -0,2203 0,2713 5 C 0,0232 -0,0349 -0,013 -0,06006 -0,0282 0,0179 6 C -0,0136 -0,0300 -0,126 -0,32353 -0,2001 -0,0255 7 C 0,1173 0,0727 0,276 0,17700 0,1703 0,0730 Atom 8 O -0,5068 -0,3598 -0,167 -0,33000 -0,4827 -0,3598 9 C -0,0136 -0,0300 -0,133 -0,24560 -0,2001 -0,0255 10 C 0,0232 -0,0349 -0,015 -0,07374 0,0282 0,0179 11 H 0,0688 0,0639 0,029 0,24727 0,1735 0,0686 12 H 0,0656 0,0644 0,033 0,21387 0,1580 0,0645 13 H 0,2921 0,2173 0,191 0,29759 0,4298 0,2173 14 H 0,0656 0,0644 0,033 0,23761 0,1580 0,0645 15 H 0,0688 0,0639 0,029 0,25330 0,1735 0,0686

31 4. VÝSLEDKYADISKUSE

Obrázek 4.2: Graf hodnot parciálních náboj ˚upro r ˚uznémetody a r ˚uznésoftwary

4.2 Vizualizace molekul

Pro ukázku vizualizací byly vybrány 3 molekuly r ˚uznévelikosti, aby byla lépe vidˇetvyužitel- nost jednotlivých nástroj ˚upro r ˚uznétypy molekul. Informace o tˇechtomolekulách naleznete v následující tabulce:

Tabulka 4.2: Vizualizované molekuly Jméno molekuly Typ molekuly Poˇcetatom ˚u 2-bromo-5-hydroxybenzaldehyd malá organická molekula 15 cilengitid peptid 83 hemoglobin protein 4950

V pˇrílozena stranách 46 a 47 jsou pro ukázku pˇridányvizualizace pro dva velké proteiny obsahující kolem 25000 atom ˚ua 69500 atom ˚u. Vzhledem k nároˇcnostirenderování povrchu nˇekterýchvˇetšíchmolekul zde pˇrikládámpa- rametry poˇcítaˇcovésestavy, která byla použita pˇritvorbˇetˇechtovizualizací: Dvoujádrový pro- cessor AMD Athlon 64 X2 5000+ @ 2600 MHz, RAM pamˇet’ 2048 MB (2 x 1024 DDR2-SDRAM), grafická karta Radeon X1950 Series, operaˇcnísystém Windows 7 Home Premium, DirectX verze 11.00. Pro vizualizaci parciálního náboje se podaˇrilonajít celkem 5 softwarových nástroj ˚u:VMD, Jmol, Chem3D, DSV, Mol2mol. Program MOE nebyl mezi tyto nástroje zahrnut, protože ne- dokáže náboje vizualizovat pomocí barev (pouze pomocí popisku), ale hodí se pˇredevším pro výpoˇctyparciálních náboj ˚upomocí r ˚uznýchmetod. V tˇechtoprogramech bylo použito násle- dujících vizualizaˇcníchmodel ˚ua schémat:

• Tyˇcinkový,tyˇcinkya kuliˇcky, kalotový, vdW a SASA

• Zabarvení atom ˚ua vazeb podle hodnoty parciálního náboje, velikost atom ˚upodle hod- noty parciálního náboje, zabarvení povrchu molekuly podle hodnoty parciálního náboje

• K výpoˇctunáboj ˚ubyl u malé a stˇrednímolekuly použit program OpenBabel a metoda Gasteiger. Pro výpoˇcetnáboj ˚uproteinu byl použit program MOE (opˇets metodou Gaste- iger), který dokáže lépe pracovat s velkými molekulovými strukturami.

32 4. VÝSLEDKYADISKUSE

4.2.1 Vizualizace malé molekuly Vizualizována byla molekula 2-bromo-5-hydroxybenzaldehydu – malá organická molekula ob- sahující 15 atom ˚u.Výstupy vizualizace jsou ukázány na obrázcích 4.3, 4.4 a 4.5.

(a) VMD, tyˇcinky (b) VMD, tyˇcinkya kuliˇcky (c) VMD, kalotový model

(d) Jmol, tyˇcinky (e) Jmol, tyˇcinkya kuliˇcky (f) Jmol, kalotový model

(g) Chem3D, tyˇcinky (h) Chem3D, tyˇcinkya kuliˇcky (i) Chem3D, kalotový model

(j) DSV, tyˇcinky (k) DSV, tyˇcinkya kuliˇcky (l) DSV, kalotový model

(m) Mol2mol, tyˇcinky (n) Mol2mol, tyˇcinkya kuliˇcky (o) Mol2mol, kalotový model

Obrázek 4.3: Ukázka vizualizace parciálního náboje na atomech a vazbách malé molekuly

33 4. VÝSLEDKYADISKUSE

Všechny programy dokáží vizualizovat molekulu pomocí model ˚utyˇcinky, tyˇcinkya ku- liˇckya kalotového modelu. Vizualizovat povrch lze ve všech programech vyjma Mol2mol. Na obrázku 4.4 je ukázka vizualizace povrchu. Nicménˇeu takto malé struktury jsou povrchy vdW, SASA ˇci3D izopovrch velmi podobné kalotovému modelu, jehož vizualizace nám postaˇcí. Doba vykreslení molekuly byla zanedbatelná u všech program ˚ukromˇeMol2mol a POV- Ray, kde renderování trvalo kolem 15 s. Pˇripráci s takto malými molekulami je výhodou mít možnost zobrazit hodnotu parciálního náboje popiskem. To umožˇnujíprogramy Jmol, DSV a pˇrípadnˇeMOE, který ale nedokáže vizualizovat parciální náboj podle barev. Jako nejvhod- nˇejšípro vizualizaci parciálního náboje malých organických molekul se jeví program DSV. Ten jako jediný dokáže pracovat s náboji uloženými ve formátu PDBQ, umožˇnujevelkou variabi- litu vizualizací a obsahuje všechny podstatné funkce pro vizualizaci parciálního náboje. Dal- ším velmi vhodným nástrojem je Jmol, který podporuje skriptování a tím m ˚užedo velké míry urychlit tvorbu a upravit vzhled vizualizací. Chem3D také obsahuje všechny potˇrebnéfunkce a vysokou variabilitu vizualizace – jeho nevýhodou však je, že oproti ostatním program ˚um jsou parciální náboje zobrazeny s opaˇcnýmbarevným schématem. Program VMD dosahuje podobných výsledku jako DSV s tím rozdílem, že neumí zobrazit popisky s parciálními náboji u molekul a použití tˇríoken se m ˚uženˇekomuzdát zbyteˇcnˇenepˇrehledné.

(a) VMD, povrch (b) Jmol, povrch (c) Chem3D, povrch (d) DSV, povrch

Obrázek 4.4: Ukázka vizualizace parciálního náboje na povrchu malé molekuly

Poslední obrázek 4.5 zobrazuje velikosti atom ˚upodle hodnoty parciálního náboje. Tuto vi- zualizaci jako jediný program umožˇnujeChem3D.

Obrázek 4.5: Ukázka vizualizace parciálního náboje podle velikosti atomu v programu Chem3D

34 4. VÝSLEDKYADISKUSE

4.2.2 Vizualizace stˇrednímolekuly

Vizualizována byla molekula cilengitidu – peptidu obsahujícího 82 atom ˚u.Výstupy vizualizace jsou ukázány na obrázku 4.6, 4.7 a 6.1.

(a) VMD, tyˇcinky (b) VMD, tyˇcinkya kuliˇcky (c) VMD, kalotový model

(d) Jmol, tyˇcinky (e) Jmol, tyˇcinkya kuliˇcky (f) Jmol, kalotový model

(g) Chem3D, tyˇcinky (h) Chem3D, tyˇcinkya kuliˇcky (i) Chem3D, kalotový povrch

(j) DSV, tyˇcinky (k) DSV, tyˇcinkya kuliˇcky (l) DSV, kalotový model

(m) Mol2mol, tyˇcinky (n) Mol2mol, tyˇcinkya kuliˇcky (o) Mol2mol, kalotový model

Obrázek 4.6: Ukázka vizualizace parciálního náboje na atomech a vazbách molekuly cilengitidu

35 4. VÝSLEDKYADISKUSE

Obdobnˇejako u pˇredchozímolekuly i u této struktury se podaˇrilo ve všech pˇetiprogramech vizualizovat pomocí model ˚utyˇcinky, tyˇcinkya kuliˇckya kalotového modelu. Povrch lze vizu- alizovat v programech VMD, Jmol, Chem3D a DSV (pevný, drátˇenýˇcitransparentní). Vykres- lování molekul bylo opˇetvelice rychlé s vyjímkou program ˚uMol2mol a POV-Ray. Pro stˇrední molekulu je již vizualizace povrchu stejnˇeužiteˇcnájako vizualizace jednotlivých atom ˚u.Nej- lepších výsledk ˚udosahují programy Jmol, Chem3D (pokud nám nevadí "obrácené" barevné schéma) a DSV. Bohužel program DSV zatím plnˇenepodporuje vizualizaci povrchu podle par- ciálního náboje – neumí správnˇeurˇcitrozsah zobrazených hodnot a je nutno ruˇcnˇezmˇenit hodnoty min a max u nastavení RWB1 barevného schématu. Proto se jeví jako nejvhodnˇejší program Jmol. Výhodou Chem3D opˇetm ˚užebýt možnost zobrazit velikosti atom ˚upodle hod- noty parciálního náboje – jak je vidˇetna obrázku v pˇrílozena stranˇe44. Naopak nejhorších výsledk ˚udosahuje program Mol2mol, který neumí vizualizovat porvch ani zobrazit popisky a navíc je pomalý kv ˚ulinutnosti renderovaní v POV-Ray.

(a) VMD, povrch (b) Jmol, povrch

(c) Chem3D, povrch (d) DSV, SASA povrch

Obrázek 4.7: Ukázka vizualizace parciálního náboje na povrchu molekuly cilengitidu

1. RWB (Red-white-blue): je barevné schéma používané pro obarvení atom ˚upodle parciálního náboje, kdy nej- zápornˇejšínáboj je obarven tmavˇeˇcervenoubarvou, neutrální náboj bílou a nejkladnˇejšítmavˇemodrou barvou. Nˇekteréprogramy jako napˇr.Chem3D používají opaˇcnébarevné schéma – BWR.

36 4. VÝSLEDKYADISKUSE

4.2.3 Vizualizace velké molekuly

Vizualizována byla molekula hemoglobinu – protein obsahující 4950 atom ˚u.Výstupy vizuali- zace jsou ukázány na obrázku 4.8.

(a) VMD, povrch (b) Jmol, povrch

(c) DSV, povrch (d) VMD, tyˇcinky

Obrázek 4.8: Ukázka vizualizace parciálního náboje pro molekulu hemoglobinu

Modely pro vizualizaci parciálních náboj ˚una atomech molekuly se sice podaˇrilozobrazit ve všech pˇetiprogramech, ale výsledné vizualizace byly nepˇrehledné– jak je vidˇetv ukázce na obrázku 4.8 d). Proto je u molekul protein ˚ud ˚uležitápˇredevším vizualizace náboje na povrchu molekuly. Ten se nepodaˇrilozobrazit v programu Chem3D (z d ˚uvodunedostatku pamˇetipˇri vykreslování povrchu) a v Mol2mol, který neumí vizualizovat povrch molekuly. Vykreslování povrchu bylo nejrychlejší v programu VMD (kolem 10 s), naopak nejpomalejší v programu Jmol (kolem 2 m). Dobrých výsledk ˚udosahoval také DSV, který dokázal vizualizovat povrch za 15 s na nejvyšší rozlišení s vykreslováním hloubky (depth cue) a nasvícením. Opˇetvšak bylo u tohoto programu nutné zmˇenithodnoty minima a maxima barevného spektra. Celkovˇelze tyto programy pˇrivizualizaci velké molekuly považovat za rovnocené – každý má své výhody a nevýhody.

37 4. VÝSLEDKYADISKUSE

Ve všech tˇrechprogramech lze vizualizaci zobrazit jako transparentní ˇciv podobˇedrátˇené kostry. V programech Jmol a DSV jsou provedeny obdobnˇe,ale v programu VMD je tato vizu- alizace velice nepˇrehlednáa nevhodná pro použití.

4.3 Pˇrehleda srovnání vlastností softwarových nástroj ˚u

4.3.1 Komentáˇrek jednotlivým program ˚um

VMD

Program umožˇnujenejrychlejší vykreslování povrchu, což je vhodné zejména pro vizualizaci vˇetšíchmolekul. VMD dokáže zobrazit povrch i u molekul obsahujících pˇres60000 atom ˚uv pomˇernˇekrátké dobˇe.Nevýhodou je špatná pˇrehlednostpˇripráci se tˇremiokny. Další nevý- hodou VMD je, že neumožˇnujezobrazit k atom ˚umpopisky s hodnotami parciálních náboj ˚u. Posledním nedostatkem je, že pˇrivizualizaci transparentního povrchu nedosahuje vizualizace kvalitních výsledk ˚u.Tyto nedostatky nejsou nijak závažné a vzhledem k dostupnosti programu a možnosti dodání plugin ˚uje VMD velmi užiteˇcnýmnástrojem pro vizualizaci parciálních ná- boj ˚u.

Jmol

Nejvˇetšívýhodou programu Jmol je možnost pracovat se skripty, což zkušenˇejšímuuživateli do znaˇcnémíry ulehˇcípráci. Na internetu je možné dohledat spoustu výukových web ˚upro práci v pˇríkazovéˇrádce.Jmol se jeví jako nejuniverzálnˇejšípro práci s parciálními náboji, protože umí dobˇrevizualizovat jak malé organické molekuly, tak i komplexní proteinové struktury. Nevýhodou je pouze delší doba vykreslování u opravdu velkých molekul (5000 atom ˚ua více). Pˇripráci s tímto programem nebyly objeveny žádné závažnˇejšíkomplikace. Poslední stabilní verze a zároveˇnverze použitá v této práci je Jmol v. 12.0 dostupná na internetu zdarma.

Chem3D

Jako jediný software umí zmˇenitvelikost atomu podle parciálního náboje. Umožˇnujevykreslit povrch molekuly dvˇemazp ˚usoby, pokaždé s velice dobrými výsledky. Pˇrivizualizaci povrchu jako transparentního, ˇciv podobˇedrátˇenékostry, vypadá vizualizace v Chem3D nejlépe ze všech zde zmínˇenýchprogram ˚u.Chem3D používá opaˇcnébarevné schéma než ostatní pro- gramy, které se nedá zmˇenit– tzn. záporný náboj je zobrazen modˇrea kladný ˇcervenˇe.Další nevýhodou je, že program neakceptuje na vstupu náboje ze souboru MOL2. Je tedy nutné vy- poˇcítatnáboje pˇrímov programu napˇríkladpomocí rozšíˇrenéHückelovy metody nebo pomocí nástroje MOPAC. Pˇrívykreslování vˇetšíchmolekul ˇcastodochází k chybám. Program je tedy vhodný pˇredevšímpro vizualizaci malých ˇcistˇredníchmolekul, kdy dosahuje dobrých vý- sledk ˚upˇrivizualizaci povrchu i jednotlivých obarvených atom ˚u.Bohužel se jedná o pomˇernˇe drahý, komerˇcnísoftware, dostupný ve zkušební verzi pouze na dobu jednoho mˇesíce.

DSV

V tomto programu lze výsledné vizualizace snadno upravit v nabídce Display style, která umož- ˇnujezmˇenitosvˇetlení,kvalitu, materiál, barvy apod. Program také jako jediný dokáže kromˇe formátu MOL2 vizualizovat i náboje obsažené ve formátu PDBQ. Obsahuje nástroje pro vý- poˇcetparciálního náboje a umožˇnujevyˇcíslithodnoty náboj ˚upomocí popisk ˚u.Je vhodný k

38 4. VÝSLEDKYADISKUSE vizualizaci malých, stˇredníchi velkých molekul. Jedinou nevýhodou je špatné implicitní obar- vení povrchu molekuly – je nutné zmˇenithodnoty min a max pro získání rozumné vizualizace, pˇriˇcemžu nˇekterýchmolekul bývá ˇcastoproblémové zjistit jak tyto hodnoty nastavit.

Mol2mol Tento program dokáže nejlépe vizualizovat náboj na molekulových vazbách (obarvení vazeb je "spojité"). Umožˇnujevýpoˇcetnáboj ˚umetodou Gasteiger. Pˇrímov Mol2mol nelze zmˇenitpo- zadí – zmˇenase musí provést pˇrímov programu POV-Ray editací vstupního POV souboru. Bo- hužel s tímto programem se pracuje nejh ˚uˇre,protože je potˇrebanejprve programem Mol2mol pˇrevéstmolekulu do formátu POV a ten teprve renderovat v POV-Ray. Jelikož Mol2mol ne- podporuje vizualizaci povrchu, je nepoužitelný pro vizualizaci velkých molekul. Pro menší molekuly dosahuje podobných výsledk ˚ujako pˇredchozíprogramy, ale vizualizace se nedají upravit bez dobré znalosti programu POV-Ray a jejich vykreslování trvá nejdéle. Na druhou stranu je možné s molekulou pracovat v POV-Rayi dále jako s grafickým objektem a upravo- vat jej. Tento program je dostupný zdarma po dobu jednoho mˇesíce.Po uplynutí této doby se zablokují nˇekteréd ˚uležitéfunkce.

MOE Program neumí vizualizovat barevnˇeparciální náboje, pouze formou popisku. Dá se použít k výpoˇctuparciálních náboj ˚umetodami: Gasteiger, AMBER 89,94 a 99, MMFF 94 (Merck molecu- lar force field), PM3 (parametric method number 3), AM1 (Austin model 1), AM1-BCC (Austin model 1 with bond-charge corrections), MNDO (modified neglect of diatomic overlap). Což je užiteˇcnézejména u vˇetšíchmolekul, protože vˇetšinasoftwarových nástroj ˚unedokáže vypoˇcítat náboj u velkých protein ˚u,zatímco MOE ano. Za zmínku také stojí možnost vizualizace elek- trostatiky molekuly, která je velmi podobná vizualizaci parciálního náboje. Tyto vizualizace jsou ukázány v pˇrílozena stranách 45 a 46 .

39 4. VÝSLEDKYADISKUSE

4.3.2 Pˇrehledvlastností nástroj ˚u V tabulce 4.3 jsou shrnuty všechny základní funkce a vlastnosti, které analyzované softwarové nástroje nabízejí a které by mˇel dobrý nástroj obsahovat. Celkovˇese nedá ˇríci,který nástroj je nejlepší, protože každý se hodí pro jiné úˇcely. Pro malé a stˇrednímolekuly se jako nejuži- teˇcnˇejšíjeví Jmol, Chem3D a DSV, které mají nejširší možnosti použití. Pro velké proteinové struktury je vhodný naopak pˇredevšímVMD ˇciJmol díky rychlosti vykreslování. Program Mol2mol hodnotím jako nejhorší, protože není schopen vizualizovat molekulu pˇrímo,ale jen pomocí programu POV-Ray. Program MOE má pak využití pˇredevšímdíky možnosti výpoˇctu parciálních náboj ˚uhned nˇekolikar ˚uznýmimetodami a jejich následném uložení ve formtáu MOL2.

Tabulka 4.3: Pˇrehledvlastností nástroj ˚u VMD Jmol Mol2mol Chem3D DSV MOE Podpora datových formát ˚u PDB 1 1 1 1 1 1 PDBQ 0 0 0 0 1 0 MOL2 1 1 1 0/1 1 1 Zobrazení parciálního náboje atomu podle barvy atomu 1 1 1 1 1 0 popisku atomu 0 1 0 0 1 1 velikosti atomu 0 0 0 1 0 0 Modely molekul tyˇcinky 1 1 1 1 1 1 tyˇcinkya kuliˇcky 1 1 1 1 1 1 kalotový model 1 1 1 1 1 1 Zobrazení parciálního náboje povrchu molekuly SASA povrch 0 1 0 1 1 0 izopovrch 1 1 0 1 1 0 vdW povrch 0 1 0 0 1 0 pevný povrch 1 1 0 1 1 0 drátˇenákostra 1 0 0 1 1 0 transparentní 0 1 0 1 1 0 Ostatní výpoˇcetnáboj ˚u 0 0 1 1 1 2 pˇríkazovýˇrádek 1 2 0 0 0 1 podpora skript ˚u 0 2 0 0 0/1 1 export do POV-Ray 1 1 1 0 1 1 dostupnost 2 2 1/2 1 2 1

Nástroje jsou hodnoceny podle následujícího klíˇce:

• "0"– nástroj funkci v ˚ubecnenabízí nebo ji nabízí, ale funkce pro nás není použitelná

• "1"– nástroj funkci nabízí v základní podobˇe

• "2"– nástroj funkci obsahuje a dosahuje s ní vyjímeˇcnýchvýsledk ˚u

40 5 Závˇer

Tato bakaláˇrskápráce se zabývá tématem vizualizace parciálních náboj ˚una atomech v mole- kulách. Parciální náboje jsou reálná ˇcísla,která popisují, jakou ˇcástelektron ˚uz molekuly (tzv. elektronové hustoty) si daný atom pˇritáhnuldo své blízkosti nebo naopak odevzdal jiným ato- m ˚um.Náboje jsou významnými veliˇcinamia ideálním zp ˚usobem,jak o nich chemik ˚uma biolo- g ˚umzprostˇredkovatinformace, je právˇevizualizace. Díky vizualizaci jsme napˇríkladschopni posoudit, kde je náboj na molekule koncentrován a která místa jsou nábojovˇeneutrální. Cí- lem práce bylo nastudovat a popsat r ˚uznézp ˚usobyzobrazování náboj ˚u,vyhledat softwarové nástroje pro vizualizaci náboj ˚u,analyzovat jejich využitelnost a ukázat jejich funkˇcnostna r ˚uz- ných typech molekul. V rámci bakaláˇrsképráce jsem se nejdˇríveseznámil s poˇcítaˇcovýmzápisem molekul a zá- kladními chemickými datovými formáty, kterými jsou napˇríkladPDB a MOL. Kromˇetˇechto obvyklých formát ˚ujsem nastudoval i ménˇestandartní datové formáty, obsahující hodnoty par- ciálních náboj ˚u,jako jsou MOL2, PDBQ a Gaussian. U každého z tˇechtoformát ˚ujsem se de- tailnˇeseznámil se strukturou a jednotlivé formáty popsal v metodické ˇcásti.Z tˇechtodatových formát ˚uje pro práci s parciálními náboji nejd ˚uležitˇejšíformát MOL2, protože je akceptován vˇetšinoupoˇcítaˇcovˇechemických softwar ˚u,zatímco ostatní formáty jsou akceptovány pouze nˇekterýmiz nich. Právˇeformát MOL2 byl použit jako vstup pro veškeré softwarové nástroje použité v této práci. Souˇcástípráce bylo rovnˇežvytvoˇritjednoduchý program Import charges pro konverzi ná- boj ˚uzískaných kvantovˇemechanickými výpoˇctypomocí software Gaussian do formátu MOL2. Program Import charges byl napsán v programovacím jazyce Java. Tento program umožˇnuje snadno vizualizovat i náboje získané pomocí software Gaussian, který je jedním z nejˇcastˇejších softwar ˚upro výpoˇcetnáboj ˚u. Dále jsem se seznámil s r ˚uznýmigrafickými modely molekul a zp ˚usoby, jakými lze v rámci tˇechtomodel ˚uvizualizovat náboj. Obecnˇeje možno tyto modely rozdˇelitna dva typy – modely struktury molekul (napˇr.tyˇcinkovýmodel, kuliˇckya tyˇcinky, kalotový model,...) a modely po- vrchu molekul (napˇr.vdW povrch, SASA povrch, 3D izopovrch,...). Hodnotami parciálního náboje lze pak obarvit bud’ jednotlivé atomy a vazby nebo lze parciální náboj mapovat na po- vrch molekuly. Posledním zp ˚usobemvizualizace náboj ˚uje zobrazení parciálního náboje podle velikosti atom ˚u,kdy velikost kuliˇcekatom ˚uje pˇrímoúmˇernávelikosti parciálního náboje. Poté jsem vyhedal softwarové nástroje pro vizualizaci náboj ˚u.Konkrétnˇejsem se seznámil s tˇemitoprogramy: VMD, Jmol, Chem3D, DSV a Mol2mol. Tyto programy jsem popsal v rámci své práce a zároveˇnk nim poskytuji i základní postupy pro vizualizaci pˇrípadnˇevýpoˇcetpar- ciálních náboj ˚u. Uvedené programy byly dále porovnávány a byla provedena analýza jejich využitelnosti pro vizualizaci náboj ˚una r ˚uznýchtypech molekul. V rámci porovnání byly brány ohledy na nˇekolikfaktor ˚u.Tˇemibyly pˇredevšímmožnost vizualizace parciálního náboje na atomech a vazbách molekuly, možnost vizualizace parciálního náboje na povrchu molekuly a kvalita této vizualizace, dostupnost programu, uživatelské prostˇredía rozšiˇrujícífunkce vzhledem k ostat- ním program ˚um.Pˇripráci s malými ˇcistˇrednímimolekulami, kdy je d ˚uležitápˇredevšímvizu- alizace náboje na atomech a vazbách molekuly, dosahovaly programy VMD, Jmol, Chem3D a DSV témˇeˇrstejných výsledk ˚ua lišily se spíše ve zp ˚usobudosažení tˇechto vizualizací. Program Mol2mol se ukázal jako nejhorší nástroj pro práci s parciálním nábojem – má nejsložitˇejšíovlá- dání a vyžaduje zpracování svých výstup ˚upomocí programu POV-Ray. Pro vˇetšímolekuly, kdy je kv ˚ulipˇrehlednostid ˚uležitápˇredevšímvizualizace parciálního náboje na povrchu mole- kuly, již byla zaznamenána vˇetšídiverzita mezi programy. Z výše jmenovaných nástroj ˚udokáží

41 5. ZÁVERˇ vykreslit parciální náboj na povrch bez vˇetšíchproblém ˚uprogramy VMD a Jmol. Program DSV dosahuje podobných výsledk ˚u,ale je nutno vˇedˇetjak nastavit minimální a maximální hodnotu pˇrimapování barevného schématu na povrch. Bakaláˇrskápráce bude využita pracovníky a studenty v NCBR (Národním centrum pro vý- zkum biomolekul) k získání pˇrehleduo formátech pro zápis náboj ˚ua softwarových nástrojích pro vizualizaci náboj ˚u.Práce poskytuje informace pro vhodnou volbu vizualizaˇcníhosoftware na základˇetypu studovaných molekul.

42 6 Pˇrílohy

6.1 Obsah pˇriloženéhoDVD

• Bakaláˇrskápráce v elektronické podobˇevˇcetnˇezdrojového kódu v systému LATEX • Program Import charges

• Obrázky použité v rámci bakaláˇrsképráce

• MOL2 soubory s molekulamy, které byly vizualizovány v rámci práce

43 6. PRÍLOHYˇ

6.2 Skript Jmol

Pˇripráci s programem Jmol jsem si vytvoˇrilkrátký skript: select all; color atom partialCharge; wireframe; delay 1.5; wireframe 30; delay 1.5; spacefill 30; delay 1.5; spacefill 100; delay 1.5; rotate x 180; zoom 50; delay 1.5; CPK 200; background blue;label %P %e; isoSurface m1 sasurface 0.5 colorscheme bwr property partialcharge; delay 2; isosurface off; isoSurface m2 solvent 1 colorscheme bwr property partialcharge opaque; delay 2; isosurface off; isoSurface m3 molecular colorscheme bwr property partialcharge translucent;

Tyto pˇríkazyuložíme do textového souboru s pˇríponouSPT a otevˇremev programu Jmol. Po spuštˇenískriptu se zobrazí naˇctenámolekula postupnˇev šesti r ˚uznýchvizualizacích. Slouží pouze jako ukázka jednoduchých skriptovacích možností programu Jmol.

6.3 Dodateˇcnévizualizace vytvoˇrenév rámci práce

Obrázek 6.1: Ukázka vizualizace parciálního náboje podle velikosti atomu v Chem3D

Obrázek 6.2: Ukázka pr ˚uˇrezumolekuly hemoglobinu vytvoˇrenéhopˇríkazemSlab 75 v pro- gramu Jmol

44 6. PRÍLOHYˇ

Obrázek 6.3: DSV, drátˇenákostra, nejvyšší rozlišení povrch obarven podle parciálního náboje

(a) pevný povrch (b) povrch, drátˇenákostra

(c) transparentní povrch (d) Transparentní povrch, custom theme

Obrázek 6.4: MOE, Ukázka vizualizace "electrostatics" na povrchu molekuly. Výsledné vizua- lizace jsou podobné vizualizacím parciálního náboje mapovaného na povrch molekuly

45 6. PRÍLOHYˇ

6.4 Vizualizace extra velké molekuly

Na závˇerjsem zkusil vizualizovat dvˇeextrémnˇevelké molekuly pro zajímavost. Menší znich s PDB id "1FO4.pdb"obsahující 22000 atom ˚ua vˇetšímolekulu, obsahující cca 69500 atom ˚us PDB id "2UVB.pdb". U obou molekul selhal openBabel pˇrikonverzi z formátu PDB do MOL2. Náboje se podaˇrilovypoˇcítataž v programu MOE. V programu VMD se podaˇrilonaˇcístmenší molekulu, pˇripokusu vizualizovat vˇetšímolekulu 2UVB došlo k chybˇekv ˚ulinedostatku pa- mˇetipro zpracování obrázku. Obdobná chyba nastala pˇripokusu vizualizovat molekuly v Chem3D. Mol2mol neumí vi- zualizovat povrch ˇcilinepˇripadáv úvahu. Jmol zvládl menší molekulu, po dvou hodinách renderování vˇetšímolekuly pˇrestalprogram reagovat. MOE se choval stejnˇe.Pouze v DSV se podaˇrilomolekulu vizualizovat. Celé renderovaní trvalo cca 3 minuty, výsledek je vidˇetna obrázku 6.5.

(a) VMD, povrch (b) MOE, povrch, electrostatics

Obrázek 6.5: Ukázka vizualizace parciálního náboje na povrchu molekuly s 25000 atomy. V MOE trvalo renderování cca 20,5 minuty

46 6. PRÍLOHYˇ

(a) DSV, povrch (b) DSV, vdW povrch

(c) DSV, SASA povrch

Obrázek 6.6: Ukázka vizualizace parciálního náboje na povrchu molekuly s 69000 atomy. Vy- kreslení obrázku a) a b) trvalo kolem 30 vteˇrin.Vykreslení obrázku c) trvalo cca 2 minuty.

6.5 RasMol

Podle dokumentace programu sice dokáže vizualizovat parciální náboj, ale nepodaˇrilose mˇe naˇcístparciální náboje ze souboru MOL2. Podle dokumentace lze k vizualizaci parciální náboje použít hodnoty "beta factor field" obsažené v PDB souboru, ale ani s tˇemitohodnotami vý- sledná vizualizace neodpovídala oˇcekávanýmvýsledk ˚um.Protože se v programu RasMol ne- podaˇrilodosáhnout správné vizualizace, nebyl tento program zahrnut v mé bakaláˇrsképráci. Ukázka nepovedené vizualizace je na obrázku 6.7.

47 6. PRÍLOHYˇ

Obrázek 6.7: Ukázka neúspˇešnévizualizace parciálních náboj ˚upomocí programu RasMol

6.6 Formát POV

POV-Ray neboli Persistance of Vision Raytracer je datový formát s informacemi pro práci s gra- fikou, ve kterém jsou uloženy informace o tvarech, barvách, texturách, rotacích, nasvíceních, atmosférických efektech a dalších 3D obrazových vlastností. Data jsou opˇetuložena v textovém souboru v ASCII formátu. Datové soubory s pˇríopnou.pov jsou definovány pomocí POV-Ray scene description language, který specifikuje instrukce jak má POV-Ray engine renderovat 3D modely. Obrazová data jsou v souboru reprezentována matematicky. Nˇekteréprogramy mo- lekulárního modelování umí vytváˇretna výstupu datové soubory typu POV, které následnˇe mohou být použity jako vstup do programu POV-Ray. Obecnˇeje struktura tohoto formátu mnohem komplexnˇejší,ale pokud uvažujeme pouze datové soubory vytvoˇrenéjako výstup program ˚umolekularního modelování, tak obsahuje ná- sledující informace obsažené v patˇriˇcnýchsekcích v souboru:

• global settings – globální nastavení souboru

• declarations – deklarace promˇených

• camera – kartézské souˇradnicebodu, odkud má být pohled na výslednou molekulu

• light source – kartézské souˇradnicemísta, kde se nachází zdroj svˇetlaa údaje o nasvícení

• bonds – informace o vazbách, popsány jako grafické objekty - válce o r ˚uznýchkartéz- ských souˇradnicích,barvˇeatd.

• atoms – informace o atomech, popsány jako grafické objekty - kuliˇckyo r ˚uznýchkartéz- ských souˇradnicích,barvˇeatd.

• ˇrádkyunion {molecule} a background {white} - union je pˇríkazpro vykreslení molekuly, background pro nastavení pozadí

Zkušenˇejšíprogramátor m ˚užeopˇetsnadno mˇenitr ˚uznéparametry v souboru a celkový grafický výstup tím upravovat.

48 Seznam obrázk ˚u

2.1 Ukázka model ˚umolekul 3 2.2 Ukázka vdW povrchu pro molekulu cilengitidu 3 2.3 Ukázka 3D izopovrchu pro molekulu cilengitidu 4 2.4 SASA povrch 4 2.5 Ukázka pevného povrchu ˇcástimolekuly DNA 5 2.6 Ukázka drátˇenékostry povrchu ˇcástimolekuly DNA 5 2.7 Ukázka teˇckovanéhopovrchu molekuly cilengitidu 6 2.8 Ukázka transparentního povrchu molekuly cilengitidu 6 2.9 Pˇríkladbarevné škály pro znázornˇenínáboj ˚u 8 2.10 Ukázka zabarvení atom ˚ua vazeb podle hodnot parciálních náboj ˚upro molekulu 2,6-dichlorfenolu 8 2.11 Ukázka velikosti atom ˚upodle hodnoty parciálních náboj ˚upro molekulu cytosinu 9 2.12 Ukázka zabarvení povrchu molekuly podle hodnoty parciálního náboje 9 3.1 Prostˇredíprogramu Open Babel 14 3.2 Prostˇredíprogramu VMD 15 3.3 Ukázka zabarvení atom ˚ua vazeb molekuly podle hodnoty parciálního náboje v programu VMD 16 3.4 Ukázka zabarvení povrchu molekuly podle hodnoty parciálního náboje v programu VMD 17 3.5 Prostˇredíprogramu Jmol 18 3.6 Ukázka vizualizace parciálního náboje pomocí programu Jmol 19 3.7 Prostˇredíprogramu MOE 20 3.8 Ukázka modifikovaného prostˇredíMOE 20 3.9 Ukázka vizualizace parciálního náboje pomocí popisk ˚upomocí programu MOE 21 3.10 Prostˇredíprogramu Chem3D 22 3.11 Ukázka vizualizace parciálního náboje molekuly cholesterolu pomocí Chem3D 23 3.12 Prostˇredíprogramu DSV 24 3.13 Ukázka zabarvení atom ˚ua vazeb molekuly podle parciálního náboje v DSV 25 3.14 Ukázka zabarvení povrchu molekuly podle parciálního náboje v DSV 26 3.15 Prostˇredíprogramu Mol2mol 27 3.16 Ukázka vizualizace parciálního náboje 28 4.1 Molekula 4-nitrofenolu s oˇcíslovanýmiatomy 31 4.2 Graf hodnot parciálních náboj ˚upro r ˚uznémetody a r ˚uznésoftwary 32 4.3 Ukázka vizualizace parciálního náboje na atomech a vazbách malé molekuly 33 4.4 Ukázka vizualizace parciálního náboje na povrchu malé molekuly 34 4.5 Ukázka vizualizace parciálního náboje podle velikosti atomu v programu Chem3D 34 4.6 Ukázka vizualizace parciálního náboje na atomech a vazbách molekuly cilengitidu 35 4.7 Ukázka vizualizace parciálního náboje na povrchu molekuly cilengitidu 36 4.8 Ukázka vizualizace parciálního náboje pro molekulu hemoglobinu 37 6.1 Ukázka vizualizace parciálního náboje podle velikosti atomu v Chem3D 44

49 6. PRÍLOHYˇ

6.2 Ukázka pr ˚uˇrezumolekuly hemoglobinu vytvoˇrenéhopˇríkazemSlab 75 v programu Jmol 44 6.3 DSV, drátˇenákostra, nejvyšší rozlišení povrch obarven podle parciálního náboje 45 6.4 MOE, Ukázka vizualizace "electrostatics" na povrchu molekuly. Výsledné vizualizace jsou podobné vizualizacím parciálního náboje mapovaného na povrch molekuly 45 6.5 Ukázka vizualizace parciálního náboje na povrchu molekuly s 25000 atomy. V MOE trvalo renderování cca 20,5 minuty 46 6.6 Ukázka vizualizace parciálního náboje na povrchu molekuly s 69000 atomy. Vykreslení obrázku a) a b) trvalo kolem 30 vteˇrin.Vykreslení obrázku c) trvalo cca 2 minuty. 47 6.7 Ukázka neúspˇešnévizualizace parciálních náboj ˚upomocí programu RasMol 48

50 Seznam tabulek

4.1 Hodnoty náboj ˚upro molekulu 4-nitrofenolu, poˇcítanépomocí r ˚uznýchmetod a r ˚uznýchsoftwar ˚u 31 4.2 Vizualizované molekuly 32 4.3 Pˇrehledvlastností nástroj ˚u 40

51 Literatura

[1] Leach, A.R.: . Longman, 1996

[2] Jensen, F.: . Wiley, 1999

[3] Leach, A.R., Gillet, V.J.: An introduction to chemoinformatics. Springer, 2005

[4] Bunin, B.A.: Chemoinformatics: Theory, practice, and products. Springer, 2007

[5] McClure, William.: CPK colors [online]. [cit. 5.10.2010]. Dostupné z World Wide Web:

[6] Wikipedia contributors, Wikipedia, The Free Encyclopedia.: Van der Waals surface [on- line]. [cit. 5.10.2010]. Dostupné z World Wide Web:

[7] Wikipedia contributors, Wikipedia, The Free Encyclopedia.: Isosurface [online]. [cit. 5.10.2010]. Dostupné z World Wide Web:

[8] Leach, A.R.: Molecular Modelling: Principles and Applications. Pearson Education EMA, 2001. 2nd ed.

[9] Atkins, P.W.: Physical chemistry. Oxford university press, 1992 J. Gasteiger, M. Marsili, Tetrahedron, 1980, 36, 3219-3228

[10] Gasteiger, J., and Marsili, M. (1978) A new model for calculating atomic charges in mo- lecules, Tetrahedron Letters 19, 3181-3184. Gasteiger

[11] Leach, A.R.: Molecular modelling. Longman, 1996

[12] Chana, Kam, ChemNews.com: Chem3D adds partial charges [online]. [cit. 3.9.2010]. Do- stupné z World Wide Web:

[13] SOURCEFORGE.NET: Jmol Colors [online]. Dostupné z World Wide Web:

[14] Svobodová Vaˇreková,R.:PV082 [online]. [cit. 10.11.2010]. Dostupné z World Wide Web:

[15] PDB FORMAT Version 2.3 [online]. Datum poslední revize 9.6.1998 [cit. 3.1.2011]. Do- stupné z World Wide Web:

[16] AutoDock file formats [online].[cit. 24.12.2010]. Dostupné z World Wide Web:

[17] Open Babel [online]. verze 2.3.0. Datum poslední revize 26.10.2010 [cit. 3.1.2011]. Dostupné z World Wide Web:

[18] Mol2mol homepage [online]. [cit. 28.9.2010]. Dostupné z World Wide Web:

52 [19] Chemical Computing Group: MOE: Molecular operating environment [online]. [cit. 20.8.2010]. Dostupné z World Wide Web:

[20] Research Collaboratory for Structural Bioinformatics: RCSB Protein Data Bank [online]. [cit. 3.9.2010]. Dostupné z World Wide Web:

[21] SYMYX: CTfile formats. SYMYX, 2010, page 43.

[22] Accelrys and SYMYX co. Scientific Informatics Software for Life Sciences [online]. [cit. 15.10.2010]. Dostupné z World Wide Web:

[23] SYMYX: CTfile formats. SYMYX, 2010, page 5.

[24] Frisch, M. J., Trucks, G. W., Schlegel, H. B., Scuseria, G. E., Robb, M. A., Cheeseman, J. R., Montgomery, J. A., Jr., Vreven, T., Kudin, K. N., Burant, J. C., Millam, J. M., Iyengar, S. S., Tomasi, J., Barone, V., Mennucci, B., Cossi, M., Scalmani, G., Rega, N., Petersson, G. A., Nakatsuji, H., Hada, M., Ehara, M., Toyota, K., Fukuda, R., Hasegawa, J., Ishida, M., Nakajima, T., Honda, Y., Kitao, O., Nakai, H., Klene, M., Li, X., Knox, J. E., Hratchian, H. P., Cross, J. B., Bakken, V., Adamo, C., Jaramillo, J., Gomperts, R., Stratmann, R. E., Yazyev, O., Austin, A. J., Cammi, R., Pomelli, C., Ochterski, J. W., Ayala, P. Y., Morokuma, K., Voth, G. A., Salvador, P., Dannenberg, J. J., Zakrzewski, V. G., Dapprich, S., Daniels, A. D., Strain, M. C., Farkas, O., Malick, D. K., Rabuck, A. D., Raghavachari, K., Foresman, J. B., Ortiz, J. V., Cui, Q., Baboul, A. G., Clifford, S., Cioslowski, J., Stefanov, B. B., Liu, G., Liashenko, A., Piskorz, P., Komaromi, I., Martin, R. L., Fox, D. J., Keith, T., Al-Laham, M. A., Peng, C. Y., Nanayakkara, A., Challacombe, M., Gill, P. M. W., Johnson, B., Chen, W., Wong, M. W., Gonzalez, C., Pople, J. A.: Gaussian 03, revision C.02. Gaussian, Inc., 2004

[25] Open Eye Scientific Software: OELib library [online]. [cit. 3.9.2010]. Dostupné z World Wide Web:

[26] Humprey, W., Dalke, A., Schulten, K., VMD - Visual Molecular Dynamics. J. Molec. Gra- phics, 1996, vol. 14, s. 33-38.

[27] Herráez A.: How to use Jmol to study and present molecular structures. Lulu Enterprise, 2008. 144 s. ISBN 978-1-84799-259-8.

[28] Jmol Interactive Script Documentation [online]. Datum poslední revize: 8.11.2010 [cit. 3.12.2010]. Dostupné z World Wide Web:

[29] Chemical Computing Group: Chemical Computing Group [online]. [cit. 20.8.2010]. Dostupné z World Wide Web:

[30] Santavy M., Labute P., Chemical Computing Group: SVL: The Scientific Vector Language [online]. [cit. 20.8.2010]. Dostupné z World Wide Web:

[31] Cambridge Soft: Cambridge Soft Desktop Software – ChemOffice [online]. [cit. 15.9.2010]. Dostupné z World Wide Web: .

53 [32] Cambridge Soft: Cambridge Soft Company [online]. [cit. 15.9.2010]. Dostupné z World Wide Web: .

[33] Accelrys: Visualizer [online]. [cit. 20.12.2010]. Dostupné z World Wide Web: .

[34] Accelrys: Discovery Studio Overview [online]. [cit. 20.12.2010]. Dostupné z World Wide Web: .

[35] Persistance of Vision Raytracer Pty.: POV-Ray - The Persistance of Vision Raytracer [online]. [cit. 18.12.2010]. Dostupné z World Wide Web: .

[36] Pˇrispˇevatelé Wikipedie, Wikipedie: Otevˇrená encyklopedie: Scene Description Langu- age [online], c2008. Datum poslední revize 2. 07. 2008. [cit. 22. 12. 2010] Dostupné z World Wide Web: .

54