UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE FARMACIA DEPARTAMENTO DE MICROBIOLOGÍA II

ANÁLISIS GENÉTICO Y BIOQUÍMICO DEL CATABOLISMO DEL COLESTEROL EN smegmatis mc²155

TESIS DOCTORAL

IRIA UHÍA CASTRO

Madrid, 2010

UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE FARMACIA DEPARTAMENTO DE MICROBIOLOGÍA II

ANÁLISIS GENÉTICO Y BIOQUÍMICO DEL CATABOLISMO DEL COLESTEROL EN mc²155

TESIS DOCTORAL IRIA UHÍA CASTRO

DIRECTORES: Dra. BEATRIZ GALÁN SICILIA Dr. JOSÉ LUIS GARCÍA LÓPEZ

CONSEJO SUPERIOR DE INVESTIGACIONES CIENTÍFICAS CENTRO DE INVESTIGACIONES BIOLÓGICAS

Madrid, 2010

La miro a V. en los ojos, y mis ojos le dicen que soy un pobre buscador en el mundo, que no comprendo nada de mi destino ni del de los demás, que he vivido, y pecado, y creado, y que un día me iré sin haber comprendido nada, en la oscuridad que nos ha parido a todos.

J. J.

En la Ciencia la única verdad sagrada, es que no hay verdades sagradas.

Carl Sagan

A mis padres

AGRADECIMIENTOS

Por si cabe alguna duda, sabed que no se podría entender el trabajo acumulado en estas páginas sin este apartado. Una tesis no son sólo las miles de horas pasadas en el laboratorio intentando que salga ese experimento que no te deja dormir, una tesis es también todo el lado humano que está detrás y que te permite dar lo mejor de ti cada día con ilusión a pesar de los tropiezos. Una tesis es todas las experiencias, buenas y malas, dentro y fuera del laboratorio, acumuladas en estos años, más allá de las pipetas, las electroforesis y los microarrays. No se puede entender lo uno sin lo otro. Por todo eso me es obligatorio dedicar unas líneas a todos los que conformaron el escenario en el que se desarrolló este trabajo, y a todos los que estuvieron entre bastidores. Desde el director hasta el último apuntador, todos son importantes y sin ellos hubiera sido imposible que la obra hubiese empezado y terminado. Es tarea difícil agradecer tantas cosas a tantos en tan poco espacio. Se intentará. Todo sea dicho, os merecéis mucho más.

En primer lugar quiero agradecerle al Doctor José Luis García el haberme “engañado” para realizar la tesis doctoral. Ha sido un camino duro, pero ha merecido la pena. Gracias por tus brillantes ideas, por enseñarme a buscar las mías propias, por intentar que diese lo mejor de mi en todo momento, por saber contagiar esa pasión tan grande que tienes por la ciencia y por aparecer (afortunadamente) como por arte de magia cuando tu presencia es imprescindible y ya empezamos a temer que quizás estés en Vladivostock u otro lugar de nombre más impronunciable si cabe.

Gracias a la Doctora Beatriz Galán (Bea), mi primera compañera de batalla en el mundo nuevo de las micobacerias; empezamos solas ante el peligro rodeadas de Pseudomonas, Escherichia y Azoarcus, ¡pero al final hemos conseguido hacernos un hueco respetable!. Gracias por tus sabios consejos, por enseñarme a ser práctica cuando tiendo al enrevesamiento, por animarme en los momentos de pesimismo científico, por tu actitud siempre positiva y ante todo por ser, además de una gran codirectora de tesis, una estupenda compañera de laboratorio más.

Gracias a todos los miembros de plantilla del grupo de Biotecnología Medioambiental y del grupo de Genética Bacteriana. Creo que uno de los secretos para que un laboratorio funcione a la perfección es que haya entendimiento, cooperatividad y respeto entre los “jefes”; esto siempre influye positivamente en los que estamos más abajo y hace que el ambiente de trabajo sea inmejorable. Felicidades, porque lo habéis conseguido. Gracias al doctor Eduardo Díaz, que nunca deja un cabo suelto, al doctor Manuel Carmona, nuestro experto en evolución, a la doctora Auxiliadora Prieto, maestra de los plásticos, al doctor Rubén López, el patriarca, al doctor Ernesto García, el sentenciador, al doctor Pedro García, eres auténtico, no cambies nunca.

A mis compañeros del día a día: en general gracias a todos porque no creo que hubiese mejores personajes con los que compartir alegrías y penas científicas. Sois los mejores.

En primer lugar me gustaría recordar a Patricia, Cris F y Pepa; prácticamente nos cruzamos, yo entrando de novata y vosotras saliendo hacia vuestra recién estrenada etapa de post doc. Espero que todo os vaya estupendamente.

Gracias a los neumos, tan dispuestos a ayudar en temas científicos como a hacer vídeos al más puro estilo Dogma o a darlo todo con unos abanicos al ritmo de Locomía: Miri, Elisa, José Yuste, Marta, Beatriz, Miriam, Violeta, Susana, Elo. Gracias María del Mar por esas habitaciones rurales compartidas y por tener siempre en la cara esa sonrisa encantadora que ilumina. Gracias Dani, (el más actor de todos los científicos, el más científico de todos los actores) por descubrirme el mundo de la improvisación teatral; aquí tienes una seguidora incondicional. Gracias María por tantas noches imborrables, por el estupendo viaje a Donosti, por todas las historias con un toootal (especialmente aquella de Koldo Matilla), ¡y felicidades por la peque en camino! Ana, Anitaaaaa!!! Muchas gracias por esa alegría y vitalidad que desprendes por cada poro de tu piel y que consigues contagiarnos; gracias por ser la primera en ir a visitarme al 344 cuando aún era territorio recién conquistado y nadie se atrevía a entrar, gracias por tantas y tantas charlas, algunas de camino a casa al borde de la congelación, pero no importa: siempre es un placer hablar contigo. Vales mucho, convéncete de ello.

Seguiré por los que me quedan más cerquita, los biodegradadores, y en primer lugar por el primer laboratorio en el que hice escala recién llegada al grupo: el 342. Gracias Irene por ser tan maja y eficiente y ser un apoyo femenino en aquella primera etapa rodeada de testosterona. Gracias Niño; a ti te tocó ejercer de primer papá pato de una Iria totalmente novata; gracias por tu paciencia, por estar siempre dispuesto ayudar, por no quejarte por robarte espacio de poyata y mesa de ordenador, por intentar siempre hacerme reír y conseguirlo, esos primeros meses y los siguientes dos años. Gracias Gonn, el equilibrio perfecto hecho persona, gracias por ponerme bien el cuello de la bata, por estar siempre ahí para lo que haga falta, científico o no, por tomarte la confianza de vacilarme sin ningún pudor, por nonononono, por los conciertos, por tantas y tantas risas. A mis extremeños favoritos: Blas, Blasete, Bleis: gracias por las conversaciones en la campana y fuera de ella, por sorprenderme siempre con nuevas e insospechadas preguntas sobre lo humano y lo divino, por recomendarme buenas series, por tu cruzada pro-cañas los jueves, por tus ji ji ji, por ser tan maligno pero a la vez tan pedazo de pan, por enseñarme tantos consejillos prácticos en el labo y por supuesto por el cloruro de calcio. Ánimo con el postdoc. ¿Para cuándo una quedada rubenil en Las Vegas? Juan: ha sido un privilegio tenerte sentado detrás gran parte de esta tesis. Gracias por tu paciencia infinita todas las veces (que no fueron pocas) que te asalté con dudas, desde cuánto tiempo se dejaba una ligación hasta cómo se hacía un modelo 3D de proteínas. Y sobre todo por los dibujos de colorines sin los que mi mente cuadriculada todavía no entendería la recombinación homóloga. Te debo más pulpos de los que puedas comer en esta vida. Gracias por los momentos grunge (voy a obviar los momentos Sínkope) y gracias sobre todo, ante todo y a pesar de todo por ser un grandísimo amigo. Aunque intentes esconderte detrás de un gruñón a mí no me engañas: eres de las mejores personas que he conocido.

Gracias al laboratorio de las niñas, el 343, adonde hacía escapadas cuando ya notaba que me estaba masculinizando en demasía. Gracias Tere por ser el mejor ejemplo a seguir y por luchar contra el caos que nos caracteriza a los biodegradadores; gracias Laura, compañera del metal, por tu mente clara (contado por ti cualquier protocolo parece fácil) y por tu ironía y sarcasmo de los que soy fan número uno, gracias también por salvarme la vida (del ordenador) en un momento de crisis vírica de cuyo nombre no quiero acordarme…Gracias Isa Manso, por esa gracia cordobesa y por no perder tu dulzura e inocencia a pesar que tener que lidiar con los caballeros del 342 durante años. Gracias Merche, mi compañera en la conquista de nuevos territorios, por recordarme que lo más importante en la vida es precisamente eso: vivir y disfrutar de cada momento como si fuera el último; por los cotilleos compartidos y por esa naturalidad tan genial que te caracteriza.

A los que llegaron después de mí: Javier, gracias por tu bondad intrínseca e inseparable de tu persona, porque no importa lo apurado que estés, siempre tienes un momento para preguntar ¿qué tal te va? o para ayudar en lo que sea; gracias también por aquel sirtaki sueco y por los momentos Tom Jones a última hora de la tarde. Te deseo toda la suerte del mundo. Gracias Isabel por intentar y lograr el milagro de organizar a los rubenes en tantas ocasiones; después de mi momento de coreógrafa sé lo difícil que es. Gracias junto a Javier por ser los mejores guías posibles en el viaje a León. Gracias Vir por ser un encanto de persona siempre dispuesta a escuchar y a dar cariño, por tus despistes con los que me siento tan identificada, por tus momentos de soprano y por las noches en las que lo dimos todo. Gracias Nina por tu vitalidad incombustible, por las tardes de garrapato y póker y por ser una rubena por derecho propio desde el primer día. Gracias Andrés por tus visitas al 344 que siempre acaban con risas, por las “servesitas en el sésped”, por la sincronización en las coreografías y por ser tan buena gente. Gracias Ana V. por ser la torrejonera más buenaza por dentro y por fuera y por saber mantenernos a raya, que ya sabes que si no nos subimos a la chepa…Espero que Esther ya te haya enseñado a preparar el colesterol. Gracias Esther, mi primera discípula en el complicado mundo de las micobacterias y el colesterol, por no desesperarte conmigo ante mi inexperiencia como profesora; espero haber conseguido transmitirte el legado; gracias por ser tan lista y aprender tan rápido, es genial tener a alguien hombro con hombro trabajando en lo mismo, y gracias por los experimentos de última hora. Millones de gracias Valle, porque sin ti seguiríamos sin creernos la existencia de la colestenona, y esta tesis hubiese sido muy triste; gracias por currarte el método de LC/MS y por ese buen rollo tan genial que te rodea siempre. Gracias José Ramos, el sucesor de Merche en el puesto (¡e outro galego por fin!) por las risas máximas, por predicar ese entusiasmo total por la ciencia y por los ánimos cuando a una lo único que le apetecía era tirar la toalla. ¡A ver si coincidimos en más congresos, calamidad! Por último gracias a aquellos que pasasteis más fugazmente por el laboratorio y a los que merece la pena recordar: Valeria (creo que ni tú ni yo olvidaremos nunca el Shingo mama); Dani (mi primer patito) y Julia (¡que parece que te has quedado con ganas de más y vuelves!).

Fuera ya del grupo, pero aun por los pasillos del CIB, tengo que agradecer a Luque sus visitas al 344 para saquear sin miramientos el cajón de las fuentes de carbono, no sin antes conseguir que perdiésemos completamente el hilo de lo que estábamos haciendo a base de charla. A pesar de ello tus historietas siempre son bien recibidas, creo que ya soy adicta. Gracias a los compañeros microbiólogos con los que compartí experiencias y risas en congresos: Juan, Eli, Fátima…Gracias en general a los becarios del CIB por esas terapias de grupo en el Lekumberri, fiestas y casas rurales que hacen que seamos la envidia de los demás centros; en especial gracias a los organizadores profesionales de eventos del CIB, Carlos y R.. Gracias Marta Fierro por ese cocido en Redilluera que nos salvó de la congelación. Gracias a toda la gente de los distintos servicios del CIB que me han ayudado durante estos años: Proteómica, Secuenciación, Servicio Técnico, Gerencia…Gracias Ana por las conversaciones mopa en mano.

Más allá del CIB me gustaría agradecerle al doctor Julián Perera y a su grupo (Oliver, María, Laura, Vicky, Julio) las “reuniones del colesterol”, que ayudan siempre a ver tu trabajo desde otra perspectiva, a resolver dudas y a plantear nuevas. Ha sido muy bueno poder contar con un apoyo tan cerca. Muchísimas gracias al doctor Carlos Martín y a todo su grupo, en especial al doctor José Antonio Aínsa, por acogerme tan bien en Zaragoza y enseñarme prácticamente todo lo que sé sobre micobacterias, por cederme la cepa Mycobacterium smegmatis mc2155 con la que he trabajado en esta tesis y por su disposición desinteresada para ayudar a lo largo de todos estos años. Gracias al doctor Neil G. Stoker y a la doctora Sharon L. Kendall por el excelente trato recibido durante mi estancia en su laboratorio y por los conocimientos transmitidos. Gracias también a los demás miembros del grupo: Annemmieke, Ricardo y Dunni, siempre dispuestos a ayudarme.

A todos los que me han acompañado a lo largo de estos años en este Madrid (donde también queda un agujero para mí): Isora, Bea, gracias por ese primer año compartido que tuvo mucho de telenovelesco pero también de experiencias compartidas y compañerismo predoctoral entre tres recién llegadas a Madrid y al mundo de la investigación. Iso, creo que aún sigues siendo mi pareja más estable. Bea, gracias por sentarte a mi lado aquel primer día que llegaste tarde. Gracias a las dos sobre todo por haber conseguido superar las piedras que nos encontramos por el camino y seguir ahí. Gracias Andrés, compartimos piso unos pocos meses, pero te quedaste para siempre con nosotras. Gracias por tu cariño, las cotufas, los marujeos, aquel estupendo viaje a Canarias post- DEA…¡Ánimo en la recta final! Gracias Aniña y Sergio, por hacer que me entendéis cuando os hablo de frustraciones científicas, por hacer tan llevadera la convivencia, por las charlas (en persona y vía Facebook) y por los buenos ratos vividos dentro y fuera del hogar. Gracias a Diana por esas cañitas inocentes que acababan en un metro a las 6 de la mañana, ¿cuándo vienes de visita con tu bólido?; gracias a Borja, que sin saberlo también me ha ayudado, gracias a Javi, al que le ha tocado aguantarme en esta recta final.

A los que compartieron conmigo esos años cruciales en los que decidimos nuestro futuro: gracias a las demás Despojos (Isora, Ro, Carol, Bea, Elena, Sara) por seguir haciendo realidad cada año el milagro de reunirnos, por las visitas a Madrid durante estos años, por supuesto por los años de alegrías y penas en la facultad y porque el milagro se siga repitiendo por muuuchos años. Gracias Mar (Mel!), nunca olvidaré esos años de estudios, siestas, gárgolas, Estela, confesiones, Teruel, Trujillo crest, Nessun dorma y risas; Sandriña, la supercampeona que puede con todo, ¡nos dejas a todos quedar mal! Gracias por tu enorme cariño que no sé como te cabe en ese cuerpecito y por todos los momentos sala rosa compartidos aquí con la anterior y con tantas otras personas y personajes que pasaron por Cadarso.

Gracias Sara por ¿23 años ya? (madre mía) de amistad ininterrumpida; qué te voy a decir a ti, sé que te tengo para lo que haga falta y no dudes que tú me tienes a mí también. Gracias Leti por las escapaditas a Madrid, y por tener siempre una sonrisa y una palabra de ánimo preparadas; gracias a los del “insti”, porque da igual cuánto haga que no nos vemos, cuando quedamos es como si hubiésemos hablado el día anterior, gracias por todos estos años y por tantos momentos inolvidables compartidos: Ana, Carmen, Antía, Héctor, Juan. No importa dónde acabemos cada uno, siempre nos quedará Vigo.

Gracias Edith y Carlos, por animarme a pedir la Beca de Introducción a la Investigación sin la que todo esto no hubiese sido posible; gracias también por el apoyo y los ánimos que me habéis dado a lo largo de estos años, ayuda mucho que crean en ti en los momentos en que una ya no sabe ni en qué creer. Gracias al sector “Villa” (Alfredo, Marisa, Quiqui, Marcos, Alicia, Celia, Víctor…) por ofrecerme gustosamente en repetidas ocasiones vuestro cuerpo para inyectaros comedoras de lorzas, por preguntarme siempre qué tal me va con mi tesis (e incluso intentar entender de qué va) o simplemente y ante todo por estar ahí para lo que haga falta, que es lo que realmente define a una familia, más que la sangre o los genes compartidos.

Gracias Papá y Mamá por quererme tanto, apoyarme siempre y animarme a que siga mis sueños, aunque eso signifique que esté lejos, que ya sé que preferiríais que estuviese más a mano…Gracias por estar tan orgullosos de mí aunque no merezca ni la mitad de tanto orgullo, gracias por aceptarme como soy y por tener la culpa en gran medida de que sea como soy; sin duda sois las dos personas más importantes de toda esta lista y de todo este libro.

Ha sido un placer.

Índice

ÍNDICE

ABREVIATURAS vii

I. INTRODUCCIÓN 1 1. El colesterol y los compuestos esteroideos 3

1.1 Esteroides y esteroles 3 1.2 El colesterol y moléculas derivadas en animales 4

1.3 Impacto ambiental del colesterol y de las moléculas derivadas del

colesterol 9 2. Rutas microbianas de degradación de compuestos esteroideos 10

2.1 Degradación aeróbica de esteroides 12 2.1.1 Degradación aeróbica del colesterol 14 2.1.2 Enzimas responsables de la transformación de colesterol en 4-

colesten-3-ona 20 2.1.2.1 Enzimas con actividad colesterol oxidasa 20

2.1.2.2 Enzimas con actividad 3-β hidroxiesteroide deshidrogenasa 22

2.2 Degradación anaeróbica de esteroides 23 3. Regulación de las rutas de degradación de compuestos esteroideos 25

4. Mecanismos de transporte del colesterol 25 5. Degradación aeróbica del colesterol y compuestos esteroideos en el género Mycobacterium 27

II. OBJETIVOS 33

III. MATERIALES Y MÉTODOS 37

1. Cepas bacterianas, plasmidos y oligonucleótidos utilizados 39

2. Medios y condiciones de cultivo 45 2.1 Escherichia coli 45

2.2 Mycobacterium smegmatis 45 3. Transformación de las células 48 3.1 Transformación de Escherichia coli 48

3.2 Transformación de Mycobacterium smegmatis 48 3.2.1 Preparación de células electrocompetentes 48

3.2.2 Electroporación 49

i Índice

4. Técnicas de DNA 49 4.1 Electroforesis de DNA en geles de agarosa 50 4.2 Extracción de DNA cromosómico de micobacterias 50 4.3 Aislamiento de DNA plasmídico 51 4.4 Reacción de amplificación en cadena con DNA polimerasa termorresistente (PCR) 51 4.5 Secuenciación de DNA 51 4.6 Construcción de cepas mutantes de Mycobacterium smegmatis mc2155 mediante mutagénesis insercional 52 4.7 Construcción de cepas mutantes de Mycobacterium smegmatis mc2155 mediante deleción por recombinación homóloga 55 5. Técnicas de proteínas 58 5.1 Obtención de los extractos proteicos 58

5.1.1 Extractos de Escherichia coli 58 5.1.2 Extractos de Mycobacterium smegmatis 58

5.2 Electroforesis en geles de poliacrilamida-SDS 59 5.3 Purificación de la proteína KstR 59 5.4 Ensayos enzimáticos 60

5.4.1 Ensayos in vitro de actividad productora de 4-colesten-3-ona para análisis mediante TLC y LC/MS 60 5.4.2 Ensayos in vivo de actividad productora de 4-colesten-3-ona para

análisis mediante TLC y LC/MS 62 6. Ensayos de unión DNA-Proteína 63

6.1 Marcaje de sondas con 32P 63 6.2 Ensayos de retardo en gel 63 6.3 Ensayos de protección frente a la digestión con DNasa I (footprinting) 64

7. Técnicas de RNA 65 7.1 Extracción de RNA de micobacterias 65

7.2 Retrotranscripción seguida de reacción de PCR (RT-PCR semicuantititiva) 66

7.3 Retrotranscripción para PCR en tiempo real 66 7.4 PCR en tiempo real (q-PCR) 67

7.5 Análisis genómico de M. smegmatis bajo diferentes condiciones de

cultivo mediante microarrays de RNA 67

ii Índice

7.5.1 Síntesis y marcaje del cDNA 68

7.5.2 Hibridación de los microarrays 69 7.6 Técnica de primer extension o extensión con cebador 70 8. Cromatografía líquida/espectrometría de masas (LC/MS) 72

9. Cromatografía en capa fina (TLC) 74 10. Análisis de los datos de secuencia 74

IV. RESULTADOS 77 1. Potencial catabólico de compuestos esteroideos y caracterización

genética in silico y mediante RT-PCR de la ruta de degradación del colesterol en M. smegmatis mc2155 79 1.1 Crecimiento de M. smegmatis mc2155 en distintos esteroides 79

1.2 Identificación y caracterización in silico de genes de M. smegmatis y M. tuberculosis implicados en el metabolismo del colesterol 82

1.3 Validación de los genes identificados in silico mediante análisis de su

expresión por RT-PCR 89 1.4 Búsqueda de un indicador genético de degradación de esteroides en

bacterias 95 2. Estudio de enzimas que catalizan la transformación de colesterol en 4 colesten-3-ona 97

2.1 Análisis in silico de genes que codifican actividad colesterol oxidasa o deshidrogenasa 98

2.1.1 MSMEG_1604 98

2.1.2 MSMEG_5228 103 2.2 Análisis mediante RTq-PCR de la expresión diferencial en colesterol de los

genes MSMEG_1604 y MSMEG_5228 108 2.3 Clonación y expresión heteróloga de los genes MSMEG_1604 y MSMEG_5228 109

2.3.1 Clonación de los genes MSMEG_1604 y MSMEG_5228 109 2.3.2 Expresión heteróloga de MSMEG_1604 111

2.3.3 Expresión heteróloga de MSMEG_5228 112

2.4 Ensayos enzimáticos mediante TLC con colesterol marcado con 14C 112

2.4.1 Experimentos in vitro con ChoDMS y 3-β HSDMS. Cinética enzimática 113

2.4.2 Detección de la actividad de ChoDMS in vivo 116

iii Índice

2.5 Ensayo de ChoDMS y 3-β HSDMS mediante LC/MS 117

2.6 Ensayo de afinidad de ChoDMS por el colesterol 119 2.7 Mutagénesis de MSMEG_1604 y MSMEG_5228 121 2.7.1 Ensayos de crecimiento en colesterol de los distintos mutantes 121

2.7.2 Ensayos de sobrenadante de cultivo en colesterol de los distintos mutantes mediante TLC 123

2.7.3 Ensayos de sobrenadante de cultivo en colesterol de los distintos

mutantes mediante LC/MS 124 2.8 Búsqueda de nuevas enzimas con actividad colesterol

oxidasa/deshidrogenasa: SDRMS 127 2.8.1 Análisis in silico de genes ortólogos a acmA 128 2.8.2 Análisis mediante RTq-PCR de la expresión diferencial en colesterol

del gen MSMEG_5233 132 2.8.3 Clonación y expresión heteróloga del gen MSMEG_5233 133

2.8.4 Cinética enzimática de SDR mediante TLC con colesterol marcado MS con 14C 136

2.8.5 Ensayos mediante LC/MS de SDRMS 137

2.8.6 Mutagénesis del gen MSMEG_5233 139 2.8.6.1 Ensayos de crecimiento con el mutante M. smegmatis::MSMEG_5233 139

2.8.6.2 Análisis de la composición del sobrenadante de cultivo en colesterol del mutante M. smegmatis::MSMEG_5233

mediante TLC 140

2.8.6.3 Ensayos de sobrenadante de cultivo en colesterol del mutante M. smegmatis::MSMEG_5233 mediante LC/MS 141

3. Análisis genómico mediante microarrays de la ruta de degradación del colesterol 144 3.1 Resultados de los análisis mediante microarrays del genoma de M.

2 smegmatis mc 155 145 3.2 Validación de los resultados de expresión obtenidos con los microarrays

mediante RTq-PCR 170

4. Estudio mediante mutagénesis insercional de diversos genes implicados en el metabolismo del colesterol 172

4.1 Estudio mediante mutagénesis insercional del gen MSMEG_6036 173

iv Índice

4.2 Estudio mediante mutagénesis insercional del gen MSMEG_1366 175

4.3 Estudio mediante mutagénesis insercional del gen MSMEG_5995 177 4.4 Estudio mediante mutagénesis insercional del gen MSMEG_0217 180 4.5 Estudio mediante mutagénesis insercional del gen MSMEG_1543 181

4.6 Estudio mediante mutagénesis insercional del gen MSMEG_3519 182 5. Introducción al estudio de la regulación transcripcional del catabolismo

del colesterol por las proteínas represoras KstR y KstR2 183

5.1 Ensayos de crecimiento con los mutantes de los reguladores KstR y KstR2 184 5.2 Introducción al estudio del represor transcripcional KstR 185

5.2.1 Caracterización del promotor P5228 186 5.2.1.1 Identificación del sitio de inicio de la transcripción del promotor

P5228 187

5.2.2 Regulación del promotor P5228 por KstR 189

5.2.2.1 Clonación, hiperexpresión y purificación de la proteína KstRMsm 190

5.2.2.2 Unión de KstR a la región intergénica 5228 192

5.2.2.3 Determinación de las regiones operadoras de KstR en la región promotora de MSMEG_5228 194

5.3 Estudio de la regulación mediada por KstR2 mediante la técnica de microarrays 196 5.3.1 Resultados de los análisis mediante microarrays de M.

smegmatisΔkstR2 197

V. DISCUSIÓN 201

1. Estudio del potencial catabólico de degradación de esteroides de M. smegmatis mc2155 203

2. Análisis de las enzimas que catalizan la transformación de colesterol en 4- colesten-3-ona en M. smegmatis mc2155 204 3. Análisis global de los genes inducidos diferencialmente en colesterol en

2 M. smegmatis mc 155 209 4. Estudio de los reguladores transcripcionales KstR y KstR2 220

VI. CONCLUSIONES 227

VII. BIBLIOGRAFÍA 231

v

vi Abreviaturas

ABREVIATURAS

A: Adenina AD: 4-androstadien-3,17-diona ADD: 1,4-androstadien-3,17-diona r Ap : Resistencia a ampicilina APCI+: Ionización química a presión atmosférica at: Atmósfera ATP: Adenosina trifosfato Bq: Bequerelio BSA: Seroalbúmina bovina C: Citosina ºC: Grado centígrado cDNA: DNA complementario Ci: Curio CO: Colesterol oxidasa CoA: Coenzima A C-terminal: Carboxilo terminal Cy3: Cianina 3 Cy5: Cianina 5 Cy3-dCTP: Desoxicitosina trifosfato marcado con cianina 3 Cy5-dCTP: Desoxicitosina trifosfato marcado con cianina 5 Da: Dalton dATP: Desoxiadenina trifosfato dCTP: Desoxicitosina trifosfato DEPC: Dietilpirocarbonato dGTP: Desoxiguanina trifosfato 3,4-DHSA: 3,4-dihidroxi-9,10-secoandrosta-1,3,5(10)-trien-9,17-diona DMSO: Dimetilsulfóxido DNA: Ácido desoxirribonucleico DNasa: Desoxirribonucleasa DNP: 2,4-Dinitrofenol

vii Abreviaturas dNTP: Desoxinucleótido trifosfato

DO600: Densidad óptica medida a 600 nanómetros DOHNAA: Ácido 9,17-dioxo-1,2,3,4,10,19-hexanorandrostan-5-oico 4,9-DSHA: Ácido 4,5,9,10-diseco-3-hidroxi-5,9,17-trioxoandrosta-1(10), 2-dien-4- oico DTT: Ditiotreitol http: Desoxitimidina trifosfato ε: Coeficiente de extinción molar EDTA: Ácido etilendiaminotetracético FAD: Dinucleótido de flavina y adenina oxidado FDR: False Discovery Rate G: Guanina g: gramo g: Unidades de fuerza G r Gm : Resistencia a gentamicina GTP: Guanosina trifosfato h: Hora HEPES: Ácido 4-(2-hidroxietil)-1-piperacinetanosulfónico 3-HAS: 3-hidroxi-9,10-secoandrosta-1,3,5(10)-trien-9,17-diona HTH: Dominio hélice-giro-hélice IPTG: Isopropil-β-D-tiogalatopiranósido Kb: 1000 pares de bases kDa: 1000 dalton r Km : Resistencia a kanamicina kV: Kilovoltio L: Litro LB: Medio de cultivo Luria-Bertani LC/MS: Cromatografía líquida acoplada a espectrometría de masas μCi: 10−6 curios μF: 10−6 faradios μg: 10−6 gramos μl: 10−6 litros

viii Abreviaturas

μM: Micromolar M: Molar MCS: Sitio de clonación múltiple mg: miligramo min: Minuto ml: Mililitro mM: Milimolar MOPS: Ácido 3-(N-morfolin) propanosulfónico mRNA: RNA mensajero MS/MS: Espectrometría de masas tándem m/z: Relación masa/carga NAD: Nicotinamina-adenina-dinucleótido oxidado NADH: Nicotinamina-adenina-dinucleótido reducido NADP: Fosfato de nicotinamina-adenina-dinucleótido oxidado NADPH: Fosfato de Nicotinamina-adenina-dinucleótido reducido ng: Nanogramo nM: Nanomolar nm: Nanómetro N-terminal: Amino terminal Ω: Ohmio ORF: Marco abierto de lectura P: p-valor PAGE: Electroforesis en gel de poliacrilamida pb: Pares de bases PCR: Reacción de amplificación en cadena con DNA polimerasa termorresistente PDB: Protein Data Bank PIPES: Sal disódica del ácido piperazina-N, N-bis2 etano sulfónico pmol: Picomol PMSF: fenil metanosulfonilfluoruro p/v: relación peso/volumen RBS: Sitio de unión al ribosoma RNA: Ácido ribonucleico

ix Abreviaturas

RNasa: Ribonucleasa rpm: Revoluciones por minuto RT-PCR: Reacción de retrotranscripción acoplada a PCR RTq-PCR: Reacción de retrotranscripción acoplada a PCR en tiempo real s: Segundo SD: Secuencia Shine-Dalgarno de unión al ribosoma SDR: Superfamilia de las deshidrogenasas/reductasas de cadena corta SDS: Dodecilsulfato sódico SSC: Tampón citrato sódico salino T: Timina TAE: Tampón Tris-Acetato-EDTA TBE: Tampón Tris-Borato-EDTA TE: Tampón Tris-EDTA TLC: Cromatografía en capa fina Tris: Trihidroximetilaminometano tRNA: RNA de transferencia U: Unidad de actividad enzimática V: Voltio v/v: Relación volumen/volumen X-gal: 5-Bromo-4-cloro-3-indolil-β-D-galactopiranósido

ABREVIATURAS PARA AMINOÁCIDOS:

Ala (A): Alanina Gly (G): Glicina Pro (P): Prolina Arg (R): Arginina His (H): Histidina Ser (S): Serina Asn (N): Asparragina Ile (I): Isoleucina Thr (T): Treonina Asp (D): Aspártico Leu (L): Leucina Trp (W): Triptófano Cys (C): Cisteína Lys (K): Lisina Tyr (Y): Tirosina Gln (Q): Glutamina Met (M): Metionina Val (V): Valina Glu (E): Glutámico Phe (F): Fenilalanina

x Introducción

I. INTRODUCCIÓN

1 Introducción

2 Introducción I. INTRODUCCIÓN

1. El colesterol y los compuestos esteroideos

1.1 Esteroides y esteroles

Los esteroides son compuestos de gran importancia en biología, medicina y química que se encuentran ampliamente distribuidos en el medio ambiente. Su estructura contiene un esqueleto de ciclopentanoperhidrofenantreno o un esqueleto derivado de éste por rotura de uno o más enlaces o contracción o expansión de los anillos (Fig. 1 A). Este esqueleto consiste en cuatro anillos fusionados, tres de seis carbonos y uno de cinco carbonos, que se nombran con las letras A-D. Este núcleo esteroideo es prácticamente plano y relativamente rígido de tal manera que los anillos fusionados no permiten la rotación en los enlaces C-C. Normalmente aparecen grupos metilo en las posiciones C-10 y C-13 y en la posición C-17 puede aparecer una cadena lateral tipo alquilo (JCBN, 1989).

Los esteroles son compuestos esteroideos que poseen un grupo hidroxilo en la posición C-3 y que conservan la mayor parte del esqueleto del colestano, formado por el núcleo esteroideo y una cadena lateral de 8 átomos de carbono en el carbono 17 (Fig. 1 B). En la cadena lateral suelen presentar más átomos de carbono (JCBN, 1989). Entre los esteroles de origen natural destacan los fitosteroles en plantas, el ergosterol en hongos y levaduras, y el colesterol en células animales. Todos ellos desempeñan una importante función como agentes estabilizantes de las membranas celulares de los organismos en los que se encuentran y como precursores de una gran variedad de productos con actividades biológicas específicas.

El colesterol (3-hidroxi-5,6-colesteno) (Fig. 2) es un esterol de 27 átomos de carbono en el que el grupo hidroxilo adopta una configuración β. Este alcohol policíclico ha sido una de las moléculas biológicas más estudiadas, ya que es un componente esencial de todos los tejidos animales (Bloch, 1965). El colesterol es

3 Introducción

una de las moléculas más comunes en la naturaleza, donde se encuentra formando parte de las membranas celulares de las células animales, aunque también se encuentra en algunos organismos procariotas, como se comentará más adelante.

21 20 22 18 24 12 12 13 17 23 25 27 11 11 17 19 13 D 16 16 1 9 C 1 10 26 2 14 2 9 14 8 15 AB 10 8 15 3 7 3 5 5 7 4 6 4 6

A B

Figura 1. Estructura química del ciclopentanoperhidrofenantreno (A) y del colestano (B).

La nomenclatura de los átomos de carbono y de los anillos está indicada en la figura.

1.2 El colesterol y moléculas derivadas en animales

21 20 22 18 24 12 23 25 27 11 17 19 CD13 1 16 26 2 9 14 15 AB10 8 3 7 HO 5 4 6

Figura 2. Fórmula química del colesterol. La nomenclatura de los átomos de carbono y de los anillos está indicada en la figura.

4 Introducción

Aunque es una molécula esencial para muchos animales, incluido el ser humano, los mamíferos no requieren el colesterol en la dieta, ya que todas las células pueden sintetizarlo a partir de precursores simples. Aunque la estructura de los esteroles sugiere una ruta biosintética complicada, en los organismos eucariotas se sintetizan a partir de subunidades simples de isopreno. La síntesis de colesterol en animales tiene lugar en cuatro etapas, mostradas resumidamente en la figura 3. Esta síntesis es particularmente activa en el hígado, corteza renal, piel, intestino y en la aorta (Bloch, 1965). Dado que la cantidad total de colesterol (absorbido más sintetizado) sobrepasa la cantidad requerida por el organismo para atender al normal funcionamiento celular, parte de ese colesterol debe ser eliminado. Debido a que los mamíferos carecen de las enzimas necesarias para degradar el núcleo del colesterol, este se excreta tal cual, con pequeñas modificaciones estructurales o bien transformado en otros compuestos esteroideos (ácidos biliares u hormonas esteroideas) (Björkhem y Eggertsen, 2001).

5 Introducción

3 CH3-COS-CoA Acetil-CoA

1

CH3 - OOC-CH2-C-CH2-OH Mevalonato OH

2

O O CH3 - CH2 C-CH2-CH2-O-P-O-P-O Isopreno activado

-O -O 3

4

Escualeno Colesterol HO

Figura 3. Resumen de la ruta biosintética del colesterol en animales. 1) Condensación de tres unidades de acetato para formar un intermediario de seis átomos de carbono, el mevalonato. Tres moléculas de acetil-CoA se condensan para formar el compuesto ß-hidroxi-ß-metilglutaril-CoA (HMG-CoA). La enzima HMG-CoA reductasa cataliza la reducción de HMG-CoA a mevalonato. 2) Conversión del mevalonato a unidades activadas de isopreno; 3) polimerización de seis unidades de isopreno para formar el escualeno, estructura lineal de 30 carbonos; y 4) ciclación del escualeno para formar los cuatro anillos del núcleo esteroideo, con una serie de cambios más (oxidaciones, eliminación o migración de grupos metilo) hasta la formación del colesterol (Nelson y Cox, 2004).

Como ya se ha comentado anteriormente, el colesterol tiene una gran importancia metabólica, ya que es el precursor inmediato de un gran número de sustancias tales como vitaminas, hormonas esteroideas y ácidos biliares (Fig. 4)

6 Introducción

(Björkhem y Eggertsen, 2001; Miller, 1988). Todas las hormonas esteroideas derivan del colesterol (Fig. 4). En la corteza de la glándula adrenal se sintetizan dos clases de hormonas esteroideas: los mineralocorticoides, que controlan la + - - reabsorción de iones inorgánicos (Na , Cl , y HCO3 ) por el riñón, y los glucocorticoides, que afectan al metabolismo de proteínas y carbohidratos (participan en la regulación de la gluconeogénesis, por ejemplo), reducen la respuesta inmune, la inflamación y las respuestas alérgicas. Las hormonas sexuales se producen en las gónadas masculinas y femeninas y en la placenta. Entre ellas se encuentran la progesterona, que regula el ciclo reproductivo femenino, y los andrógenos (como la testosterona) y estrógenos (como el estradiol), que influyen en el desarrollo de los caracteres sexuales secundarios masculinos y femeninos, respectivamente. La síntesis de estas hormonas requiere la eliminación de algunos o todos los carbonos de la cadena lateral situada en el carbono 17 del anillo D del colesterol. Esta eliminación de la cadena lateral tiene lugar en la mitocondria de los tejidos esteroidogénicos, e incluye la hidroxilación de dos carbonos adyacentes en la cadena lateral (carbonos 20 y 22) seguida de la rotura de la unión entre ellos. La formación de las diversas hormonas también envuelve la introducción de átomos de oxígeno. Todas las reacciones de hidroxilación y oxigenación están catalizadas por enzimas oxidasas de función mixta que utilizan NADPH, O2 y el citocromo P-450 mitocondrial. Los ácidos y sales biliares (Fig. 4) son derivados hidrofílicos del colesterol que tienen un papel importante en la digestión, donde participan en la emulsión de las grasas de la dieta. Por último, la vitamina D también deriva de la molécula de colesterol. La vitamina D3 (Fig. 4), también llamada colecalciferol, se forma normalmente en la piel a partir del 7-deshidrocolesterol en una reacción fotoquímica catalizada por el componente ultravioleta de la luz solar. Posteriormente es convertida por enzimas en el hígado y los riñones a 1,25-dihidroxicolecalciferol, la hormona activa, que regula la absorción de calcio en el intestino y los niveles de calcio en riñones y hueso (Nelson y Cox, 2004).

7 Introducción

HO Colesterol

ÁCIDOS BILIARES HORMONAS ESTEROIDEAS VITAMINA D3 (colecalciferol)

O O OH NH

- SO3

HO OH HO Pregnenolona HO

O

O Progesterona

OH OH

O O OH OH O OH HO OH HO

O HO O O

Cortisol Aldosterona Testosterona Estradiol (glucocorticoide) (mineralocorticoide) (andrógeno) (estrógeno)

Figura 4. Estructura química de algunas de las moléculas derivadas del colesterol.

El colesterol es un compuesto popularmente conocido por los nocivos efectos que causa su excesiva concentración en nuestro organismo y por las numerosas estrategias que se han desarrollado para la prevención de dichos efectos a través de la promoción y divulgación de las dietas bajas en colesterol (Denke, 1995). Cuando la suma del colesterol sintetizado e ingerido en la dieta excede la cantidad

8 Introducción requerida para la síntesis de membranas, sales biliares y esteroides, pueden desarrollarse acumulaciones patológicas del mismo en los vasos sanguíneos (placas arterioscleróticas) que resultan en su obstrucción (arteriosclerosis). El fallo cardíaco debido a la obstrucción de arterias coronarias es una de las principales causas de muerte en la sociedad industrializada. Por otro lado, muchos de los derivados del colesterol o de los compuestos con él relacionados poseen un gran valor como intermediarios en la síntesis de esteroles y esteroides de interés farmacológico, por lo que durante décadas la industria químico-farmacéutica les ha prestado gran atención (Demain, 1992; Sedlaczek y Smith, 1988).

1.3 Impacto ambiental del colesterol y de las moléculas derivadas del colesterol

Entre los miles de nuevos compuestos contaminantes vertidos al medio ambiente como consecuencia de la actividad humana, se observa, cada vez con más frecuencia, la aparición en diferentes ecosistemas de numerosas moléculas que poseen estructura esteroídica o que son derivados directos de compuestos que poseen dicha estructura. Muchos de esos compuestos poseen potentes actividades metabólicas que afectan a un gran número de procesos celulares (algunos de ellos tan esenciales como la proliferación celular, control de ciclo celular, mecanismos básicos de reconocimiento intercelular, etc.) por lo que su presencia y/o acumulación en determinados nichos ecológicos puede causar efectos muy perjudiciales sobre la salud humana y alterar los ciclos biológicos de las especies que forman parte de esos ecosistemas. La contaminación procede en parte como resultado de diversas actividades industriales, pero también de los efluentes municipales, que son hoy en día una de las mayores fuentes de emisión de estos residuos, ya que esos vertidos no sólo aportan hidrocarburos, pesticidas, surfactantes y distintos metales, sino que también aportan esteroles y esteroides de origen natural y sintético. En este sentido, recientemente los productos farmacéuticos y los denominados productos para el cuidado personal (PPCPs) han sido clasificados como una clase emergente de contaminantes de especial relevancia para los medios acuáticos

9 Introducción

(Gagné et al., 2006). Entre estos productos se encuentran muchos compuestos de naturaleza esteroídica de origen farmacéutico. Así por ejemplo el anticonceptivo sintético oral 17α-etinilestradiol es considerado responsable, junto con los estrógenos 17β-estradiol y estrona de causar la producción de vitelogenina (feminización) en peces macho (Daughton y Ternes, 1999). Este fenómeno de feminización fue observado por vez primera en lagunas de tratamiento de aguas residuales a mediados de los años 80 (Routledge et al., 1998). Además, hay que señalar que el colesterol es el principal componente de la lanolina, y este y otros esteroles relacionados son contaminantes naturales bastante resistentes al tratamiento anaeróbico que se lleva a cabo sobre los efluentes procedentes del lavado industrial de la lana (Poole y Cord-Ruwisch, 2004). Estos efluentes derivados del lavado de la lana están expresamente reconocidos como altamente contaminantes por la legislación española nacional y autonómica que regula el impacto ambiental de los residuos industriales. La cantidad de estrógenos procedentes de fuentes animales es de menor importancia que la procedente de aguas residuales, pero los residuos de estiércol contribuyen de manera importante a su entrada en el medio ambiente (Hanselman et al., 2003; Raman et al., 2004). El estiércol procedente de ganado y aves de corral también es considerado una fuente de testosterona ambiental (Lee et al., 2003).

2. Rutas microbianas de degradación de compuestos esteroideos

Aunque se trata de moléculas naturales muy abundantes en la biosfera, el colesterol y sus derivados son relativamente resistentes a la degradación microbiana. El hecho de que el colesterol sea una molécula recalcitrante es atribuido al bajo número de grupos funcionales (un único doble enlace C-C y un sólo grupo hidroxilo), a su baja solubilidad en agua (3 x 10-8 M) y a la complejidad de su conformación espacial. Su hidrofobicidad y baja volatilidad hacen que sean compuestos en los que su absorción a fases sólidas es significativa en cuanto a su presencia en el medio natural. Así por ejemplo, estudios acerca de la absorción del estradiol en sedimentos fluviales predicen que menos del 1% del esteroide

10 Introducción presente puede ser movilizado por sedimentos resuspendidos (Holthaus et al., 2002). Por su alto índice de persistencia, el colesterol y algunos de sus derivados primarios, como el coprostanol, son ubicuos y se utilizan como biomarcadores de referencia en algunos análisis de contaminación medioambiental (Veiga et al., 2005). Centrándonos en la degradación bacteriana del colesterol, hay que señalar que, por su importancia, este compuesto no ha pasado desapercibido y así la búsqueda de microorganismos capaces de degradar colesterol se inició hace más de 70 años. Ya a principios del siglo XX se observó que varias especies de Mycobacterium podían utilizar el colesterol como única fuente de carbono y energía (Söhngen, 1913). Años más tarde se comprobó que microorganismos pertenecientes al género Proactinomyces eran capaces de degradar parcialmente el colesterol añadido al medio de cultivo y que algunos de ellos, en particular P. erytrhopolis, posteriormente renombrado como Rhodococcus erythropolis, acumulaba ciertos compuestos estructuralmente relacionados con el colesterol, lo que ponía de manifiesto su capacidad para transformar esta molécula y su uso potencial para obtener nuevos derivados esteroídicos (Turfitt, 1944; Turfitt, 1948). Además se comprobó que ciertas especies de Azotobacter podían transformar el colesterol en 4-colesten-3-ona o en 7-deshidrocolesterol y que muchas de ellas hidrolizaban la cadena lateral generando metilheptanona que se acumulaba en el medio de cultivo (Horvath y Kramli, 1947). Whitmarsh demostró que ciertas especies de Nocardia aisladas del suelo eran capaces de hidrolizar la cadena lateral del colesterol transformando esta molécula en diferentes derivados esteroídicos, muchos de los cuales tenían características parecidas a ciertas hormonas sexuales (Whitmarsh, 1964). Otros autores pusieron de manifiesto que distintas bacterias pertenecientes a los géneros Nocardia, Arthrobacter, Bacillus, Brevibacterium, Corynebacterium, Streptomyces, Microbacterium, Serratia, Achromobacter, Pseudomonas o Protaminobacter, entre otras, eran capaces de degradar total o parcialmente el colesterol y otros esteroles (Arima et al., 1969; Brown y Peterson, 1966; Chipley et al., 1975; Ferreira y Tracey, 1984; Martin, 1977; Nagasawa et al., 1969; Tak, 1942), si bien hay que decir que muchas de estas cepas hoy en día se clasifican de diferente manera. A este respecto hay que

11 Introducción señalar que Owen y colaboradores describieron en 1983 una cepa de Pseudomonas con capacidad para mineralizar el colesterol, Pseudomonas sp. NCIB 10590, la única Gram-negativa con capacidad de utilizar el colesterol como única fuente de carbono y energía en aerobiosis descrita por el momento (Owen et al., 1983). Desgraciadamente, la capacidad de esta cepa para degradar colesterol no ha podido ser reproducida en nuestro laboratorio, ya que el único cultivo que actualmente se conserva de la misma en la colección inglesa NCIB no es capaz de crecer en estas fuentes de carbono (comunicación personal), por lo que su operatividad actual está cuestionada. Hay que señalar que existe un conocimiento limitado de las bases genéticas y bioquímicas de las rutas catabólicas de estos compuestos, si bien es evidente que un conocimiento detallado de las mismas podría permitir un uso más racional de estos procesos y aportar a la industria farmacéutica enzimas con nuevas propiedades susceptibles de ser producidas, modificadas y mejoradas por técnicas de ingeniería de proteínas. Por otro lado, la aplicación de elementos y sistemas biológicos a la resolución racional del problema de la eliminación de esteroles contaminantes, también requiere un profundo conocimiento de su metabolismo a nivel genético y bioquímico. La definición y caracterización de las rutas metabólicas de estos compuestos permitiría emplear los procedimientos de ingeniería metabólica para la modificación, el control y la ampliación de las capacidades degradativas de diversas cepas bacterianas, para su utilización como agentes biológicos descontaminantes. Tampoco se puede olvidar que el colesterol desempeña un papel importante en la dieta y que existe mucho interés por reducir la cantidad de colesterol en los alimentos. La posibilidad de modificar y ensamblar estas rutas en organismos probióticos capaces de reducir el nivel de colesterol en los alimentos de la dieta y/o en el intestino puede ser un objetivo técnicamente posible a medio plazo.

2.1 Degradación aeróbica de esteroides

En la actualidad, el catabolismo aeróbico de esteroides en bacterias Gram- negativas se ha estudiado en profundidad en Comamonas testosteroni TA441

12 Introducción

(anteriormente denominada Pseudomonas testosteroni), una cepa que además de testosterona es capaz de utilizar también los ácidos biliares como fuente de carbono y energía, pero no el colesterol. Se ha estudiado exhaustivamente la ruta de degradación de la testosterona en esta bacteria, y muchas de las etapas de la misma se han caracterizado a nivel genético y bioquímico (Horinouchi et al., 2001; Horinouchi et al., 2003a; Horinouchi et al., 2003b; Horinouchi et al., 2004a; Horinouchi et al., 2004b; Horinouchi et al., 2005). Así, la mayoría de los genes de la ruta de degradación de la testosterona, denominados genes tes, ya han sido caracterizados, si bien aún existen algunas lagunas de conocimiento sobre su funcionalidad. En esta bacteria se han caracterizado muy bien algunas enzimas (así como sus respectivos genes) que intervienen en la metabolización de esteroides. Entre ellas cabe destacar la 3α-hidroxisteroide deshidrogenasa/carbonilreductasa (3α-HSD/CR codificada por el gen hsdA), que cataliza la oxidorreducción en posición 3 de una gran variedad de esteroides C19-27 (Hwang et al., 2005); la 3-oxo-Δ5-Δ4-esteroide isomerasa (KSI), que transforma la 5-androsten-3,17-diona en 4-androsten-3,17-diona (4-AD) (Kuliopulos et al., 1987); y las Δ4-deshidrogenasas (Δ4-DHs, 3-oxo-Δ4(5α)-esteroide y 3-oxo-Δ4(5β)- esteroide deshidrogenasas), que catalizan la conversión del 1-androstene-3,17- diona (1-AD) (anillos A:B trans o cis, respectivamente) en ADD (Florin et al., 1996). Dentro de grupo de las bacterias Gram-positivas, el género Rhodococcus tiene un gran potencial catabólico (Larkin et al., 2005; van der Geize y Dijkhuizen, 2004). En él se han descrito algunas cepas capaces de degradar colesterol y recientemente se ha avanzado en el estudio de algunas enzimas implicadas en el metabolismo de esteroides, tales como la colesterol oxidasa, la 3-cetoesteroide Δ1-deshidrogenasa o la 3-cetoesteroide 9α-hidroxilasa (Ivshina et al., 2005; Knol et al., 2008; Morii et al., 1998; Navas et al., 2001; van der Geize et al., 2000; van der Geize et al., 2002b; van der Geize et al., 2008). El reciente análisis completo del genoma de Rhodococcus jostii cepa RHA1 (McLeod et al., 2006) ha revelado la existencia de un conjunto de genes que podrían estar implicados en el catabolismo del colesterol (van der Geize et al., 2007), algunos de los cuales han sido definidos funcionalmente.

13 Introducción

Recientemente también se han desarrollado diversos trabajos sobre el metabolismo del colesterol y su regulación en micobacterias, dirigidos gran parte de ellos a investigar el papel que esta molécula desempeña en la patogenicidad de la especie Mycobacterium tuberculosis; de ello se hablará específicamente en el apartado 4.

2.1.1 Degradación aeróbica del colesterol

Aunque el catabolismo bacteriano del colesterol no se ha dilucidado completamente en ninguna de las bacterias capaces de metabolizarlo, y por lo tanto no se conoce su ruta de degradación completa, a partir de la combinación de diferentes estudios bioquímicos realizados con varias cepas degradadoras de esteroles (Kieslich, 1985; Martin, 1977; Owen et al., 1983; Schoemer y Martin, 1980; Sedlaczek y Smith, 1988; Szentirmai, 1990) se ha postulado una ruta para la degradación aeróbica del mismo como se muestra en la figura 5. A continuación se detallarán las diferentes etapas de esta ruta en tres apartados: a) Transformación del colesterol en 4-colesten-3-ona. En esta ruta aeróbica parece que el primer paso es la oxidación de colesterol a 4-colesten-3-ona a través de dos reacciones secuenciales: la oxidación de colesterol a 5-colesten-3- ona (Figura 5, (2)) seguida de su isomerización a 4-colesten-3-ona (Figura 5, (3)). La enzima que aporta esta primera actividad en el sistema degradativo es en algunos microorganismos una colesterol oxidasa, mientras que en otros se trata de una 3-β hidroxiesteroide deshidrogenasa/isomerasa. En ambos casos se trata de enzimas bifuncionales que incluyen actividad 3β-hidroxiesteroide oxidasa o deshidrogenasa y actividad Δ5-3-cetoesteroide isomerasa. Dado que una parte de esta tesis doctoral se ha centrado en el estudio de este paso enzimático, se detallarán las características de estas enzimas más adelante en el texto. b) Eliminación de la cadena lateral del colesterol. Parece que, concomitante o posteriormente al primer proceso oxidativo, la cadena alifática del colesterol se elimina mediante varios procesos de oxidación, similares a una β-oxidación, aun no bien precisados a nivel genético y bioquímico (van der Geize et al., 2007). Estudios muy recientes han señalado a la proteína codificada por el gen ro04679

14 Introducción de Rhodococcus jostii RHA1 (Rosłoniec et al., 2009), que codifica el citocromo P450 125 (Cyp125) y tiene como ortóloga en M. tuberculosis a la proteína codificada por el gen Rv3545c (Capyk et al., 2009a; Capyk et al., 2009b), como la enzima responsable del primer paso de hidroxilación de la cadena lateral. c) Rutas central y baja de degradación del colesterol. Una vez que la cadena alifática se ha oxidado, el metabolismo del colesterol parece seguir para la mayoría de bacterias aeróbicas una ruta catabólica común para esteroides de 19 átomos de carbono. Brevemente, 3-cetoesteroide- Δ1-deshidrogenasas de baja especificidad, como KsdD en M. smegmatis (Brzostek et al., 2005), KstD en Rhodococcus erythropolis (van der Geize et al., 2000; van der Geize et al., 2001; van der Geize et al., 2002a) o TesH en Comamonas testosteroni (Horinouchi et al., 2003b) transforman el compuesto 4-androstadien-3,17-diona (AD) (Figura 5, (9A)) en 1,4-androstadien-3,17-diona (ADD) (Figura 5, (9B)), que puede considerarse el metabolito central de las distintas etapas degradativas, así como metabolito central de la degradación de distintos esteroides, como la testosterona. Posteriormente tiene lugar una 9α-hidroxilación catalizada por KstH en M. smegmatis (Andor et al., 2006) y KshAB en R. erythropolis (van der Geize et al., 2001; van der Geize et al., 2002b; van der Geize et al., 2008) y en M. tuberculosis (Capyk et al., 2009a), seguida de la transformación no enzimática de la 9α-hidroxi- 1,4-androstadien-3,17-diona (Figura 5, (10B)) en 3-hidroxi-9,10-secoandrosta- 1,3,5(10)-trien-9,17-diona (3-HSA) (Figura 5, (11)). La hidroxilación subsecuente de 3-HSA por enzimas como la oxigenasa de dos componentes TesA1A2 en C. testosteroni (Horinouchi et al., 2004a) conduce a la obtención de la 3,4-dihidroxi- 9,10-secoandrosta-1,3,5(10)-trien-9,17-diona (3,4-DHSA) (Figura 5, (12)), un derivado catecólico cuyo anillo A se abre por una extradiol dioxigenasa de tipo meta (TesB en C. testosteroni (Horinouchi et al., 2001); HsaC en R. jostii RHA1 (van der Geize et al., 2007) y en M. tuberculosis (Yam et al., 2009)) originando el ácido 4,5,9,10-diseco-3-hidroxi-5,9,17-trioxoandrosta-1(10), 2-dien-4-oico (4,9- DSHA) (Figura 5, (13)). Este compuesto es hidrolizado por TesD en C. testosteroni (Horinouchi et al., 2003a), y HsaD en M. tuberculosis (Lack et al., 2008; Lack et al., 2009) o R. jostii RHA1 (van der Geize et al., 2007) originando los ácidos 2-hidroxi- 2,4-hexadienoico (Figura 5, (14)) y 9,17-dioxo-1,2,3,4,10,19-hexanorandrostan-5-

15 Introducción oico (DOHNAA) (Figura 5, (15)). Los siguientes pasos, en los que muy probablemente participan los genes catabólicos tesE, tesF, y tesG en C. testosteroni (Horinouchi et al., 2005) conducirían a metabolitos que entrarían ya en rutas generales de degradación (Kieslich, 1985). Sin embargo, las enzimas que intervienen en esta ruta baja están aún por confirmar. Parece que el ácido 2- hidroxi-2,4-hexadienoico se metaboliza a ácido 4-hidroxi-2-oxo-hexanoico (este paso estaría catalizado por TesE) (Figura 5, (16)) que finalmente se rompería en ácido pirúvico y propionaldehído (probablemente por la acción de TesG), que se transformaría en propionil-CoA por acción de TesF. Por otra parte, se ha propuesto que el DOHNAA se degradaría a ácido succínico. Se asume que el primer paso en la degradación de este compuesto podría ser la eliminación de su fracción propionil para producir ácido 9,17-dioxo-1,2,3,4,5,6,10,19- octanorandrostan-7-oico (Figura 5, (17)) a través de una β-oxidación típica (Kieslich, 1985).

16 Introducción

COL. OXIDASA COL. OXIDASA

HO O O COL. DESHIDROGENASA COL. DESHIDROGENASA COLESTEROL (1) 5-COLESTEN-3-ONA (2) 4-COLESTEN-3-ONA (3)

DESHIDROGENACIÓN

¿HIDROXILA- CIÓN MEDIADA O POR CITO- CROMO P450? 1,4-COLESTADIEN-3-ONA (4)

CH2OH CH2OH DESHIDROGENACIÓN

O O

26-HIDROXI-1,4-COLESTADIEN-3-ONA (5B) 26-HIDROXI-4-COLESTEN-3-ONA (5A)

OXIDACIÓN OXIDACIÓN

COOH COOH DESHIDROGENACIÓN

O O

ÁCIDO 1,4-COLESTADIEN-3-ONA-26-OICO (6B) ÁCIDO 4-COLESTEN-3-ONA-26- OICO (6A) OXIDACIÓN OXIDACIÓN

COOH COOH DESHIDROGENACIÓN

O O ÁCIDO 1,4-COLADIEN-3-ONA-24-OICO (7B) ÁCIDO 4-COLEN-3-ONA-24 OICO (7A)

OXIDACIÓN OXIDACIÓN

COOH COOH

DESHIDROGENACIÓN

O O

ÁCIDO1,4-PREGNADIEN-3-ONA-20-CARBOXÍLICO (8B) ÁCIDO 4-PREGNEN-3-ONA-20- CARBOXÍLICO (8A)

17 Introducción

COOH COOH DESHIDROGENACIÓN

O O

ÁCIDO 1,4-PREGNADIEN-3-ONA-20-CARBOXÍLICO (8B) ÁCIDO 4-PREGNEN-3-ONA-20- CARBOXÍLICO (8A) OXIDACIÓN OXIDACIÓN

O O KsdD/KstD/Tes H

O O 1,4-ANDROSTADIEN-3,17-DIONA (ADD) (9B) 4-ANDROSTEN-3,17 DIONA (AD) (9A)

KshAB/KstH KstH

O O KsdD/KstD/Tes H

OH OH O O

9 ALFA-HIDROXI-1,4-ANDROSTADIEN-3,17-DIONA (10B) 9 ALFA-HIDROXI-4-ANDROSTEN-3,17 DIONA (10A)

¿APERTURA ESPONTÁNEA?

O

O

HO

3-HSA (11)

Tes A1A2

O

O

HO OH

3,4-DHSA (12) HsaC/Tes B HOOC OH O O ÁCIDO 2-HIDROXI-2,4-HEXADIENOICO HsaD/Tes D (14) O O O HOOC O HOOC OH O 4,9-DSHA (13) O

O HOOC

DOHNAA (15)

18 Introducción

O OH OH Tes E ¿Tes G? O HOOC OH COOH O ÁCIDO PIRÚVICO ÁCIDO 2-HIDROXI-2,4- ÁCIDO 4-HIDROXI-2-OXOHEXANOICO (16) HEXADIENOICO (14) O

PROPANAL

O O ¿Tes F?

O O COOH HOOC PROPIONIL-CoA

DOHNAA (15) ÁCIDO 9,17-DIOXO-1,2,3,4,5,6,10,19- OCTANORANDROSTAN-7-OICO (17)

O O

O COOH O COOH

OH COOH COOH O

O OH

HO O SUCCINATO

Figura 5. Ruta postulada de degradación microbiana aeróbica del colesterol. Se indican las distintas nomenclaturas de las enzimas implicadas en los pasos caracterizados. Es posible que la 4-colesten-3-ona (3) o alguno de los sucesivos metabolitos producto de la degradación de la cadena lateral hasta (e incluida) la AD (9A) sufran una reacción de deshidrogenación que introduzca un doble enlace en la posición 1, dando lugar al compuesto colesta-1,4-dien-3-ona (4) en el caso de la 4-colesten-3-ona, o a los correspondientes 1,2-deshidro derivados de las demás

19 Introducción moléculas (nombrados con la letra B). Estos compuestos se han rodeado con línea discontinua en la figura. Seguirían un proceso degradativo de la cadena lateral idéntico al que sufre la 4-colesten- 3-ona hasta el intermediario común 9α-hidroxi-1,4-androstadien-3,17-diona (10B).

2.1.2 Enzimas responsables de la transformación del colesterol en 4- colesten-3-ona

Como ya se ha comentado anteriormente, el primer paso en la degradación aeróbica del colesterol es la oxidación de colesterol a 4-colesten-3-ona a través de dos reacciones secuenciales: la oxidación de colesterol a 5-colesten-3-ona (Figura 5, (2)) seguida de su isomerización a 4-colesten-3-ona (Figura 5, (3)). Hasta la fecha existen dos tipos de enzimas descritas que son capaces de realizar esta reacción: las colesterol oxidasas y las 3-β hidroxiesteroide deshidrogenasas/isomerasas. En ambos casos se trata de enzimas bifuncionales que incluyen actividad 3β-hidroxiesteroide oxidasa o deshidrogenasa y actividad Δ5-3-cetoesteroide isomerasa.

2.1.2.1 Enzimas con actividad colesterol oxidasa

Las colesterol oxidasas (EC 1.1.3.6) (en lo sucesivo abreviadas como CO) son enzimas flavin adenin dinucleótido (FAD)-dependientes bien caracterizadas y de las que se conoce su estructura tridimensional. Se distinguen dos clases de CO; la clase I está formada por aquellas CO en las que el FAD no está covalentemente unido a la proteína, y la clase II por aquellas CO en las que el FAD está unido covalentemente a un residuo de histidina. La actividad catalítica de estas dos clases de CO es la misma, pero no comparten homología de secuencia y pertenecen a diferentes familias (Aparicio y Martin, 2008). La clase I pertenece a la familia de las GMC (glucosa/metanol/colina) oxidorreductasas, y se han identificado enzimas de esta clase principalmente en actinomicetos (Doukyu, 2009). De esta clase se conocen las estructuras cristalinas de la CO de Streptomyces sp. SA-COO (Lario et al., 2003; Yue et al., 1999) y de

20 Introducción

Brevibacterium sterolicum (Li et al., 1993; Vrielink et al., 1991). La clase II pertenece a la familia de las VAO (vainillil/alcohol oxidasas). Se han identificado enzimas de esta clase en B. sterolicum, R. erythropolis y bacterias Gram- negativas (Doukyu, 2009). Además se ha determinado la estructura de una CO de clase II de B. sterolicum (Coulombe et al., 2001). Las CO en la mayoría de los casos requieren oxígeno molecular para formar 4-colesten-3-ona y peróxido de hidrógeno (Smith y Brooks, 1974). Sin embargo, algunas CO de Burkholderia cepacia ST-200, Pseudomonas spp., y Chromobacterium sp. DS-1 oxidan el colesterol mayoritariamente a 6β-hidroperoxi-4-colesten-3-ona y peróxido de hidrógeno, y no a 4-colesten-3-ona (Doukyu y Aono, 1999; Doukyu et al., 2008). Este intermediario no se ha asociado hasta el momento a ninguna ruta de degradación completa de colesterol; de hecho, la cepa Burkholderia cepacia ST- 200 (antes denominada Pseudomonas sp. ST-200) es incapaz de crecer en colesterol o 6β-hidroperoxi-4-colesten-3-ona, lo que sugiere que el colesterol no es el sustrato natural de esta enzima (Doukyu y Aono, 1999) o que la transformación tiene otro fin distinto al de obtención de energía. Hay que señalar que las CO mejor caracterizadas hasta la fecha, e. g., ChoA y ChoM de Streptomyces sp SA-COO, ChoB de Bacillus sterolicum, ChoE de Rhodoccocus equi y ChoD de M. tuberculosis (todas de clase I) son extracelulares y parecen actuar más como factores de virulencia que como parte de un sistema catabólico (Brzostek et al., 2007; Navas et al., 2001). De hecho, algunos estudios (Av-Gay y Sobouti, 2000) postulaban que las micobacterias de crecimiento lento, es decir, las patógenas como M. tuberculosis, M. bovis y M. leprae, poseían CO de naturaleza extracelular, que aclaraban del medio el colesterol, y podían modificarlo o almacenarlo, pero este no era utilizado como fuente de carbono, en contraposición con las micobacterias de crecimiento rápido, como M. smegmatis, que poseerían CO intracelulares y que sí utilizan el colesterol como fuente de carbono y energía. De confirmarse esta hipótesis, se podría efectivamente relacionar a las CO extracelulares micobacterianas con la patogenicidad y a las intracelulares con el catabolismo del colesterol. Sin embargo, en estudios más recientes se ha comprobado que el patógeno M. tuberculosis sí puede utilizar el colesterol como fuente de carbono y energía (Brzostek et al., 2009; Pandey y

21 Introducción

Sassetti, 2008), con lo cual se especula que las CO extracelulares podrían formar parte de la ruta catabólica del colesterol. Otra posible interpretación es que las CO extracelulares se utilicen efectivamente en patogénesis y que otra enzima sea la responsable de transformar el colesterol intracelularmente en 4-colesten-3-ona para su metabolismo completo, como parece ser el caso en M. tuberculosis, donde una hidroxiesteroide deshidrogenasa, además de ChoD, cataliza esta transformación, e intracelularmente (Yang et al., 2007).

2.1.2.2 Enzimas con actividad 3-β hidroxiesteroide deshidrogenasa/isomerasa

Las 3-β-hidroxi-Δ5-esteroide deshidrogenasas son una familia de enzimas que catalizan la conversión de 3-β-hidroxi-5-eno-esteroides a 3-oxo-4-eno- esteroides a través de una reacción de oxidación y una isomerización, utilizando NAD+ o NADP+ como cofactores. El análisis de las bases de datos genéticas ha puesto de manifiesto la existencia de una superfamilia de proteínas que además de las esteroide deshidrogenasas bacterianas incluye a las 3-β-hidroxiesteroide deshidrogenasas de mamíferos, las dihidroflavonol reductasas de plantas, las UDP-galactosa-4-epimerasas bacterianas y las 3-β-hidroxiesteroide deshidrogenasas víricas (Baker y Blasco, 1992). Las 3-β-hidroxiesteroide deshidrogenasas bacterianas están filogenéticamente menos relacionadas con las deshidrogenasas de mamíferos que las víricas. Sin embargo, su función podría ser similar, esto es, la síntesis de hormonas esteroideas o de flavonoles bacterianos (Yang et al., 2007). A esta familia pertenecen por ejemplo la enzima colesterol deshidrogenasa NAD(P)-dependiente [NAD(P)-CDH] responsable del paso de colesterol a 4-colesten-3-ona en el género Nocardia (Horinouchi et al., 1991) y la 3-β-hidroxiesteroide deshidrogenasa Rv1106c de M. tuberculosis (Yang et al., 2007), implicada, además de en la transformación de colesterol a 4-colesten-3- ona, en la oxidación e isomerización de la dehidroepiandrosterona y la pregnenolona. El hecho de que la colesterol deshidrogenasa de Nocardia se active a nivel transcripcional por la adición de colesterol al medio de cultivo (Horinouchi et al., 1991) y de que la interrupción del gen Rv1106c reduzca la oxidación de

22 Introducción colesterol en M. tuberculosis por lo menos 90 veces (Yang et al., 2007) sugiere una implicación directa de estas enzimas en el catabolismo del colesterol en los organismos donde están presentes.

2. 2 Degradación anaeróbica de esteroides

Las transformaciones de esteroides más estudiadas que suceden en ambientes anóxicos tienen lugar durante la circulación enterohepática en mamíferos y son producidas por bacterias intestinales anaeróbicas. Se ha constatado la rotura de enlaces alquilaril éter, deshidroxilaciones y oxidaciones o reducciones en el carbono 17, pero no se ha descrito la rotura del núcleo esteroideo por estas bacterias para la obtención de energía (Groh et al., 1993). Un ejemplo de estos microorganismos es Bacteroides sp. cepa D8, primera bacteria encontrada en el colon humano capaz de convertir colesterol, 4-colesten-3-ona y coprostanona a coprostanol (Gerard et al., 2007). En 1988 se demostró por vez primera la existencia de bacterias capaces de crecer en colesterol bajo condiciones desnitrificantes (Taylor et al., 1981). Recientemente se han descrito bacterias desnitrificantes capaces de oxidar colesterol y otros esteroides completamente. Ejemplos de estos microorganismos son Denitratisoma oestradiolicum, capaz de degradar 17β-estradiol utilizando el nitrato como aceptor de electrones (Fahrbach et al., 2006); Steroidobacter denitrificans, degradadora de estradiol, estrona, testosterona y AD (Fahrbach et al., 2008) o las cepas 72Chol (Harder y Probian, 1997) y Sterolibacterium denitrificans (Tarlera y Denner, 2003), capaces de oxidar completamente el colesterol. Aunque algunas de estas bacterias han sido caracterizadas exhaustivamente, todavía no existe mucha información sobre las rutas de degradación o las enzimas implicadas en las mismas. Los estudios más avanzados hasta el momento se han realizado con S. denitrificans, en el que se han propuesto los pasos iniciales de la ruta de degradación de colesterol anóxica (Chiang et al., 2007). Según estos estudios, el primer paso de la ruta hasta el metabolito 4-colesten-3-ona estaría catalizado por la enzima AcmA, una deshidrogenasa/reductasa de cadena corta NAD(P) dependiente (Chiang et al.,

23 Introducción

2008b). El segundo paso de la ruta estaría catalizado por una 4-colesten-3-ona-Δ¹- deshidrogenasa denominada AcmB (Chiang et al., 2008a; Chiang et al., 2008b). Este paso implicaría la producción de 25-hidroxi-4-colesten-3-ona mediante la hidroxilación del carbono terciario de la cadena lateral, paso que difiere de los descritos hasta ahora para las rutas aeróbicas y que presuntamente estaría catalizado por una enzima de la familia de las molibdeno-hidroxilasas, que utilizan agua como fuente del átomo de oxígeno incorporado al sustrato (Chiang et al., 2007). Alternativamente, estos intermediarios pueden originarse como las correspondientes 1,2-deshidro estructuras, colesta-1,4-dien-3-ona y 25- hidroxicolesta-1,4-dien-3-ona. Los pasos iniciales del catabolismo anóxico del colesterol propuestos para S. denitrificans se muestran en la figura 6.

AcmA AcmA HO O O COLESTEROL 5-COLESTEN-3-ONA 4-COLESTEN-3-ONA

H2O AcmB

OH OH

AcmB H2O O O O 25-HIDROXI-4- 25-HIDROXI-1,4 1,4-COLESTADIEN-3-ONA COLESTEN-3-ONA COLESTADIEN-3-ONA

Figura 6. Pasos iniciales propuestos para el metabolismo anóxico del colesterol en Sterolibacterium denitrificans (Chiang et al, 2008b).

24 Introducción

3. Regulación de las rutas de degradación de compuestos esteroideos

Existen todavía muy pocos estudios sobre la regulación de los genes implicados en la degradación microbiana de compuestos esteroideos. Como en el caso de los genes catabólicos, los estudios más avanzados en regulación se han llevado a cabo en la bacteria C. testosteroni. En este microorganismo se ha descrito que la expresión del gen hsdA está regulada por dos genes denominados repA y repB (Xiong et al., 2001; Xiong et al., 2003). RepA actúa como un represor transcripcional uniéndose a dos secuencias operadoras situadas en la región 5’ de hsdA, mientras que RepB actúa como un represor traduccional uniéndose al mRNA de hsdA. En ambos casos se produce la desrepresión del sistema cuando existe testosterona en el medio, que se une a las proteínas represoras evitando su unión al DNA o mRNA. Otro regulador, denominado TeiR, y perteneciente a la familia LuxR, regula la expresión de varios genes implicados en la degradación de la testosterona (Linares et al., 2008; Pruneda-Paz et al., 2004). Esta proteína se ha estudiado en mayor detalle muy recientemente y se ha demostrado que es una kinasa que presenta tres dominios funcionales (anclaje, unión a esteroide, regulador). Se localiza anclada en la membrana, responde a diferentes esteroides y está implicada en quimiotaxis (Göhler et al., 2008). La regulación de la ruta de degradación del colesterol en el género Mycobacterium se ha comenzado a estudiar recientemente, lo que se comentará en el apartado 5.

4. Mecanismos de transporte del colesterol

Los mecanismos de transporte de colesterol y otros esteroides en bacterias todavía no se conocen en detalle. Los estudios más avanzados en este sentido se están llevando a cabo en las . El análisis de las bases de datos de secuencias génicas indica que diversas actinobacterias, incluyendo miembros de los géneros Mycobacterium, Nocardia, Rhodococcus y Streptomyces y tanto de especies patógenas como de saprófitas, contienen loci mce (Casali y Riley, 2007;

25 Introducción

McLeod et al., 2006). Las proteínas Mce (de mammalian cell entry) presentes en actinobacterias son componentes de sistemas de transporte ABC (ATP-binding cassette) complejos, que incluyen más de 8 proteínas distintas (Casali y Riley, 2007). En M. tuberculosis hay hasta 4 loci (mce 1-4). Los genes mce de M. tuberculosis se han asociado con patogénesis, aunque su función todavía no está totalmente clarificada. Parece que, por ejemplo, el gen mce1A está implicado en facilitar la fagocitosis de las bacterias por macrófagos (Arruda et al., 1993). Los dos primeros genes de estos loci (llamados yrbE) codifican proteínas transmembrana con similitud con los componentes permeasa de transportadores ABC. El rasgo distintivo de este tipo de transportadores es una ATPasa con características conservadas. Todas las actinobacterias con loci mce contienen genes que codifican ATPasas de la familia Mkl, normalmente no próximos a los loci mce (Casali y Riley, 2007). En M. tuberculosis esta ATPasa está codificada por un gen denominado mceG. Recientemente, se ha comprobado que el locus mce4 de R. jostii RHA1 se induce durante el crecimiento en colesterol (van der Geize et al., 2007). En M. smegmatis se ha demostrado que el operón mce4 está regulado por la proteína KstR, regulador de la familia TetR que actúa como represor transcripcional de genes relacionados con el metabolismo del colesterol (Kendall et al., 2007). Estos hallazgos implicaban que este locus podía estar relacionado con el transporte de colesterol, hecho que se ha visto confirmado en R. jostii RHA1, donde se ha comprobado que distintos mutantes en el locus mce4 son incapaces tanto de captar como de crecer en colesterol (Mohn et al., 2008). Esta incapacidad de crecimiento se presenta así mismo en presencia de moléculas con estructura similar como el β-sitosterol, el 5α-colestanol y la 5α- colestanona, que poseen una cadena lateral en el carbono 17 de 8 o más átomos de carbono, mientras que estos mutantes siguen creciendo en AD, ácido cólico y progesterona, moléculas con cadenas laterales más cortas y más polares (Mohn et al., 2008). En M. tuberculosis, mutantes en el gen yrbE4A así como en la ATPasa mceG tienen un escaso crecimiento en colesterol, aunque este se ve recuperado a tiempos largos, lo que sugiere que podría existir otro sistema de transporte secundario (Pandey y Sassetti, 2008). Así mismo, los mutantes en estos genes presentan una virulencia disminuida en modelos animales (Pandey y

26 Introducción

Sassetti, 2008). El hecho de que este locus esté presente en micobacterias saprófitas indica que su función no se limita a la virulencia (Mohn et al., 2008), lo que se explica fácilmente teniendo en cuenta que en la naturaleza los esteroides son sustratos valiosos y abundantes; el locus mce4 habría adquirido posteriormente su papel en patogénesis.

5. Degradación aeróbica del colesterol y compuestos esteroideos en el género Mycobacterium

El género Mycobacterium es el único de la familia Mycobacteriaceae, del orden Actinomycetales. Las micobacterias son bacterias aerobias con forma de bacilos rectos o ligeramente curvados y miden 0,2-0,6 µm de ancho por 1,0-10 µm de largo. Poseen un contenido en G+C muy elevado (62-70%). Son bacterias típicamente ácido-alcohol resistentes aunque suelen considerarse Gram-positivas. Todas las especies de Mycobacterium comparten una característica pared celular, más gruesa que la de muchas otras bacterias, hidrofóbica y rica en ácidos micólicos y lípidos. Esta pared celular proporciona una contribución sustancial a la resistencia de este género de bacterias. El género incluye patógenos que causan graves enfermedades en los mamíferos, como M. tuberculosis, M. bovis o M. leprae, y también saprófitos de vida libre, no patógenos u oportunistas, como M. smegmatis, M. aurum, M. phlei o M. fortuitum.

27 Introducción

Figura 7. Mycobacterium smegmatis mc2155.

Aunque ya se sabía desde hacía mucho tiempo que estas bacterias degradaban colesterol, sólo muy recientemente se han realizado estudios moleculares sobre la degradación aeróbica del colesterol con cepas de Mycobacterium. Como ya se ha comentado anteriormente, no hace mucho se postuló que los Mycobacterium de crecimiento rápido, por lo general no patógenos, eran capaces de crecer en colesterol como única fuente de carbono y energía, en tanto que los de crecimiento lento, que incluyen a los Mycobacterium patógenos, podían acumular y modificar el colesterol pero no utilizarlo como fuente de carbono y energía (Av-Gay y Sobouti, 2000). Esta teoría ha sido recientemente refutada al comprobarse que M. tuberculosis sí puede crecer en colesterol (Brzostek et al., 2009; Pandey y Sassetti, 2008). Gracias a que el genoma de M. smegmatis se ha secuenciado recientemente, se describieron por primera vez dos genes, ksdD1 y ksdD2, que podrían estar implicados en la ruta de degradación del colesterol (paso de AD a ADD) y que codifican dos posibles 3-cetoesteroide-Δ1-deshidrogenasas (Brzostek et al., 2005). Poco tiempo después, se describió un gen que codifica una enzima KstH (Andor et al., 2006), y que podría estar implicado en el paso de ADD a 9α-hidroxi-1,4- androstadien-3,17-diona. Sin duda el avance más importante en el conocimiento global de los genes implicados en la degradación del colesterol a nivel genético en este microorganismo se logró como consecuencia del descubrimiento del

28 Introducción regulador transcripcional KstR (Kendall et al., 2007). Previamente, se había observado que en M. tuberculosis se inducía un gen durante infección en macrófagos y que era esencial para la infección en ratones: Rv3574, que codifica un regulador represor tipo TetR (Kendall et al., 2004). El gen ortólogo en M. smegmatis, MSMEG_6042, fue delecionado y se comprobó que esto conllevaba la inducción de un elevado número de genes (83) relacionados con el metabolismo lipídico y más concretamente, como se verá a lo largo de esta tesis doctoral, con el metabolismo del colesterol. En cuanto a su mecanismo de acción, se identificó un motivo conservado en su propio promotor (TnnAACnnGTTnnA), así como en las secuencias intergénicas de los genes a los que reprime, al que se postula que la proteína se une como un dímero (Kendall et al., 2007). La desrepresión podría producirse mediante la unión de KstR a la molécula de colesterol; de hecho se ha encontrado un sitio de unión para esta molécula en un modelo de KstR (comunicación personal). Más recientemente se ha encontrado otro regulador, denominado KstR2, también un represor tipo TetR, que regula la expresión de 15 genes adicionales relacionados con el metabolismo de colesterol (Kendall et al., 2010). De estos dos reguladores se hablará más extensamente en el apartado 5 de resultados. Profundizando en el papel del colesterol en la patogénesis causada por estas bacterias, hay que señalar que desde hace tiempo se ha relacionado la entrada de diversas bacterias patógenas en células del sistema inmune y su mantenimiento dentro de las mismas con dominios de la membrana plasmática de estas células ricos en colesterol. Este es el caso por ejemplo de M. tuberculosis o M. bovis Calmette-Guérin en macrófagos; este proceso, que requiere de dominios ricos en colesterol en la membrana del macrófago, a los que las micobacterias se unen específicamente a través del colesterol, supone que las micobacterias que penetran en el interior del macrófago queden ‘secuestradas’ en fagosomas recubiertos de TACO (proteína de cubierta que contiene triptófano y aspartato) que previene la fusión lisosomal y asegura la supervivencia intracelular del patógeno (Gatfield y Pieters, 2000). Estos dominios ricos en colesterol también son necesarios para la entrada de M. kansasii (Peyron et al., 2000) o Bordetella pertussis (Lamberti et al., 2008) en neutrófilos. Se especula que la unión

29 Introducción específica de las micobacterias al colesterol podría deberse al alto contenido en glicolípidos de su pared celular (Gatfield y Pieters, 2000). Por otra parte, se ha visto que el operón mce4 de M. tuberculosis, que está en general presente en los Actinomycetales (Casali y Riley, 2007) y que codifica un sistema de importación de colesterol, es esencial para la supervivencia del patógeno durante los tiempos prolongados de infección (Joshi et al., 2006; Sassetti y Rubin, 2003). Este hallazgo hizo que se investigase y que finalmente se verificase la capacidad del patógeno de crecer en colesterol como única fuente de carbono y energía. Se postula que esta capacidad para degradar el colesterol la hereda de sus ancestros saprofíticos, y que puede permitir a la bacteria aprovechar este esteroide para conseguir carbono y energía en un compartimento intracelular que de hecho causa la inanición de otros patógenos potenciales (Pandey y Sassetti, 2008). Además se ha comprobado que los mutantes de M. tuberculosis en el gen choD presentan una patogenicidad atenuada (Brzostek et al., 2009).

Por otro lado, hay que destacar que desde hace tiempo se sabe que el colesterol puede sintetizarse también en bacterias (Hayami et al., 1979; Weeks y Francesconi, 1978). No hace mucho se ha descrito que M. smegmatis es capaz de sintetizar de novo este compuesto y que M. tuberculosis y M. leprae poseen genes homólogos a los genes responsables de la biosíntesis del colesterol en levaduras (Lamb et al., 1998). Más aún, en M. tuberculosis se ha caracterizado una actividad esterol 14α-demetilasa (CYP51) (Podust et al., 2001) correspondiente a un citocromo P-450 homólogo al que está implicado en la biosíntesis de esteroles en hongos y que se ha estudiado exhaustivamente, ya que podría constituir una excelente diana para desarrollar fármacos antifúngicos. La coexistencia en Mycobacterium de una ruta biosintética y otra degradativa para el colesterol, resulta muy interesante a la vez que plantea interrogantes. Tras todo lo anteriormente expuesto, parecía interesante caracterizar desde el punto de vista genético y bioquímico la ruta de degradación aeróbica del colesterol utilizando como sistema modelo de estudio la bacteria M. smegmatis mc2155 (Snapper et al., 1990) (figura 7) ; se trata de una bacteria de crecimiento rápido en medios ricos y medios sintéticos simples, que se ha desarrollado y

30 Introducción utilizado internacionalmente como cepa tipo por su alta eficacia de transformación para el estudio de las micobacterias. Su velocidad de crecimiento en colesterol, en donde alcanza densidades ópticas a 600 nm próximas a 2 y donde llega a fase estacionaria aproximadamente en 48 h, la convierten en un buen candidato para el estudio de esta ruta de degradación. Su genoma completo ha sido además secuenciando recientemente. El interés surge principalmente desde un punto de vista medioambiental, pero teniendo también en cuenta que por tratarse de una especie muy próxima a M. tuberculosis, los resultados que se obtuviesen podrían extrapolarse fácilmente a este patógeno. Esta extrapolación resultaría muy interesante dada la relación del colesterol con los mecanismos de patogenicidad en M. tuberculosis. Al inicio de esta tesis doctoral, la ruta de degradación del colesterol en este organismo era prácticamente desconocida, aunque actualmente se han caracterizado algunos de los pasos implicados, gracias en gran medida al descubrimiento de la existencia de un gran catabolón de esteroides en actinomicetos (Kendall et al., 2007; van der Geize et al., 2007) .

31

32 Objetivos

II. OBJETIVOS

33 Objetivos

34 Objetivos

II. OBJETIVOS

Como se ha comentado en la Introducción, al comienzo de esta tesis doctoral se desconocían la mayor parte de los genes implicados en el catabolismo del colesterol en Mycobacterium smegmatis mc2155, así como sus posibles mecanismos de regulación. Dado el interés que planteaba el conocimiento de esta ruta metabólica, tanto desde un punto de vista medioambiental como por el posible papel del metabolismo del colesterol como un mecanismo de patogenicidad en especies próximas a M. smegmatis, en esta tesis se han abordado los siguientes objetivos:

1. Identificación in silico de los genes de la ruta de degradación del colesterol en M. smegmatis. Utilizando los bancos de datos de secuencias y la información acumulada sobre el catabolismo del colesterol en distintos microorganismos se planteó el análisis del genoma de M. smegmatis para identificar in silico aquellos genes que pudieran estar implicados en dicho catabolismo.

2. Caracterización de genes de la ruta de degradación del colesterol en M. smegmatis. Mediante este objetivo, una vez realizado el estudio in silico, se confirmaría la verdadera implicación en el metabolismo del colesterol de los genes hallados utilizando las técnicas de RT-PCR, microarrays y la construcción de mutantes de inserción por recombinación homóloga sobre M. smegmatis. La técnica de microarrays permitiría así mismo la caracterización de nuevos genes implicados en esta ruta de degradación.

3. Identificación y caracterización de la proteína responsable de la transformación de colesterol en 4-colesten-3-ona. Con este objetivo se pretende identificar la enzima o enzimas implicadas en la primera etapa esta ruta catabólica. Los genes que codifican estas enzimas se clonarían y se expresarían en Escherichia coli para caracterizarlas bioquímicamente.

35 Objetivos

4. Estudio de la regulación del catabolismo del colesterol. Mediante este objetivo se pretende identificar y caracterizar los reguladores implicados en la degradación del colesterol. Los genes que codifican estos reguladores se clonarían y expresarían para estudiar su actividad in vitro e in vivo.

36 Materiales y Métodos

III. MATERIALES Y MÉTODOS

37 Materiales y Métodos

38 Materiales y Métodos III. MATERIALES Y MÉTODOS

1. Cepas bacterianas, plásmidos y oligonucleótidos utilizados

Las cepas bacterianas utilizadas en este trabajo se describen en la Tabla 1. Los plásmidos empleados para la clonación, mutación y expresión génica se muestran en la Tabla 2. Los oligonucleótidos sintéticos utilizados en este trabajo para la amplificación de productos por PCR se presentan en la Tabla 3. Los oligonucleótidos sintéticos empleados en los ensayos de RT-PCR de genes posiblemente pertenecientes a agrupaciones génicas de degradación del colesterol se muestran en la Tabla 4. Los oligonucleótidos sintéticos utilizados en RTq-PCR se muestran en la Tabla 5. Todos los oligonucleótidos utilizados en este trabajo se adquirieron en Sigma-Genosys.

Tabla 1. Cepas bacterianas

ESTIRPE CEPA GENOTIPO/FENOTIPO RELEVANTE REFERENCIA

- - + E. coli DH5α F , endA1, hsdR17 (rk mk ), supE44, thi-1, recA1, gyrA, (Hanahan, 1983) relA1, Δ(argF-lac)U169, deoRΦ80dlac, Δ (lacZ)M15

E. coli DH10B F-, mcrA, Δ (mrr hsdRMS-mcrBC), Φ80dlacZΔM15, Life Technologies ΔlacX74, deoR, recA1, araD139, Δ(ara-leu)7697, galU, galK, λ-, rpsL, endA1, nupG

- E. coli BL21 (DE3) F , ompTgal[cdm] [lon] hsdSB B con DE3 (Studier y Moffatt, 1986)

M. smegmatis mc²155 ept-1 , mutante de mc²6 eficiente para electroporación (Snapper et al., 1990)

M. smegmatis ::MSMEG_0217 Mutante de mc²155 con el gen MSMEG_0217 Este trabajo interrumpido mediante recombinación homóloga

M. smegmatis ::MSMEG_1366 Mutante de mc²155 con el gen MSMEG_1366 Este trabajo interrumpido mediante recombinación homóloga

M. smegmatis ::MSMEG_1543 Mutante de mc²155 con el gen MSMEG_1543 Este trabajo interrumpido mediante recombinación homóloga

M. smegmatis ::MSMEG_1604 Mutante de mc²155 con el gen MSMEG_1604 Este trabajo interrumpido mediante recombinación homóloga

M. smegmatis ::MSMEG_3519 Mutante de mc²155 con el gen MSMEG_3519 Este trabajo interrumpido mediante recombinación homóloga

M. smegmatis ::MSMEG_5228 Mutante de mc²155 con el gen MSMEG_5228 Este trabajo interrumpido mediante recombinación homóloga

39 Materiales y Métodos

M. smegmatis ::MSMEG_5233 Mutante de mc²155 con el gen MSMEG_5233 Este trabajo interrumpido mediante recombinación homóloga

M. smegmatis ::MSMEG_5995 Mutante de mc²155 con el gen MSMEG_5996 Este trabajo interrumpido mediante recombinación homóloga

M. smegmatis ::MSMEG_6036 Mutante de mc²155 con el gen MSMEG_6036 Este trabajo interrumpido mediante recombinación homóloga

M. smegmatis ΔMSMEG_5228 Mutante de mc²155 con el gen MSMEG_5228 Este trabajo delecionado mediante recombinación homóloga

M. smegmatis ::MSMEG_1604- Doble mutante de mc²155 con el gen MSMEG_5228 Este trabajo ΔMSMEG_5228 delecionado y el gen MSMEG_1604 interrumpido mediante recombinación homóloga

M. smegmatis ΔkstR Mutante de mc²155 con el gen MSMEG_6042 (Kendall et al., delecionado 2007)

M. smegmatis ΔkstR2 Mutante de mc²155 con el gen MSMEG_6009 (Kendall et al., delecionado 2010)

M. smegmatis ΔkstR/ΔkstR2 Doble mutante de mc²155 con los genes (Kendall et al., MSMEG_6042 y MSMEG_6009 delecionados 2010)

Tabla 2. Plásmidos

PLÁSMIDO DESCRIPCIÓN REFERENCIA

Vector de clonación, Apr oriColE1, pUC19 (Sambrook y Russell, 2001) lacZα

Vector de clonación de productos de pGEM-T easy r Promega PCR, Ap , oriColE1, lacZα

Vector de clonación e pET-29a(+) Novagen hiperexpresión, Kmr, oriColE1

Vector de clonación suicida para

micobacterias para la construcción pJQ200X (Jackson et al., 2001) de mutantes por recombinación homóloga. Gmr

pSUM36 Vector de clonación, oriE, oriM, Kmr (Aínsa et al., 1996)

Vector pUC19 que contiene los pUC5228DR fragmentos up-5228 y down-5228. Este trabajo Apr

Vector pGEM-T que contiene el gen pGEM1604 Este trabajo MSMEG_1604. Apr

Vector pGEM-T que contiene el gen pGEM5228 r Este trabajo MSMEG_5228. Ap

pGEM5233 Vector pGEM-T que contiene el gen r Este trabajo MSMEG_5233. Ap

Vector pGEM-T que contiene el gen pGEM6042 Este trabajo MSMEG_6042. Apr

40 Materiales y Métodos

Vector pET29 que expresa el gen pET1604 r Este trabajo MSMEG_1604. Km

Vector pET29 que expresa el gen pET5228 r Este trabajo MSMEG_5228. Km

Vector pET29 que expresa el gen pET5233 Este trabajo MSMEG_5233. Kmr

Vector pET29 que expresa el gen pET6042 Este trabajo MSMEG_6042 . Kmr

Vector pJQ200X que contiene un pJQ0217 fragmento interno del gen Este trabajo MSMEG_0217. Gmr

Vector pJQ200X que contiene un pJQ1366 fragmento interno del gen Este trabajo MSMEG_1366. Gmr

Vector pJQ200X que contiene un pJQ1543 fragmento interno del gen Este trabajo MSMEG_1543. Gmr

Vector pJQ200X que contiene un pJQ1604 fragmento interno del gen Este trabajo MSMEG_1604. Gmr

Vector pJQ200X que contiene un

fragmento interno del gen pJQ1604int r Este trabajo MSMEG_1604. Gm . Utilizado para la construcción de un mutante doble.

Vector pJQ200X que contiene un pJQ3519 fragmento interno del gen Este trabajo MSMEG_3519. Gmr

Vector pJQ200X que contiene un pJQ5228 fragmento interno del gen Este trabajo MSMEG_5228. Gmr

Vector pJQ200X que contiene los pJQ5228DR fragmentos up-5228 y down-5228. Este trabajo Gmr

Vector pJQ200X que contiene un pJQ5233 fragmento interno del gen Este trabajo MSMEG_5233. Gmr

Vector pJQ200X que contiene un pJQ5995 fragmento interno del gen Este trabajo MSMEG_5995. Gmr

Vector pJQ200X que contiene un pJQ6036 fragmento interno del gen Este trabajo MSMEG_6036. Gmr

Vector que contiene el gen lacZ sin pUJ9 r (de Lorenzo et al., 1990) promotor. Ap

Derivado de pUJ9 que contiene la pUJ9-5228 Este trabajo fusión P5228 :: lacZ

41 Materiales y Métodos

Tabla 3. Oligonucleótidos generales. Las secuencias marcadas en negrita en varios de ellos se corresponden con dianas de restricción creadas.

OLIGONUCLEÓTIDO SECUENCIA 5’-3’ UTILIDAD

Amplificación de CO5 GGAACTCATATGAAGCCTGACTACGACGTC MSMEG_1604. NdeI

Amplificación de CO3 CAGAATTCCTACCCCGCCGACGACAC MSMEG_1604. EcoRI

Amplificación de 5228-F CATATGGCTGACTCCACCACCGAC MSMEG_5228. NdeI

Amplificación de 5228-R AAGCTTCGTGCTGCCCTGAACTAG MSMEG_5228. HindIII

Amplificación de MSMEG_5233. NdeI 5233 pET F GGAATTCCATATGTCCGACGCCTTGGTCAC

Amplificación de MSMEG_5233. 5233 pET R CCGGATCCATCGCGACGCGTTGACTCA BamHI

Amplificación de MSMEG_6042. NdeI pET6042 F CATGCATATGGCCGGAAACTCACAGC

Amplificación de MSMEG_6042. XhoI pET6042 R CATGCTCGAGGATCTTAGGTTGCTCCTCGG

Amplificación de un fragmento interno MSMEG_1604 F int CTAGTCTAGAGGACACGTTCGTGCAGACG de MSMEG_1604. XbaI

Amplificación de un fragmento interno MSMEG_1604 R int CTAGGAGCTCCGTTTGGTGTAGGTGGTGATC de MSMEG_1604. SacI Amplificación de un fragmento CTAGGAATTCGGGCCCCGACGAGATCCACCGCG MSMEG_5228 UP F upstream de MSMEG_5228. EcoRI- CC ApaI Amplificación de un fragmento CTAGTCTAGAGATATCCCAGCAGTTCGGTGACCA MSMEG_5228 UP R upstream de MSMEG_5228. XbaI- G EcoRV Amplificación de un fragmento MSMEG_5228 DOWN CTCACTGCAGGATATCAGATGGAGGCGCAGGCC downstream de MSMEG_5228. PstI- F CG EcoRV Amplificación de un fragmento MSMEG_5228 DOWN CTAGAAGCTTGGGCCCGGAACCGAACTGCTGAA downstream de MSMEG_5228. R CTC HindIII-ApaI Amplificación de un fragmento interno MSMEG_6036 Rec F GCTCTAGACAAGGTCCTCGGCATGGTC de MSMEG_6036. XbaI

ATAAGAATGCGGCCGCCGGTGTCTTCATGTAGAA Amplificación de un fragmento interno MSMEG_6036 Rec R CG de MSMEG_6036. NotI

Amplificación de un fragmento interno MSMEG_5233 F int CTAGTCTAGACCAACCGCAAATCAGCAACC de MSMEG_5233. XbaI

Amplificación de un fragmento interno MSMEG_5233 R int CTAGACTAGTGATGAGCAGCACCTCGTGG de MSMEG_5233. SpeI

Amplificación de un fragmento interno MSMEG_1366 F int CATCGTCGACCCAAGGAGCTCTACGAGATC de MSMEG_1366. SalI

CATGCTCGAGGAGGGTGTGCAGGATCTCG Amplificación de un fragmento interno MSMEG_1366 R int de MSMEG_1366. XhoI

42 Materiales y Métodos

Amplificación de un fragmento interno MSMEG_5995 F int CTAGACTAGTGTGCTGCTCAACATGGACG de MSMEG_5995. SpeI

Amplificación de un fragmento interno MSMEG_5995 R int CTAGTCTAGAGAGTTCGACGTCCTCCAGC de MSMEG_5995. XbaI

CATGCTCGAGCGACTACCACATCACCACGG Amplificación de un fragmento interno MSMEG_0217 F int de MSMEG_0217. XhoI

Amplificación de un fragmento interno MSMEG_0217 R int CATGCTGCAGGGTCAGGATCAACGCCTCTTC de MSMEG_0217. PstI

Amplificación de un fragmento interno MSMEG_1543 F int CATGCTGCAGATGGAGGAGAACCTCGAATCC de MSMEG_1543. PstI

Amplificación de un fragmento interno MSMEG_1543 R int GATGGTCGACTCATGGTCTCGGTGTCCAGC de MSMEG_1543. SalI

Amplificación de un fragmento interno MSMEG_3519 F int CATGTCTAGACACTCAACTCCCTCGTGCC de MSMEG_3519. XbaI

Amplificación de un fragmento interno MSMEG_3519 R int GTAGGGGCCCCGACACCATGTACTGCAGCG de MSMEG_3519. ApaI Análisis de las interrupciones pJQ200X dir xylE TTGATGTTACCCGAGAGCTTG insercionales generadas mediante el plásmido pJQ200X Análisis de las interrupciones pJQ200X dir xylE int GGTCCAAGCCTTCAGATAGAC insercionales generadas mediante el plásmido pJQ200X Análisis de las interrupciones pJQ200X inv xylE GAGTTAGCTCACTCATTAGGC insercionales generadas mediante el plásmido pJQ200X Análisis de las interrupciones pJQ200X inv xylE int TCACTCACGGCAAGACCATC insercionales generadas mediante el plásmido pJQ200X Análisis de las interrupciones F24 CGCCAGGGTTTTCCCAGTCACGAC insercionales generadas mediante el plásmido pUC19 o pGEM-T-Easy Análisis de las interrupciones R24 AGCGGATAACAATTTCACACAGGA insercionales generadas mediante el plásmido pUC19 o pGEM-T Easy Empleado para amplificar el gen 16S 63f CAGGCCTAACACATGCAAGT rDNA

Empleado para amplificar el gen 16S 1387r GGGCGGAGTGTACAAGGC rDNA

Empleado para amplificar la sonda 5228 FP F TCAGCGCGTCGAGCAGGC MSMEG_5228 FP

Empleado para amplificar la sonda 5228 FP R GCAGTTCGGTGACCAGGTTG MSMEG_5228 FP Determinación del sitio +1 del Lac57 CGATTAAGTTGGGTAACGCCAGGG promotor P5228

Amplificación de P y posterior 5228pUJ9 F CTGAGAATTCTTGGATGATTCGCTGCAGC 5228 clonaje en pUJ9. EcoRI

Amplificación de P y posterior 5228pUJ9 R CTGAGGATCCATGCCCGCAGCATAACTG 5228 clonaje en pUJ9. BamHI

43 Materiales y Métodos

Tabla 4. Oligonucleótidos empleados en RT-PCR semicuantitativa. Las secuencias en negrita se corresponden con dianas de restricción creadas.

GEN SECUENCIA 5’-3’OLIGO INTERNO F(directo) SECUENCIA 5’-3’OLIGO INTERNO R(reverso) MSMEG_5935 CGAAACTTCTGCGCAATGCC CCAGTCCGATACGCAGTGC MSMEG_5936 ATGAAGAAGATGTCCGCACG GAAGAACGTCCGGTACAGG MSMEG_5937 ACGCGTCGACAACTACGGCTTCTCCAAGAC CCGCTCGAGTCATCAAAAAGCCCACGGTC MSMEG_5938 ACGCGTCGACATCTTCTGCAGATCCTGCG CCGCTCGAGTGTCCGTCGCTGCTTGTAC MSMEG_5939 AAAACTGCAGTACGAGGAAGCGGGCATTC CCGCTCGAGCTCGTGGTCTTGGTGAACTC MSMEG_5940 AAACTGCAGAACTGGCAGATCAAGCTGTG CCACTCGAGTTGAGCCGCACACCGAAAC MSMEG_5941 AAAACTGCAGAGGTCTCGAACCGCCGTAC CCGCTCGAGGACGAGGTTCTTGCCGCTG MSMEG_5943 AAAACTGCAGAGCTTCCACATGACCGAGC CCGCTCGAGAAGATGGACCGCTTGGTGG MSMEG_5994 TCAACGGAACCAAAATCGGTG CAGTGCGAGTTGGTTGACC MSMEG_5995 GGGCCCATGTCGTCGTTCGAGCTGATC GGGCTCGAGTCTGCGCGAACGCGATCATG MSMEG_5996 AAAACTGCAGGACATCGACATGCCCAACC CCGCTCGAGTGTGGTGTCACGCAGACCC MSMEG_5997 TTCTCGGGAGATCACCTGC CTAACGTGTGATGAACGGAC MSMEG_5998 CAGACGTTCCTGTTCAAGAC GCTTCTCGCTCCTGGTCTG MSMEG_5999 AAAACTGCAGCGCCAACGGCTCCAACGTC CCGCTCGAGAACTCGTGTTGATGATGCGC MSMEG_6000 AAAACTGCAGTGCCGTACGAGTTCCACAGC CCGCTCGAGCCTGGTTCTGCATGACCGC MSMEG_6001 AAAACTGCAGGACGCCAAATTCGGTCTGC CCGCTCGAGTGTCCTTGGTGGCGATGTC MSMEG_6002 GCTCTAGAACGTGCGCAGCTTCTGGG ATAAGAATGCGGCCGCTCAGGAACAGGTCGTCGAAG MSMEG_6003 CTAGTCTAGAAACCAGATCGATCGCTACGG CCGCTCGAGGGTAGATGTTGACGAACCGG MSMEG_6004 CTAGTCTAGAACGCTCGACGAACTCAAGAC GGGCTCGAGGGACGGAATGACCACCACG MSMEG_6005 CCGCTCGAGTATCACCTACCGCAGATCTTC ACGCGTCGACCTCCGAAAGATACTGCGAC MSMEG_6006 TGCAGTTGCTCGTCATCGC TGAGCTGCACGAGCATGAC MSMEG_6007 AAAACTGCAGAAAGCTTTCTGACGGTGCTG CCGCTCGAGACCGTGAACAGACCGAACG MSMEG_6008 CTAGTCTAGAAAGGAACTCGGATTCAGCAC GGAGCTCGGATCTCGTTGTCGAAGTGCC MSMEG_6009 TCTCTCGGGCAGCCTGTAC ACATCTTGCGCTGCTCTTTTG MSMEG_6010 GGTTACTGACGTGCGTTTCG ATACGGCACCAGTGCTGAG MSMEG_6011 ACGTGGTGATCTCCGACTAC ACTCCTCGTCTGTCATGTCG MSMEG_6012 GCTCTAGAGACAAGGTCAACCACTTCGG CGAGCTCGCTGATTCCCCGTCGCTCC MSMEG_6013 CGAGCTCGAAACGACGGCACCTGGGAC GCTCTAGATGATGCACAGGTAGCGGTC MSMEG_6014 AACAGCTCGACCGTGTGTTG GAAGAAGATCTCGCCGAAC MSMEG_6015 CGAGAAGTTCGACGGCATC CGGATTCGTGGCTTGCTCC MSMEG_6016 CCGCTCGAGCACGCAGTGGGACACTTTCAC AAAACTGCAGTTGAGCGCCTGGAAGCTGC MSMEG_6017 CTAGTCTAGATTCCTGGCGTGTTTCGACG GGAGCTCCAGTTCCTCGGGTGCGATCAC MSMEG_6033 CCTTCAGAACTGGTACAACG CCAGATTGGTGACGTTCTGC MSMEG_6034 ATGGACGACCGGCGTCACGG TCAATTATCAGCTTCAGGG MSMEG_6035 AAAACTGCAGCACGAGAACCAGCAGCACG CCGCTCGAGGGGTTTGGTCTTCGGCACC MSMEG_6036 GCTCTAGATTCAAGGAGGGCACCTCGG ATAAGAATGCGGCCGCTCCTTGGTCAGCACGAC MSMEG_6037 AAAACTGCAGAACGCTACAGCGCCAAG CCGCTCGAGGGTTCGACGTTGAACTTCGC MSMEG_6038 GCTCTAGAACAACTGGCACCTCGCGC ATAAGAATGCGGCCGCCGTCGTCGATCGTGTACTC MSMEG_6039 GCTCTAGAAGGACCTCGACACCGACTTC ATAAGAATGCGGCCGCAGCCAGTGCACCACGGTC MSMEG_6040 AACCACGACAACGTGCTGTC TCAGCTGAACTTGGTCTGGG

44 Materiales y Métodos

Tabla 5. Oligonucleótidos empleados en RTq-PCR. Las secuencias en negrita se corresponden con dianas de restricción creadas.

GEN SECUENCIA 5’-3’OLIGO INTERNO F (directo) SECUENCIA 5’-3’OLIGO INTERNO R (reverso) MSMEG_0217 CGACTACCACATCACCACGG TGACGTTCTTGCCGACCTTG MSMEG_1366 GTTCCTGAAGTCGCTGATCG GATCTCGTAGAGCTCCTTGG MSMEG_1604 TGCTGTTCAAGATGCGCGAC CCATCGCGTTGGAGCCCTTG

MSMEG_5906 TTCTGACCATCAACAGCGTCG CGATCGAGAAGTGCAGTTCAC MSMEG_5228 CGTACACCGAGCGTTTCAAC GGATCGAGCACGTCAGCATG MSMEG_5233 CTGCAGACCGTCGACGTG CTAGACTAGTGATGAGCAGCACCTCGTGG MSMEG_5895 GGTGTGGTGGCCAAGATGC GCACCAGGTCGATGTACTGC MSMEG_5920 TGGGTTTGCAACTCGGATATTG GGTGAACACGGTGTCGAAAC MSMEG_5925 CGACAACGTCACCGACATGG CGTTGTGCAGGTACTGGCTG MSMEG_6009 AGCAGATGGTCGAAGAGGTC CGTCAGCTTCTCCAGCGG MSMEG_6012 GCTCTAGAGACAAGGTCAACCACTTCGG CGAGCTCGCTGATTCCCCGTCGCTCC ATAAGAATGCGGCCGCTCCTTGGTCAGCACG MSMEG_6036 GCTCTAGATTCAAGGAGGGCACCTCGG AC ATAAGAATGCGGCCGCAGCCAGTGCACCAC MSMEG_6039 GCTCTAGAAGGACCTCGACACCGACTTC GGTC MSMEG_6041 TCGTCGACGGACGTGCTTC CGTCGAGCAGCAGCACATC

2. Medios y condiciones de cultivo

2.1. Escherichia coli

Todas las soluciones y medios de cultivo utilizados en este trabajo se esterilizaron por calor húmedo en un autoclave a 121 ºC y 1 at de presión, o mediante filtración utilizando filtros estériles Millipore de 0,2 micras de diámetro. El medio complejo utilizado para cultivar las células de E. coli es el medio Luria-Bertani (LB) (Sambrook y Russell, 2001). Los cultivos en medio sólido se realizaron con medio LB al que se adicionó Bacto Agar (Pronadisa) al 1,5% (p/v). Cuando fue necesario, se añadió 5-bromo-4-cloro-3-indolil-β-D-galactopiranósido (X-Gal) 0,08 mM, así como isopropil-1-tio-β-galactopiranósido (IPTG) de 1,00 a 0,01 mM.

2.2. Mycobacterium smegmatis

Para el cultivo de micobacterias se utilizan los medios complejos Bacto Middlebrook 7H10 Agar (Difco) y LB con 1,5% de agar como medios sólidos, y

45 Materiales y Métodos

Middlebrook 7H9 Broth (Difco) y LB como medios líquidos. Al medio Bacto Middlebrook 7H9 Broth y 7H10 Agar se le añade Middlebrook ADC Enrichment (Difco) (fórmula aproximada por litro de agua: NaCl (8,5 g), albúmina bovina (Fracción V) (50 g), dextrosa (20 g), catalasa (0,03 g)) (1/5 del volumen final). El medio 457 es un medio basal (pH 6,9) cuya composición se detalla a continuación: KH2PO4 (1,52 g), Na2HPO4 (2,44 g), (NH4)2SO4 (0,5 g),

MgSO4·7H2O (0, 2 g), CaCl2·2H2O (0,05 g), H2O destilada csp 1 L. A este medio se adicionó glicerol 0,6 M o 18 mM o colesterol 1,8 mM como fuente de carbono para su utilización como medio mínimo. Para los cultivos en medio líquido con colesterol se utilizó medio mínimo 457 al que se adicionó colesterol acomplejado con β-ciclodextrina metilada al azar, hasta conseguir una concentración final de colesterol 1,8 mM, que se corresponde con una concentración final de ciclodextrina 18 mM. El protocolo de síntesis de estos complejos se detalla más adelante. A todos los cultivos en medio líquido de micobacterias se le adiciona siempre Tween 80 al 0,05% para evitar la agregación de las células.

Síntesis de complejos colesterol-metil-β-ciclodextrina

Este protocolo se ha llevado a cabo para conseguir un medio en el que el colesterol se disuelva perfectamente, ya que así está repartido homogéneamente y además no produce turbidez, lo que permite que se pueda medir espectrofotométricamente el crecimiento de los cultivos en medio líquido. Esta disolución se lleva a cabo mediante la formación de complejos de colesterol con metil-β-ciclodextrina (TRMB-T Randomly Methylated BCD, CTD Inc.) Para ello se ha seguido un protocolo de disolución de esteroides en ciclodextrinas descrito previamente (Klein et al., 1995). Brevemente, una solución de 30 mg de colesterol en 400 µl de isopropanol-cloroformo (2:1 v/v) se añade en pequeñas alícuotas a 1 g de β-ciclodextrina metilada al azar disuelta en 11 ml de PBS y en agitación en un baño de agua a 80 ºC. La solución final contiene colesterol 6,8 mM y ciclodextrina 70 mM (≈9% ciclodextrina), y es la base que se añadirá al medio mínimo para cultivos con colesterol en medio líquido o en placa. Habitualmente se preparan las

46 Materiales y Métodos placas de cultivo con colesterol 1,8 mM (0,08% colesterol), con 1,5% de agar y medio mínimo 457. Los cultivos líquidos también contienen colesterol 1,8 mM, que se corresponde con una concentración final de ciclodextrina de 18 mM. Este protocolo también se llevó a cabo para disolver los otros esteroides utilizados en este trabajo, ajustando en cada caso la cantidad de esteroide utilizada según las necesidades. En el caso del ergosterol, la cantidad de ciclodextrina necesaria para su completa disolución fue mayor, por lo que la concentración final de ciclodextrina en los medios de crecimiento fue de 35 mM. Como se puede apreciar en la figura 8, la ciclodextrina apenas puede ser utilizada por M. smegmatis como fuente de carbono y energía. Los cultivos en medio líquido con ciclodextrina como única fuente de carbono a las concentraciones utilizadas llegan a una DO600 máxima de 0,3. Así, cuando la ciclodextrina se encuentra acomplejada con un esteroide, se puede discernir perfectamente el crecimiento debido al esteroide solubilizado.

A B Figura 8. M. smegmatis mc2155 sembrado en A. Placa con ciclodextrina 18 mM. B. Placa con colesterol 1,8 mM-ciclodextrina 18 mM.

Las células de E. coli y M. smegmatis se cultivaron a 37 ºC. Los cultivos en medio líquido se llevaron a cabo en un agitador orbital a 300 rpm. El crecimiento en medio líquido fue seguido por turbidimetría a 600 nm (DO600) empleando un espectrofotómetro UVmini-1240 (SHIMADZU). Los antibióticos se prepararon en soluciones acuosas 1000x, a excepción de la ampicilina, que se preparó 250x. Las soluciones preparadas se esterilizaron por filtración y se conservaron a –20 ºC. Los antibióticos se utilizaron a las

47 Materiales y Métodos concentraciones finales que se indican a continuación. Para E. coli: ampicilina (Ap, 100 μg/ml), kanamicina (Km, 50 μg/ml), higromicina (Hyg, 150 μg/ml), gentamicina (Gm, 10 μg/ml). Para M. smegmatis: kanamicina (Km, 20 μg/ml), higromicina (Hyg, 50 μg/ml) y gentamicina (Gm, 5 μg/ml). Durante periodos inferiores a un mes las cepas se conservaron a 4 ºC en placas de LB, 7H10 o medio mínimo. Para la conservación a largo plazo, las bacterias se congelaron en el medio de cultivo correspondiente con glicerol al 20% (v/v) para E. coli y al 50% (v/v) para M. smegmatis y se mantuvieron a -80 ºC.

3. Transformación de las células

3.1 Transformación de Escherichia coli

Las células de E. coli fueron modificadas genéticamente por transformación tras hacerlas competentes mediante el método de RbCl y choque térmico (Sambrook y Rusell, 2001).

3.2 Transformación de Mycobacterium smegmatis

3.2.1 Preparación de células electrocompetentes

La preparación de células electrocompetentes de M. smegmatis se llevó a cabo según un protocolo descrito previamente (Parish y Stoker, 1998). Básicamente, se siembra una colonia de la cepa de micobacteria correspondiente en 10 ml de medio 7H9-ADC conteniendo Tween 80 0,05% y se incuba a 37 ºC hasta alcanzar la fase estacionaria (aproximadamente 30 horas en M. smegmatis). Con 2 ml de este cultivo se inoculan 200 ml de medio 7H9-ADC conteniendo Tween 0,05% y se incuba en agitación (80 rpm) a 37 ºC hasta una

DO600 de 0,8-1 (18 h de cultivo aproximadamente). A continuación el cultivo se incuba 1,5 h en hielo y se centrifuga repartido en 4 tubos Falcon de 50 ml a 3000 g a 4 ºC 10 min. Una vez decantado el sobrenadante, se resuspenden las células en

48 Materiales y Métodos

200 ml de glicerol 10% (enfriado en hielo, y con Tween 0,05%). Tanto en este paso como en las etapas posteriores se resuspenden las células volteando el recipiente, nunca con vórtex, ni pipeteando. Seguidamente se centrifuga la suspensión a 3000 g a 4 ºC 10 min. Posteriormente se retira el sobrenadante y se resuspenden las células en 100 ml de glicerol 10% frío. Seguidamente se centrifugan las células a 3000 g 10 min a 4 ºC y se añaden 25 ml de glicerol 10% frío. Las células se resuspenden volteando y se dejan reposar para sedimentar los agregados que no se resuspenden. Posteriormente se toma la suspensión sin los agregados con una pipeta estéril. La suspensión se lleva a un tubo Falcon limpio enfriado en hielo y se centrifuga a 3000 g 10 min a 4 ºC. Finalmente se retira el sobrenadante y se resuspenden las células en 1,5 ml de glicerol 10% frío, que se reparten en alícuotas de 200 µl y se guardan a −80 ºC hasta su uso.

3.2.2 Electroporación

A una alícuota de las células competentes se añade el DNA con el que se va a transformar. Esta mezcla se pasa a una cubeta de electroporación (Cell Projects), la mezcla se incuba 10 min en hielo y se electropora en un electroporador Gene Pulser (Biorad) a 2,5 Kv, 25 µF y 1000 Ω. Se incuba la cubeta en hielo otros 10 min. Posteriormente se añade 1 ml de medio 7H9-Tween- ADC a la cubeta y el líquido se pasa a un tubo Falcon de 15 ml. Las células se incuban 4 h a 37 ºC en agitación (80 rpm) antes de sembrarlas en medio sólido con los antibióticos necesarios.

4. Técnicas de DNA

Las enzimas de restricción se obtuvieron de Amersham, Takara y New England Biolabs. La enzima T4 DNA ligasa fue proporcionada por USB (Amersham), la DNA polimerasa I y la Pfu polimerasa fueron suministradas por Biotools B. M. Labs. Todas las enzimas se emplearon atendiendo a las

49 Materiales y Métodos especificaciones de las diferentes casas comerciales. Los fragmentos de DNA se purificaron empleando geles de agarosa, mediante el kit GeneClean (BIO 101) o el High Pure PCR Product Purication Kit (Roche).

4.1 Electroforesis de DNA en geles de agarosa

Se utilizaron geles de agarosa al 0,7% o al 1,5% en tampón TAE (Tris-HCl 40 mM, ácido acético 20 mM, EDTA 2 mM pH 8,1), utilizando el mismo tampón como electrolito. A las muestras se les añadió ¼ de su volumen de una solución compuesta por Ficoll 400 al 30% (p/v), azul de bromofenol al 0,2% (p/v), xilencianol al 0,2% (p/v) y EDTA 40 mM pH 8,0. La electroforesis se realizó a 100 V durante 15-20 min y, una vez finalizada, los geles se tiñeron con bromuro de etidio (5 µg/ml) y los fragmentos de DNA se visibilizaron con radiación ultravioleta en un transiluminador. Como marcadores de tamaño se utilizaron el DNA del fago λ digerido con la enzima de restricción BstEII (Amersham), y la forma replicativa del fago ΦX174 digerida con HaeIII (New England Biolabs).

4.2 Extracción de DNA cromosómico de micobacterias

Para realizar la extracción de DNA se recogen las células de una placa, se resuspenden en 400 µl de Tris-EDTA (TE) y se incuban a 80 ºC durante 20 min. Se dejan enfriar a temperatura ambiente y se añaden 50 µl de lisozima (10 mg/ml), se mezcla con vórtex y se deja 1-12 h a 37 ºC. A continuación se añaden 75 µl de SDS al 10% conteniendo proteinasa K (10 mg/ml), se mezcla con vórtex y se incuba 10 min a 65 ºC. Posteriormente se añaden 100 µl de NaCl 5 M y 100 µl de CTAB/NaCl precalentados a 65 ºC y se incuba 10 min a 65 ºC. Seguidamente se añaden 750 µl de cloroformo/alcohol isoamílico (24:1), se mezcla con vórtex y se centrifuga 5 min a 14000 g. La solución acuosa se toma con pipeta, se transfiere a un tubo eppendorf y se añade un volumen equivalente de fenol/cloroformo/isoamílico (25:24:1), se mezcla con vórtex y se centrifuga 5 min a 14000 g. La solución acuosa se toma con pipeta y se transfiere a un eppendorf

50 Materiales y Métodos donde el DNA se precipita con 0,6 volúmenes de isopropanol y se mantiene 30 min a 20 ºC. Finalmente el DNA se centrifuga 15 min a 14000 g a 4 ºC, se lava con etanol al 70%, se centrifuga 2 min a 14000 g y se seca al aire o en speed-vac el precipitado que posteriormente se resuspende en 40-100 µl de TE.

4.3 Aislamiento de DNA plasmídico

La extracción de DNA plasmídico de células E. coli se llevó a cabo empleando el sistema High Pure Plasmid Purification Kit (Roche), de acuerdo con las especificaciones del fabricante.

4.4 Reacción de amplificación en cadena con DNA polimerasa termorresistente (PCR)

La amplificación del DNA se realizó en un equipo Mastercycler Gradient de Eppendorf y las enzimas que se emplearon fueron la DNA polimerasa I y la Pfu polimerasa, ambas proporcionadas por Biotools B. M. Labs. Las mezclas de reacción contenían MgCl2 1,5 mM y dNTPs 0,25 mM. Los productos amplificados se purificaron con el sistema High Pure PCR Product Purification Kit (Roche).

4.5 Secuenciación de DNA

La secuenciación de DNA se llevó a cabo en el Servicio de Secuenciación Automática de DNA (SSAD) del Centro de Investigaciones Biológicas (CIB) (SECUGEN, SL) utilizando un secuenciador automático modelo ABI Prism 3730 (Applied Biosystems). Para la reacción de secuenciación se utilizó el “Dye Terminator Cycle Sequencing Ready Reaction Kit” de Applied Biosystems, y la DNA polimerasa AmpliTaq FS, de acuerdo con las recomendaciones del proveedor. Las reacciones de amplificación se llevaron a cabo mediante la técnica de PCR con un termociclador “Gene Amp PCR System 2400” de Perkin-Elmer. En el caso concreto de los experimentos de extensión por cebador (primer

51 Materiales y Métodos extension), la secuenciación del DNA patrón se llevó a cabo según el método de terminación de la polimerización por dideoxinucleótidos (Sanger et al., 1977) utilizando el Sequenase Version 2.0 DNA Sequencing Kit (USB), y [α-32P]dATP (14,8 × 1012 Bq/mmol, 3,7 × 105 Bq/μl) (Amersham Biosciences) como deoxinucleósido trifosfato marcado radiactivamente, siguiendo las recomendaciones del fabricante.

4.6 Construcción de cepas mutantes de Mycobacterium smegmatis mc²155 mediante mutagénesis insercional

Para la construcción de distintos mutantes de M. smegmatis se procedió a la interrupción insercional de los genes por recombinación homóloga simple. Para ello, se amplificaron fragmentos internos de al menos 600 pb de cada uno de los genes, y se clonaron en uno de los polilinkers de pJQ200x (Jackson et al., 2001), plásmido que no replica en Mycobacterium pero sí en E. coli (Figura 9).

MCS

M C S

Figura 9. Vector pJQ200x. Este vector incluye un gen de resistencia a gentamicina (Gm), el gen de contraselección sacB, que permite distinguir aquellas colonias en las que el vector se ha insertado en el cromosoma (y por tanto son sensibles a sacarosa) y el gen xylE, que permite confirmar, mediante la adición de catecol a una colonia, si la construcción se insertó en el cromosoma (se producirá una coloración amarilla intensa). Las flechas amarillas indican la situación de los dos sitios de clonación múltiple (MCS) presentes en este vector.

52 Materiales y Métodos

Con las construcciones resultantes se transformó la cepa E. coli DH10B y se seleccionaron clones en que se comprobó que dichas construcciones eran correctas. De estos clones se extrajo DNA plasmídico para la electroporación de M. smegmatis. Las bacterias recombinantes presentaban una interrupción génica por inserción, mediante recombinación homóloga entre el gen nativo cromosómico y el correspondiente fragmento interno clonado en el vector suicida, de los respectivos derivados del plásmido suicida pJQ200x (figura 10), y fueron seleccionadas en un primer paso en placas de 7H10 con gentamicina (5 μg/ml). En un segundo paso, las colonias resistentes se crecieron en placas de 7H10 con sacarosa 10% para selección negativa, ya que el plásmido pJQ200x incluye el gen sacB (levansucrasa de Bacillus subtilis), cuya expresión es letal para la bacteria cuando crece en sacarosa. Finalmente, a aquellas colonias sensibles a sacarosa se adicionaron 10-15 µL de catecol. La aparición de coloración amarilla en las mismas indica que portan el gen xylE que incluye el plásmido suicida. Los mutantes así obtenidos fueron analizados por PCR, empleando un oligonucleótido específico del vector pJQ200x (Tabla 3) y un oligonucleótido externo al fragmento clonado, para confirmar la interrupción de los respectivos genes truncados. También se analizó la ausencia de una copia del gen no mutado mediante amplificación por PCR con un oligonucleótido de la región 5’ y otro de la región 3’ del gen mutado en cada caso.

53 Materiales y Métodos

Amplificación mediante PCR de un fragmento interno del gen

MSMEG_1604 MSMEG_5228 MSMEG_5233

XhoI PstI BamHI SalI XbaI SpeI

Inserción en pJQ200x

Gm xyl E

pJQ200X ( ~ 6407 pb) ori sacB

XbaI SpeI BamHI

SalI PstI

pJQ1604 pJQ5228 pJQ5233 (~7357pb) (~7407 pb) (~7043 pb)

XhoI

ELECTROPORACIÓN (M. smegmatis mc²155)

PstI XhoI

RECOMBINACIÓN HOMÓLOGA SIMPLE (GmR, SacS) M. smegmatis::MSMEG_1604

SalI BamHI

RECOMBINACIÓN HOMÓLOGA SIMPLE (GmR, SacS) M. smegmatis::MSMEG_5228

SpeI XbaI RECOMBINACIÓN HOMÓLOGA SIMPLE (GmR, SacS) M. smegmatis::MSMEG_5233

Figura 10. Mecanismo de mutagénesis insercional en M. smegmatis utilizando el vector pJQ200x. El fragmento interno amplificado del gen a mutar (en este ejemplo MSMEG_1604, MSMEG_5228 y MSMEG_5233) se inserta en pJQ200x utilizando sitios de restricción presentes en los MCS. Como resultado se obtiene un derivado del plásmido pJQ200x portando un fragmento interno del gen (pJQ1604, pJQ5228 y pJQ5233 en este ejemplo). Este plásmido se electropora en

54 Materiales y Métodos

M. smegmatis y tiene lugar la recombinación homóloga del mismo con el gen correspondiente en el cromosoma, dando lugar a un mutante por interrupción del gen mediante inserción del plásmido suicida.

4.7 Construcción de cepas mutantes de Mycobacterium smegmatis mc²155 mediante deleción por recombinación homóloga

Para la construcción de mutantes de M. smegmatis mediante deleción (M. smegmatisΔMSMEG_5228 en este trabajo, figura 11) se clonaron primero en un mismo vector pUC19 dos fragmentos de DNA de unos 600 pb cada uno, uno en posición 5’ al gen a mutar (fragmento up-5228), utilizando los oligonucleótidos MSMEG_5228 UP F/UP R (Tabla 3) y otro en posición 3’ al gen a mutar (fragmento down-5228), utilizando los oligonucleótidos MSMEG_5228 DOWN F/DOWN R (Tabla 3). Con la construcción resultante se transformó la cepa E. coli DH10B y tras extraer DNA plasmídico se digirió la región conteniendo los fragmentos up y down con la enzima de restricción ApaI y se insertó en el sitio ApaI de pJQ200x. La nueva construcción se seleccionó tras transformar nuevamente E. coli DH10B y se electroporó con ella M. smegmatis mc²155. Los transformantes por electroporación se sembraron en placas de medio 7H10 con gentamicina. Las colonias obtenidas con gentamicina se replicaron en placas de 7H10 con sacarosa 10%. Se seleccionaron colonias que fuesen resistentes a gentamicina, sensibles a sacarosa y que portasen el gen xylE (lo que se comprobó como se detalla en el apartado anterior). Estas colonias han sufrido una recombinación simple, todo el vector está integrado en el cromosoma. Para forzar una segunda recombinación, tras crecer una colonia en 10 ml de medio 7H9 con gentamicina hasta una DO600 aproximada de 0,8-0,9, se sembraron 20 μL de una dilución ½ del cultivo en una placa de 7H10 y otros 20 µl en una placa de 7H10 con sacarosa 10%. En la placa con sacarosa se deben obtener alrededor de 103 a 104 colonias menos, lo que indica que ha tenido lugar la recombinación doble. Las colonias crecidas en presencia de sacarosa se replicaron en placas de 7H10 con gentamicina o sacarosa 10%. Aquellas sensibles a gentamicina, que no portan el

55 Materiales y Métodos gen xylE y resistentes a sacarosa eran mutantes por recombinación doble. Los mutantes así obtenidos fueron analizados por PCR, empleando tres parejas distintas de cebadores que dan lugar a amplicones de diferente tamaño según se trate de una cepa mutada o no mutada: 1. un oligonucleótido situado a 566 pb del inicio del gen MSMEG_5228 (MSMEG_5228 UP F) con un oligonucleótido reverso situado al final del gen (5228-R); 2. Un nucleótido situado al inicio del gen (5228-F) con un oligonucleótido situado a 604 pb del final del gen (MSMEG_5228 Down R); 3. se analizó la ausencia de una copia del gen no mutada mediante amplificación por PCR con un oligonucleótido situado en el inicio del gen (5228-F) y otro reverso situado al final del gen (5228-R). La secuencia de estos oligonucleótidos se muestra en la Tabla 3.

Zona up-5228 Zona down-5228 (654 pb) (633 pb)

MSMEG_5226 MSMEG_5227 MSMEG_5228 MSMEG_5229 MSMEG_5230 Amplificación mediante PCR de los fragmentos up-5228 y down- 88 29 5228 EcoRI- Xba Pst ApaI-

lacZ EcoR I-ApaI MCS Inserción de los fragmentos XbaI PstI up-5228 y ApaI- HindIII pUC19 down-5228 en R pUC5228DR bla (Ap ) (2686 pb) pUC19

rep (pMB1)

Digestión con ApaI e inserción del fragmento up-down en pJQ200x Electroporación en M. smegmatis ApaI mc²155 MSMEG_5226 MSMEG_5227 MSMEG_5229 MSMEG_5230 pJQ5228DR ApaI 88 29

ΔMSMEG_5228 RECOMBINACIÓN HOMÓLOGA DOBLE M. smegmatisΔMSMEG_5228 (GmS, SacR)

Figura 11. Construcción del mutante mediante deleción M. smegmatisΔMSMEG_5228. Los detalles de la construcción se indican en el texto.

56 Materiales y Métodos

La construcción del doble mutante M. smegmatis::MSMEG_1604- ΔMSMEG_5228 se llevó a cabo a partir del mutante M. smegmatis ΔMSMEG_5228. Se hicieron células competentes de esta cepa y se transformaron con el plásmido pJQ1604int, que incluye un fragmento interno del gen MSMEG_1604 y que al sufrir recombinación homóloga simple produjo un mutante en el gen MSMEG_1604 mediante interrupción por el plásmido suicida (Fig. 12). Así, el mutante doble M. smegmatis::MSMEG_1604-ΔMSMEG_5228 presenta el gen MSMEG_5228 delecionado y el gen MSMEG_1604 interrumpido por pJQ200x.

SacI XbaI Gm xyl E MSMEG_1604 INSERCIÓN pJQ200X

ori XbaI SacI sacB

SacI XbaI

pJQ1604int

ELECTROPORACIÓN (M. smegmatis ΔMSMEG_5228)

SacI XbaI

RECOMBINACIÓN HOMÓLOGA SIMPLE (GmR, SacS) M. smegmatis::MSMEG_1604-ΔMSMEG_5228

Figura 12. Construcción del mutante doble M. smegmatis::MSMEG_1604-ΔMSMEG_5228. Se amplificó un fragmento interno de MSMEG_1604 y se clonó en el sitio SacI-XbaI de pJQ200x dando lugar al plásmido pJQ1604int. Con esta construcción se electroporó el mutante por deleción M. smegmatis ΔMSMEG_5228. Tras la recombinación homóloga simple que tiene lugar en

MSMEG_1604 se obtiene el mutante doble M. smegmatis::MSMEG_1604-ΔMSMEG_5228.

57 Materiales y Métodos

5. Técnicas de proteínas

5.1 Obtención de los extractos proteicos

5.1.1 Extractos de Escherichia coli

La obtención de extractos crudos se llevó a cabo con las cepas de E. coli que expresaban distintas proteínas de M. smegmatis en vectores de expresión. Para ello se cultivaron las células a 37 ºC en 1 L de medio LB y se añadió la concentración de IPTG requerida (50 µM) cuando los cultivos alcanzaron una

DO600 de 0,5-0,6. La inducción con IPTG se mantuvo durante 3 h a temperatura ambiente (20 ºC) en agitación. Los cultivos se resuspendieron en 5 ml del tampón adecuado tras centrifugar 30 min a 8000 g y 4 ºC, lavar con solución salina y centrifugar de nuevo y se lisaron empleando la prensa de French (Aminco Corp.) operada a una presión de 20000 psi. La suspensión obtenida se centrifugó a 4 ºC a 16000 g durante 30 min, recogiéndose el sobrenadante (extracto crudo). La determinación de la concentración de proteína se realizó empleando el método de Bradford (Bradford, 1976), usando albúmina de suero bovino (BSA) como patrón.

5.1.2 Extractos de Mycobacterium smegmatis

Para obtener extractos de las micobacterias se utilizó un sonicador Branson 150. Un volumen de los cultivos correspondientes se centrifugó, se lavó 2-3 veces con solución salina (NaCl 0,9% en H2O destilada) y se resuspendió en 500 µl del tampón adecuado en tubos eppendorf de 2 ml. Las muestras se sonicaron enfriadas en hielo aplicando 5-8 pulsos de 1 min a intensidad 9 del equipo. Entre pulsos se incubaron los tubos 5 min en hielo. Después se centrifugaron a 4 ºC a 14000 g y se separó la fracción celular soluble de la insoluble. Alternativamente, puede obtenerse el extracto proteico de las micobacterias sometiéndolas a lisis en Fast-Prep (ver apartado 7.1 de Materiales y Métodos)

58 Materiales y Métodos aumentando el número de ciclos hasta 6 y utilizando como medio de suspensión celular el tampón adecuado en cada caso. La determinación de la concentración de proteína en ambos casos se realizó empleando el método de Bradford.

5.2 Electroforesis en geles de poliacrilamida-SDS

Las electroforesis analíticas de proteínas se realizaron en condiciones desnaturalizantes en presencia de dodecilsulfato sódico (SDS), en geles de poliacrilammida (PAGE), a una concentración del 10% o del 12,5% según la técnica descrita previamente (Laemmli, 1970). Las muestras se hirvieron durante 10 min en presencia del tampón de ruptura (Tris-HCl 250 mM a pH 6,8; SDS 2%; β-mercaptoetanol 5%; glicerol 10% y azul de bromofenol 0,05%). Las electroforesis se realizaron a temperatura ambiente, empleando un electrolito de composición: Tris-HCl 25 mM pH 8,0, glicina 192 mM y SDS 0,1%. Las proteínas fueron teñidas con Coomasie Brilliant Blue R250, según se describe previamente (Swank y Munkres, 1971). Las proteínas empleadas como marcadores de tamaño molecular (miosina, 200 kDa; β-galactosidasa, 116,2 kDa; fosforilasa B, 97,4 kDa; BSA, 66,2 kDa; ovoalbúmina, 45,0 kDa; anhidrasa carbónica, 31,0 kDa; inhibidor de tripsina, 21,5 kDa; lisozima, 14,4 kDa; aprotinina, 6,5 kDa) fueron proporcionadas por Bio-Rad (marcadores Broad-Range).

5.3 Purificación de la proteína KstR

El gen que codifica la proteína KstR, kstRMsm, (MSMEG_6042) se amplificó por PCR y se subclonó en el vector de hiperexpresión pET-29a (+), fusionando en su extremo 3’ 6 tripletes en fase que codifican un tag de 6His, resultando en el plásmido pET6042. La cepa E. coli BL21 (DE3) transformada con el plásmido pET6042, se creció en 50 ml de LB a 37 ºC hasta una DO600 de 0,6, momento en que se indujo la expresión de KstR-His con IPTG 200 μM, y se mantuvo el cultivo otras 3 h a 37 ºC. Tras centrifugar 30 min a 8000 g y 4 ºC, lavar con solución

59 Materiales y Métodos salina y centrifugar de nuevo, los cultivos se resuspendieron en 5 ml del tampón KST (HEPES 20 mM pH 8, KCl 150 mM, ß-mercaptoetanol 2 mM, glicerol 10%,

MgCl2 10 mM, PMSF 0,1 mM e imidazol 10 mM) y se lisaron empleando la prensa de French (Aminco Corp.) operada a una presión de 20000 psi. A continuación, la suspensión obtenida se centrifugó durante 30 min a 4 ºC a 16000 g y se purificó a través de columnas de níquel-nitrilotriacetato en gel de sílice (columnas Ni-NTA Spin, del kit Ni-NTA Spin, Qiagen). La columna se equilibró con 600 μl de tampón KST sin imidazol (centrifugando durante 2 min a 300 g a 4 ºC), y seguidamente se pasó el extracto proteico de 600 en 600 μl, quedando retenida en la columna la proteína KstR-His. Seguidamente se lavó la columna con 3 volúmenes de tampón KST con una concentración de imidazol 50 mM, y mediante interacción de afinidad se procedió a la elución de la proteína unida a ésta con tampón KST con imidazol 1 M. La pureza de las muestras recogidas se analizó mediante SDS-PAGE. Las fracciones recogidas se concentraron y se eliminó el imidazol de las mismas utilizando las columnas VIVASPIN 500 (Sartorius); primero se pasó toda la muestra a concentrar por la columna según las especificaciones del fabricante, y posteriormente se realizaron 3 lavados con el mismo tampón KST sin imidazol, obteniendo un volumen final de muestra de 50-75 μl. La concentración de proteína pura KstR-His se calculó utilizando un Nanodrop 1000 (Nanodrop Technologies) o espectrofotómetro UVmini-1240 (SHIMADZU). La proteína purificada se conservó en tampón KST sin imidazol a 4 ºC por períodos no superiores a una semana.

5.4 Ensayos enzimáticos

5.4.1 Ensayos in vitro de actividad productora de 4-colesten-3-ona para análisis mediante TLC y LC/MS

Los extractos proteicos de E. coli BL21 (DE3) expresando los plásmidos pET1604, pET5228 o pET5233 se ensayaron en un volumen final de 1 a 4 ml que contenían 8 mg/ml de extracto proteico en el tampón adecuado (fosfato potásico 0,1 M pH 7,5 para extractos expresando el producto de MSMEG_1604 e

60 Materiales y Métodos hidrocloruro de trietanolamina 0,1 M pH 8,5 para extractos expresando el producto de MSMEG_5228 o MSMEG_5233). Una solución de colesterol 0,5% disuelto en Triton X-100 al 10% se añadió a las soluciones de ensayo hasta una concentración final de colesterol 0,44 mM. A los extractos proteicos que contenían pET5228 y pET5233, se añadió NAD 1,35 mM. Cuando los ensayos se realizaron para un análisis posterior mediante cromatografía en capa fina (TLC), se añadieron 120.000 dpm de [4C-14C]colesterol por ml. Como control positivo se llevaron también a cabo ensayos con colesterol oxidasa de Pseudomonas fluorescens (Sigma). Se añadieron 2 µl de una solución de enzima de concentración 5 mg/ml por ml de ensayo en tampón fosfato potásico 0,1 M pH 7,5. Los ensayos se llevaron a cabo a 30 ºC en tubos de vidrio con agitación continua. En el caso de las muestras para TLC, se retiraron alícuotas de 900 µl a distintos tiempos de reacción y tras precipitar las proteínas con ácido tricloroacético al 4% se centrifugaron, se recuperaron los sobrenadantes y se neutralizaron con NaOH 10 N. Posteriormente se extrajeron 2 veces con un volumen equivalente de acetato de etilo. A continuación las dos extracciones se concentraron bajo vacío. Los residuos así concentrados se analizaron posteriormente mediante TLC como se describe en el apartado 9 de esta sección. En el caso de las muestras para LC/MS, se retiraron alícuotas de 900 µl a distintos tiempos de reacción y se extrajeron 2 veces con un volumen equivalente de cloroformo. Como patrón interno se añadió a las alícuotas, antes de su extracción, 50 μl de una solución de pregnenolona 20 mg/ml en cloroformo. A continuación las dos extracciones se concentraron bajo vacío. Los residuos así concentrados se analizaron posteriormente mediante LC/MS como se describe en el apartado 8 de esta sección.

61 Materiales y Métodos

5.4.2 Ensayos in vivo de actividad productora de 4-colesten-3-ona para análisis mediante TLC y LC/MS

Diferentes cepas de M. smegmatis (mc2155, ::MSMEG_1604, ΔMSMEG_5228, ::MSMEG_1604-ΔMSMEG_5228, ::MSMEG_5233) se cultivaron en 15 ml (para un posterior análisis mediante TLC) o 25 ml (para un posterior análisis mediante HPLC) de medio mínimo 457 con colesterol 1,8 mM en β- ciclodextrina. Cuando los ensayos se realizaron para un análisis posterior mediante cromatografía en capa fina (TLC), se añadieron 3 x 106 dpm de [4C-14C] colesterol a los 15 ml. Los cultivos se crecieron a 37 ºC durante 24 h (para un posterior análisis mediante TLC) o 72 h (para un posterior análisis mediante LC/MS). En el caso de las muestras para TLC, se recogieron alícuotas de 2 ml a las 24 h de cultivo y se centrifugaron durante 15 min a 14000 g. Los sobrenadantes se filtraron con filtros de acetato de celulosa 0.20 μm (Iwaki) y se extrajeron 2 veces con un volumen equivalente de acetato de etilo. Los dos extractos de acetato de etilo se concentraron bajo vacío. Los residuos así concentrados se analizaron posteriormente mediante TLC como se describe en el apartado 9 de esta sección. En el caso de las muestras para LC/MS, se recogieron alícuotas de 2 ml a las 0, 24, 48 y 72 h de cultivo. Posteriormente se extrajeron 2 veces con un volumen equivalente de cloroformo añadiendo antes de la extracción 50 μl de una solución de pregnenolona 20 mg/ml en cloroformo. Los dos extractos de cloroformo se concentraron bajo vacío. Los residuos así concentrados se analizaron posteriormente mediante LC/MS como se describe en el apartado 8 de esta sección.

62 Materiales y Métodos

6. Ensayos de unión DNA-proteína

6.1 Marcaje de sondas con 32P

Mediante este método se marcó el oligonucleótido 5228 FP F. Para la reacción de marcaje se emplearon 2,5 µl del oligonucleótido (2 µM), 1,25 µl de tampón kinasa 10x (Biolabs), 3 µl de [γ-32P]ATP (3000 Ci/mmol) (Amersham Pharmacia Biotech) y 10 U de T4 polinucleótido kinasa 10 U/µl (Biolabs) en un volumen total de 10 µl. La mezcla de reacción se incubó 30 min a 37 ºC. Al término de la incubación se comprobó el nivel de incorporación del nucleótido radiactivo al oligonucleótido mediante una cromatografía en capa fina (TLC). Para ello se depositaron 0,5 µl de la sonda marcada sobre una membrana de sílica gel 60 (Merck) utilizando HCl 1 N como fase móvil. A continuación se realizó una autorradiografía empleando una película Hyperfilm™ MP (Amersham Pharmacia Biotech). Una vez marcado el oligonucleótido de interés se obtuvo mediante PCR el fragmento 5228 FP (196 pb) utilizando como molde 100 ng de DNA de M. smegmatis y los oligonucleótidos 5228 FP F y 5228 FP R (tabla 3 de oligonucleótidos). En este caso la reacción de PCR difiere de la descrita en el apartado 4.4 de esta sección. Se añadieron 10 µl del oligonucleótido marcado (5 pmoles), 7,5 µl del oligonucleótido frío a 1 µM (7,5 pmoles), 4 µl de dNTPs a 2,5 mM (0,2 mM final), 5 µl de tampón Taq polimerasa 10x, 1 µl de Taq polimerasa, 1 µl de DNA molde (100 ng/µl), en un volumen final de 50 µl. A continuación el producto amplificado se purificó con el sistema High Pure PCR Product Purification Kit (Roche) y se eluyó en un volumen final de 100 µl.

6.2 Ensayos de retardo en gel

Las mezclas de reacción contenían: tampón KST (HEPES 20 mM pH 8,0, KCl

150 mM, ß-mercaptoetanol 2 mM, glicerol 10%, MgCl2 10 mM, PMSF 0,1 mM), 0,1 nM de sonda de DNA (marcada mediante el método descrito en el apartado anterior), BSA 50 μg/ml y la proteína purificada en este trabajo KstR-His (o

63 Materiales y Métodos extracto proteico de la cepa E. coli BL21 (DE3) (pET6042) expresando KstR-His) en un volumen final de 20 μl. Cuando se ensayó la unión DNA-proteína en presencia de ligando, se añadió colesterol (0,25, 0,5, 1, 2 o 4 mM disuelto en Triton X-100 al 10%) en un volumen final de 9 µl. Después de incubar las diferentes mezclas de reacción durante 10 min a 25 ºC, las muestras se analizaron por electroforesis en gel no desnaturalizante de poliacrilamida al 5%. Los geles se corrieron en cubetas de electroforesis “Miniprotean II” (Bio-Rad) a 125 V en tampón TBE (Tris-borato 45 mM pH 8,3 y EDTA 1 mM) a temperatura ambiente. Los geles se secaron al vacío sobre papel Whatman 3MM y se expusieron en películas Hyperfilm MP (Amersham Pharmacia Biotech).

6.3 Ensayos de protección frente a la digestión con DNasa I (footprinting)

Para los experimentos de footprinting con DNasa I se amplificó por PCR el fragmento 5228 FP utilizando 5228 FP R (Tabla 3) como oligonucleótido frío y 5228 FP F (Tabla 3) como oligonucleótido marcado (procedimiento descrito en el apartado 6.1 de esta sección) para marcar el extremo 5’ de dicho fragmento. Esta sonda nos permitió realizar experimentos de footprinting con la región promotora 5228. Una vez purificada la sonda se formaron los complejos proteína-DNA durante 20 min a 25 °C en 15 µl de tampón KST (HEPES 20 mM pH 8, KCl 150 mM, ß-mercaptoetanol 2 mM, glicerol 10%, MgCl2 10 mM, PMSF 0,1 mM) que contenía: 1nM de la sonda 5228 FP, BSA 500 μg/ml, y distintas diluciones de la proteína KstR-His purificada o de un extracto proteico de la cepa E. coli BL21 (DE3) (pET6042) expresando KstR-His. Transcurrida la incubación se añadieron 3 µl de solución DNasa I (1µg/ml (Amersham Biosciences)) en Tris-HCl 10 mM pH

7,0, MgCl2 10 mM, CaCl2 10 mM y KCl 125 mM y se incubó a 37 ºC durante 20 s. La reacción se paró al añadir 180 µl de la solución DNasa STOP (acetato sódico 0,4 M, EDTA 2,5 mM, tRNA 50 µg/ml y 5 µg/ml de DNA de esperma de salmón) y 0,3 µl/ml de glicogen. Las muestras se trataron con fenol/cloroformo/alcohol isoamílico y posteriormente fueron precipitadas y lavadas con etanol absoluto y etanol 70%, respectivamente. Las muestras se secaron, se resuspendieron en tampón de carga (formamida al 98%, EDTA 10 mM pH 8,0 y cantidades traza de

64 Materiales y Métodos azul de bromofenol y azul de xilencianol) y se desnaturalizaron por incubación a 95 ºC durante varios min. Posteriormente se analizaron en un gel de poliacrilamida desnaturalizante al 6% (v/v)-urea 8 M. Los geles se secaron al vacío sobre papel Whatman 3MM y se expusieron en películas Hyperfilm™ MP (Amersham Pharmacia Biotech). La secuenciación del fragmento 5228 FP se llevó a cabo mediante el método A+G (Maxam y Gilbert, 1977).

7. Técnicas de RNA

7.1 Extracción de RNA de micobacterias

El RNA para el análisis genómico de expresión diferencial en colesterol de M. smegmatis mc²155 mediante microarrays, retrotranscripción-PCR y PCR en tiempo real se extrajo de cultivos de la cepa cultivada en medio mínimo 457 que contenía colesterol 1,8 mM en β-ciclodextrina, glicerol 18 mM en β-ciclodextrina o glicerol 0,6 M. El RNA que se utilizó para el análisis genómico de expresión diferencial del mutante en el regulador transcripcional KstR2 mediante microarrays se extrajo de cultivos de la cepa salvaje y mutante en medio 7H9 conteniendo

ADC. En ambos casos 15 ml de cultivo en fase logarítmica (DO600 0,5-0,6) se añadieron a 35 ml de solución de tiocianato de guanidinio (tiocianato de guanidinio 5 M, sarkosyl 0,5%, citrato sódico 25 mM) para interrumpir la transcripción. El cultivo se centrifugó 20 min a 4000 g a temperatura ambiente y las células se resuspendieron en 200 µl de agua. Este volumen se transfirió a tubos del Kit Precellys VK01 (Bertin Technologies) y se añadieron 700 µl de solución RLT (Qiagen). Las bacterias se lisaron utilizando un MiniBeadBeaterTM (Biospec) o un Fast-Prep FP129 (Savant) durante 40 segundos a intensidad 6.5 y los extractos solubles se recuperaron mediante centrifugación durante 5 min a 13000 g a 4 ºC. Este procedimiento se realizó por duplicado para cada cultivo, usando un total de 30 ml de cada uno. En este punto, los extractos solubles de los duplicados se recogieron en un mismo tubo y el RNA se purificó utilizando el Rneasy kit (Qiagen) según las especificaciones del fabricante. El RNA para análisis mediante microarrays se trató adicionalmente con Dnasa (Qiagen). Finalmente, las muestras

65 Materiales y Métodos se eluyeron en 30 µl de agua. La cantidad de RNA extraído se midió utilizando un NanoDrop 1000 (NanoDrop Technologies).

7.2 Retrotranscripción seguida de reacción de PCR (RT-PCR semicuantitativa)

El RNA utilizado para PCR semicuantitativa se trató con el kit Dnase and Removal treatment (Ambion) según las especificaciones del fabricante. La obtención del cDNA se llevó a cabo en un volumen de 20 µl de reacción que contenían 300 ng de RNA purificado, DTT 10 mM, dNTPs 0,5 mM, 200 unidades de SuperScript™ II Reverse Transcriptase (Invitrogen) y 5 mM de hexámeros al azar como cebadores (pd(N)6 random hexamer 5´phosphate (Amersham Biosciences)). En primer lugar el RNA y los hexámeros la azar se calentaron a 65 ºC durante 5 min para la hibridación y tras enfriar en hielo se añadieron los restantes componentes de la reacción y esta se incubó a 42 ºC durante 2 h seguido de 15 min a 70 ºC. Se emplearon 1,5 µl del cDNA así obtenido como molde para la PCR posterior. El cDNA se amplificó utilizando los oligonucleótidos requeridos en cada caso a concentración final 0,5 μM y 1 U de la DNA polimerasa I de Biotools. En cada una de las reacciones de PCR se incluyó un control con 1,5 µl de la reacción de RT en la que no se empleó la transcriptasa reversa. Con este control no se debe obtener ninguna banda de amplificación, lo que indicaría que las preparaciones de RNA no contienen DNA contaminante. El volumen total de reacción de PCR fue de 50 µl. El número de ciclos de amplificación fue en todos los casos de entre 27 y 30.

7.3 Retrotranscripción para PCR en tiempo real

El RNA utilizado para PCR en tiempo real se trató de la misma manera que el RNA utilizado para PCR semicuantitativa (apartado 7.2) pero la retrotranscripción se llevó a cabo con 1 µg de RNA purificado, y una vez obtenido el cDNA, se añadieron 7 µl de NaOH 1 M y 7 µl de EDTA 0,5 M, y se incubó 15 min a 65 ºC para hidrolizar el RNA tras la reacción de retrotranscripción. Para neutralizar se

66 Materiales y Métodos añadieron 17 µl de HEPES 1 M pH 7,5. El cDNA obtenido fue purificado mediante el kit Geneclean Turbo (MP Biomedicals) y su concentración se estimó utilizando un NanoDrop 1000 (Nanodrop Technologies).

7.4 PCR en tiempo real (q-PCR)

Para analizar los niveles de transcripción de diferentes genes se realizaron experimentos de PCR en tiempo real en un iQ5 Multicolor Real-Time PCR Detection System (Bio-Rad). Se amplificaron fragmentos de alrededor de 100 pb de cada uno de los genes de interés. Se utilizaron muestras por triplicado a las distintas cantidades de 5, 0,5 y 0,05 ng de cDNA total, 0,2 mM final de cada cebador y 12,5 µl de SYBR® Green PCR Master Mix (Applied Biosystems) en 25 µl de volumen. Las parejas de cebadores utilizadas se muestran en la tabla 5. Las muestras fueron desnaturalizadas a 95 ºC 30 s; la temperatura de fusión fue 60 ºC 30 s y para la elongación y la adquisición de señal se mantuvieron a 72 ºC 30 s. Se realizaron 40 ciclos. Para la cuantificación relativa de los valores de fluorescencia se utilizaron diluciones seriadas de DNA genómico de M. smegmatis mc²155 (entre 4x10-4 y 40 ng). Los datos que se muestran son la media de los obtenidos al analizar la expresión de los genes en tres cultivos independientes con tres concentraciones diferentes de cDNA (5, 0,5 y 0,05 ng) y por triplicado. La obtención y el análisis de los datos se llevó a cabo utilizando el iQ5 Optical System Software (Versión 2.0) (Bio-Rad).

7.5 Análisis genómico de M. smegmatis bajo diferentes condiciones de cultivo mediante microarrays de RNA

Los microarrays para el análisis de la expresión diferencial del genoma de M. smegmatis mc²155 fueron facilitados por el Pathogen Functional Genomics Resource Center de TIGR (http://pfgrc.tigr.org/). Éstos (Mycobacterium smegmatis versión 4) consisten en 7736 oligonucleótidos diferentes de 70 pb, que representan el genoma completo de M. smegmatis, impresos en una superficie de

67 Materiales y Métodos aminosilano. Cada oligonucleótido está impreso 3 veces. Como control negativo se incluyen 480 oligonucleótidos de 70 pb de Arabidopsis thaliana en cada microarray. Para los microarrays para el análisis de expresión diferencial en colesterol, el cDNA procedente de cultivos crecidos en colesterol 1,8 mM en β-ciclodextrina se hibridó competitivamente frente al cDNA correspondiente procedente de cultivos crecidos en glicerol 18 mM en β-ciclodextrina. En los microarrays para el análisis de expresión diferencial del mutante en el regulador KstR2, el cDNA procedente de cultivos de este mutante se hibridó competitivamente frente al cDNA de la cepa salvaje. En ambos casos el experimento incluyó réplicas técnicas mediante marcaje reverso (dye-swap). Esta técnica consiste en hibridar dos microarrays con las mismas muestras biológicas, pero marcadas cada una de ellas con un fluorocromo distinto en cada uno de ellos (si la muestra A está marcada con el fluorocromo Cy5 y la B con el fluorocromo Cy3 en un microarray, en su réplica técnica se marcará A con Cy3 y B con Cy5). Mediante esta técnica se elimina el sesgo que se puede producir por diferencias en la de eficiencia de marcaje de las muestras dependiente de los fluorocromos.

7.5.1 Síntesis y marcaje del cDNA

Se marcaron 5 µg de RNA de M. smegmatis cultivado en colesterol/ glicerol (o 5 µg de RNA de M. smegmatis con KstR2 delecionado/cepa salvaje) con el fluorocromo Cy3-dCTP o Cy5-dCTP (GE Healthcare). En cada caso, 3 µg de oligonucleótidos al azar (InvitrogenTM Life Technologies) se hibridaron al RNA mediante una incubación a 95 ºC durante 5 min, seguida de enfriamiento en hielo. La reacción de marcaje contenía dATP, dGTP y dTTP a una concentración 0,5 mM, dCTP 0,2 mM, DTT 10 mM, 60 µmoles de Cy3-dCTP (o Cy5-dCTP) y 500 unidades de Superscript II (InvitrogenTM Life Technologies) en 25 µl de volumen final. Las muestras se incubaron en oscuridad a 25 ºC durante 10 minutos y seguidamente a 42 ºC durante 90 minutos.

68 Materiales y Métodos

Los microarrays se sumergieron en solución de prehibridación (SSC 3,5X, SDS 0,1%, BSA 10 mg/ml) a 55 ºC durante 20 minutos. Posteriormente se lavaron en 400 ml de agua durante 1 min y después en 400 ml de propanol durante 1 min. Finalmente se secaron mediante centrifugación en tubos Falcon de 50 ml a 1500 g durante 5 minutos y se guardaron en cajas oscuras sin polvo hasta su hibridación (< 1 h).

7.5.2 Hibridación de los microarrays

Las muestras de cDNA marcadas con Cy3/Cy5 procedentes de cultivos crecidos en colesterol 1,8 mM se combinaron con las correspondientes muestras marcadas de cDNA procedentes de cultivos crecidos en glicerol 18 mM (o las muestras procedentes de cultivos del mutante en KstR2 se combinaron con las correspondientes muestras procedentes del cultivo de la cepa salvaje) y se purificaron utilizando el kit MinElute PCR Purification (Qiagen). Las muestras se eluyeron en 25 µl de agua y la eficiencia del marcaje se midió utilizando un NanoDrop 1000 (Nanodrop Technologies). 22,5 µl de cada muestra se mezclaron con 67,5 µl de solución de hibridación (formamida 30%, solución Denhardt 3,75X, SSC 6X, pirofosfato sódico 0,75 mM, Tris pH 7,4 37,5 mM, SDS 0,075%) y se desnaturalizaron incubando 2 min a 95 ºC antes de añadirse al microarray. Las hibridaciones tuvieron lugar en cada microarray bajo tres cubreobjetos LifterSlips 22x22 mm (VWR International) en cámaras de hibridación humidificadas (Corning) sumergidas en un baño de agua a 55 ºC en oscuridad durante 16-20 h. Los microarrays se sacaron entonces de las cámaras de hibridación y se lavaron cuidadosamente en la solución de lavado A (SSC 1X, SDS 0,05%) a 55 ºC para quitar los cubreobjetos. Después se lavaron secuencialmente en 400 ml de solución A 2 min a 55 ºC seguido de 2 lavados en 400 ml de solución B (SSC 0,06X) a temperatura ambiente 2 min cada uno. Se secaron mediante centrifugación en tubos Falcon de 50 ml a 1500 g durante 5 min a temperatura ambiente y se escanearon utilizando un escáner Affimetrix 428 Array Scanner. Los archivos de imagen se cuantificaron utilizando el programa TIGR Spotfinder 3.1.1 (Saeed et al., 2003). Para cada condición, el RNA se extrajo de tres cultivos

69 Materiales y Métodos independientes, y se utilizaron dos microarrays por experimento (réplicas técnicas mediante marcaje reverso). Los datos se promediaron y normalizaron utilizando el algoritmo no paramétrico RANK product (Breitling et al., 2004), disponible como el paquete "RankProd" en Bioconductor (http://www.bioconductor.org) (Hong et al., 2006). Este método detecta genes que se expresan diferencialmente en un número de experimentos replicados independientemente de su intensidad numérica. Los resultados son proporcionados en forma de P-valores definidos como la probabilidad de que un gen dado se catalogue en la posición observada por azar. Los genes que estaban inducidos más de 3 veces en colesterol frente a glicerol y con un valor de P<0,1 fueron seleccionados para posteriores análisis. Tras la normalización, se disponía de tres valores de P y de número de veces de inducción para cada marco abierto de lectura (ORF). El valor central de los tres, que como cabía esperar eran similares, se seleccionó para incluirse en las tablas que se presentan en este trabajo. La inducción de 12 de los genes fue validada mediante PCR a tiempo real.

7.6 Técnica de primer extension o extensión con cebador

La técnica de primer extension permitió determinar el sitio de iniciación de la transcripción de la región promotora P5228. Para ello, se cultivaron células de E. coli DH10B (pUJ9-5228) a 37 ºC en 25 ml de medio LB. Cuando las células alcanzaron una DO600 de 0,6, se recogieron 6 ml que se centrifugaron, lavaron y resuspendieron para proceder a la extracción de su RNA utilizando el Rneasy kit (Qiagen) según las especificaciones del fabricante. Una vez extraído el RNA, se procedió al análisis del sitio de inicio de la transcripción mediante la técnica de extensión por cebador. La extensión se realiza mediante un cebador que hibrida con el mRNA en una posición más o menos cercana del supuesto sitio de iniciación de la transcripción. Para la identificación de la posición +1 del promotor P5228 se empleó el oligonucleótido Lac57 (Tabla 3), que hibrida entre los nucleótidos 39 y 62 en posición 3’ respecto al residuo de adenina del codón de inicio de la traducción del gen lacZ.

70 Materiales y Métodos

El oligonucleótido Lac57 fue marcado empleando 7 μl del oligonucleótido (2,15 μM), 2 μl de tampón T4 polinucleótido kinasa 10x (Biolabs), 10 μl de [γ- 32P]ATP (3.000 Ci/mmol) (Amersham Pharmacia Biotech) y 10 U de T4 polinucleótido kinasa (Biolabs) en un volumen total de 20 μl. Esta mezcla se incubó a 37 ºC durante 30 min y la reacción se paró añadiendo 0,5 μl de SDS 10% (p/v) y 0,5 μl de EDTA 0,5 M pH 8,0. La mezcla de reacción se calentó a 65 ºC durante 10 min y a continuación se añadió tampón TE hasta un volumen final de 100 μl. Finalmente el oligonucleótido marcado fue purificado mediante la utilización de una columna de Sephadex G-25 previamente equilibrada en tampón TE. Se tomaron 15 μg de RNA purificado, el oligonucleótido marcado en el paso anterior (5 x 105 cpm), 10 μl de tampón acetato sódico 3 M pH 5,2 y agua destilada hasta completar un volumen final de 100 μl. La mezcla resultante fue precipitada y lavada con etanol absoluto y etanol 70%, respectivamente. Tras secar la muestra a temperatura ambiente, el precipitado resultante se resuspendió en 30 μl de tampón de hibridación (PIPES 40 mM pH 6,6, formamida 1 mM, EDTA 1 mM pH 8, NaCl 0,4 M) y se calentó a 85 ºC durante 10 min. La muestra se incubó durante toda la noche a 58 ºC. Después de ese tiempo, se añadieron otros 40 μl de tampón de hibridación y la mezcla resultante fue precipitada con etanol absoluto y lavada con etanol 70% secándose posteriormente a temperatura ambiente. El precipitado se resuspendió en 10 μl de una mezcla de reacción compuesta por 2 μl de tampón 5x de transcriptasa reversa AMV (Promega), 3,6 μl de dNTPs 2,5 mM, 3 U de transcriptasa reversa AMV (Promega) y agua destilada hasta 10 μl. Esta mezcla se incubó 1 h a 42 ºC y después de ese tiempo se detuvo la reacción añadiendo 2 μl de NaOH 2 N. La muestra se mantuvo a temperatura ambiente durante una noche y después fue precipitada añadiendo 1,5 μl de acetato sódico 3 M y 30 μl de etanol absoluto. Finalmente se lavó con etanol 70% y se secó obteniéndose un sedimento que fue resuspendido en 4 μl de solución STOP (formamida 0,5% (v/v), EDTA 20 mM; azul de bromofenol 0,05% (p/v) y xilencianol 0,05% (p/v)). El resultado de la reacción fue analizado por electroforesis en gel de poliacrilamida 6%-urea 8 M (Sambrook y Russell, 2001), detectándose los productos de la reacción por autorradiografía en películas HyperfilmTM-MP (Amersham Pharmacia Biotech) utilizando pantallas

71 Materiales y Métodos amplificadoras (Cronex Lightning Plus DuPont). La secuenciación del plásmido pUJ9-5228 se realizó utilizando el oligonucleótido Lac57, como se describe en el apartado 4.5 de esta sección.

8. Cromatografía líquida/ espectrometría de masas (LC/MS)

La cromatografía líquida acoplada a espectrometría de masas (LC/MS) se utilizó para analizar la transformación de colesterol en 4-colesten-3-ona en extractos proteicos o en cultivos de diversas cepas de M. smegmatis en colesterol. El equipo empleado consistió en un equipo de cromatografía líquida (Surveyor Plus LC) equipada con inyector automático acoplado a una trampa iónica (LXQ) equipada con una fuente de ionización química a presión atmosférica (APCI), todo de Thermo Electron (San Jose, CA, EE. UU.). Los datos se procesaron con el software Xcalibur (Thermo Fisher Scientific, San Jose, CA, EE.UU.). La separación cromatográfica se realizó en una columna Tracer Excel 120

ODSB C18, (150 mm × 4.6 mm de diámetro interno , 5 μm de tamaño de partícula) (Teknokroma, Barcelona, Spain). La fase móvil estuvo constituida por acetonitrilo/agua (90/10, v/v) y acetonitrilo/isopropanol (85/15, v/v) como fases A y B respectivamente. El flujo empleado fue de 1mL/minuto y el gradiente lineal utilizado fue el siguiente: 100% A durante 5 min, incrementado a 100% B en 35 min. Tras mantener 100% B durante 7 min se reestablecieron las condiciones iniciales, reequilibrándose la columna en las mismas durante 8 min. Durante este gradiente, el eluyente pasó al espectrómetro de masas desde el minuto 2 hasta el 45. La optimización de los parámetros en el espectrómetro de masas se realizó a partir de soluciones madre de patrones de colesterol (Sigma) y 4-colesten-3-ona (Fluka) en ciclodextrina a una concentración inicial de 6,8 mM y 7 mM respectivamente, inyectados en la trampa iónica mediante infusión directa con una velocidad de flujo de 5 µL/min. Así, el valor de los distintos parámetros que permiten una mayor sensibilidad de detección son los siguientes: temperatura del capilar 275 ºC, temperatura de vaporización 425 ºC, voltaje del capilar 39 V, voltaje de descarga de la corona 6.00 kV, corriente de la fuente 6.00 µA y 15 eV

72 Materiales y Métodos para la energía de disociación por colisión. Como gas auxiliar y nebulizador se utilizó nitrógeno de alta pureza. El análisis cuantitativo se realizó por el método del patrón interno, a partir de diluciones de la solución madre de colesterol y 4-colesten-3-ona en agua destilada, en concentraciones comprendidas entre 34 µM y 1,52 mM para el colesterol y 0,875 hasta 70 µM para la 4-colesten-3-ona, adicionadas con 50 µL de 5-pregnen-3β-ol-20-ona (patrón interno) en una concentración de 20 mg/mL. La extracción de analitos se llevó a cabo de la misma manera que en las muestras a analizar, tal y como se describe en los apartados 5.4.3 y 5.4.4 de esta sección. Los residuos concentrados de las muestras se resuspendieron en 400 µL de acetonitrilo (Scharlau) de los que se inyectaron 25 µL para su análisis cromatográfico. Las rectas de calibración obtenidas fueron y = 880,751 x + 128999 para el colesterol y y = 8207,230 x + 22278,6 para la 4-colesten-3-ona, donde x es la concentración inyectada e y las áreas. Los coeficientes de determinación fueron de 0,9984 y 0,9999 respectivamente. La cuantificación se llevó a cabo mediante la fragmentación de los iones padre del colesterol y la 4-colesten-3-ona (m/z 369.4 and m/z 385.4, respectivamente) y recogiendo todos los iones fragmentos en full scan, trabajando en MS2 o MS/MS. El precursor de colesterol, a m/z 369.4, es debido a la deshidratación de la molécula de colesterol. La identificación de colesterol y 4-colesten-3-ona en las muestras analizadas (extractos proteicos o cultivos de diversas cepas de M. smegmatis) se llevó a cabo por las fragmentaciones específicas de ambos compuestos, obtenidas a partir de sus standards. En el análisis de las muestras, además de las fragmentaciones de los iones característicos de colesterol y 4-colesten-3-ona, se recogieron todos los iones producidos (full scan) en modo positivo desde m/z 100 a m/z 1500.

73 Materiales y Métodos

9. Cromatografía en capa fina (TLC)

La cromatografía en capa fina (TLC) también se utilizó para visualizar la transformación de colesterol en 4-colesten-3-ona en extractos proteicos o en cultivos de diversas cepas de M. smegmatis en colesterol. Los residuos concentrados de las muestras se resuspendieron en 40 µL de acetato de etilo y se cargaron 5 µL en placas de cromatografía en capa fina de ® silica gel (40 x 80 mm Polygram SIL G/UV254, Macherey-Nagel). Las cromatografías se llevaron acabo utilizando n-hexano-acetato de etilo (65:35,v/v) como fase móvil. Los productos esteroideos se visualizaron en luz ultravioleta y/o mediante tinción con una solución de ácido fosfomolíbdico en etanol (10%, p/v). Los productos marcados con 14C se localizaron mediante autorradiografía utilizando un escáner FLA300 (Fuji Photo Film Co., Ltd., Kanagawa, Japan).

10. Análisis de los datos de secuencia

Los análisis de secuencias de DNA y proteínas se realizaron utilizando el paquete de programas DNASTAR y los programas y bases de datos detallados a continuación. El análisis y búsqueda de secuencias nucleotídicas y proteicas de M. smegmatis y M. tuberculosis fue realizado con el servidor Comprehensive Microbial Resource (CMR) (Craig Venter’s Institute) (http://cmr.jcvi.org/tigr- scripts/CMR/CmrHomePage.cgi) y el servidor Tuberculist (http://genolist.pasteur.fr/TubercuList/). Para la búsqueda de secuencias nucleotídicas y proteicas de Rhodococcus jostii RHA1 se utilizaron las herramientas disponibles en el sitio Rhodococus Genome Project (McLeod et al., 2006; Warren et al., 2004) (http://www.rhodococcus.ca/). Las secuencias de nucleótidos y las secuencias de aminoácidos fueron comparadas con las existentes en las bases de datos mediante el uso de los algoritmos BLASTN y BLASTP, respectivamente (Altschul et al., 1990) a través del servidor del National Center for Biotechnology Information (NCBI), (http://www.ncbi.nlm.nih.gov/cgibin/Entrez/genom_table_cgi), a través del servidor

74 Materiales y Métodos

CMR o el sitio Rhodococus Genome Project. Los alineamientos múltiples de proteínas se llevaron a cabo con el programa CLUSTALW (Thompson et al., 1994) alojado en el servidor EMBL-EBI (http://www.ebi.ac.uk/Tools/). Las masas moleculares teóricas de las proteínas se calcularon con el programa Compute pI/Mw del servidor ExPASy (http://www.expasy.org/tools/pi_tool.html). Las predicciones de estructura secundaria y tridimensional se realizaron con el programa LOOPP alojado en el servidor BioHPC (http://cbsuapps.tc.cornell.edu/loopp.aspx) y la visualización de los distintos modelos y los análisis posteriores se realizaron con el programa PyMol (DeLano, 2002). La búsqueda de dominios conservados en secuencias proteicas se llevó a cabo utilizando la base de datos PROSITE alojada en el servidor ExPASy (http://www.expasy.ch/prosite/).

75

76 Resultados

IV. RESULTADOS

77 Resultados

78 Resultados IV. RESULTADOS

1. Potencial catabólico de compuestos esteroideos y caracterización genética in silico y mediante RT-PCR de la ruta de degradación del colesterol en M. smegmatis mc2155

Como una primera aproximación al conocimiento del potencial catabólico de compuestos esteroideos de M. smegmatis mc2155, se analizó su capacidad de degradar distintas moléculas esteroideas mediante ensayos de crecimiento. Posteriormente, el primer gran objetivo de esta tesis doctoral ha sido localizar regiones del genoma de Mycobacterium smegmatis mc2155 que pudiesen estar directamente relacionadas con la degradación del colesterol sirviéndonos de distintos análisis in silico y que posteriormente serían validados mediante RT-PCR.

1.1 Crecimiento de M. smegmatis mc2155 en distintos esteroides

Para estudiar el potencial catabólico para degradar compuestos esteroideos de M. smegmatis mc2155 se cultivó la cepa en medio mínimo 457 utilizando como fuente de carbono distintos esteroides. Estos esteroides fueron disueltos en β- ciclodextrina (apartado 2.2 de Materiales y Métodos). En el caso del ergosterol, debido a su baja solubilidad, se aumentó la concentración de ciclodextrina utilizada hasta una concentración final 35 mM en lugar de utilizar 18 mM, como en el resto de esteroides. La concentración de esteroides utilizada en los cultivos se ajustó de tal forma que los medios de todos los cultivos contuviesen el mismo número de átomos de carbono que un medio con colesterol a concentración 1,8 mM y poder así comparar el rendimiento que aportan las distintas fuentes de carbono. Debido a las propiedades detergentes del desoxicolato este ajuste en el número de átomos de carbono no se realizó con esta molécula y se utilizó una concentración menor que permitiese la viabilidad del cultivo. La concentración de ácido cólico se igualó a la de desoxicolato.

79 Resultados

Los resultados obtenidos a partir de estos ensayos de crecimiento indicaron 2 que M. smegmatis mc 155 crece hasta DO600 cercanas a 2 tanto en colesterol como en el primer intermediario de su ruta de degradación, 4-colesten-3-ona, alcanzando una DO600 de 1,8 para colesterol y 1,5 para la 4-colesten-3-ona (Fig. 13 A). Sin embargo, su crecimiento es bastante inferior en otros esteroides que no poseen la cadena lateral del colesterol, como la androsterona, AD, ADD, dehidroandrosterona (Fig. 13 B), β-estradiol, pregnenolona, progesterona y testosterona (Fig. 13 C), donde se alcanzan DO600 próximas a 0,6. El crecimiento fue nulo en ácido cólico o desoxicolato a las concentraciones utilizadas de estos compuestos (0,25 mM, Fig. 13 D), ya que alcanza los mismos valores de DO600 que los cultivos control en β-ciclodextrina (DO600 de 0,3). En ergosterol alcanza también DO600 próximas a 0,6 (Fig. 13 D), pero necesita para ello un intervalo mayor de tiempo que para los demás esteroides. Cabe destacar sin embargo que comparativamente al crecimiento en ciclodextrina 35 mM (concentración utilizada para el crecimiento con ergosterol) la capacidad de crecimiento en este esteroide es notable.

80 Resultados

(para todos ellos excepto el ergosterol) y 35 mM (para el ergosterol). el (para y mM 35 el ergosterol) excepto ellos todos (para cultivos con en solubilizados esteroides distintos con 457 suplementado mínimo en medio cultivado mc²155 Figura 13. Crecimiento de de Crecimiento 13. Figura estradiol, pregnenolona, progesterona y testosterona. y testosterona. progesterona pregnenolona, estradiol,

DO 600 DO 600 0,01 0,01 0,1 0,1 10 1 1 0 0 β -ciclodextrina como única fuente de carbono a las dos concentraciones finales que se utilizaron para solubilizar los distintos es distintos los solubilizar para utilizaron se que finales concentraciones dos a las de carbono fuente única como -ciclodextrina

Tiempo (h) Tiempo Tiempo (h) Tiempo smeg M. 100 100

matis

mc2155 en distintos esteroides. en distintos mc2155

C AB 200 200 D Ácido cóloico, desoxicolato (DOC) y (DOC) ergosterol. Ácido cóloico, desoxicolato

Ciclodextrina 18mM Colesterol 1,8 mM Colestenona 1,8 mM mM 2,52 Testosterona mM 2,34 Progesterona mM Pregnenolona 2,34 β Ciclodextrina 18mM 2,7mM-estradiol

A.

y colesterol. 4-colesten-3-ona

Se v Se

DO 600 DO 600 alor 0,01 0,01 0,1 0,1 1 1 liceet easracaa60n (DO nm a 600 absorbancia de incremento el ó 0 0

β -ciclodextrina metilada al azar. Se siguieron también dos dos también Se siguieron al azar. metilada -ciclodextrina

B. 100 Androsterona, dehidroandrosterona, AD y ADD. yADD. AD dehidroandrosterona, Androsterona, Tiempo (h) Tiempo (h) Tiempo

100

200

D 200 600

de ) 2,52 mM Dehidroandrosterona Ciclodextrina 18mM mM DD 2,52 A AD 2,52 mM mM 2,52 Androsterona teroides: 18 mM teroides: Ciclodextrina 35mM 35mM mMmMErgosterol 1,73 1,73 DOC 0,25 mM 0,25 mM Ciclodextrina 18mM 18mM Cólico Cólico 0,25 mM0,25 mMAc. M. smegmatis M.

C β

-

81 Resultados

1.2. Identificación y caracterización in silico de genes de M. smegmatis y M. tubeculosis implicados en el metabolismo del colesterol

Como ya se comentó en el apartado de Introducción, la mayoría de los genes implicados en la degradación de la testosterona (denominados genes tes) se han caracterizado en la bacteria Gram-negativa Comamonas testosteroni TA441 (Horinouchi et al., 2004b). Dado que la ruta de degradación de la testosterona confluye con la de degradación del colesterol en el compuesto 4-androsten-3,17 diona (AD), y que al comienzo de esta tesis doctoral no se había descrito ningún gen de M. smegmatis directamente relacionado con la ruta catabólica del colesterol, decidimos realizar un análisis in silico del genoma de M. smegmatis mc²155 utilizando como sondas las secuencias de las enzimas ya descritas para la degradación de testosterona en C. testosteroni. Utilizando el programa BLASTP a través del servidor CMR se pudieron localizar diversas proteínas en M. smegmatis que presentaban similitud con la mayoría de las distintas sondas de C. testosteroni (Tabla 6). Estas proteínas se encontraban codificadas por genes que forman agrupaciones génicas (clusters), representadas en la figura 14, lo que sugería una funcionalidad común de los genes situados dentro de estas regiones.

82 Resultados

Comamonas testosteroni Mycobacterium smegmatis mc²155

Función Gen Función Gen (locus) % Dominio similar a flavin tesA1 Nitrilotriacetato monooxigenasa, MSMEG_6035 31 reductasa componente B Naftociclinona hidroxilasa tesA2 Hidroxilasa de producción de pigmento MSMEG_6038 33 Enzima de meta-apertura tesB 2,3-dihidroxibifenil 1,2-dioxigenasa MSMEG_6036 42 Hidrolasa de plegamiento tesD Hidrolasa, familia plegamiento MSMEG_6037 34 alfa/beta alfa/beta Hidratasa/descarboxilasa tesE 2-ceto-4-pentenoato hidratasa MSMEG_5940 39 Acetaldehido tesF Acetaldehido deshidrogenasa MSMEG_5939 55 deshidrogenasa Deshidrogenasa tesG Oxovalerato aldolasa MSMEG_5937 46 3-oxoesteroide-Δ-1- tesH 3-cetosteroide-delta-1-deshidrogenasa MSMEG_5941 36 deshidrogenasa 3-cetoesteroide-Δ4(5α)- tesI deshidrogenasa Coenzima A transferasa ORF1 3-oxoadipato:succinil-CoA transferasa, MSMEG_6002 42 subunidad A Acil CoA:acetato/3- ORF2 3-oxoadipato:succinil-CoA transferasa, MSMEG_6003 34 cetoácido CoA transferasa, subunidad B subunidad β [metabolismo lipídico] Enoil-CoA ORF3 hidratasa/isomerasa Enoil-ACP reductasa ORF4 Oxidorreductasa, familia 2- MSMEG_6004 44 nitropropano dioxigenasas Enoil-CoA hidratasa ORF5 Enoil-CoA hidratasa MSMEG_6001 43 ORF17 ORF17 Oxidorreductasa, componente de MSMEG_6039 44 transferencia de electrones ORF18 ORF18 Substrato--CoA ligasa (fadD3) MSMEG_6013 45 Acil-CoA deshidrogenasa ORF21 Supuesta acil-CoA deshidrogenasa MSMEG_6014 49 Acil-CoA deshidrogenasa ORF22 Supuesta acil-CoA deshidrogenasa MSMEG_6015 30 Tiolasa ORF23 Acetil-CoA acetil transferasa MSMEG_6008 60 ORF25, proteina hipotética ORF25 ORF26, proteina hipotética ORF26 Oxidorreductasa ORF27 Oxidorreductasa, familia MSMEG_5999 53 deshidrogenasas/reductasas de cadena corta Acil-CoA deshidrogenasa ORF28 Supuesta acil-CoA deshidrogenasa MSMEG_6016 31 Acil-CoA deshidrogenasa ORF30 Supuesta acil-CoA deshidrogenasa MSMEG_6012 52 Oxidorreductasa ORF31 Deshidrogenasa de cadena corta MSMEG_6011 62 ORF32, proteina hipotética ORF32 Acil-CoA tiolasa ORF33 acetil-CoA acetil transferasa MSMEG_5996 36 Factor de transcripción tipo tesR Supuesta proteína reguladora LuxR MSMEG_6568 22 LuxR

83 Resultados

Tabla 6. Comparación in silico de sondas de C. testosteroni TA441 frente a M. smegmatis mc2155. Se señala el porcentaje de identidad (%) hallado en cada caso entre las secuencias proteicas con mayor similitud utilizando el programa ClustalW. Las secuencias de las sondas utilizadas de C. testosteroni se encuentran depositadas en las bases de datos de secuencias DDBJ, EMBL y GenBank con los números de acceso AB040808 (tesB, ORF1-3), AB063482 (tes A1, tesA2, tesD, tesE, tesF y tesG), AB076368 (tesH, tesI, ORF17 y 18) y AB186487 (ORF4, 5, 21- 23, 25-28, 30-33 y tesR).

El análisis in silico también se llevó a cabo con el genoma de M. tuberculosis H37Rv, ya que aunque hasta recientemente se pensaba que esta bacteria no era capaz de utilizar el colesterol como única fuente de carbono y energía (Pandey y Sassetti, 2008), si que se postulaba que el colesterol podía estar implicado en su supervivencia dentro de los macrófagos (Gatfield y Pieters, 2000). Así se comprobó que existían igualmente agrupaciones génicas que presentaban una alta similitud con los genes de C. testosteroni y M. smegmatis (Tabla 7).

84 Resultados

Comamonas testosteroni Mycobacterium tuberculosis H37Rv

Función Gen Función Gen % Dominio similar a flavin tesA1 Posible oxidorreductasa Rv3567c 30 reductasa Naftociclinona hidroxilasa tesA2 Posible oxidorreductasa Rv3570c 32 Enzima de meta-apertura tesB 2,3-dihidroxibifenil 1,2-dioxigenasa Rv3568c 42 (DHBD) Hidrolasa de plegamiento tesD 2-hidroxi-6-oxo-6-fenilhexa-2,4- Rv3569c 32 α/β dienoato hidrolasa Hidratasa/descarboxilasa tesE 2-hidroxipenta-2,4-dienoato hidratasa Rv3536c 41 Acetaldehido tesF Acetaldehido deshidrogenasa Rv3535c 56 deshidrogenasa Deshidrogenasa tesG 4-hidroxi-2-oxovalerato aldolasa Rv3534c 47 (HOA) 3-oxoesteroide-Δ-1- tesH 3-cetoesteroide 1-deshidrogenasa Rv3537 36 deshidrogenasa 3-cetoesteroide-delta4(5α)- tesI deshidrogenasa Coenzima A transferasa ORF1 Posible CoA-Transferasa (subunidad Rv3551 41 alfa) Acil CoA:acetato/3- ORF2 Rv3552 37 cetoácido CoA transferasa, CoA transferasa, subunidad beta subunidad β [metabolismo lipídico] Enoil-CoA ORF3 hidratasa/isomerasa Enoil-ACP reductasa ORF4 Oxidorreductasa, familia 2- Rv3553 45 nitropropano dioxigenasas Enoil-CoA hidratasa ORF5 EchA20 (fad) Rv3550 43 ORF17 ORF17 Oxigenasa reductasa KshB (PA5411) Rv3571 43 ORF18 ORF18 Substrato--CoA ligasa (ligasa) Rv3561 47 Acil-CoA deshidrogenasa ORF21 FadE31 (acd) Rv3562 50 Acil-CoA deshidrogenasa ORF22 FadE32 Rv3563 30 Tiolasa ORF23 FadA6_1 (fadA) Rv3556c 60 ORF25, proteina hipotética ORF25 ORF26, proteina hipotética ORF26 Oxidorreductasa ORF27 Oxidorreductasa, familia de Rv3548c 53 deshidrogenasas/reductasas de cadena corta Acil-CoA deshidrogenasa ORF28 Probable proteína fadE27 (acd) Rv3564 29 Acil-CoA deshidrogenasa ORF30 FadE30 (acd) Rv3560c 52 Oxidorreductasa ORF31 Oxidorreductasa, familia de Rv3559c 60 deshidrogenasas/reductasas de cadena corta ORF32, proteina hipotética ORF32 Acil-CoA tiolasa ORF33 FadA5 (PA1736) Rv3546 35 Factor de transcripción tipo tesR Proteína hipotética Rv2488c 12 LuxR

85 Resultados

Tabla 7. Comparación in silico de sondas de C. testosteroni TA441 frente a M. tuberculosis H37Rv. Se señala el porcentaje de identidad (%) hallado en cada caso entre las secuencias proteicas con mayor similitud utilizando el programa ClustalW. Las secuencias de las sondas utilizadas de C. testosteroni se encuentran depositadas en las bases de datos de secuencias DDBJ, EMBL y GenBank con los números de acceso AB040808 (tesB, ORF1- 3), AB063482 (tes A1, tesA2, tesD, tesE, tesF y tesG), AB076368 (tesH, tesI, ORF17 y 18) y AB186487 (ORF4, 5, 21- 23, 25-28, 30-33 y tesR).

Las únicas sondas de C. testosteroni para las que no se encontraron genes similares en ninguna de las dos especies de Mycobacterium fueron las correspondientes al gen tesI y a las ORFs 25, 26 y 32. El producto del gen tesI no afecta al crecimiento en testosterona en C. testosteroni, pero sí limita la degradación de androsterona en esta cepa. El gen tesI codifica una 3- cetoesteroide-Δ4(5α)-deshidrogenasa que cataliza el paso de androstan-3,17 diona a AD (Horinouchi et al., 2003b). La ruta postulada de degradación de colesterol no alberga esta transformación (Kieslich, 1985; Martin, 1977; Owen et al., 1983; Schoemer y Martin, 1980; Sedlaczek y Smith, 1988; Szentirmai, 1990). Este hecho unido al bajo crecimiento que presenta M. smegmatis en androsterona (ver apartado 1.1 de resultados) apoyarían el hecho de que esta enzima no esté presente en su genoma. Para las ORFs 25, 26 y 32 todavía no se ha postulado una posible función en la ruta de degradación de la testosterona u otros esteroides (Horinouchi et al., 2004b). Por otra parte, en las dos especies de Mycobacterium se encontraron proteínas con similitud con tesR, la proteína reguladora del catabolismo de la testosterona tipo LuxR, pero los porcentajes de identidad fueron bajos (ver tablas 6 y 7). La posición en el genoma de estos posibles genes reguladores, muy alejada de los genes catabólicos, sugiere que no están relacionados con la regulación del catabolismo de esteroides. Curiosamente, los genes similares a las sondas de C. testosteroni se sitúan de forma diferente en M. smegmatis y M. tuberculosis. En M. tuberculosis se distribuyen más próximos entre sí en el genoma que en M. smegmatis, donde se distinguen hasta tres agrupaciones génicas distintas (véase la figura 14). Estas agrupaciones fueron delimitadas preliminarmente para su posterior análisis

86 Resultados mediante RT-PCR, y comprenden en M. smegmatis las regiones del genoma situadas entre: 1. La posición 5996 y la 6003 (en kb), donde se ubican los genes similares a tesE, tesF, tesG y tesH; 2. La posición 6060 y la 6083, donde se sitúan los genes similares a las ORFs 1, 2, 4, 5, 18, 17, 21, 22, 23, 27, 28, 30, 31 y 33; 3. La posición 6102 y 6108, que incluye los genes similares a tesA1, tesA2, tesB, tesD y la ORF17. En M. tuberculosis todos los genes similares a los genes tes y ORFs de C. testosteroni se sitúan en una región de tan sólo 46 kb que comprende desde la posición 3972 a la posición 4018. Dado que de manera común en los organismos patógenos se produce la pérdida de genes prescindibles a medida que se incrementa su adaptación al hospedador, estos datos obtenidos en M. tuberculosis insinúan que se han conservado los genes imprescindibles para la degradación del colesterol frente a otras regiones situadas entre ellos que se han ido perdiendo, lo que sugiere la gran importancia que la degradación de esta molécula tiene para el patógeno.

87 Resultados

4.018 3556c 6.108 tesG 3573c Figura14

6040 tesF 3572 3555c tesE 6039 3571 6006 tesD 3554 6005 3553

tesA1

3570c 6004 6038 tesA2 3552 3569c 6037 6003 tesH 3551 3568c 6036 tesI 6002 3550 6035 3567c 6001 ORF17

6000 ORF18 6034 3549c 5999 6033

3548c 6.102

tesR 5998 6.083 33 3547 5997

6017 32

5996 3546 6016 3566c 31 3565 6015 30 3564 5995 3545c

28 6014 3563 5994 3544c 27 6.060 6.060

3562 3543c 26 6013 3561 6.006 3542c 25 6012 3541c 23 5942 6011 H37Rv 3540c 22 5943 mc²155

TA441 3539 21 5941 3560c 6010 5 3559c 5940 3538 4 3558

3537 5939 6009 3

5937 6008 2

3536c 5938 3535c

ORF1 5936 6007 Comamonas testosteroni Mycobacterium tuberculosis Mycobacterium smegmatis tesB 3557c 3534c 5.996

88 Resultados

Figura 14. Representación esquemática de zonas relacionadas con la ruta baja de degradación del colesterol en C. testosteroni TA441, M. smegmatis mc2155 y M. tuberculosis H37Rv. En esta figura se representa esquemáticamente en primer lugar los genes de C. testosteroni cuya participación en la degradación de la testosterona está estudiada o en proceso de estudio (genes tes, mostrados como flechas coloreadas) y los marcos abiertos de lectura (ORFs) de los que se postula su participación en este catabolismo (Genes numerados según la ORF que representan. Se muestran como flechas blancas con el borde coloreado). La representación de estos genes se ha adaptado de la propuesta por Horinouchi et al (2004). No se especifica su posición en el genoma ya que C. testosteroni TA441 no está completamente secuenciada. A continuación, se representan los genes de M. smegmatis mc2155 con elevada similitud con los de C. testosteroni hallados mediante análisis in silico, así como algunos de los genes circundantes a estos. Se han coloreado de manera idéntica al gen al que se asemejan de C. testosteroni, y el número que los representa es su denominación en la base de datos Comprehensive Microbial Resource (CMR). Por ejemplo, el gen representado como 5936 es el gen denominado MSMEG_5936 en CMR. Por último, se representan los genes de M. tuberculosis H37Rv similares a los de C. testosteroni. El número que incluye cada gen es su denominación. Por ejemplo, 3534c representa el gen Rv3534c. Tanto en este caso como en el de M. smegmatis mc²155, los números que aparecen sobre las líneas en diagonal indican las posiciones del genoma, en kb, entre las que se encuentran las distintas agrupaciones génicas.

1.3. Validación de los genes identificados in silico mediante análisis de su expresión por RT-PCR

A partir de los análisis in silico realizados sobre el genoma de M. smegmatis mc²155, se llevaron a cabo ensayos de RT-PCR para averiguar si los genes identificados como responsables del catabolismo del colesterol se expresan específicamente cuando la bacteria crece con colesterol como única fuente de carbono y energía. Así mismo, se analizaron los genes circundantes a éstos que probablemente podrían estar también relacionados con el catabolismo de esteroides, lo que al mismo tiempo servía para delimitar con mayor precisión en el genoma las regiones implicadas en el catabolismo del colesterol. Los ensayos de RT-PCR se realizaron a partir de cultivos de M. smegmatis mc²155 cultivado en colesterol 2 mM o glicerol 0,6 M, tal y como se expone en el apartado 7.1 de Materiales y Métodos.

89 Resultados

Los resultados de las RT-PCR se muestran en las figuras 15. A, B y C junto con la representación esquemática de los genes analizados y como cabía esperar se observó que muchos de estos genes efectivamente se expresan cuando la bacteria crece con colesterol como única fuente de carbono pero no cuando crece en glicerol (véase tabla 8. A). Por otra parte, algunos de los genes que no presentaron expresión diferencial en colesterol como MSMEG_5994, MSMEG_6004, MSMEG_6007, MSMEG_6014, MSMEG_6016 (Véase Tabla 8. B) parece que están formando operones con genes que sí presentan inducción en colesterol. Esto sugiere que los resultados negativos obtenidos mediante la técnica de RT-PCR hay que tomarlos siempre como posibles falsos negativos, ya que podrían ser debidos a un problema de ajuste de las condiciones de amplificación o a otros problemas relacionados con la estabilidad de los mensajeros y necesitan ser comprobados mediante otras técnicas de estudio cuantitativas. Como se verá en otros apartados de resultados, la inducción con colesterol de algunos de estos genes se hizo efectivamente evidente utilizando otros métodos de análisis.

90 Resultados

Figura 15 A 15 Figura

5 4 2 1 1 2 3 4 5 2 3 1

3 5.995

5 4

5936 5938 1 2 3 4 5 4 3 2 1

6.060 6.060 1 2 3 4 5 4 3 2 1 1 2 3 4 5 4 3 2 1 5 4 3 2 1 5 4 3 2 1 5 4 3 2 1 5 4 3 2 1 [86]

5994 5937

[2] [124] [18] 4 [38] (4)

5939 5995 1 2 3 4 5 2 3 1

1 2 3 4 5 1 2 3 4 5 2 3 4 5 4 3 2 5 4 3 2 1 5 4 3 2 1 1 2 3 4 5 1 2 3 4 5 2 3 4 5 4 3 2 5 4 3 2 1 5 4 3 2 1

5940 5996

7][1] [73]

5997

5941 [7]

5998

5943

6.003

1

91 Resultados

15 B 15

6.083 gura

Fi

6017 1 2 3 4 5 3 4 1 2

[17]

6016

6006 (4) 3 4 5 3 4

6015 6005 1 3 2 4 5 1 2 3 4 5 3 4 1 2 1 2 1 3 2 4 5 1 3 2 4 5

6014

(1) (4) (4) 6004 6013

5 4 1 2 (4) [43]

[105]

6003 1 2 3 4 5 6012

6002 6011

4 5 1 3 2 5 4 6001 [125] (4)

6010 1 2 3 4 5 1 2 3 1 2 3 4 5 1 2 3 4 5 5 3 4 1 2 6000

[314] [15] [61] (4) (4)

5999 6009 (8) 1 2 3 4 5 1 2 3 4 5 1 2 1 3 2 5 4 1 2 3 1 2 3 4 5

6008

[88]

6007

1 2 3 5 4

92 Resultados de agarosa 1,5% y el esquem genes a los que genes a los corresponden. y 1,5% de agarosa el esquem de ayos de inducción en colesterol de los genes de sondas Figura 15. Resultados de los genes adyacentes. Los númer entre corchetes indican separación y los números entre paréntesis solapamiento. paréntesis entre y números los separación indican entre corchetes númer adyacentes. Los genes de bases entr de pares el número genes señalan los por de encima que se muestran números ión. Los amplific que presentaron cDNA de muestras aquella s un rojo Se han señalado con círculo positivo). de DNA (control 5. Amplificación inante). de DNA conta (control glicerol de (control colesterol en del cultivo del RNA procedente 2. Amplificación 1,8 mM. colesterol en de cultivo del del RNA procedente M. 4. Amplificación 0,6 en glicerol del cultivo procedente ión del cDNA 3. Amplific DNA contaminante). proc del cDNA Amplificación 5999-6017. C. genes 15 Figura C 1 2 5 3 41

C. testosteroni

Se mues an los genes 6033-6040. En todos los casos se cargaron cinco muestras, señaladas con números : 1. números con señaladas muestras, cinco se genescargaron 6033-6040. an los casos En todos los Se mues

3 4 5 2 1 6.102 Se muestran los productos de las RT-PCR cargados en geles cargados de RT-PCR productos las los mediantemuestran Se RT-PCR. genes circudantes gunos y a edente a de los m os tr ens ac ac l

3 4 5 6033

13 12 [7] [142] (133)

6034

1 2 3 4 5 4 5 3 2 1 1 2 3 4 5 4 5 3 2 1

6035

A. 6036 Se muestran los genes 5936-5943y genes los 5994-5998. Se muestran 1 2 3 4 5 4 3 21 5 4 3 21 (0)

6037

yoatru smegmatis Mycobacterium [2] 6038 1 2 5 3 41 2 5 3 41 1 2 3 4 5 5 4 2 3 1 1 2 3 4 5 5 4 2 3 1 [159]

6039

[42] c15smlrsa las similares mc²155 6040 1 2 1 3 4 5 2 1 3 4 5 B. 1 2 1 3 4 5 2 1 3 4 5 Se muestran los los Se muestran

cultivo en cultivo 6.108

e los

93 Resultados

Genes de M. Gen similar en Genes de M. Gen similar en smegmatis mc2155 C. testosteroni smegmatis mc2155 que C. testosteroni con expresión TA441 no presentaron TA441 diferencial en expresión diferencial colesterol mediante en colesterol mediante RT-PCR RT-PCR semicuantitativa semicuantitativa MSMEG_5937 tesG MSMEG_5936 MSMEG_5939 tesF MSMEG_5938 MSMEG_5940 tesE MSMEG_5994 MSMEG_5941 tesH MSMEG_6004 orf4

MSMEG_5943 MSMEG_6005 MSMEG_5995 MSMEG_6006 orf33 MSMEG_5996 orf33 MSMEG_6007 MSMEG_5997 MSMEG_6013 orf18 MSMEG_5998 MSMEG_6015 orf22 MSMEG_5999 orf27 MSMEG_6017

MSMEG_6000 MSMEG_6033 MSMEG_6001 orf5 MSMEG_6034 MSMEG_6002 orf1 MSMEG_6040 MSMEG_6003 orf2 MSMEG_6008 orf23 8.B MSMEG_6009 MSMEG_6010 MSMEG_6011 orf31 MSMEG_6012 orf30 MSMEG_6014 orf21

MSMEG_6035 tesA1

MSMEG_6036 tesB

MSMEG_6037 tesD MSMEG_6038 tesA2 MSMEG_6039 orf17

8.A

Tabla 8. Resumen de los genes con (A) y sin (B) expresión diferencial en colesterol mediante los ensayos de RT-PCR.

94 Resultados

1.4 Búsqueda de un indicador genético de degradación de esteroides en bacterias

Dada la conservación de genes ortólogos a los genes tes de Comamonas testosteroni dentro de las principales bacterias degradadoras de esteroides conocidas, muchas de ellas actiomicetos, nos propusimos investigar si estos genes eran específicos de microorganismos catabolizadores de compuestos con dicha estructura, pudiendo servir así como “indicador genético” de microorganismos degradadores de esteroides. Para ello se llevaron a cabo comparaciones de las secuencias de tres proteínas codificadas por los genes tes: TesA2, TesB y TesH mediante el programa BLASTP, contra la base de datos de secuencias de proteínas no redundantes (nr) y se seleccionaron aquellos microorganismos que presentaban proteínas similares a estas tres (las tres inclusive) dentro de las 100 primeras secuencias con homología. El porcentaje de identidad que presentan las proteínas seleccionadas con las respectivas de C. testosteroni es de 30% o mayor (cuantificado por ClustalW). Se escogieron estas tres proteínas porque el conjunto de microorganismos que poseen ortólogas a las mismas el bastante homogéneo. Otras como por ejemplo TesA1, componente de la monooxigenasa TesA1TesA2, tiene similitud con componentes flavín reductasa de proteínas pertenecientes a un mayor rango de microorganismos, para algunos de los cuales el crecimiento en esteroides no ha sido constatado, como varias especies pertenecientes al género Pseudomonas. Los resultados de este análisis se muestran en la tabla 9 e incluyen β-proteobacterias como C. testosteroni y distintas especies del género Burkholderia, ambas especies conocidos degradadores de compuestos esteroideos y aromáticos, respectivamente (Horinouchi et al., 2003b; Krumme et al., 1993). También aparecen otras β- proteobacterias como Cupriavidus taiwanensis, un fijador de nitrógeno metal- resistente simbionte de leguminosas (Amadou et al., 2008) y Ralstonia eutropha, degradadora de compuestos aromáticos clorados (Trefault et al., 2004). Como cabía esperar, la mayoría de bacterias que aparecen en esta búsqueda pertenecen al grupo de los actinomicetos, conocidos degradadores de esteroides. Nos encontramos así con numerosas especies de bacterias del género

95 Resultados

Mycobacterium, tanto patógenas como saprófitas. Cabe destacar la ausencia de M. leprae, que un análisis más detallado ha confirmado que no posee genes ortólogos a los relacionados con la degradación de colesterol. Hay representantes de otros géneros como Gordonia, Rhodococcus, Nocardia, Nocardioides, Streptomyces y otros menos conocidos como los actinomicetos marinos Salinispora arenicola y S. tropica (Maldonado et al., 2005), el termófilo Thermomonospora curvata (Stutzenberger, 1971) y Tsukamurella paurometabola (Collins et al., 1988). Fuera de las β-proteobacterias y los actinomicetos nos encontramos con algunos representantes de otros grupos de bacterias, así por ejemplo presentan proteínas similares a las Tes dos α-proteobacterias: Novosphingobium aromaticivorans, degradadora de hidrocarburos aromáticos policíclicos (PAHs) que porta un plásmido catabólico que incluye genes responsables de la degradación de bifenilo, m-xileno o p-cresol, entre otros compuestos (Romine et al., 1999) y Sphingomonas wittichii, degradadora de dioxinas y herbicidas difenil éter (Keum et al., 2008). Por último, aparecen representantes del grupo de las γ-proteobacterias, todos ellos de origen marino: Shewanella halifaxensis, un psicrófilo desnitrificante degradador del compuesto explosivo hexahidro-1,3,5-trinitro-1,3,5-triazina (RDX) (Zhao et al., 2006), el mesófilo Shewanella pealeana (Leonardo et al., 1999), la bacteria antártica Pseudoalteromonas haloplanktis, degradadora de compuestos aromáticos dioxigenados como los catecoles (Papa et al., 2009) y otras dos γ- proteobacterias marinas mesófilas todavía sin clasificar: HTCC2080 y HTCC2148. Aunque no se ha descrito todavía la posible capacidad de degradación de esteroides para las bacterias de los grupos α y γ encontradas en esta búsqueda, nos aventuramos a decir que muy probablemente la poseen, y el hecho de que un microorganismo posea tres genes ortólogos a tesA2, tesB y tesH puede ser un “marcador genético” de su potencial catabólico de compuestos esteroideos. No obstante, para definir la utilidad real de este análisis habrá que demostrar que alguna de las bacterias detectadas crece en colesterol. Por otra parte es necesario aclarar que el hecho de que un organismo no presente estas proteínas no descarta su implicación en estas rutas de degradación, como le sucede por

96 Resultados ejemplo al anaerobio facultativo Sterolibacterium denitrificans (Chiang et al., 2008b).

Burkholderia ambifaria IOP40-10 Mycobacterium tuberculosis H37Rv Burkholderia cenocepacia J2315 Agy99 Burkholderia sp. 383 Mycobacterium vanbaalenii PYR-1 Burkholderia sp. H160 Nocardia farcinica IFM 10152 Comamonas testosteroni CNB-2 Nocardioides sp. JS614 Comamonas testosteroni KF-1 Novosphingobium aromaticivorans DSM 12444 Cupriavidus taiwanensis Pseudoalteromonas haloplanktis TAC125 Gordonia bronchialis DSM 43247] Ralstonia eutropha marine gamma proteobacterium HTCC2080 Rhodococcus erythropolis marine gamma proteobacterium HTCC2148 Rhodococcus jostii RHA1 ATCC 19977 Rhodococcus opacus B4 Mycobacterium avium 104 Salinispora arenicola CNS-205 Mycobacterium avium subsp. avium ATCC 25291 CNB-440 Mycobacterium avium subsp. paratuberculosis K-10 Shewanella halifaxensis HAW-EB4 PYR-GCK Shewanella pealeana ATCC 700345 Mycobacterium intracellulare ATCC 13950 Sphingomonas wittichii RW1 Mycobacterium kansasii ATCC 12478 Streptomyces sp. AA4

Mycobacterium smegmatis str. mc²155 Thermomonospora curvata DSM 43183 Mycobacterium sp. JLS Tsukamurella paurometabola DSM 20162 Mycobacterium sp. MCS Uncultured marine bacterium 442

Tabla 9. Microorganismos que presentan proteínas similares a TesA2, TesB y TesH utilizando el programa BlastP. Se escogieron todas las especies dentro de las 100 primeras que contienen proteínas con similitud (identidad ≥30%) con las tres de C. testosteroni (TesA2, TesB y TesH), las tres inclusive. Se señalan en naranja las bacterias del grupo de los actinomicetos, en amarillo las α-proteobacterias, en azul las β-proteobacterias y en verde las γ-proteobacterias. La prevalencia de actinomicetos es apreciable.

2. Estudio de enzimas que catalizan la transformación de colesterol en 4-colesten-3-ona

Como ya se ha comentado en la introducción, el primer paso de la ruta de degradación del colesterol es, según las rutas postuladas hasta el momento, la oxidación de colesterol a 5-colesten-3-ona (Figura 5 Introducción (2)) seguida de su isomerización a 4-colesten-3-ona (Figura 5 Introducción (3)). En primer lugar para dilucidar esta ruta catalítica en M. smegmatis, nos propusimos identificar genes que por similitud de secuencia fueran claros candidatos para ser los

97 Resultados responsables de esta transformación. Los productos de estos genes se sometieron posteriormente a ensayos de actividad y a mutagénesis para confirmar su posible función. Además la inducción de su expresión en presencia de colesterol se estudió mediante RT-PCR a tiempo real.

2. 1 Análisis in silico de genes que codifican actividad colesterol oxidasa o deshidrogenasa

Mediante comparaciones in silico utilizando como sondas las secuencias de dos proteínas diferentes responsables ambas de catalizar el paso de colesterol a 4-colesten-3-ona en otros microorganismos, se identificaron en el genoma de M. smegmatis mc2155 dos genes que podrían codificar la actividad catalítica buscada. A continuación se expone de manera detallada la determinación de los mismos.

2.1.1 MSMEG_1604

La primera secuencia proteica que se comparó frente al genoma de M. smegmatis fue la correspondiente a la colesterol oxidasa de M. tuberculosis H37Rv, codificada por el gen Rv3409c y denominada ChoD, como nombre genérico de las colesterol oxidasas de micobacterias patógenas y de Streptomyces coelicolor (Navas et al., 2001). La hiperproducción de ChoD en M. tuberculosis produce la acumulación temporal de 4-colesten-3-ona, y su mutagénesis disminuye la virulencia de este patógeno (Brzostek et al., 2007), pero su implicación directa en la ruta de degradación de colesterol todavía no ha sido constatada. En primer lugar se hizo una comparación de ChoD frente a la totalidad de las secuencias proteicas de las bases de datos utilizando el programa BLASTP. Como puede verse en la tabla 10, se conservan proteínas muy similares a ChoD en las especies del género Mycobacterium, tanto en las de crecimiento lento (todas ellas

98 Resultados patógenas) (M. ulcerans, M. kansasii, M. intracellulare, M. avium, M. leprae) como en las de crecimiento rápido (M. vanbaalenii, M. smegmatis, M. gilvum, M. sp JLS, M. sp MCS, M. abscessus), (no patógenas, excepto M. abscessus, que es oportunista). ChoD es así mismo muy similar a las colesterol oxidasas de otros actinomicetos como algunas de los géneros Rhodococcus o Nocardia; la mayoría son saprófitos de vida libre aunque algunos de ellos pueden actuar como patógenos oportunistas en pacientes inmunocomprometidos, como por ejemplo Nocardia farcinica (Ishikawa et al., 2004) o Gordonia bronchialis (Richet et al., 1991).

Proteína / % ID con Proteína/ % ID con microorganismo Rv3409c microorganismo Rv3409c (ChoD) (ChoD) ClustalW ClustalW

Precursor de colesterol oxidasa ChoD Oxidorreductasa FAD dependiente [Mycobacterium ulcerans Agy99] 90 [Mycobacterium sp. MCS] 79 YP_905003.1 YP_638338.1 Precursor de colesterol oxidasa ChoD Posible colesterol oxidasa ChoD [Mycobacterium kansasii ATCC 90 [Mycobacterium abscessus ATCC 78 12478] 19977] ZP_04746501.1 YP_001704447.1

Oxidorredictasa FAD dependiente Proteína hipotética RER_19350 [Mycobacterium intracellulare ATCC 88 [Rhodococcus erythropolis PR4] 71 13950] YP_002765382.1 ZP_05226006.1 Oxidorredictasa FAD dependiente Colesterol oxidasa [Mycobacterium avium 104] 87 [Rhodococcus erythropolis SK121] 70 YP_883489.1 ZP_04383195.1

Oxidorredictasa FAD dependiente Colesterol oxidasa [Mycobacterium avium subsp. Avium 87 [Rhodococcus jostii RHA1] 68 ATCC 25291] YP_706136.1 ZP_05218299.1 Posible colesterol oxidasa Posible oxidorreductasa [ Br4923] 88 [Rhodococcus opacus B4] 68 YP_002503010.1 YP_002783453.1 ChoD Posible colesterol oxidasa [Mycobacterium leprae] 87 [Nocardia farcinica IFM 10152] 70 AAC43233.1 YP_118824.1 Posible colesterol oxidasa Flavoproteína Colina [Mycobacterium leprae TN] 88 deshidrogenasa-like 69 NP_301379.1 [Saccharomonospora viridis DSM 43017] YP_003132378.1 Oxidorredictasa FAD dependiente Colesterol oxidasa [Mycobacterium vanbaalenii PYR-1] 83 [Saccharopolyspora erythraea NRRL 66 YP_952352.1 2338] YP_001108796.1

99 Resultados

Oxidorredictasa FAD dependiente Colesterol oxidasa [Mycobacterium smegmatis mc2155] 83 [Streptomyces sp. AA4] 65 YP_885983.1 ZP_05476910.1 Oxidorredictasa FAD dependiente Oxidorreductasa FAD dependiente [Mycobacterium gilvum PYR-GCK] 81 [Gordonia bronchialis DSM 43247] 65 YP_001136160.1 YP_003272883.1 Oxidorredictasa FAD dependiente Flavoproteína colina deshidrogenasa [Mycobacterium sp. JLS] 80 [Kribbella flavida DSM 17836] 62 YP_001069491.1 ZP_03859915.1

Tabla 10. Resultados de la comparación de ChoD de M. tuberculosis H37Rv frente a las bases de datos de secuencias proteicas utilizando el programa BLASTP. Se muestran las 24 proteínas más similares, el microorganismo al que pertenecen, su código de acceso y su similitud con ChoD indicada en porcentaje de identidad hallado con ClustalW. La proteína producto del gen MSMEG_1604 de M. smegmatis mc2155 se ha señalado en color azul.

Centrándonos en el genoma de M. smegmatis, la proteína más similar a Rv3409c (y la novena en una comparación frente al total de secuencias proteicas) es la oxidorreductasa FAD-dependiente codificada por el gen MSMEG_1604 (1737 pb), con la que comparte un 83% de identidad (cuantificado por ClustalW, tabla 10). La siguiente secuencia proteica más similar a ChoD en el genoma de M. smegmatis sería la correspondiente a la glucosa-metanol-colina oxidorreductasa codificada por el gen MSMEG_5967, que sólo presenta una identidad del 17% (cuantificado por ClustalW) con ChoD, (e igualmente un 17% con MSMEG_1604) con lo que se puede concluir que ChoD no tiene más ortólogos en mc2155 que MSMEG_1604. Tanto ChoD como el producto del gen MSMEG_1604 (al que a partir de ahora nos referiremos como ChoDMS) presentan características propias de las proteínas FAD-dependientes. Así, presentan un motivo Gly-X-Gly-(X)2-Gly-(X)10- Gly (donde X representa cualquier aminoácido) en la región N-terminal, que es común a proteinas de unión a FAD y NAD (Vrielink et al., 1991), como se verá más adelante. Con respecto al sitio activo, se ha visto que las colesterol oxidasas de Brevibacterium sterolicum y Streptomyces así como otras oxidorreductasas tienen en su centro activo 3 residuos hidrofílicos conservados que actúan como bases catalíticas: His447, Glu361 y Asn485 (Vrielink et al., 1991; Yue et al., 1999). ChoD y ChoDMS también presentan estos residuos en posiciones cercanas a las descritas (Fig. 16).

100 Resultados

MSMEG_1604 MKPDYDVLVIGSGFGGSVSALRLTEKGYRVGVLEAGRRFSDEEFAKTSWQLRKFLWAPKL 60 NT02MT3722 MKPDYDVLIIGSGFGGSVTALRLTEKGYRVGVLEAGRRFSDEEFAKTSWDLRKFLWAPRL 60 ********:*********:******************************:********:*

MSMEG_1604 GCYGIQRIHLLRNVMILAGAGVGGGSLNYANTLYVPPEPFFADRQWAGITDWRAELTPHY 120 NT02MT3722 GCYGIQRIHPLRNVMILAGAGVGGGSLNYANTLYVPPEPFFADQQWSHITDWRGELMPHY 120 ********* *********************************:**: *****.** ***

MSMEG_1604 DQAQRMLGVVTNPTFTDADRVVKEVADDMGVGDTFVQTPVGVFFGPDGEKTPGKTVPDPY 180 NT02MT3722 QQAQRMLGVVQNPTFTDADRIVKEVADEMGFGDTWVPTPVGVFFGPDGTKTPGKTVPDPY 180 :********* *********:******:**.***:* *********** ***********

MSMEG_1604 FGGVGPDRTGCIECGSCMTGCRYGAKNTLLKNYLGLAERGGAEVHPLRTVAGFEQLPDGT 240 NT02MT3722 FGGAGPARTGCLECGCCMTGCRHGAKNTLVKNYLGLAESAGAQVIPMTTVKGFERRSDGL 240 ***.** ****:***.******:******:******** .**:* *: ** ***: .**

MSMEG_1604 WRVDTVRTGRWARKDKRSFTATHVVLAAGTWGTQRLLFKMRDTGKLPKLSSRLGVLTRTN 300 NT02MT3722 WEVRTVRTGSWLRRDRRTFTATQLVLAAGTWGTQHLLFKMRDRGRLPGLSKRLGVLTRTN 300 *.* ***** * *:*:*:****::**********:******* *:** **.*********

MSMEG_1604 SESIVGAGRYEVTPDLDLTHGVAITSSIHPTPDTHIEPVRYGKGSNAMGLLQTLMTDGDG 360 NT02MT3722 SESIVGAATLKVNPDLDLTHGVAITSSIHPTADTHIEPVRYGKGSNAMGLLQTLMTDGSG 360 *******. :*.******************.**************************.*

MSMEG_1604 PDGAGIPRWKQLLRNAAEDPRGTLRLLNVHRWSERTLIALVMQHLDNSITTYTKRNRLGI 420 NT02MT3722 PQGTDVPRWRQLLQTASQDPRGTIRMLNPRQWSERTVIALVMQHLDNSITTFTKRGKLGI 420 *:*:.:***:***:.*::*****:*:** ::*****:**************:***.:***

MSMEG_1604 RRYLSKQGHGAPNPTWIPVGNEVTRRIAKKIDGVAGGTWGELFNIPLTAHFLGGAAIGDS 480 NT02MT3722 RWYSSKQGHGEPNPTWIPIGNQVTRRIAAKIDGVAGGTWGELFNIPLTAHFLGGAVIGDD 480 * * ****** *******:**:****** **************************.***.

MSMEG_1604 PETGVIDPYQRVYNYPTLHVMDGAAISANLGVNPSLSITAQAERATSLWPNKGEQDQRPA 540 NT02MT3722 PEHGVIDPYHRVYGYPTLYVVDGAAISANLGVNPSLSIAAQAERAASLWPNKGETDRRPP 540 ** ******:***.****:*:*****************:******:******** *:**.

MSMEG_1604 QGEPYRRLAPIAPVRPVVPADAPGALRRLPIEPVSSAG 578 NT02MT3722 QGEPYRRLAPIQPAHPVVPADAPGALRWLPIDPVSNAG 578 *********** *.:************ ***:***.**

Figura 16. Alineamiento del producto del gen MSMEG_1604 (ChoDMS) y ChoD de M. tuberculosis H37Rv y supuestos motivos consenso hallados en las secuencias. Los residuos marcados en amarillo estarían implicados en la unión de la coenzima FAD y los residuos marcados en rojo formarían parte del centro activo.

Para apoyar estos datos, se llevó a cabo la predicción de la estructura secundaria y la estructura tridimensional de ChoDMS utilizando para ello el programa LOOPP, alojado en el servidor BioHPC (http://cbsuapps.tc.cornell.edu/loopp.aspx). Este programa busca el molde más adecuado para la secuencia proteica problema dentro de las estructuras presentes en las bases de datos. En el caso de ChoDMS, se seleccionó como molde para la construcción del modelo la cadena A de la colesterol oxidasa de Streptomyces (PDB: 1B4V) (Yue et al., 1999), ya que el programa en este caso fue capaz de comparar el 86 % de la secuencia de la proteína con una identidad de secuencia

101 Resultados de 21 %. Su estructura se presenta con la proteína unida a la coenzima FAD. Aunque el modelo no presenta una elevada confianza, permite visualizar la disposición conservada de los aminoácidos consenso (Figura 17).

A B

Figura 17. Predicción de la estructura tridimensional de la proteína ChoDMS tomando como modelo la colesterol oxidasa de Streptomyces (PDB: 1B4V cadena A). A. Modelo de la estructura propuesto para ChoDMS. B. Estructura publicada de la cadena A de la colesterol oxidasa de Streptomyces (Yue et al., 1999). Los aminoácidos marcados en amarillo son aquellos para los que se predice su implicación en la unión de la coenzima FAD. La Gly27 de ChoDMS así como la Gly28 de 1B4V no parecen implicadas en esta unión, ya que se sitúan en la superficie externa de la proteína alejadas del sitio de unión a FAD. Los residuos marcados en rojo formarían parte del centro activo. En verde se ha marcado la coenzima FAD en la proteína de Streptomyces.

102 Resultados

2.1.2 MSMEG_5228

La transformación de colesterol en 4-colesten-3-ona puede estar catalizada, además de por enzimas del tipo colesterol oxidasa, por las hidroxiesteroide deshidrogenasas, como ya se comentó en la Introducción. Así, Horinouchi et al. (1991) describieron una colesterol deshidrogenasa NAD(P)-dependiente (NAD(P)- CDH, número de acceso BAA14290.1) en Nocardia sp. encargada de realizar esta transformación. El análisis comparativo in silico de esta proteína se efectuó, como en el apartado anterior, comparando su secuencia frente a la totalidad de las secuencias proteicas de las bases de datos utilizando el programa BLASTP. Este análisis nos condujo al gen MSMEG_5228 (1068 pb) cuyo producto, que se describe como perteneciente a la familia de las 3-β hidroxiesteroide deshidrogenasas/isomerasas, presenta una identidad del 77% (cuantificado por ClustalW) con la proteína de Nocardia (tabla 12). Las demás proteínas bacterianas que mostraron cierta similitud con la NAD(P)-CDH que salieron a la luz como resultado de este análisis pertenecen todas ellas, sorprendentemente, a especies bacterianas del género Mycobacterium (las siguientes proteínas en orden de similitud con NAD(P)-CDH pertenecen a vegetales, datos no mostrados). Al igual que en el caso de ChoD, aparecen proteínas de especies tanto patógenas como no patógenas, y tanto de crecimiento rápido como lento (tabla 11). En el genoma de M. smegmatis parece ser el gen MSMEG_5228 el único ortólogo al gen de Nocardia, siendo el siguiente gen en orden de similitud MSMEG_6142, que codifica una nucleósido-difosfato-azúcar epimerasa, con una identidad de sólo el 22% con la proteína de Nocardia.

103 Resultados

Proteína / % ID con Proteína/ % ID con microorganismo NAD(P)- microorganismo NAD(P)- CDH CDH ClustalW ClustalW 3-beta hidroxiesteroide Proteína de la familia 3-beta deshidrogenasa/isomerasa 77 hidroxiesteroide 74 [Mycobacterium vanbaalenii PYR-1] deshidrogenasa/isomerasa YP_955416.1 [Mycobacterium avium 104] YP_880472.1 Proteína de la familia 3-beta Proteína hipotética MAP2688 hidroxiesteroide 77 [Mycobacterium avium subsp. 73 deshidrogenasa/isomerasa paratuberculosis K-10] [Mycobacterium smegmatis mc2155] NP_961622.1 YP_889474.1 Posible colesterol deshidrogenasa Colesterol deshidrogenasa [Mycobacterium kansasii ATCC 12478] 75 [Mycobacterium ulcerans Agy99] 72 ZP_04749754.1 YP_904397.1

3-beta hidroxiesteroide Colesterol deshidrogenasa deshidrogenasa/isomerasa 75 [ M] 73 [Mycobacterium gilvum PYR-GCK] YP_001852621.1 YP_001133341.1 3-beta hidroxiesteroide Proteína de la familia 3-beta deshidrogenasa/isomerasa 76 hidroxiesteroide 72 [Mycobacterium sp. MCS] deshidrogenasa/isomerasa YP_641270.1 [Mycobacterium intracellulare ATCC 13950] ZP_05224707.1

3-beta hidroxiesteroide Colesterol deshidrogenasa deshidrogenasa/isomerasa 76 [Mycobacterium leprae TN] 71 [Mycobacterium sp. JLS] NP_302310.1 YP_001072602.1 Colesterol deshidrogenasa Colesterol deshidrogenasa [Mycobacterium tuberculosis H37Rv] 73 [Mycobacterium tuberculosis T17] 72 NP_215622.1 ZP_03536067.1

Tabla 11. Resultados de la comparación de la NAD(P)-CDH de Nocardia sp. frente a las bases de datos de secuencias proteicas utilizando el programa BLASTP. Se muestran las 14 proteínas más similares, el microorganismo al que pertenecen, su código de acceso y su similitud con la NAD(P)-CDH indicada en porcentaje de identidad hallado con ClustalW. La proteína producto del gen MSMEG_5228 de M. smegmatis mc2155 se ha señalado en color azul.

La NAD(P)-CDH de Nocardia sp. así como el producto del gen MSMEG_5228

(a partir de ahora denominado en el texto 3-β HSDMS) presentan un motivo Gly-X-

Gly-(X)2-Gly-(X)10-Gly (donde X representa cualquier aminoácido) en la región N- terminal (Fig. 18) que está bien conservado entre los dominios de unión a NAD de muchas deshidrogenasas NAD(P)-dependientes (Scrutton et al., 1990). Así

104 Resultados mismo, presentan una tétrada catalítica característica de proteínas de la superfamilia de las deshidrogenasas/reductasas de cadena corta (SDR) constituída por una Asn alrededor de la posición 111, una Ser alrededor de la posición 138 y Tyr-(X3)-Lys alrededor de la posición 151 (Oppermann et al., 2003). Además de esta tétrada presentan otras características propias de las SDR, como son un Asp alrededor de la posición 60, una Ala alrededor de la posición 88 y un motivo Pro-Gly alrededor de la posición 180 seguido de una Thr conservada alrededor de la posición 188 (Fig. 18).

MSMEG_5228 MADS--TTDLGRILVTGGSGFVGANLVTELLDRGYAVRSFDRVPSPLPAHAGLEVATGDI 58 NAD_P_-CDH MGDASLTTDLGCVLVTGGSGFVGANLVTELLDRGYAVRSFDRAPSPLGDHAGLEVIEGDI 60 *.*: ***** :*****************************.**** ****** ***

MSMEG_5228 CDLDNVTNAVAGVDTVFHTAAIIDLMGGASVTAEYRQRSFAVNVGGTENLVRAAQSAGVK 118 NAD_P_-CDH CDKETVAAAVKDIDTVIHTAAIIDLMGGASVTEAYRQRSFAVNVEGTKNLVHASQEAGVK 120 ** :.*: ** .:***:*************** ********** **:***:*:*.****

MSMEG_5228 RFVYTASNSVVMGGQHIVHGDETLPYTERFNDLYTETKVVAEKFVLGRNGVAGMLTCSIR 178 NAD_P_-CDH RFVYTASNSVVMGGQDIVNGDETMPYTTRFNDLYTETKVVAEKFVLAENGKHDMLTCAIR 180 ***************.**:****:*** ******************..** .****:**

MSMEG_5228 PSGIWGRGDQTMFRKVFESVLAGHVKVLVGRKSTLLDNSYVHNLVHGFILAAEHLTPNGT 238 NAD_P_-CDH PSGIWGRGDQTMFRKVFENVLAGHVKVLVGNKNIKLDNSYVHNLIHGFILAGQDLVPGGT 240 ******************.***********.*. *********:******.:.*.*.**

MSMEG_5228 APGQAYFINDGEPVNMFEFARPVIEACGRKLPRVRVPGRAVHAAMSGWQRLHFRFGIPEP 298 NAD_P_-CDH APGQAYFINDGEPINMFEFARPVLAACGRPLPTFYVSGRLVHKVMMAWQWLHFKFALPEP 300 *************:*********: **** ** . *.** ** .* .** ***:*.:***

MSMEG_5228 LLEPLAVERLYLNNYFSIAKATRDLGYRPLFTTEQARVDCLPYYVDLFKQME-AQARPA- 356 NAD_P_-CDH LIEPLAVERLYLNNYFSIAKAKRDLGYEPLFTTEQAMAECMPYYVEMFHQMESAQKAPAA 360 *:*******************.*****.******** .:*:****::*:*** ** **

MSMEG_5228 ---- NAD_P_-CDH AVAR 364

Figura 18. Alineamiento del producto del gen MSMEG_5228 (3-β HSDMS) y la NAD(P)-CDH de Nocardia sp. y supuestos motivos consenso hallados en las secuencias. Los residuos marcados en amarillo estarían implicados en la unión de la coenzima mediante el mantenimiento de la estructura de la lámina β central; los residuos marcados en azul estarían implicados en interacciones con la coenzima y los residuos marcados en rojo formarían la tétrada catalítica.

Las funciones postuladas para estos residuos en estas posiciones particulares se resumen en la tabla 12, adaptada de Opperman et al. (2003).

105 Resultados

Motivo Posición Función aproximada D 60 Estabilización del bolsillo del anillo de adenina, unión débil a la coenzima A 88 Estabilización de la lámina β central N 111 Sitio activo

S-Y-K 138, 151,155 Sitio activo N 179 Conexión del bucle de unión al sustrato y el sitio activo P-G 183-184 Dirección de la reacción T 188 Unión a la carboxamida del anillo de nicotinamida

Tabla 12. Función de los motivos conservados encontrados en enzimas SDR. Para las posiciones se ha utilizado como referencia la 3β/17β-HSD de C. testosteroni (código PDB 1hxh) (Oppermann et al., 2003). Los aminoácidos se han escrito en código de una letra.

Las SDR forman una gran familia de proteínas funcionalmente heterogénea. A pesar de las bajas identidades de secuencia entre las diferentes formas (alrededor de un 15-20 %), las estructuras tridimensionales presentan patrones de plegamiento α/β similares con una lámina β central típica del plegamiento de Rossmann (motivo estructural de unión a NAD).

La predicción de las estructuras secundaria y tridimensional de 3-β HSDMS se llevó a cabo, al igual que se hizo con ChoDMS, utilizando el programa LOOPP. En el caso de 3-β HSDMS se seleccionó como molde para la construcción del modelo la cadena A de la proteína DesIV (dTDP-glucosa 4,6-deshidratasa) de Streptomyces venezuelae (PDB: 1R66) (Allard et al., 2004), un miembro de la familia de las SDR. Su estructura se presenta con la proteína unida a la coenzima NAD y a dTDP (el nucleótido desoxitimidina difosfato, que forma parte del sustrato de DesIV, la dTDP glucosa). El programa pudo comparar el 90 % de DesIV con una identidad de secuencia de 22 %. Este modelo presenta un bajo nivel de confianza, pero permite visualizar la disposición conservada de los aminoácidos consenso (Figura 19).

106 Resultados

A B

Figura 19. Predicción de la estructura tridimensional de la proteína 3-β HSDMS tomando como modelo la SDR DesIV de Streptomyces venezuelae (PDB: 1R66 cadena A). A. Modelo de la estructura propuesto para 3-β HSDMS. B. Estructura publicada de la cadena A de la proteína DesIV de Streptomyces venezuelae (Allard et al., 2004). Los aminoácidos marcados en amarillo son aquellos para los que se predice su implicación en la unión de la coenzima NAD. La Gly24 de

3-β HSDMS así como la Gly23 de DesIV no parecen implicadas en esta unión, ya que se sitúan alejadas del sitio de unión de NAD (la Gly23 de DesVI se sitúa detrás de una hélice α y prácticamente no es visible en esta imagen). Los residuos marcados en rojo formarían parte del centro activo. En azul se ha señalado el Asp60 relacionado con interacciones con la coenzima NAD. En lila se ha señalado la Asn180 que actúa como conector del bucle de unión al sustrato y el sitio activo. Este residuo no aparece en la proteína 3-β HSDMS. En verde se ha marcado la coenzima NAD en la proteína de Streptomyces, y en rosa, la desoxitimidina difosfato (dTDP).

107 Resultados

2.2 Análisis mediante RTq-PCR de la expresión diferencial en colesterol de los genes MSMEG_1604 y MSMEG_5228

Una vez localizados los genes MSMEG_1604 y MSMEG_5228 mediante análisis in silico, que podrían ser responsables de catalizar la transformación de colesterol en 4-colesten-3-ona, se analizó en primer lugar su expresión diferencial en colesterol para comprobar si el crecimiento en este esteroide inducía la expresión de ambos o alguno de los genes, lo que apoyaría su papel en la degradación del colesterol. Para ello se cultivó M. smegmatis mc2155 en colesterol 1,8 mM en β-ciclodextrina y en glicerol 18 mM en β-ciclodextrina, se extrajo el RNA de los cultivos en fase logarítmica como se describe en el apartado 7.1 de Materiales y Métodos y se ejecutaron análisis mediante RTq-PCR como se describe en los apartados 7.3 y 7.4 de Materiales y Métodos. Los resultados indican que el gen MSMEG_5228 sí se expresa de manera diferencial en colesterol, resultado que se reproduce con cada una de las tres cantidades de cDNA total con las que se realizó la PCR en tiempo real: 5, 2 y 0,5 ng (Figura 20 A). Sin embargo, el gen MSMEG_1604 no presenta expresión diferencial en colesterol, sino una expresión basal en colesterol y glicerol (Figura 20 B). Estos resultados parecían implicar al gen MSMEG_5228 en la degradación de colesterol frente a MSMEG_1604, aunque eran necesarios estudios de actividad enzimática para corroborar esta hipótesis.

108 Resultados

Expresión difrencial de MSMEG_5228 en Expresión diferencial de MSMEG_1604 en colesterol 1,8 mM-Glic 18 mM colesterol 1,8 mM- glicerol 18 mM

rito) 2,000E+00 3,500E-01

ánsc

tr 3,000E-01 1,500E+00 2,500E-01

de (ng Colesterol 2,000E-01 Colesterol 1,000E+00 pción Glicerol Glicerol 1,500E-01

nscri 1,000E-01 tra 5,000E-0 1 5,000E-02

de vel Nivel de transcripción (ng de tránscrito) de (ng transcripción de Nivel Ni 0,000E+00 0,000E+00 123 123

A B

Figura 20. Expresión diferencial obtenida mediante RTq-PCR de los genes MSMEG_5228 (A) y MSMEG_1604 (B) de M. smegmatis mc2155 cultivado en colesterol 1,8 mM comparado con M. smegmatis mc2155 cultivado en glicerol 18 mM. Los niveles de transcripción se midieron mediante RTq-PCR como se describe en los apartados 7.3 y 7.4 de Materiales y Métodos. Las barras de error representan la desviación estándar calculada. Los valores de P del test t de Student no pareado fueron menores de 0,05 para MSMEG_5228 en todos los casos, lo que implica que la diferencia de expresión es estadísticamente significativa a este nivel de confianza, mientras que para MSMEG_1604 fueron mayores de 0,1, lo que implica que la diferencia de expresión no es estadísticamente significativa a este nivel de confianza (datos no mostrados). Las parejas de barras colesterol (azul)/glicerol (morado) se han señalado con los números 1, 2 o 3 que indican el nivel de transcripción obtenido a partir de distintas cantidades de cDNA: 1: 5 ng, 2: 2 ng y 3: 0,5 ng.

2.3 Clonación y expresión heteróloga de los genes MSMEG_1604 y MSMEG_5228

2.3.1 Clonación de los genes MSMEG_1604 y MSMEG_5228

Para estudiar el posible papel del producto de los genes MSMEG_1604 y MSMEG_5228 en la ruta de degradación del colesterol se procedió, en primer lugar, a su clonación e hiperexpresión en E. coli. Para ello, fueron amplificados por PCR y subclonados en el vector de hiperexpresión pET-29a (+) bajo el control de un promotor fuerte, el promotor 10 del fago T7, y con una región de unión al ribosoma (SD) heteróloga consenso, resultando en los plásmidos pET1604 y pET5228, respectivamente (Fig. 21). Estos plásmidos fueron posteriormente

109 Resultados transferidos a la cepa E. coli BL21 (DE3) (Tabla 1 Materiales y Métodos) que posee el fondo genético necesario para la correcta expresión desde el promotor

PT7.

NdeI EcoRI MSMEG_1604 ApR

CO5 CO3 Ligación pGEM®-T NdeI HindIII Easy (3,0 kb) MSMEG_5228 ori

5228-F 5228-R Polilinker

ApR KmR PT7

pGEM1604 (4,7 kb) pET-29a(+) lacI pGEM5228 (5,4 kb) (4 kb) Digestión

ori ori Ligación

KmR

PT7 pET1604 (7,1 kb) pET5228 (6,4 kb) lacI

ori

Figura 21. Representación esquemática de la construcción de los plásmidos pET1604 y pET5228. Los genes MSMEG_1604 y MSMEG_5228 fueron amplificados mediante PCR utilizando cada uno la pareja de oligonucleótidos correspondiente señalada en la figura (secuencias en Tabla 3 de Materiales y Métodos) y DNA genómico de M. smegmatis mc2155 como molde. Cada gen amplificado se clonó en el plásmido pGEM-T easy (dando lugar a los plásmidos pGEM1604 y pGEM5228) y fue subclonado en el vector pET-29a (+) empleando las enzimas de restricción correspondientes para cada gen señaladas en la figura (y que están presentes en los oligonucleótidos utilizados para la amplificación de los genes), dando lugar a los plásmidos pET1604 y pET5228. Las abreviaturas utilizadas son: ApR, gen que confiere resistencia a ampicilina; KmR, gen que confiere resistencia a kanamicina; lacI, gen que codifica el represor LacI;

PT7, promotor del gen 10 del fago T7; ori, origen de replicación.

110 Resultados

2.3.2 Expresión heteróloga de MSMEG_1604

Los extractos proteicos obtenidos de la cepa E. coli BL21 (DE3) (pET1604), fueron analizados mediante SDS-PAGE. Tras analizar distintas condiciones de fermentación, en las cuales se cambiaron la temperatura, agitación, tiempo de inducción con IPTG, etc., finalmente se seleccionaron las indicadas en el apartado

5.1.1 de Materiales y Métodos (inducción de cultivos a DO600 de 0,6 con IPTG 50 μM en agitación durante 3 horas a 20 ºC). Estas condiciones provocan la insolubilización de parte de la proteína, pero también se detectan niveles apreciables de proteína soluble (Fig. 22, calle 3).

KDa 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 200,0

116,0 97,4

66,0

45,0

31,0

A B

Figura 22. Geles SDS-PAGE en los que se muestra la expresión del producto de

MSMEG_1604 (ChoDMS) en células E. coli BL21 (DE3) bajo distintas condiciones y tratamientos. A: 1. Marcadores de peso molecular (en el margen izquierdo de la figura se detallan los pesos moleculares de los marcadores en KDa). El peso molecular de ChoDMS se ajusta al teórico calculado por el programa Compute pI/Mw del servidor Expasy (http://www.expasy.org/tools/pi_tool.html): 62,88 KDa. La posición de la proteína se indica con una flecha roja. 2-10: Fracciones celulares solubles de E. coli BL21 (DE3) (pET1604) inducidas a temperatura ambiente (20 ºC) con: 2. IPTG 50 µM 4 h. 3. IPTG 50 µM 3 h. 4. IPTG 50 µM 2 h. 5. IPTG 50 µM 1,5 h. 6. IPTG 50 µM 1 h. 7. IPTG 50 µM 45 min. 8. IPTG 50 µM 30 min. 9. IPTG 1,25 µM 12 h. 10. IPTG 0,125 µM 12 h. B: 1. Marcadores de peso molecular. 2-10: Fracciones celulares insolubles de E. coli BL21 (DE3) (pET1604) inducidas a temperatura ambiente (20 ºC) con: 2. IPTG 50 µM 4 h. 3. IPTG 50 µM 3 h. 4. IPTG 50 µM 2 h. 5. IPTG 50 µM 1,5 h. 6. IPTG 50 µM 1 h. 7. IPTG 50 µM 45 min. 8. IPTG 50 µM 30 min. 9. IPTG 1,25 µM 12 h. 10. IPTG 0,125 µM 12 h.

111 Resultados

2.3.3 Expresión heteróloga de MSMEG_5228

Los extractos proteicos de la cepa E. coli BL21 (DE3) (pET5228) fueron analizados mediante SDS-PAGE. Se probaron distintas condiciones de fermentación, pero en ningún caso se pudo obtener un extracto en el que fuese visible proteína en forma soluble, sino que se mostraba hiperproducida en forma insoluble. Como norma general para posteriores experimentos se utilizaron las mismas condiciones de inducción que para E. coli BL21 (DE3) (pET1604) (Fig. 23).

KDa 1 2 3

116,0 97,4 66,0

45,0

31,0

21,5

14,4

Figura 23. Geles SDS-PAGE en los que se muestra la expresión del producto de

MSMEG_5228 (3-β HSDMS) en células E. coli BL21 (DE3). En este caso se cargaron como muestra células enteras, ya que no hay proteína visible en las fracciones celulares solubles expresando esta proteína con las condiciones utilizadas. 1. Marcadores de peso molecular (en el margen izquierdo de la figura se detallan los pesos moleculares de los marcadores). 2. Células enteras E. coli BL21(DE3) con plásmido pET29 (control negativo de expresión) inducidas 3 h a 20 ºC con 50 μM IPTG. 3. Células enteras E. coli BL21(DE3) (pET5228) inducidas 3 h a 20 ºC con 50

μM IPTG. El peso molecular de 3-β HSDMS se ajusta al teórico calculado por el programa Compute pI/Mw del servidor Expasy (http://www.expasy.org/tools/pi_tool.html): 38,8 KDa.

2.4 Ensayos enzimáticos mediante TLC con colesterol marcado con 14C

Las proteínas ChoDMS y 3-β HSDMS fueron ensayadas utilizando colesterol marcado radiactivamente. Los productos de las reacciones fueron separados mediante la técnica de cromatografía en capa fina (TLC) y éstos fueron detectados

112 Resultados posteriormente mediante autorradiografía. Esta técnica supone una alternativa más sensible a los ensayos espectrofotométricos, que fueron probados previamente, sin que se pudiese detectar con ellos actividad enzimática. La técnica de TLC con radiactividad ya se había utilizado con anterioridad para la determinación de la actividad colesterol deshidrogenasa/isomerasa de la proteína AcmA de S. denitrificans (Chiang et al., 2008b). Los protocolos utilizados para el ensayo de AcmA se adaptaron para ensayar y posteriormente visualizar nuestras muestras proteicas (véanse los apartados 5.4.1, 5.4.2 y 9 de Materiales y Métodos). Mediante esta metodología adaptada se ensayaron extractos proteicos de E. coli BL21 (DE3) (pET1604), E. coli BL21 (DE3) (pET5228) y sobrenadantes de cultivos de E. coli BL21(DE3) (pET1604) y de M. smegmatis mc2155 y distintos mutantes de esta cepa.

2.4.1 Experimentos in vitro con ChoDMS y 3-β HSDMS. Cinética enzimática

La puesta a punto del método cromatográfico con muestras procedentes de in vitro se llevó a cabo utilizando como control positivo la colesterol oxidasa comercial de Pseudomonas fluorescens. Se cargaron las placas de TLC con muestras procedentes de soluciones de proteína incubadas con colesterol marcado radiactivamente durante 20 min a 30 ºC. Los resultados muestran la aparición de una marca cuyo tiempo de retención (Rf) coincidía con el de la 4- colesten-3-ona (Datos no mostrados). Esta marca no aparecía en ninguno de los controles negativos empleados (muestra incubada sin proteína o extracto soluble de E. coli BL21 (DE3) portando el plásmido pET29 sin inserto) (Fig. 24). Curiosamente, en la muestra de colesterol oxidasa comercial aparece además de las marcas de colesterol y de la 4-colesten-3-ona, otra marca por debajo de la del colesterol, que podría corresponder, teniendo en cuenta la fase móvil utilizada en nuestros ensayos, a la 6β-hidroperoxi-4-colesten-3-ona (Fig. 25), un compuesto que aparece, incluso de manera mayoritaria, como producto de algunas colesterol oxidasas (Doukyu y Aono, 1999; Doukyu et al., 2008).

113 Resultados

N

C

H

1 2 3

Figura 24. Producción de productos a partir de colesterol marcado con 14C por soluciones de colesterol oxidasa comercial. La línea marcada con una C indica la altura a la que migra el colesterol, la marcada con una N la de la 4-colesten-3-ona y la marcada con una H la de un producto no identificado que podría tratarse de la 6β-hidroperoxi-4-colesten-3-ona. Las muestras se cargaron en las placas de TLC tras un ensayo enzimático de 20 min. Las muestras cargadas proceden de ensayos realizados con: 1. Colesterol radiactivo sin extracto proteico. 2. Ensayo con colesterol oxidasa comercial. 3. Ensayo con extracto soluble de E. coli BL21 (DE3) portando el plásmido pET29 vacío.

Para confirmar la estructura del compuesto que se hipotetiza como 6β- hidroperoxi-4-colesten-3-ona, la muestra de reacción fue analizada por LC/MS (véanse los apartados 5.4.1 y 8 de Materiales y Métodos). En un primer análisis, en el que se recogieron los iones producidos en full scan, encontramos un pico a tiempo de retención 14,53 minutos en el que el ión quasimolecular [M+H]+ corresponde a m/z 417 y en el que los iones mayoritarios son, en orden de abundancia, m/z 371, m/z 400 y m/z 383. El ión quasimolecular corresponde con la masa de la 6-β-hidroxi-4-colesten-3-ona (peso molecular 416) mientras que los iones mayoritarios concuerdan con la pérdida de un grupo carboxilo, un grupo hidroxilo y dos grupos hidroxilo respectivamente, presentes en la estructura de este compuesto. Al fraccionar tanto el ión quasimolecular como los iones mayoritarios, encontramos espectros de masas que indican que el compuesto que estamos estudiando presenta una cadena lateral similar a la del colesterol y que

114 Resultados puede perder hasta tres moléculas de agua al ser sometido a la energía de colisión necesaria para producir su fragmentación.

O OOH

Figura 25. Estructura de la 6-β-hidroxi-4-colesten-3-ona.

Estos resultados sugieren que el compuesto tiene una estructura similar a la 6-β-hidroxi-4-colesten-3-ona, en cuanto a su estructura esteroidea y a su cadena lateral, aunque serían necesarios análisis de RMN para establecer definitivamente esta estructura en su totalidad. Tras el ensayo realizado con éxito empleando la colesterol oxidasa comercial, se procedió a realizar el mismo protocolo con los extractos proteicos de E. coli expresando ChoDMS y 3-β HSDMS (E. coli BL21 (DE3) (pET1604) y E. coli BL21 (DE3) (pET5228)). En este caso se analizaron en las placas de TLC las muestras incubadas y extraídas a distintos tiempos de reacción, a los 2, 20, 40 y 60 min.

En las muestras que expresan 3-β HSDMS se aprecia una marca en la movilidad corrrespondiente a la 4-colesten-3-ona, y su intensidad aumenta con el tiempo de ensayo (Fig. 26). También se aprecia, como ya se había visto con el control con colesterol oxidasa comercial, otra marca con menor movilidad que el colesterol, que podría corresponder a la 6β-hidroperoxi-4-colesten-3-ona. Esta es la primera vez que se describe la presencia de este tipo de metabolito para una hidroxiesteroide deshidrogenasa hasta el momento.

En las muestras procedentes de extractos que expresan ChoDMS no se aprecia ninguna banda adicional a la de colesterol. Estos resultados confirman la

115 Resultados

capacidad de transformación del colesterol de 3-β HSDMS y mantienen las dudas

sobre la actividad de ChoDMS.

2 min ensayo 20 min 40 min 60 min N C

H

1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

Figura 26. Producción de productos a partir de colesterol marcado con 14C por extractos

celulares solubles expresando las proteínas ChoDMS y 3-β HSDMS. La línea marcada con una C indica la altura a la que corre el colesterol, la marcada con una N la de la 4-colesten-3-ona y la marcada con una H la de un producto no identificado que podría tratarse de la 6β-hidroperoxi-4- colesten-3-ona. Las muestras se cargaron en las placas de TLC a diferentes tiempos de reacción que se indica en la vertical: 2, 20, 40 y 60 min. Las muestras cargadas proceden de ensayos realizados con: 1. Colesterol oxidasa comercial. 2. Extracto soluble de E. coli BL21 (DE3) (pET5228). 3. Extracto soluble de E. coli BL21 (DE3) (pET5228) al que no se adicionó NAD en el ensayo enzimático (el resultado indica que en el extracto proteico hay suficiente NAD para que la reacción enzimática tenga lugar). 4. Extracto soluble de E. coli BL21 (DE3) (pET1604).

2.4.2 Detección de la actividad de ChoDMS in vivo

El hecho de que los extractos proteicos que expresan ChoDMS no produzcan 4-colesten-3-ona podría ser debido a que la proteína se esté excretando al medio de cultivo y sea a nivel extracelular donde se cataliza esta transformación. De hecho, se ha sugerido que la ChoD de M. tuberculosis es extracelular (Cowley y Av-Gay, 2001). Para comprobar si esto era lo que estaba sucediendo, se cultivó la cepa E. coli BL21 (DE3) (pET1604) durante 24 h en medio mínimo con glicerol 20 mM como fuente de carbono y colesterol 1 mM marcado radiactivamente. Tras tomar muestras de sobrenadante de cultivo (véase apartado 5.4.2 de Materiales y

116 Resultados

Métodos), éstas se visualizaron mediante TLC. Como se muestra en la figura 27, no se apreció la existencia de una marca de 4-colesten-3-ona.

Figura 27. Producción de metabolitos a partir de colesterol marcado con 14C por muestras procedentes de sobrenadante N de cultivo de E. coli. La línea marcada con una C indica la altura a C la que corre el colesterol, la marcada con una N la de la 4-colesten-

3-ona y la marcada con una H la de un producto no identificado H que podría tratarse de la 6β-hidroperoxi-4-colesten-3-ona. Las muestras cargadas proceden de ensayos realizados con: 1. Colesterol oxidasa comercial. 2. Sobrenadante de cultivo de E. coli

BL21 (DE3) portando el plásmido pET29 vacío en glicerol 20 mM-

1 2 3 colesterol 1 mM. 3. Sobrenadante de cultivo de E. coli BL21 (DE3) (pET1604) en glicerol 20 mM-colesterol 1mM.

2.5 Ensayo de ChoDMS y 3-β HSDMS mediante LC/MS

Como método de análisis complementario a los ensayos de radiactividad, se llevaron a cabo análisis mediante LC/MS con muestras procedentes de extractos proteicos expresando los productos de MSMEG_1604 y MSMEG_5228. Estos ensayos se realizaron con distintas muestras procedentes de ensayos enzimáticos para determinar actividad colesterol oxidasa o colesterol deshidrogenasa a tiempo de ensayo 1 h (véanse los apartados 5.4.1 y 8 de Materiales y Métodos). Los ensayos enzimáticos se realizaron siguiendo el mismo método que para su análisis mediante TLC pero sin adición de colesterol radiactivo. La figura 28 muestra el espectro MS/MS de 4-colesten-3-ona obtenido por APCI+ para extractos de E. coli BL21(DE3) (pET5228) a tiempo final 1 h. Como se puede observar, aparece un pico correspondiente a la 4-colesten-3-ona, concretamente el ión 367 procedente a su vez de la reacción del ión 385 de la 4- colesten-3-ona. Este ión es uno de los iones que se generan al fragmentarse la molécula de 4-colesten-3-ona mediante espectrometría de masas. Esta fragmentación siempre genera los mismos iones padre para una molécula dada.

117 Resultados

La fragmentación de uno de estos iones mediante espectrometría de masas (por ejemplo el 385 en el caso de la 4-colesten-3-ona) genera a su vez varios iones, que igualmente siempre son los mismos (en el caso de la 4-colesten-3-ona uno de ellos es el 367). Así, la detección del ión de fraccionamiento de una molécula mediante MS/MS ofrece una garantía mucho mayor sobre la identidad de la misma que limitarse a detectar uno de los iones originales, ya que dos moléculas pueden tener un ión original común, pero difícilmente la fragmentación de éste dará a su vez lugar a iones de fragmentación comunes. Estos resultados confirmarían los obtenidos mediante ensayos con colesterol radiactivo visualizados mediante TLC. Los espectros MS/MS obtenidos con los extractos de E. coli BL21 (DE3) (pET1604) no se muestran ya que en ellos no apareció el pico de 4-colesten-3- ona, con lo que se repiten los resultados negativos ya obtenidos mediante ensayos espectrofotométricos y TLC. Hay que destacar que la concentración más elevada de 4-colesten-3-ona que se consiguió obtener en estos ensayos fue de 9 μM, valor obtenido en los ensayos de tiempo 1 h con el extracto proteico de E. coli BL21 (DE3) (pET5228). Teniendo en cuenta que por cada mol de colesterol que se degrada se forma un mol de NADH, el coeficiente de extinción molar del NADH y el volumen total de muestra, se puede estimar que el aumento de absorbancia a 340 nm del NADH sería de unas 0,055 unidades en estas condiciones de ensayo, un valor que habría sido considerado poco significativo de haberse utilizado ensayos espectrofotométricos. Estos valores tan bajos de transformación pueden deberse a que la expresión heteróloga de estas proteínas no es adecuada para su correcto plegamiento.

118 Resultados

: 7,84 - 51,69 SM: 9B 100 4-colesten-3-ona NL: 1,99E3 TIC F: ITMS + c APCI

va 80 corona SRM ms2 385,30@cid15,50

elati 60 [366,80-367,80] MS cal3 ncia r 40 Colesterol da Patrón 20

Abun 0 100 NL: 9,89E2 TIC F: ITMS + c APCI 80 corona SRM ms2 tiva 385,30@cid15,50

rela 60 [366,80-367,80] MS muestrab

ncia 40 Control negativo unda 20 Ab 0 100 NL: 2,76E3 TIC F: ITMS + c APCI 80 corona SRM ms2 385,30@cid15,50 60 [366,80-367,80] MS muestrac 40

20 E.p. pET5228 Abundancia relativa Abundancia 0 10 15 20 25 30 35 40 45 50 Tiempo (min)

Figura 28. Espectro MS/MS de 4-colesten-3-ona obtenido por APCI+ a partir de muestras procedentes de ensayos de actividad deshidrogenasa a tiempo final 1 h con extractos solubles de E. coli BL21(DE3) (pET5228). Se registradó el ión hijo m/z 367 del ión padre m/z 385 de la 4-colesten-3-ona. En la figura se señalan en el primer espectro los picos correspondientes al colesterol y a la 4-colesten-3-ona. Las muestras proceden de ensayos de actividad deshidrogenasa realizados durante 1 h. E.p. pET5228 indica la muestra procedente de un ensayo con extractos solubles de E. coli BL21(DE3) (pET5228). En la misma se puede apreciar la aparición del pico correspondiente a la 4-colesten-3-ona.

2.6 Ensayo de afinidad de ChoDMS por el colesterol

Como complemento a los ensayos de actividad de ChoDMS se hizo un sencillo ensayo de purificación de colesterol oxidasa por afinidad con colesterol (Ghasemian et al., 2009). Brevemente, a 2 ml de un extracto proteico que contiene la proteína ChoDMS se añadieron 20 mg de colesterol en polvo y se incubó a 4 ºC durante 2 h. Tras centrifugar la mezcla a 10000 g durante 10 min se retiró el sobrenadante y se hicieron tres lavados sucesivos del precipitado con los

119 Resultados siguientes tampones: tampón fosfato potásico 0,1 M pH 7,5 (para eliminar las proteínas no unidas a colesterol), tampón fosfato potásico pH 7,5 con NaCl 0,5 M (para precipitar las proteínas remanentes) y tampón fosfato potásico pH 7,5 con 1% de Triton X-100 (para extraer las proteínas unidas a colesterol). Se recogió el sobrenadante de la muestra tras la centrifugación posterior a este último lavado y se analizaron 5 μl mediante SDS-PAGE. Los resultados indican que la supuesta colesterol oxidasa ChoDMS se extrae de manera selectiva en estas condiciones (Fig. 29), lo que apoyaría la hipótesis de la existencia de algún tipo de interacción de esta proteina con el colesterol, a pesar de no haber presentado actividad colesterol oxidasa en nuestros distintos ensayos. No obstante, serían necesarios controles de hidrofobicidad con otros compuestos hidrofóbicos insolubles distintos al colesterol.

KDa 1 2 3

116,0 97,4

66,0

45,0

31,0

21,5

Figura 29. Purificación de ChoDMS mediante afinidad por colesterol. 1. Marcadores de peso molecular (en el margen izquierdo de la figura se detallan los pesos moleculares de los marcadores). 2. Fracción celular soluble de E. coli BL21 (DE3) (pET1604) antes de la purificación. 3. Fracción celular soluble de E. coli BL21 (DE3) (pET1604) después de la purificación. Se observa un aumento notable de la concentración relativa de la supuesta colesterol oxidasa. La posición de la proteína se indica con una flecha roja.

120 Resultados

2.7 Mutagénesis de MSMEG_1604 y MSMEG_5228

Para comprobar si la mutagénesis de los supuestos genes implicados en el primer paso del catabolismo del colesterol hallados mediante análisis in silico alteraba la utilización de este esteroide en M. smegmatis, se procedió a la interrupción de los mismos mediante la inserción del plásmido no replicativo en micobacterias pJQ200x (véase el apartado 4.6 de Materiales y Métodos), o bien a su deleción, en el caso del gen MSMEG_5228 (deleción necesaria para la construcción de un doble mutante de los genes MSMEG_1604 y MSMEG_5228) (véase el apartado 4.7 de de Materiales y Métodos).

2.7.1 Ensayos de crecimiento en colesterol de los distintos mutantes

Los mutantes así obtenidos se crecieron con colesterol 1,8 mM en β- ciclodextrina como única fuente de carbono. Como puede observarse en las figuras 30 A, B y C, el crecimiento en colesterol no se ve alterado en ninguno de los mutantes simples en los genes MSMEG_1604 y MSMEG_5228. Tampoco ve reducida su capacidad de crecimiento en el mutante doble M. smegmatis::MSMEG_1604-ΔMSMEG_5228 (Fig. 30 D), que presenta el gen MSMEG_5228 delecionado y el gen MSMEG_1604 interrumpido con pJQ200x. Estos resultados podían indicar que se trata de un caso de redundancia, y existan más genes no descritos que codifican proteínas con esta misma actividad en el genoma de M. smegmatis.

121 Resultados

fica la M.

. C

n mutante del MSMEG_5228 M. smegmatmc²155 is M. smegmat is::MSMEG_5228 M. smegmat mc²155 is M. smegmat is::MSMEG_1604- Δ . En cada gra´ cada 155 . En 2 MSMEG_5228. mc :: B D :: MSMEG_5228

8 mM. Mutante doble Mutante 8 mM. 080 M. smegmatis . M. smegmatis secomportan indistintamente. Dado losque M. smegmatis B en posteriores experimentos. posteriores en . se creo´para la posterior construccio´ posterior la creo´para se C MSMEG_5228 Tiempo (h) TiempoTiempo (h) (h) MSMEG_5228 MSMEG_1604 :: :: nde frente a la cepa control cepa la a frente Crecimiento en colesterol 1, colesterol en Crecimiento

M. smegatis M. smegmatis M. . 00 20406080 20406080 0 20406 A n representado en lafigura 1 1 1 Crecimiento en colesterol 1,8 mM. mM. 1,8 colesterol en Crecimiento 10 10 10 M. smegmatis 0,1 0,1 0,1 155. 155.

0,01 0,01 0,01

2

en lugar de 600 600 600 600 DO DO DO DO DO mc

n el y obtenido mediante interrupcio´ MSMEG_5228 MSMEG_5228 MSMEG_5228 M. smegmatis Δ Δ Δ El mutantedelecio´por M. smegmatis mc²155 smegmatis M. M. smegmat is::MSMEG_1604 M. smegmat smegmat mc²155 mc²155 is is M. smegmat smegmat is is MSMEG_5228 MSMEG_5228 M. smegmatis M. MSMEG_1604 :: Δ Δ A C MSMEG_5228. Δ nea azul representaa

M. smegmatis M. smegmatis MSMEG_1604- s estables seutilizo´ :: , el mutanteobtenido mediante delecio´ C

y B nson ma´ nson ficas Tiempo (h) Tiempo (h) Tiempo (h) . M. smegmatis . M. D

0 20406080 0 20406080 0 20406080 MSMEG_5228. 1 1 1 Crecimiento en colesterol 1,8 mM. Crecimiento en colesterol 1,8 mM. mM. 1,8 colesterol en Crecimiento Δ 10 10 10 0,1 0,1 0,1

0,01 0,01 0,01

600 600 600 600 DO DO DO DO

DO nea naranja representa almutante correspondiente lay li´ li´ Figuras 30B, D. C A, y Curvascrecimientode en colesterol 1,8 mM de diferentes mutantes de smegmatis doble. Como se observa en las gra´ las en se observa Como doble. mutantes obtenidos mediante delecio´

122 Resultados

2.7.2 Ensayos de sobrenadante de cultivo en colesterol de los distintos mutantes mediante TLC

Por otra parte, se analizaron los sobrenadantes de cultivos de las distintas cepas mutantes M. smegmatis::MSMEG_1604, M. smegmatisΔMSMEG_5228 y M. smegmatis::MSMEG_1604-ΔMSMEG_5228 con el fin de comprobar si, a pesar de ser todas ellas capaces de crecer en colesterol, se apreciaba alguna diferencia en el perfil de los intermediarios producidos durante su catabolismo. Las células se cultivaron durante 24 h en medio mínimo con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono y tras extraer los sobrenadantes se visualizaron en placas de TLC (véanse los apartados 5.4.2 y 9 de Materiales y Métodos). Los resultados indican que, comparativamente, el mutante M. smegmatisΔMSMEG_5228 y el mutante doble M. smegmatis::MSMEG_1604-ΔMSMEG_5228 presentan menos 4- colesten-3-ona que los demás mutantes a este tiempo de cultivo. También se aprecia menos cantidad de la supuesta 6β-hidroperoxi-4-colesten-3-ona (Fig. 31). Estos resultados son reproducibles y parecen indicar que la proteína codificada por MSMEG_5228 sería la implicada en la degradación del colesterol para su aprovechamiento como fuente de carbono y energía, aunque su ausencia es suplida sin que el crecimiento de M. smegmatis en el esteroide se vea apreciablemente alterado.

123 Resultados

N C

H

1 2 3 1 2 4 1 2 5

Figura 31. Producción de metabolitos a partir de colesterol marcado con 14C por muestras procedentes de sobrenadante de cultivo de distintas cepas de M. smegmatis. La línea marcada con una C indica la altura a la que corre el colesterol, la marcada con una N la de la 4- colesten-3-ona y la marcada con una H la de un producto no identificado que podría tratarse de la 6β-hidroperoxi-4-colesten-3-ona. Las muestras cargadas derivan de sobrenadantes de cultivos de distintas cepas de M. smegmatis crecidas en colesterol 1,8 mM durante 24 h. 1. Control procedente de un ensayo con colesterol oxidasa comercial. 2. M. smegmatis mc2155. 3. M. smegmatis::MSMEG_5228. 4. M. smegmatis::MSMEG_1604. 5. M. smegmatis::MSMEG_1604- ΔMSMEG_5228.

2.7.3 Ensayos de sobrenadante de cultivo en colesterol de los distintos mutantes mediante LC/MS

Para analizar el perfil de intermediarios de la degradación del colesterol en distintas cepas de M. smegmatis, éstas se crecieron en medio mínimo con colesterol en β-ciclodextrina como única fuente de carbono, y se fueron extrayendo alícuotas a distintos tiempos de incubación para su análisis mediante LC/MS (véanse los apartados 5.4.2 y 8 de Materiales y Métodos). Los resultados se muestran en la figura 32. Como cabría esperar teniendo en cuenta los crecimientos de los distintos mutantes en colesterol, la desaparición del esteroide sigue una tendencia muy similar en los distintos mutantes y la cepa salvaje (Fig. 32 A). Sin embargo, la tendencia que se aprecia tanto en el mutante en el gen MSMEG_5228 como en el mutante doble M. smegmatis::MSMEG_1604- ΔMSMEG_5228 es una aparición mucho menor de 4-colesten-3-ona y de los

124 Resultados posibles tercer y cuarto intermediarios de la ruta de degradación (26-hidroxi-4- colesten-3-ona y 26-hidroxi-1,4-colestadien-3-ona, estructuras 5A y 5B de la figura 15 de introducción, respectivamente) que en el mutante en el gen MSMEG_1604 y en M. smegmatis mc2155 (Fig. 32 B, C y D). Las concentraciones de intermediarios parece que tienden a igualarse en las distintas cepas en intermediarios posteriores (ácido 4-colesten-3-ona-26-oico y ácido 1,4-colestadien- 3-ona-26-oico, estructuras 6A y 6B de la figura 15 de introducción, respectivamente) (Fig. 32 E y F).

Colesterol 4-colesten-3-ona Colesterol 4-colesten-3-ona

0,80000 0,04000 0,70000 0,03500 0,60000 M. smegmatis::MSMEG_1604 0,03000 M. smegmatis::MSMEG_1604 0,50000 M. smegmatisΔMSMEG_5228 0,02500 M. smegmatisΔMSMEG_5228 0,40000 0,02000 M. smegmatis::MSMEG_1604- 0,30000 0,01500 M. smegmatis::MSMEG_1604- ΔMSMEG_5228 ΔMSMEG_5228 0,20000 0,01000 patrón interno patrón M. smegmatis mc2155 interno patrón patrón interno patrón M. smegmatis mc2155 0,10000 0,00500 0,00000 0,00000 Área del compuesto/área del del del compuesto/área compuesto/área del del Área Área del compuesto/área del del compuesto/área del Área 0244872 0 244872 Tiempo (h) Tiempo (h) AB 26-hidroxi-4-colesten-3-ona 26-hidroxi-1,4-colestadien-3-ona 26-hidroxi-4-colesten-3-ona 26-hidroxi-1,4-colestadien-3-ona 0,10000 0,00700 0,00600 0,08000 M. smegmatis::MSMEG_1604 M. smegmatis::MSMEG_1604 0,00500 M. smegmatisΔMSMEG_5228 0,06000 0,00400 M. smegmatisΔMSMEG_5228 0,04000 M. smegmatis::MSMEG_1604- 0,00300 M. smegmatis::MSMEG_1604- ΔMSMEG_5228 ΔMSMEG_5228 M. smegmatis mc2155 0,00200 patrón interno interno patrón patrón patrón interno patrón patrón interno patrón 0,02000 M. smegmatis mc2155 0,00100 0,00000 0,00000 Área del compuesto/área del Área del del compuesto/área compuesto/áreaÁrea del del 0 244872 0 244872 Tiempo (h) Tiempo (h) CD Ácido 4-colesten-3-ona-26-oico Ácido 1,4-colestadien-3-ona-26-oico Ácido 4-colesten-3-ona-26-oico Ácido 1,4-colestadien-3-ona-26-oico 0,35000 0,00160 0,30000 0,00140 M. smegmatis::MSMEG_1604 0,25000 M. smegmatis::MSMEG_1604 0,00120 0,00100 M. smegmatisΔMSMEG_5228 sto/área del del sto/área 0,20000 M. smegmatisΔMSMEG_5228 0,00080 M. smegmatis::MSMEG_1604- 0,15000 M. smegmatis::MSMEG_1604- 0,00060 ΔMSMEG_5228 ompue 0,10000 ΔMSMEG_5228 0,00040 M. smegmatis mc2155 patrón interno patrón patrón interno patrón M. smegmatis mc2155 interno patrón 0,05000 0,00020 0,00000 0,00000 Área del c del Área del sto/área 0 244872 del compuesto/área del Área 0 244872 Tiempo (h) Tiempo (h) EF Figura 32. Perfil de intermediarios de la degradación del colesterol hallado en los sobrenadantes de cultivo en colesterol de distintas cepas de M. smegmatis. Las figuras representan la relación entre las áreas de los compuestos indicados en la leyenda con respecto al área de la 5-pregnen-3-ol-20-ona, empleado como patrón interno, frente al tiempo. A. Colesterol; B. 4-colesten-3-ona; C. 26-hidroxi-4-colesten-3-ona; D. 26-hidroxi-1,4-colestadien-3-ona; E. Ácido 4-colesten-3-ona-26-oico; F. Ácido 1,4-colestadien-3-ona-26-oico.

125 Resultados

La menor producción de 4-colesten-3-ona en las cepas con el gen MSMEG_5228 mutado y en la cepa mutante doble M. smegmatis::MSMEG_1604- ΔMSMEG_5228 ya se había observado en los ensayos con colesterol radiactivo. En la tabla 13 se muestran la concentración de colesterol y 4-colesten-3-ona cuantificada en cada cepa en cada punto de la extracción.

Muestra Conc. Colesterol Conc. 4-colesten-3- (mM) ona (mM) M. smegmatis::MSMEG_1604 0h 1,715 n.d.

M. smegmatis::MSMEG_1604 24h 1,490 0,056

M. smegmatis::MSMEG_1604 48h 0,802 0,081 M. smegmatis::MSMEG_1604 72h 0,160 0,007

M. smegmatisΔMSMEG_5228 0h 1,782 n.d. M. smegmatisΔMSMEG_5228 24h 1,187 0,007 M. smegmatisΔMSMEG_5228 48h 0,754 0,008

M. smegmatisΔMSMEG_5228 72h 0,163 trazas

M. smegmatis::MSMEG_1604-ΔMSMEG_5228 1,737 0,007 0h M. smegmatis::MSMEG_1604-ΔMSMEG_5228 1,427 0,008 24h M. smegmatis::MSMEG_1604-ΔMSMEG_5228 1,312 0,011 48h

M. smegmatis::MSMEG_1604-ΔMSMEG_5228 0,172 trazas 72h

M. smegmatis mc2155 0h 1,774 0,007 M. smegmatis mc2155 24h 1,377 0,035

M. smegmatis mc2155 48h 1,051 0,095

M. smegmatis mc2155 72h 0,167 0,007

Tabla 13. Concentración de 4-colesten-3-ona hallada en los sobrenadantes de cultivo en colesterol de distintas cepas de M. smegmatis a distintos tiempos.

126 Resultados

Curiosamente, en las cepas M. smegmatisΔMSMEG_5228 y M. smegmatis::MSMEG_1604-ΔMSMEG_5228 se detectan niveles bastante superiores de hidroxicolesterol (26-hidroxicolesterol o 27-hidroxicolesterol) que en las cepas M. smegmatis::MSMEG_1604 y M. smegmatis mc2155 (Fig. 33). Estos resultados sugieren que la carencia del gen MSMSEG_5228 tiene como resultado la acumulación de este compuesto por la acción sobre el colesterol de la primera enzima de la degradación de la cadena lateral (Cyp125) y la posibilidad de que parte del catabolismo del colesterol se desvíe hacia una ruta alternativa.

Hidroxicolesterol

0,020000 0,018000 0,016000 M. smegmatis::MSMEG_1604 0,014000 0,012000 M. s megmat is ΔMSMEG_5228 0,010000 0,008000 M. smegmatis::MSMEG_1604- 0,006000 ΔMSMEG_5228 patrón interno 0,004000 M. s megmat is mc 2155 0,002000

Área del compuesto/área del 0,000000 0244872 Tiempo (h)

Figura 33. Perfil de hidroxicolesterol hallado en los sobrenadantes de cultivo en colesterol de distintas cepas de M. smegmatis. Las figuras representan la relación entre el área de hidroxicolesterol con respecto al área de la 5-pregnen-3-ol-20-ona, empleado como patrón interno, frente al tiempo.

2.8 Búsqueda de nuevas enzimas con actividad colesterol oxidasa/

deshidrogenasa: SDRMS

Los resultados de los ensayos enzimáticos realizados con ChoDMS y 3-β

HSDMS y los resultados de los experimentos realizados con los distintos mutantes de estos genes hacían pensar en la necesidad de la existencia de una o más proteínas adicionales capaces de catalizar la conversión de colesterol en 4- colesten-3-ona en M. smegmatis. Por lo tanto se realizó una nueva búsqueda de

127 Resultados posibles enzimas con actividad colesterol oxidasa o colesterol deshidrogenasa presentes en este microorganismo.

2.8.1 Análisis in silico de genes ortólogos a acmA

El primer paso en el catabolismo anóxico del colesterol en S. denitrificans está catalizado por la proteína AcmA (una colesterol deshidrogenasa/isomerasa) (Chiang et al., 2008b). Dado que el análisis mediante RT-PCR reveló que AcmA se expresa tanto si las células crecen aeróbica como anaeróbicamente en colesterol (Chiang et al., 2008b), lo que indica que puede ser activa también en aerobiosis, se decidió hacer un análisis comparativo de su secuencia frente a la base de datos de secuencias proteicas generales (Tabla 14) y frente al genoma de M. smegmatis mc2155, por si este microorganismo presentase algún gen ortólogo a acmA. En la comparación de AcmA frente a las bases de datos proteicas generales, aparece en cuarto lugar con mayor grado de similitud el producto del gen MSMEG_5233 (1080 pb) de M. smegmatis mc2155, anotado como un miembro de la superfamilia de dominio de unión a sustrato RmlD. RmlD es una proteína implicada en la síntesis del precursor de la L-ramnosa, monosacárido presente en la pared micobacteriana (Blankenfeldt et al., 2002). Las demás proteínas similares a AcmA que se detectan en las bases de datos generales son la mayoría pertenecientes a micobacterias, aunque también aparecen proteínas de otros actinomicetos como Rhodococcus, de algunos anaerobios como Dictyoglomus (Saiki et al., 1985) o Pelotomaculum (Imachi et al., 2002), y de algún patógeno como Brucella.

128 Resultados

Proteína / % ID con Proteína/ % ID con microorganismo AcmA microorganismo AcmA ClustalW ClustalW

Colesterol deshidrogenasa Proteína con dominio de unión a /isomerasa 39 sustrato RmlD 27 [Rhodococcus erythropolis [Mycobacterium avium 104] SK121] YP_881689 ZP_04385748 Epimerasa/deshidratasa Proteína con dominio de unión a NAD-dependiente 27 sustrato RmlD 29 [Dictyoglomus turgidum [Mycobacterium kansasii ATCC DSM 6724] 12478] YP_002352010 ZP_04749067

Proteína de la familia 3- Proteína hipotética MAP1751 beta hidroxiesteroide 27 [Mycobacterium avium subsp. 30 deshidrogenasa/isomerasa paratuberculosis K-10] [Dictyoglomus NP_960685 thermophilum H-6-12] YP_002251571

Proteína con dominio de Epimerasa/deshidratasa NAD- unión a sustrato RmlD 27 dependiente 27 [Mycobacterium [Mycobacterium sp. JLS] smegmatis mc2155] YP_001072039 YP_889479 Epimerasa/deshidratasa Epimerasa/deshidratasa NAD- NAD-dependiente 30 dependiente 27 [Mycobacterium [Mycobacterium sp. MCS] intracellulare ATCC 13950] YP_640922 ZP_05223429

Epimerasa/deshidratasa Epimerasa/deshidratasa NAD- NAD-dependiente 31 dependiente 23 [Mycobacterium [Brucella sp. 83/13] vanbaalenii PYR-1] ZP_05182429 YP_955010

Proteína con dominio de Epimerasa/deshidratasa NAD- unión a sustrato RmlD 29 dependiente 25 [Mycobacterium [Delftia acidovorans SPH-1] intracellulare ATCC 13950] YP_001563835 ZP_05225603 Epimerasa/deshidratasa Epimerasa/deshidratasa NAD- NAD-dependiente 26 dependiente 21 [Mycobacterium gilvum [Brucella canis ATCC 23365] PYR-GCK] YP_001594114 YP_001133690

Epimerasa nucleósido Epimerasa/deshidratasa NAD- difosfato-azúcar 30 dependiente 25 [Pelotomaculum [Burkholderia multivorans ATCC thermopropionicum SI] 17616] YP_001213184 YP_001583471 Proteína con dominio de Epimerasa/deshidratasa NAD- unión a sustrato RmlD 27 dependiente 23 [Mycobacterium avium [Brucella ceti M644/93/1] subsp. avium ATCC ZP_05173817 25291] ZP_05216670

129 Resultados

Tabla 14. Resultados de la comparación de AcmA de S. denitrificans frente a las bases de datos de secuencias proteicas utilizando el programa BLASTP. Se muestran las 20 proteínas más similares, el microorganismo al que pertenecen, su código de acceso y su similitud con AcmA indicada en porcentaje de identidad hallado con ClustalW. La proteína producto del gen MSMEG_5233 de M. smegmatis mc2155 se ha señalado en color azul.

El producto de MSMEG_5233 presenta un 27% de identidad (cuantificado por ClustalW) con AcmA. El siguiente gen del genoma de M. smegmatis con mayor similitud con AcmA es MSMEG_4184, cuyo producto codifica una dTDP-glucosa- 46-deshidratasa y tiene una identidad de secuencia del 25% con AcmA (cuantificado por ClustalW), aunque su longitud es de tan sólo 60 aminoácidos. AcmA presenta un 18 % de similitud (cuantificado por ClustalW) con la NAD(P)-CDH de Nocardia sp. descrita en el apartado 2.1.2; como esta, tanto AcmA como el producto de MSMEG_5233 (al que a partir de ahora nos referiremos como SDRMS) presentan un motivo Gly-X-Gly-(X)2-Gly-(X)10-Gly de unión a NAD (aunque en estas dos proteínas la glicina inicial está separada de la segunda no por uno, sino por dos aminoácidos) y la tétrada catalítica característica de proteínas de la superfamilia de las deshidrogenasas/reductasas de cadena corta (SDR) N-S-Y-K. También presentan un Asp alrededor de la posición 60 y una Ala alrededor de la posición 88, aunque carecen del motivo Pro-Gly alrededor de la posición 180 seguido de una Thr 188 también propio de las SDR (Fig. 34).

130 Resultados

MSMEG_5233 ------MSDAVLVTGAFGLVGSAVVATLAAQGRPVVATDVGTPANRKSATGLPPTVEV 52 AcmA ------MKTVLVTGACGAIGRRVVAGLVERGCAVSTLDFDTSANRAAARDRDARVRS 51 NAD_P_-CDH MGDASLTTDLGCVLVTGGSGFVGANLVTELLDRGYAVRSFDRAPSP-----LGDHAGLEV 55 *****. * :* :*: * :* .* : * ... . . :.

MSMEG_5233 RWADLTDAAAVDTLVADVAPAAIVHLAAIIPPF-----CYMRRELARKVNVDATESLLRA 107 AcmA HFGDLDDAAPLRAAVAGVA--HVIHLAELRPPD-----TDADQFAGYRANVCATRALLAA 104 NAD_P_-CDH IEGDICDKETVAAAVKDID--TVIHTAAIIDLMGGASVTEAYRQRSFAVNVEGTKNLVHA 113 .*: * .: : * .: ::* * : : . .** .*. *: *

MSMEG_5233 AEARATPPRFVLASSVAVYGTRNPHRITDMLTADTPVNPVDIYGAHKVEAENLVRASRLD 167 AcmA CADRVTPPRFVFASSVAVFGGQ-QTDAARRADAPAILAAADSYGRQKAAAEALVRASGLD 163 NAD_P_-CDH SQEAGVKRFVYTASNSVVMGGQDIVNGDETMPYTTRFN--DLYTETKVVAEKFVLAENGK 171 . . . **. .* * : : . * * *. ** :* *. .

MSMEG_5233 WLILRLGGVMSSTFSVDMDVELIS------LESVLPADGRLQTVDVRDVATAFAAATTV 220 AcmA HLILRLALTPDLAPDAGRPHPWLFGFHPDMRVEFLHPADAALALVNALD---AFGVLDSL 220 NAD_P_-CDH HDMLTCAIRPSGIWGRGDQTMFRK------VFENVLAGHVKVLVGNKNIKLDNSYVHNLI 225 :* . . . . .* : ... : : . :

MSMEG_5233 PVETANHEVLLIGGDPQTHRHTQARVGSEAAQAMGIRGGLPAGRPGNPDDDHAWFHTDWM 280 AcmA DGQAVRGRTLLLGGG-ARNRYRYLDWLNMALEARGLR-PLPRTAFGRAD-----YLTDWV 273 NAD_P_-CDH HGFILAGQDLVPGGTAPGQAYFINDGEPINMFEFARPVLAACGRPLPT------FYVSGR 279 . *: ** : : . . . : ..

MSMEG_5233 DTTRAQEVLTFQHHSWPQLLADTRANAGWKRYPLGLAAPLIRAFLRSKSAYKNYPGRYAD 340 AcmA DTDESEALLRYQRHDYPDWLREQVG-AVRPRWLDAGSAPLARRYLLAHSAHHAAASGQRP 332 NAD_P_-CDH LVHKVMMAWQWLHFKFALPEPLIEPLAVERLYLNNYFSIAKAKRDLGYEPLFTTEQAMAE 339 . . : :..:. * : : . ..

MSMEG_5233 VWNAVEKRWGNPRPDRSEA------359 AcmA RLLELRRAWTLARRGLAAARLYLS- 356 NAD_P_-CDH CMPYYVEMFHQMESAQKAPAAAVAR 364 . : . .

Figura 34. Alineamiento del producto del gen MSMEG_5233 (SDRMS), AcmA y la NAD(P)-CDH de Nocardia sp. y supuestos motivos consenso hallados en las secuencias. Los residuos marcados en amarillo estarían implicados en la unión de la coenzima mediante el mantenimiento de la estructura de la lámina β central; los residuos marcados en azul estarían implicados en interacciones con la coenzima y los residuos marcados en rojo formarían la tétrada catalítica.

La predicción de la estructura secundaria y la estructura tridimensional de

SDRMS se llevó a cabo, al igual que se hizo con ChoDMS y 3-β HSDMS, utilizando el programa LOOPP. En el caso de SDRMS se seleccionó como plantilla para la construcción del modelo la cadena A de la proteína WbmH de Bordetella bronchiseptica (PDB:2Q1W) (King et al., 2007) un miembro de la familia de las SDR. Su estructura se presenta con la proteína unida a la coenzima NAD. El programa pudo comparar el 83 % de WbmH con una identidad de secuencia de 22 %. Este modelo presenta un bajo nivel de confianza, pero permite visualizar la disposición conservada de los aminoácidos consenso (Figura 35).

131 Resultados

A B

Figura 35. Predicción de la estructura tridimensional de la proteína SDRMS tomando como modelo la SDR WbmH de Bordetella bronchiseptica (PDB:2Q1W, cadena A). A. Modelo propuesto para SDRMS. B. Estructura publicada de la cadena A de la proteína WbmH de B. bronchiseptica (King et al., 2007). Los aminoácidos marcados en amarillo son aquellos para los que se predice su implicación en la unión de la coenzima NAD. La Gly26 de SDRMS así como la Gly25 de WbmH no parecen implicadas en esta unión, ya que se sitúan alejadas del sitio de unión de NAD. Los residuos marcados en rojo formarían parte del centro activo. En azul se ha señalado el Asp60 relacionado con interacciones con la coenzima NAD. En verde se ha marcado la coenzima NAD en la proteína WbmH.

2.8.2 Análisis mediante RTq-PCR de la expresión diferencial en colesterol del gen MSMEG_5233

La expresión diferencial en colesterol de MSMEG_5233 fue analizada como en el caso de MSMEG_1604 y MSMEG_5228. Para ello se cultivó M. smegmatis mc2155 en colesterol 1,8 mM en β-ciclodextrina y en glicerol 18 mM en β- ciclodextrina, se extrajo el RNA de los cultivos en fase logarítmica (véase el apartado 7.1 de Materiales y Métodos) y se llevaron a cabo análisis mediante RTq- PCR (véanse los apartados 7.3 y 7.4 de Materiales y Métodos). Los resultados

132 Resultados indican que MSMEG_5233 presenta una ligera inducción en colesterol en los ensayos efectuados con 5 ng y 2 ng de cDNA total, pero no en los efectuados con 0,5 ng (Figura 36). Los valores de P del test t de Student fueron mayores de 0,05 en todos los casos (datos no mostrados), lo que implica que la inducción en colesterol no es estadísticamenete significativa a este nivel de confianza.

Expresión diferencial de MSMEG_5233 en colesterol 1.8 mM-glicerol 18 mM

4,500E-01 4,000E-01 3,500E-01 3,000E-01 2,500E-01 Colesterol 2,000E-01 Glicerol 1,500E-01 1,000E-01 5,000E-02 0,000E+00

Niveles de transcripción (ng de tránscrito) de (ng transcripción de Niveles 123

Figura 36. Expresión diferencial obtenida mediante RTq-PCR del gen MSMEG_5233 de M. smegmatis mc2155 cultivado en colesterol 1,8 mM comparado con M. smegmatis mc2155 cultivado en glicerol 18 mM. Los niveles de transcripción se midieron mediante RTq-PCR (véanse los apartados 7.3 y 7.4 de Materiales y Métodos). Las barras de error representan la desviación estándar calculada. Los valores de P del test t de Student no pareado fueron mayores de 0,05 en todos los casos, lo que implica que la diferencia de expresión no es estadísticamente significativa a este nivel de confianza (datos no mostrados). Las parejas de barras colesterol (azul)/glicerol (morado) se han señalado con los números 1, 2 o 3 que indican el nivel de transcripción obtenido a partir de distintas cantidades de cDNA: 1: 5 ng, 2: 2 ng y 3: 0,5 ng.

2.8.3 Clonación y expresión heteróloga del gen MSMEG_5233

Para estudiar el papel de la posible colesterol deshidrogenasa codificada por el gen MSMEG_5233, este se clonó e hiperexpresó en E. coli. Para ello, se amplificó por PCR y se subclonó en el vector de hiperexpresión pET-29a (+) (tal y como se hizo con los genes MSMEG_1604 y MSMEG_5228) resultando en el

133 Resultados plásmido pET5233 (Fig. 37). Este plásmido fue posteriormente transferido a la cepa E. coli BL21 (DE3).

NdeI BamHI ApR

MSMEG_5233

Ligación ® pGEM -T Easy (3,0 kb)

5233 pET F 5233 pET R ori

Polilinker

ApR KmR PT7

pGEM5233 pET-29a(+) lacI (4 kb) (5,4 kb) Digestión

ori ori Ligación

R Km

PT7 pET5233 (6,4 kb)

lacI

ori

Figura 37. Representación esquemática de la construcción del plásmido pET5233. El gen MSMEG_5233 fue amplificado mediante PCR utilizando la pareja de oligonucleótidos señalada en la figura (secuencias en Tabla 3 de Materiales y Métodos) y DNA genómico de M. smegmatis mc2155 como molde. El gen amplificado se clonó en el plásmido pGEM-T easy (dando lugar al plásmido pGEM5233) y fue subclonado en el vector pET-29a (+) empleando las enzimas de restricción señaladas en la figura (y que están presentes en los oligonucleótidos utilizados para la amplificación del gen), dando lugar al plásmido pET5233. Las abreviaturas utilizadas son: ApR, gen que confiere resistencia a ampicilina; KmR, gen que confiere resistencia a kanamicina; lacI, gen que codifica el represor LacI; PT7, promotor del gen 10 del fago T7; ori, origen de replicación.

134 Resultados

Los extractos de la cepa recombinante E. coli BL21 (DE3) (pET5233) fueron analizados mediante SDS-PAGE y aunque se probaron distintas condiciones de fermentación e inducción con IPTG, con ninguna de ellas se pudo obtener un extracto en el que fuese visible la proteína en forma soluble. La proteína aparecía siempre hiperproducida en forma insoluble. Como norma general para posteriores experimentos se utilizaron las mismas condiciones de inducción que para E. coli BL21(DE3) (pET1604) (Fig. 38).

KDa 1 2 3

116,0

97,4

66,0

45,0

31,0

21,5

14,4

Figura 38. Gel SDS-PAGE en el que se muestra la expresión de SDRMS en células E. coli BL21 (DE3). En este caso se cargaron como muestra células enteras, ya que no hay proteína visible en las fracciones celulares solubles expresando esta proteína con las condiciones utilizadas. 1. Marcadores de peso molecular (en el margen izquierdo de la figura se detallan los pesos moleculares de los marcadores). 2. Células enteras E. coli BL21(DE3) con plásmido pET29 sin inserto (control negativo de expresión) inducidas 3 h a 20 ºC con 50 μM IPTG. 3. Células enteras E. coli BL21(DE3) (pET5233) inducidas 3 h a 20 ºC con 50 μM IPTG. El peso molecular de SDRMS se ajusta al teórico calculado por el programa Compute pI/Mw del servidor Expasy (http://www.expasy.org/tools/pi_tool.html): 38,68 KDa. La posición aproximada de la proteína se indica con una flecha roja.

135 Resultados

2.8.4 Cinética enzimática de SDRMS mediante TLC con colesterol marcado con 14C

Como en el caso de ChoDMS y 3-β HSDMS la actividad enzimática de SDRMS se analizó mediante la técnica de TLC (véanse los apartados 5.4.1 y 9 de Materiales y Métodos). Se analizaron las muestras procedentes de extractos proteicos de E. coli BL21(DE3) (pET5233) incubados con colesterol marcado radiactivamente durante 2, 20, 40 y 60 min a 30 ºC. Los resultados indicaron que aparecía una marca radiactiva a la altura de la del patrón de 4-colesten-3-ona en las muestras que expresan SDRMS. Esta marca aumenta su intensidad con el tiempo de ensayo (Figura 39). En este caso no se aprecia una marca en la zona de la 6β-hidroperoxi-4-colesten-3-ona.

Estos resultados indican que la SDRMS posee, al igual que la 3-β HSDMS, una actividad colesterol deshidrogenasa productora de 4-colesten-3-ona a partir de colesterol, lo que confirma las sospechas de que existe más de una enzima capaz de catalizar esta reacción en M. smegmatis mc2155.

2 min ensayo 20 min 40 min 60 min

N

C H

1 2 3 1 2 3 1 2 3 1 2 3 Figura 39. Producción de productos a partir de colesterol marcado con 14C por extractos celulares solubles expresando la proteína SDRMS. La línea marcada con una C indica la altura a la que corre el colesterol, la marcada con una N la de la 4-colesten-3-ona y la marcada con una H la de un producto no identificado que podría tratarse de la 6β-hidroperoxi-4-colesten-3-ona. Las muestras se cargaron en las placas de TLC a diferentes tiempos de reacción que se indica en la vertical: 2, 20, 40 y 60 min. Las muestras cargadas proceden de ensayos realizados con: 1. Colesterol oxidasa comercial. 2. Extracto soluble de E. coli BL21 (DE3) (pET5233). 3. Extracto soluble de E. coli BL21 (DE3) (pET1604) (aquí actúa como control negativo de reacción).

136 Resultados

2.8.5 Ensayos mediante LC/MS de SDRMS

Estos ensayos se realizaron con muestras procedentes de ensayos enzimáticos con extractos de E. coli BL21 (DE3) (pET5233) para determinar la actividad colesterol deshidrogenasa a distintos tiempos de reacción hasta un máximo de 40 min (véanse los apartados 5.4.1 y 8 de Materiales y Métodos). Los ensayos enzimáticos se realizaron de la misma manera que para su análisis mediante TLC pero sin adición de colesterol radiactivo. La figura 40 muestra el espectro MS/MS de 4-colesten-3-ona obtenido por APCI+ para extractos de E. coli BL21 (DE3) (pET5233) a distintos tiempos. Como se puede observar, en todos ellos aparece un pico correspondiente a la 4-colesten-3-ona (concretamente el ión 367 procedente a su vez del ión 385 de la 4-colesten-3-ona). Estos resultados confirmarían los obtenidos mediante ensayos con colesterol radiactivo visualizados mediante TLC. Las concentraciones de 4-colesten-3-ona obtenidas en los ensayos a distintos tiempos con los extractos de E. coli BL21(DE3) (pET5233) fueron cuantificadas y se muestran en la figura 41.

137 Resultados

0.00 - 60.09 100 NL: 7.03E3 TIC F: ITMS + c 80 APCI corona Full lativa ms2 60 [email protected] ia r ia Colesterol [105.00-400.00] MS 40 33-2 4-colesten- bu 20 3-ona pET5233 2 min 0 100 NL: 5.66E3 TIC F: ITMS + c 80 APCI corona Full elativ

r a A ndanc e ms2 60 [email protected]

ncia [105.00-400.00] MS 40 33-22 nda r a A ndanc e Abu 20 pET5233 20 min 0 100 NL: 5.85E3 TIC F: ITMS + c 80 APCI corona Full ms2 60 [email protected] [105.00-400.00] MS 40 33-42

20 pET5233 40 min Abundancia relativa Abundancia 0 0 5 10 15 20 25 30 35 40 45 50 55 60 Tiempo (min) Figura 40. Espectro MS/MS de 4-colesten-3-ona obtenido por APCI + a partir de muestras procedentes de ensayos de actividad deshidrogenasa a distintos tiempos con extractos solubles de E. coli BL21(DE3) (pET5233). Se registradó el ión hijo m/z 367 del ión padre m/z 385 de la 4-colesten-3-ona. En la figura se señalan en el primer espectro los picos correspondientes al colesterol y a la 4-colesten-3-ona. Las muestras proceden de ensayos de actividad deshidrogenasa realizados durante 2, 20 y 40 min con extractos solubles de E. coli BL21(DE3) (pET5233). Se puede observar cómo la relación entre las áreas de los picos de colesterol y 4-colesten-3-ona varía con el tiempo.

MUESTRA Conc. colesterol Conc. 4-colesten-3- (µM) (en los 900 μl) ona (µM) (en los 900 μl)

E. coli BL21(DE3) (pET5233) 163,46 n.d. 2 min

E. coli BL21(DE3) (pET5233) 155,32 2,91 20 min E. coli BL21(DE3) (pET5233) 120,67 2,94 40 min

Figura 41. Concentración de colesterol y 4-colesten-3-ona hallada a distintos tiempos de ensayo hidroxiesteroide deshidrogenasa con los extractos proteicos de E. coli BL21(DE3) (pET5233).

138 Resultados

2.8.6 Mutagénesis del gen MSMEG_5233

El gen MSMEG_5233 fue mutado para comprobar si su ausencia afectaba a la capacidad de de transformación de colesterol en 4-colesten-3-ona de M. smegmatis, aunque habiendo comprobado la existencia de, por lo menos, otro gen que codifica una actividad colesterol deshidrogenasa (MSMEG_5228) no se esperaba una pérdida significativa de la capacidad de crecimiento en colesterol. La interrupción de MSMEG_5233 se llevó a cabo mediante el método ya descrito para MSMEG_1604 y MSMEG_5228, la inserción del plásmido no replicativo en micobacterias pJQ200x tal y como se detalla en el apartado 4.6 de Materiales y Métodos.

2.8.6.1 Ensayos de crecimiento con el mutante M. smegmatis::MSMEG_5233

El mutante en MSMEG_5233 se cultivó con colesterol 1,8 mM en β- ciclodextrina como única fuente de carbono. Como puede observarse en la figura 42, el crecimiento en colesterol no se ve alterado en el mutante M. smegmatis::MSMEG_5233.

139 Resultados

Crecimiento en colesterol 1,8 mM. M. smegmatis::MSMEG_5233

10

1

600 M. smegmatis mc²155 M. smegmatis::MSMEG_5233 DO 0,1

0,01 020406080 Tiempo (h)

Figura 42. Crecimiento en colesterol del mutante M. smegmatis::MSMEG_5233 frente a la cepa control M. smegmatis mc2155. Crecimiento en medio mínimo 457 con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono. M. smegmatis::MSMEG_5233 (línea naranja) representa al mutante M. smegmatis::MSMEG_5233 y M. smegmatis mc2155 (línea azul) representa a la cepa no mutada M. smegmatis mc2155.

2.8.6.2 Análisis de la composición del sobrenadante de cultivo en colesterol del mutante M. smegmatis::MSMEG_5233 mediante TLC

El sobrenadante de cultivos del mutante M. smegmatis::MSMEG_5233 en colesterol se analizó mediante TLC con el fin de comprobar si, a pesar de ser capaz de crecer en colesterol, se apreciaba alguna diferencia en el perfil de los intermediarios producidos durante su catabolismo. Las células se cultivaron durante 24 h en medio mínimo con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono y tras extraer el sobrenadante se visualizaron las muestras en placas de TLC (véanse los apartados 5.4.2 y 9 de Materiales y Métodos). Los resultados indican que este mutante tiene un perfil de intermediarios idéntico a la cepa salvaje a las 24 h (Fig. 43). Este hecho apoyaría la hipótesis de que la enzima 3-β HSDMS está más implicada que la enzima SDRMS en la degradación del colesterol para su aprovechamiento como fuente de carbono y energía, aunque también apunta hacia la posibilidad de que haya más proteínas implicadas en este paso enzimático en M. smegmatis.

140 Resultados

N

C

H

1 2 3

Figura 43. Producción de metabolitos a partir de colesterol radiactivo por muestras procedentes de sobrenadante de cultivo del mutante M. smegmatis::MSMEG_5233. La línea marcada con una C indica la altura a la que corre el colesterol, la marcada con una N la de la 4- colesten-3-ona y la marcada con una H la de un producto no identificado que podría tratarse de la 6β-hidroperoxi-4-colesten-3-ona. Las muestras cargadas derivan de sobrenadantes de cultivos de distintas cepas de M. smegmatis crecidas en colesterol 1,8 mM durante 24 h. 1. Control procedente de un ensayo con colesterol oxidasa comercial. 2. M. smegmatis mc2155. 3. M. smegmatis::MSMEG_5233.

2.8.6.3 Ensayos de sobrenadante de cultivo en colesterol del mutante M. smegmatis::MSMEG_5233 mediante LC/MS

Para analizar el perfil de intermediarios de la degradación del colesterol en M. smegmatis::MSMEG_5233, la cepa se creció en medio mínimo con colesterol en β-ciclodextrina como única fuente de carbono, y se fueron extrayendo alícuotas a distintos tiempos de incubación para su análisis mediante LC/MS (véanse los apartados 5.4.2 y 8 de Materiales y Métodos). La desaparición del esteroide no presenta diferencias entre el mutante y la cepa salvaje, así como tampoco hay diferencias en la aparición de 4-colesten-3-ona y de otros intermediarios de la ruta de degradación (26-hidroxi-4-colesten-3-ona, 26-hidroxi-1,4-colestadien-3-ona, ácido 4-colesten-3-ona-26-oico y ácido 1,4-colestadien-3-ona-26-oico; estructuras 5A, 5B, 6A y 6B de la figura 15 de introducción, respectivamente) (Fig. 44). Los resultados obtenidos mediante LC/MS coinciden con los observados mediante

141 Resultados

TLC, donde no se apreciaban diferencias en la concentración de colestenona entre la cepa M. smegmatis::MSMEG_5233 y M. smegmatis mc2155.

Colesterol 4-colesten-3-ona Colesterol 4-colesten-3-ona

0,04000 0,80000 0,03500 0,03000 0,60000 0,02500 M. s megmatis ::MSMEG_5233 0,40000 0,02000 M. smegmatis::MSMEG_5233 0,01500 M. smegmatis mc2155 0,20000 0,01000 M. smegmatis mc2155 patrón interno patrón patrón interno patrón 0,00500 0,00000 0,00000 0244872 Área del compuesto/área del Área del compuesto/área del 0244872 Tiempo (h) Tiempo (h)

A B

26-hidroxi-4-colesten-3-ona 26-hidroxi-1,4-colestadien-3-ona 26-hidroxi-4-colesten-3-ona 26-hidroxi-1,4-colestadien-3-ona 0,07000 0,00700 0,06000 0,00600 0,05000 0,00500 0,04000 0,00400 0,03000 M. smegmatis::MSMEG_5233 0,00300 M. smegmatis::MSMEG_5233 0,02000 0,00200 patrón interno patrón patrón interno patrón M. s megmat is mc 2155 M. s megmatis mc 2155 0,01000 0,00100 0,00000 0,00000 Área del compuesto/área del Área del compuesto/área del 0 244872 0 244872 Tiempo (h) Tiempo (h)

CD

Ácido 4-colesten-3-ona-26-oico Ácido 1,4-colestadien-3-ona-26-oico Ácido 4-colesten-3-ona-26-oico Ácido 1,4-colestadien-3-ona-26-oico 0,40000 0,00160 0,35000 0,00140 0,30000 0,00120 0,25000 0,00100 0,20000 0,00080 M. smegmatis::MSMEG_5233 M. smegmatis::MSMEG_5233 0,15000 0,00060 0,10000 0,00040 interno patrón M. smegmatis mc2155 interno patrón M. smegmatis mc2155 0,05000 0,00020 0,00000 0,00000 del compuesto/área del Área 0 244872 del compuesto/área del Área 0 244872 Tiempo (h) Tiempo (h)

EF

Figura 44. Perfil de intermediarios de la degradación del colesterol hallado en los sobrenadantes de cultivo en colesterol de M. smegmatis::MSMEG_5233 y M. smegmatis mc2155. Las figuras representan la relación entre las áreas de los compuestos indicados en la leyenda con respecto al área de la 5-pregnen-3-ol-20-ona, empleado como patrón interno, frente al tiempo. A. Colesterol; B. 4-colesten-3-ona; C. 26-hidroxi-4-colesten-3-ona; D. 26-hidroxi-1,4- colestadien-3-ona; E. Ácido 4-colesten-3-ona-26-oico; F. Ácido 1,4-colestadien-3-ona-26-oico.

142 Resultados

La concentración de colestenona cuantificada en cada punto se muestra en la tabla 15.

Muestra Conc. colesterol Conc. 4-colesten-3 (mM) ona (mM)

M. smegmatis::MSMEG_5233 0h 1,747 n.d.

M. smegmatis::MSMEG_5233 24h 1,426 0,027

M. smegmatis::MSMEG_5233 48h 1,200 0,092 M. smegmatis::MSMEG_5233 72h 0,171 0,008

M. smegmatis mc2155 0h 1,774 0,007 M. smegmatis mc2155 24h 1,377 0,035

M. smegmatis mc2155 48h 1,051 0,095

M. smegmatis mc2155 72h 0,167 0,007

Tabla 15. Concentración de colestenona hallada en los sobrenadantes de cultivo en colesterol de M. smegmatis::MSMEG_5233 y M. smegmatis mc2155 a distintos tiempos.

En el caso de la aparición de hidroxicolesterol, tampoco se aprecian diferencias significativas entre la cepa M. smegmatis::MSMEG_5233 y M. smegmatis mc2155 (Fig. 45). En conjunto todos estos resultados obtenidos mediante LC/MS parecen apuntar a que aunque SDRMS sí transforma el colesterol en 4-colesten-3-ona, no ejerce un papel principal en este paso, y esto sugiere nuevamente la posible existencia de más enzimas con esta misma actividad y/o enzimas que permiten que parte de la degradación de colesterol se efectúe a través de hidroxicolesterol cuando la enzima 3-β HSDMS no es funcional en M. smegmatis mc2155.

143 Resultados

Hidroxicolesterol

0,004500 0,004000 0,003500 0,003000 0,002500 0,002000 0,001500 M. smegmatis::MSMEG_5233 patrón interno patrón 0,001000 M. smegmatis mc2155 0,000500

Área del compuesto/área del 0,000000 0244872 Tiempo (h)

Figura 45. Perfil de hidroxicolesterol hallado en los sobrenadantes de cultivo en colesterol de M. smegmatis::MSMEG_5233 y M. smegmatis mc2155. Las figuras representan la relación entre el área de hidroxicolesterol con respecto al área de la 5-pregnen-3-ol-20-ona, empleado como patrón interno, frente al tiempo.

3. Análisis genómico mediante microarrays de la ruta de degradación del colesterol

Para tener una visión global de las zonas del genoma de M. smegmatis mc2155 implicadas en el catabolismo del colesterol, se realizaron estudios de expresión diferencial de la cepa cultivada en colesterol 1,8 mM frente a glicerol 18 mM utilizando la técnica de los microarrays y RTq-PCR. (véanse los apartados 7.3, 7.4 y 7.5 de Materiales y Métodos). Como se detalla más adelante, los resultados obtenidos apoyan el papel de los reguladores KstR y KstR2 como represores de esta ruta de degradación y ponen de manifiesto las similitudes existentes para esta ruta entre las especies de Rhodococcus y Mycobacterium. Así mismo, se han identificado nuevos genes cuya posible implicación en el catabolismo del colesterol no había sido constatada en ningún microorganismo hasta el momento.

144 Resultados

3.1 Resultados de los análisis mediante microarrays del genoma de M. smegmatis mc2155

El análisis de los microarrays reveló que 89 genes se inducían durante su crecimiento en colesterol al menos 3 veces comparado con el crecimiento en glicerol. Estos genes inducidos se encuentran repartidos a lo largo de todo el genoma de M. smegmatis (alojado en el servidor CMR: http://cmr.jcvi.org/tigr- scripts/CMR/GenomePage.cgi?org=gms) y parecen reflejar una adaptación fisiológica general de la bacteria al crecimiento en este compuesto policíclico altamente hidrofóbico. Sin embargo, muchos de ellos se encuentran dentro de dos regiones localizadas en el genoma (agrupaciones génicas o clusters). Otro grupo de genes inducidos se encuentra a lo largo de todo el genoma, algunos formando unidades transcripcionales sencillas y otros dentro de operones. Para facilitar la presentación del elevado número de genes hallados, se dividirán en cinco grupos: - Cluster 1: Abarca la región MSMEG_5990-MSMEG_6042. Comprende genes que se encuentran bajo el control del represor KstR o KstR2 (Tabla 16 y Figura 46). - Cluster 2: Abarca la región MSMEG_5903-MSMEG_5943. Comprende genes que se encuentran bajo el control del represor KstR (Tabla 17 y Figura 47). - Genes no incluidos en el cluster 1 o 2 y que se encuentran bajo el control del represor KstR (Tabla 18). - Genes inducidos en colesterol que no presentan motivos de unión para KstR o KstR2 en su región 5’ (Tabla 19). - Genes bajo el control de KstR que no se encuentran inducidos en colesterol en nuestros experimentos (Tabla 20).

145 Resultados

Cluster 1 (Tabla 16 y Figura 46)

Este cluster abarca 42 kb del cromosoma (MSMEG_5990-MSMEG_6042). Del total de genes incluidos en esta región, 33 están regulados por KstR o KstR2 como ha sido identificado previamente (Kendall et al., 2007) y en este trabajo, como se verá más adelante (Kendall et al., 2010) (Tabla 16). Estos genes se encuentran organizados en 8 posibles operones más algunas unidades transcripcionales sencillas. Los ensayos mediante microarrays revelaron que 21 de los genes presentan inducción con colesterol (Tabla 16 y Figura 46). Dos de los genes de este cluster codifican reguladores tipo TetR y han sido ya descritos, se trata de MSMEG_6042 y MSMEG_6009. El producto del gen MSMEG_6042 ha sido identificado como el represor KstR, que controla la expresión de 83 genes relacionados con el metabolismo del colesterol (Kendall et al., 2007). El producto del gen MSMEG_6009 ha sido identificado como el represor KstR2, que controla la expresión de 15 genes adicionales también implicados en esta ruta degradativa (Kendall et al., 2010). El primer supuesto operón que aparece en esta región está compuesto por los genes MSMEG_5995_5994_5993_5992_5991_5990, y muestra una similitud elevada con el operón igr de M. tuberculosis, el que se ha comprobado recientemente que es necesario para la utilización del colesterol como fuente de carbono en esta bacteria, aunque se desconoce su implicación exacta en esta ruta de degradación (Miner et al., 2009). Estos dos operones micobacterianos son muy similares a su vez al operón de función desconocida ro04483-04484-04485-04486- 04487-04488 de Rhodococcus jostii RHA1, que también se induce en presencia de colesterol (van der Geize et al., 2007). Aunque el gen ro4483 (fadE34) no aparece en el operón de M. smegmatis, tiene una elevada identidad con el gen MSMEG_6041 localizado lejos de este operón pero en esta misma región denominada cluster 1. Aunque la inducción de este gen no se detecta mediante microarrays, sí fue confirmada mediante RTq-PCR (apartado 3.2 de Resultados). Curiosamente, ambos genes fadE34 de M. smegmatis y Rhodococcus se localizan contiguos pero en sentido opuesto al regulador KstR, lo que sugiere una

146 Resultados ordenación genética original común a ambas especies. En M. tuberculosis, el gen Rv3573c, ortólogo de MSMEG_6041, se encuentra en una posición en el genoma equivalente a la del gen de M. smegmatis (Figura 48). El gen MSMEG_5990 codifica una supuesta cetoacil-CoA tiolasa (Lpt2). Los genes MSMEG_5993 (fadE29) y MSMEG_5994 (fadE28) codifican dos supuestas acil-CoA deshidrogenasas, mientras que el gen MSMEG_5991 codifica una proteína similar a MaoC, una enzima que puede actuar como una enoil-CoA hidratasa frente al crotonil-CoA (Park y Lee, 2003). Es interesante apuntar que MaoC es homóloga a la enoil-CoA hidratasa PhaJ1 de Pseudomonas aeruginosa (Tsuge et al., 2000). El gen MSMEG_5992 también codifica una proteína que contiene en su extremo N- terminal el típico plegamiento denominado hot-dog que se encuentra en las enoil- CoA hidratasas que muestran especificidad por el enántiomero (R). En Pseudomonas se ha visto que estas hidratasas que muestran especificidad por el enántiomero (R) son enzimas que interconectan la β-oxidación con la biosíntesis de polihidroxialcanoato. Además, este operón de M. smegmatis presenta el gen MSMEG_5995, que codifica un citocromo P450 (Cyp125) que también se induce en colesterol. Como se verá en el apartado 4.3, la mutación de este citocromo impide el crecimiento en este esteroide, lo que sugiere que este operón puede estar implicado en la oxidación de la cadena lateral. Curiosamente, en R. jostii RHA1 el ortólogo de MSMEG_5995 (r04679) aparece alejado de este operón. Como ya se ha comentado anteriormente, el gen ortólogo a MSMEG_5995 en M. tuberculosis, Rv3545c, codifica un citocromo implicado en patogénesis (Chang et al., 2009), y ha sido recientemente propuesto como una hidroxilasa del C27 esteroideo (Capyk et al., 2009b). Por otra parte, la enzima ortóloga en R. jostii RHA1 parece ser la responsable de iniciar el catabolismo del colesterol en esta especie, también iniciando la degradación de la cadena lateral (Rosłoniec et al., 2009). Contiguo pero en sentido opuesto al gen MSMEG_5995 se encuentra otro posible operón formado por los genes MSMEG_5996_5997_5998. El gen MSMEG_5996 codifica una supuesta acetil-CoA acetiltransferasa (tiolasa, FadA5), y los otros dos genes codifican dos proteínas hipotéticas, una de ellas similar a la

147 Resultados orf33 de C. testosteroni (MSMEG_5997). Hay que destacar que este gen MSMEG_5997 no presenta ortólogos ni en M. tuberculosis ni en R. jostii RHA1. Este nuevo operón también podría estar implicado en la degradación de la cadena lateral del colesterol, ya que como se ha explicado en el apartado 1.3 de Resultados hemos constatado la expresión diferencial en colesterol de este operón mediante RT-PCR semicuantitativa. Cabe mencionar que la cadena lateral del colesterol muy probablemente se transforma en un 2-metil ácido graso ramificado (BFA) y por tanto, el primer paso de la β-oxidación requeriría enzimas adicionales y específicas para oxidar este BFA. Otro supuesto operón que se ha identificado en este cluster 1 es el formado por los genes MSMEG_6001_6002_6003_6004, que son muy similares a las orfs5-1-2-4 de C. testosteroni, respectivamente. La expresión diferencial de los genes MSMEG_6001 a MSMEG_6003 se había comprobado anteriormente mediante RT-PCR semicuantitativa (apartado 1.3 de Resultados). Este operón está próximo a los genes MSMEG_5999 (que podría formar un operón con MSMEG_6000) y MSMEG_6008, que son muy similares a las orf27 y orf23 de C. testosteroni, respectivamente (Horinouchi et al., 2004b) y de los que también se había visto inducción en colesterol mediante RT-PCR semicuantitativa (apartado 1.3 de Resultados). Como ya se ha comentado anteriormente, el gen MSMEG_6009 codifica el represor KstR2 (Kendall et al., 2010), lo que sugiere claramente la implicación de esta región en el catabolismo del colesterol. Concretamente se encuentran bajo el control de KstR2 los genes de la región MSMEG_5999-MSMEG_6017, con la excepción de los genes MSMEG_6005, MSMEG_6006, MSMEG_6007 y MSMEG_6010 (véase con más detalle en el apartado 5.3 de Resultados). Aunque se ha propuesto la implicación de todos estos genes en la mineralización completa del DOHNAA (Figura 5 de Introducción, estructura 15) sus funciones exactas son todavía desconocidas. Los cuatro primeros genes del supuesto operón MSMEG_6013_6014_6015_6016_6017 son ortólogos a las orfs18-21-22-28 de C. testosteroni, respectivamente. La orf18 codifica una supuesta CoA ligasa de ácidos grasos que parece participar en la degradación del

148 Resultados

DOHNAA en C. testosteroni, mientras que las orfs21-22-28 codifican tres supuestas acil-CoA deshidrogenasas (Horinouchi et al., 2004b). Mediante RT-PCR semicuantitativa se observó que estos genes no se inducían en M. smegmatis en presencia de colesterol, sin embargo mediante microarrays se ven inducidos los genes MSMEG_6013, MSMEG_6015 y MSMEG_6016 de este operón. Un operón muy similar a este también se detectó en R. jostii RHA1: fadD3- ro4594-fadE31-fadE32-fadE33 (van der Geize et al, 2007). Curiosamente, el supuesto operón contiguo MSMEG_6012_6011 que está localizado en sentido opuesto es también muy similar al operón conservado en la misma posición en R. jostii RHA1 (fadE30-ro04597). Ambos operones contienen genes ortólogos a las orfs30-31 de C. testosteroni que codifican una supuesta FadE30 acil-CoA deshidrogenasa y una oxidorreductasa, respectivamente, también supuestamente implicadas en la degradación de DOHNAA (Horinouchi et al., 2004). Los genes que conforman este posible operón no aparecen inducidos en los microarrays, aunque sí se ha comprobado su inducción en colesterol mediante RT-PCR semicuantitativa (apartado 1.3 de Resultados) y RTq-PCR (apartado 3.2 de Resultados). Aunque se han descrito varios compuestos como posibles intermediarios de la mineralización de DOHNAA, la información disponible no permite establecer una ruta catabólica precisa (Kieslich, 1985). Sin embargo, se asume que el primer paso en la degradación de este compuesto podría ser la eliminación de su fracción propionil para producir ácido 9,17-dioxo-1,2,3,4,5,6,10,19-octanorandrostan-7-oico (Figura 5 introducción, (17)) a través de una β-oxidación típica (Kieslich, 1985). El gen MSMEG_6013, que codifica una supuesta acil-CoA ligasa podría representar el primer gen de esta ruta. Por otra parte, en este cluster 1 se encuentra un supuesto operón catabólico muy similar al operón hsaADCB de R. jostii RHA1 (van der Geize et al., 2007) (MSMEG_6038_6037_6036_6035) que codifica cuatro proteínas que comparten una similitud significativa (33, 34, 42 y 31 % cuantificados por ClustalW), con las enzimas codificadas por los genes tesA2, tesD, tesB y tesA1, respectivamente, de C. testosteroni TA441, que transforman el compuesto 3-HSA en DOHNAA y ácido 2-hidroxihexa-2,4-dienoico (Figura 5 de Introducción, estructuras 11-15) durante el

149 Resultados crecimiento en testosterona (Horinouchi et al., 2001; Horinouchi et al., 2003a; Horinouchi et al., 2004a). Se confirman así los resultados obtenidos mediante análisis in silico del genoma de M. smegmatis frente a estos genes de C. testosteroni así como los análisis mediante RT-PCR semicuantitativa que se presentaron en el apartado 1.3 de Resultados en los que estos genes presentaban inducción en colesterol. Este operón es contiguo, pero en dirección opuesta, al gen MSMEG_6039, probable ortólogo del gen kshB, implicado en la transformación de ADD en 3-HSA (Figura 5 de introducción, estructuras 9B y 11) junto con el gen kshA en R. erythropolis (van der Geize et al., 2001; van der Geize et al., 2002b; van der Geize et al., 2008) y en M. tuberculosis (Capyk et al., 2009a). El ortólogo de kshA en M. smegmatis es el gen MSMEG_5925, que codifica la proteína KstH (Andor et al., 2006) y que está localizado lejano a kshB, en el cluster 2.

150 Resultados

1 2 3 4 5 6 7 MSMEG_5990 25.48* KstR1 Rv3540c 84 Proteína de transferencia de lípidos (ltp2) ro04488 MSMEG_5991 23.15* KstR1 Rv3541c 76 Supuesto dominio MaoC ro04487 MSMEG_5992 22.46* KstR1 Rv3542c 74 Proteína hipotética conservada ro04486 MSMEG_5993 49.89* KstR1 Rv3543c 77 Supuesta acil-CoA deshidrogenasa (fadE29) ro04485

MSMEG_5994 73.05* KstR1 Rv3544c 73 Supuesta acil-CoA deshidrogenasa (fadE28) ro04484 MSMEG_5995 66.03* KstR1 Rv3545c 75 Citocromo P450 125 (cyp125) ro04679 MSMEG_5996 10.31 KstR1 Rv3546 84 Acetil-CoA acetiltransferasa (fadA5) ro04678

MSMEG_5997 8.07 KstR1 _ _ Proteína hipotética conservada _ MSMEG_5998 17.92* KstR1 Rv3547 49 Proteína hipotética conservada ro04677 MSMEG_5999 5.93 KstR2 Rv3548c 83 Deshidrogenasa de cadena corta ro04654

MSMEG_6000 17.51* KstR2 Rv3549c 73 Deshidrogenasa de cadena corta ro04653 MSMEG_6001 5.76 KstR2 Rv3550 86 Enoil-CoA hidratasa (echA20) ro04652 MSMEG_6002 8.41 KstR2 Rv3551 81 Coenzima A transferasa, subunidad A ro04651

MSMEG_6003 3.32 KstR2 Rv3552 81 Coenzima A transferasa, subunidad B ro04650 MSMEG_6004 _ KstR2 Rv3553 82 Oxidorreductasa, familia 2-nitropropano dioxigenasas ro04649 MSMEG_6008 _ KstR2 Rv3556c 80 Acetil-CoA acetiltransferasa (fadA6) ro04599

MSMEG_6009 3.29 KstR2 Rv3557c 73 Regulador transcripcional de la familia TetR (kstR2) ro04598 MSMEG_6011 _ KstR2 Rv3559c 84 Deshidrogenasa de cadena corta ro04597 MSMEG_6012 _ KstR2 Rv3560c 84 Supuesta acil-CoA deshidrogenasa (fadE30) ro04596

MSMEG_6013 8.72 KstR2 Rv3561 74 Probable CoA sintetasa de ácidos grasos(fadD3) ro04595 MSMEG_6014 _ KstR2 Rv3562 84 Supuesta acil-CoA deshidrogenasa (fadE31) ro04593 MSMEG_6015 8.61 KstR2 Rv3563 75 Supuesta acil-CoA deshidrogenasa (fadE32) ro04592

MSMEG_6016 8.98 KstR2 Rv3564 68 Supuesta acil-CoA deshidrogenasa ro04591 MSMEG_6017 _ KstR2 Rv3565 80 Aminotransferasa, clase I _ MSMEG_6033 _ KstR1 _ _ Proteína hipotética _

MSMEG_6035 4.14 KstR1 Rv3567c 79 Nitrilotriacetato monooxigenasa, componente B (hsaB) ro04542 MSMEG_6036 8.33 KstR1 Rv3568c 81 Bifenil-2,3-diol 1,2-dioxigenasa (hsaC) ro04541 MSMEG_6037 31.54* KstR1 Rv3569c 81 Hidrolasa del ácido 2-hidroxi-6-cetonona-2,4-dienodioico (hsaD) ro04540

MSMEG_6038 47.73* KstR1 Rv3570c 81 Hidroxilasa de producción de pigmento (hsaA) ro04539 MSMEG_6039 _ KstR1 Rv3571 73 Cetoesteroide 9α-hidroxilasa, reductasa (kshB) ro05833 MSMEG_6040 _ KstR1 Rv3572 30 Proteína hipotética conservada _

MSMEG_6041 _ KstR1 Rv3573c 73 Supuesta acil-CoA deshidrogenasa (fadE34) ro04483

MSMEG_6042 21.99* KstR1 Rv3574 89 Regulador transcripcional de la familia TetR (kstR1) ro04482

Tabla 16. Genes inducidos en colesterol en M. smegmatis mc2155 (Cluster 1). Columna 1. Anotación de los genes de M. smegmatis mc2155 que presentan inducción en colesterol. Se seleccionaron aquellos como mínimo más de 3 veces inducidos y con un valor máximo de P de 0,1, tras un análisis visual previo de las imágenes escaneadas de los microarrays. Columna 2. Se muestra el número de veces que cada gen está inducido. Los valores marcados con un asterisco tienen un valor de P ajustado (FDR) <0,05. Se marcan con una línea aquellos casos en los que los valores de inducción no se ajustaban a los parámetros seleccionados y por tanto fueron descartados. Columna 3. Regulón al que pertenece cada gen (KstR o KstR2). Columna 4. Genes similares en M. tuberculosis H37Rv. Columna 5. Porcentaje de identidad (ClustalW) entre los genes de M. smegmatis y M. tuberculosis. Columna 6. Descripción de los productos de los genes.

151 Resultados

Entre paréntesis se indica, de tener uno asignado, el nombre del gen. Columna 7. Genes similares en R. jostii RHA1 que también presentan inducción en colesterol (van der Geize et al, 2007).

6056

5990 5991 5992 5993 5994 5995 5996 5997 5998 5999 6000 6001 6002 6003 6004 6005 6006 6007 6008 6009 (4) (19) (4) (1) [18] [124] [2] [7] [77] [15] [61] (4) (4) (4) [43] (4) [7] [88] (8) [314]

6102 6082 6110 6010 6011 6012 6013 6014 6015 6016 6017 6033 6034 6035 6036 6037 6038 6039 6040 6041 6042 [125] (4) [105] (1) (4) (4) [17] (133) [142] [7] (0) [2] [159] [42] [80] [263]

Figura 46. Representación esquemática de la disposición en el genoma de los genes de M. smegmatis mc2155 incluidos en el cluster 1. Se señalan con una estrella aquellos genes que presentan inducción en colesterol en los microarrays. Los números que se muestran por debajo de los genes señalan el número de pb entre genes adyacentes. Los números entre corchetes indican separación y los números entre paréntesis solapamiento. Los números que aparecen sobre las líneas en diagonal indican las posiciones del genoma, en kb, entre las que se encuentran las distintas agrupaciones génicas.

Cluster 2 (Tabla 17 y figura 47)

El segundo cluster de genes inducidos en colesterol comprende una zona de 50 kb en el cromosoma de M. smegmatis mc2155 (MSMEG_5903-MSMEG_5943). Del total de genes incluidos en esta región, 24 están regulados por KstR (Tabla 17) y aparecen organizados en 8 posibles operones. De ellos, 16 genes presentan inducción en colesterol en nuestros ensayos de expresión con los microarrays (Tabla 17 y Figura 47). El primer supuesto operón incluido en este cluster comprende los genes MSMEG_5904_5903, y ambos presentan inducción en colesterol. El gen hsd4A, ortólogo a MSMEG_5903 en R. jostii RHA1, junto con otros cuatro genes, hsd4B, fadD19, fadE26 y ltp3, que también están inducidos por colesterol, y que se corresponden con los genes MSMEG_5943, MSMEG_5914, MSMEG_5906 y MSMEG_5923 de M. smegmatis también presentes en este cluster e inducidos por

152 Resultados colesterol, parece que podría llevar a cabo un ciclo completo de β- oxidación, ya que codifican todas las enzimas necesarias para realizar este proceso (van der Geize et al., 2007). Por tanto, estos genes podrían estar implicados en la degradación de la cadena lateral del colesterol. Además, Hsd4A es homóloga al dominio N-terminal de la 17β-hidroxiesteroide deshidrogenasa IV de eucariotas (17βHSD4) (Mindnich et al., 2004). Este dominio actúa como una 17β- hidroxiesteroide deshidrogenasa y, en presencia de ácidos grasos ramificados y ácidos biliares, como una D-3-hidroxiacil-CoA deshidrogenasa. Hsd4B es homóloga al dominio central de esta 17βHSD4, que es una 2-enoil acil-CoA hidratasa de la que se ha propuesto que puede estar implicada en el acortamiento de la cadena lateral del colesterol. Estas homologías apoyarían la implicación de Hsd4A y Hsd4B en la transformación a través de un ciclo de β-oxidación de la cadena lateral del C17 para dar lugar a propionil-CoA y acetil-CoA (van der Geize et al., 2007). También en Rhodococcus se ha identificado otro grupo de genes, echA19, fadD17, fadE27 y ltp4, relacionados con la β-oxidación (van der Geize et al., 2007) cuyos ortólogos en M. smegmatis se sitúan así mismo en este cluster 2. Estos genes de Rhodococcus presentan una menor inducción por colesterol que los anteriormente señalados. Los genes ortólogos en M. smegmatis son MSMEG_5915, MSMEG_5908, MSMEG_5907 y MSMEG_5922, respectivamente. Todos ellos se encuentran inducidos por colesterol o dentro de un operón que presenta inducción por colesterol según los datos obtenidos mediante microarrays (Fig. 47). Dentro de este cluster 2 de M. smegmatis encontramos así mismo el gen MSMEG_5925, ortólogo del gen kshA de R. erythropolis y que en M. smegmatis codifica la proteína KstH (Andor et al., 2006). KstH está implicada en la hidroxilación del ADD que conlleva, tras la apertura espontánea del anillo A, a su transformación en 3-HSA (Figura 5 de introducción, estructuras 9B, 10B y 11). Como se ha comentado anteriormente, la proteína KshA de Rhodococcus y M. tuberculosis actúa junto con la proteína KshB (cuyo ortólogo en M. smegmatis es el gen MSMEG_6039) para llevar a cabo esta transformación (Capyk et al., 2009a; van der Geize et al., 2001; van der Geize et al., 2002b). Hasta la fecha se

153 Resultados desconoce si en M. smegmatis sucede lo mismo. El gen MSMEG_5925 se organiza dentro de un posible operón MSMEG_5925_5927, lo que sugiere la participación del gen MSMEG_5927, que codifica una proteína hipotética, en esta ruta catabólica. Finalmente, en este cluster 2 se encuentra también el posible operón hsaEGF (MSMEG_5940_5939_5937) que codifica proteínas que comparten una alta similitud de secuencia de aminoácidos (39, 55 y 46 % cuantificados por ClustalW, respectivamente) con las enzimas codificadas por los genes tesEFG de C. testosteroni, que transforman el ácido 2-hidroxi-2,4-hexadienoico (Figura 5 de introducción, estructura 14) en propionil-CoA y piruvato durante la degradación de la testosterona (Horinouchi et al, 2003). La inducción de este operón de M. smegmatis en presencia de colesterol ya se había observado mediante ensayos de RT-PCR semicuantitativa (véase el apartado 1.3 de resultados). Este operón es contiguo, pero su transcripción es opuesta, a la del gen kstD (MSMEG_5941) cuyo producto transforma el AD en ADD (Figura 5 de introducción, estructuras 9A y 9B) (Brzostek et al, 2005). Es interesante apuntar que los operones hsaEGF y hsaADCB (comentados en el apartado anterior) se disponen en posiciones adyacentes en R. jostii RHA1 y C. testosteroni (excepto el gen tesB, que en en este microorganismo parece hallarse aislado del resto), pero se encuentran considerablemente alejados en M. smegmatis y M. tuberculosis.

154 Resultados

1 2 3 4 5 6 Proteína de la familia deshidrogenasas/reductasas de MSMEG_5903 3.33 Rv3502c 72 cadena corta (hsd4A) ro04695 MSMEG_5904 7.34 Rv3503c 80 Ferredoxina (fdxD) ro04694 MSMEG_5906 9.59 Rv3504 84 Supuesta acil-CoA deshidrogenasa (fadE26) ro04693

MSMEG_5907 10.74 Rv3505 74 Acil-CoA deshidrogenasa (fadE27) ro04692

MSMEG_5908 _ Rv3506 65 Acil-CoA sintasa (fadD17) ro04691 MSMEG_5909 _ _ _ Oxidorreductasa _ MSMEG_5911 _ Regulador transcripcional similar a AraC _

MSMEG_5913 3.55 _ _ Dioxigenasa _ MSMEG_5914 7.19 Rv3515c 83 Acil-CoA sintasa (fadD19) ro04689 MSMEG_5915 13.74 Rv3516 82 Enoil-CoA hidratasa (echA19) ro04688 MSMEG_5918 _ Rv3518c 78 Citocromo P450 monooxigenasa (cyp142) ro04588

MSMEG_5919 _ Rv3519 66 Monooxigenasa ro04586 MSMEG_5920 _ Rv3520c 85 Monooxigenasa FMN-dependiente ro04686 MSMEG_5921 12.05* Rv3521 76 Proteína hipotética conservada ro04685

MSMEG_5922 27.42* Rv3522 80 3-ceto-acil-CoA tioloasa (ltp4) ro04684 MSMEG_5923 32.15* Rv3523 87 3-ceto-acil-CoA tioloasa (ltp3) ro04683 MSMEG_5925 6.91 Rv3526 79 Cetoesteroide-9α-hidroxilasa (kstH, kshA) ro04538 MSMEG_5927 4.71 Rv3527 62 Proteína hipotética conservada ro04537

MSMEG_5932 _ Rv3531c 80 conserved hypothetical protein _ MSMEG_5937 7.23 Rv3534c 89 4-hidroxi-2-oxovalerato aldolasa (hsaF) ro04535 MSMEG_5939 13.30* Rv3535c 83 Acetaldehido deshidrogenasa (hsaG) ro04534 MSMEG_5940 _ Rv3536c 78 2-ceto-4-pentenoato hidratasa (hsaE) ro04533

MSMEG_5941 13.00* Rv3537 82 3-cetoesteroide deshidrogenasa (kstD) ro04532 MSMEG_5943 9.09 Rv3538 73 Supuesta enzima peroxisomal multifuncional tipo 2 (hsd4B) ro04531

Tabla 17. Cluster 2 de genes inducidos en colesterol en M. smegmatis mc2155. Columna 1. Anotación de los genes de M. smegmatis mc2155 que presentan inducción en colesterol. Se seleccionaron aquellos como mínimo más de 3 veces inducidos y con un valor máximo de P de 0,1, tras un análisis visual previo de las imágenes escaneadas de los microarrays. Columna 2. Se muestra el número de veces que cada gen está inducido. Los valores marcados con un asterisco tienen un valor de P ajustado (FDR) <0,05. Se marcan con una línea aquellos casos en los que los valores de inducción no se ajustaban a los parámetros seleccionados y por tanto fueron descartados. Columna 3. Genes similares en M. tuberculosis H37Rv. Columna 4. Porcentaje de identidad (ClustalW) entre los genes de M. smegmatis y M. tuberculosis. Columna 5. Descripción de los productos de los genes. Entre paréntesis se indica, de tener uno asignado, el nombre del gen. Columna 6. Genes similares en R. jostii RHA1 que también presentan inducción en colesterol (van der Geize et al., 2007).

155 Resultados

5963

5903 5904 5905 5906 5907 5908 5909 59115910 5912 5913 5914 5915 5916 5917 5918 5919 5920 [42] [133] (65) [19] [2] (4) (46) (64) [127] [3] [10] [68] [54] [275] [71] (4) [43] [159]

5989 5995 6003

5921 5922 5923 5924 5925 5927 5926 5928 5936 59385937 5939 5940 5941 5943 [39] (1) [158] [104] (1) (4) [35] [86] (4) [38] [73] [1]

Figura 47. Representación esquemática de la disposición en el genoma de los genes de M. smegmatis mc2155 incluidos en el cluster 2. Se señalan con una estrella aquellos genes que presentan inducción en colesterol en los microarrays. Los números que se muestran por debajo de los genes señalan el número de pb entre genes adyacentes. Los números entre corchetes indican separación y los números entre paréntesis solapamiento. Los números que aparecen sobre las líneas en diagonal indican las posiciones del genoma, en kb, entre las que se encuentran las distintas agrupaciones génicas.

156 Resultados 5 5963 3921 994 4842 4724 3972 4929 3555c ro04481 6005 tesB ro04590 ee nuio nclseo , Men los microarrays Genes inducidos en colesterol 1,8 mM ro04677 yoatru tuberculosis Mycobacterium oaoa testosteroni Comamonas 5903 jostii Rhodococcus yoatru smegmatis Mycobacterium 3534c 3502c ORF1

6006 3556c 5936 3535c fadA5 5904 kstR fadE33 3503c 2 5938 3536c 6007 ro04679 fadE32 fadE34 5937 5905

3557c 3 fadE31 3504 6008 3537 5939 ro04680 5906 fadE28 4 ro04594 6009 3538 3505 RHA1 5940 ro04681 fadE29 5 5907

fadD3 3558 21 5908 ro04486 ro04682 fadE30 3925 TA441 6010 5941 3539 mc²155 3559c 22 5909 3951 H37 Rv H37 ro04597 ro04487 3540c 5943 ltp3 3560c 3515c 23 6011 5942

ltp2 3541c ltp4 ro04598 25 6012

5913 ro04489 3542c 3561 ro04685 6005 3516 26

fadA6 3543c 5914 4733 6013 3562 27

ro04686 3544c 3517 ro04600 6014 6056 5915 4776 28 3563 5990 ro04687 3545c hsd4B 6015 30 3518c 3564 4853 5916 5991 kstD 6016 3565 echA19 31 4902 3566c 5992 3519 3546 ro04648 32 6017 hsaE 5917 fadD19 5993 3566A 3520 6082 33 ro04649 hsaG 3547 ro04690 5994 5918 6102

6033 ro04650 34 hsaF 5919 3521 5995 3567c 6034 fadD17 3548c ro04651 3568c ro04536 fadE27 5920 3522 ORF18 6035 5996 3549c echA20 3569c ORF17 fadE26 6036 3523 ro04537 5997 5921 3570c 3550 ro04653 6037 tesI 5998 kshA ro04694 5922

3551 3524 ro04654 6038 tesH

5923 3552 3571 5999 hsd4A hsaA tesA2 3525

ro04655 6000 6039 5924 hsaD 3572 tesA1 4909 3553 hsaC 3526 ro04696 6001 6040 tesD 3573c

5925 3554 hsaB 3527 6002 tesE

5927 4951 6041 gabD3 6003 5926 tesF 3965 3574 6004 tesG 4789

6042 5928

4018 6110 5989

157 Resultados

Figura 48. Representación esquemática de las zonas del genoma que abarcarían los denominados en este trabajo cluster 1 y 2 en M. smegmatis mc2155 y zonas relacionadas encontradas en los genomas de C. testosteroni TA441, R. jostii RHA1 y M. tuberculosis H37Rv. Los genes supuestos ortólogos de los distintos organismos se han coloreado de manera idéntica y el número que los representa es su denominación en las bases de datos. Los números que aparecen sobre las líneas en diagonal indican las posiciones del genoma, en kb, entre las que se encuentran las distintas agrupaciones génicas.

Genes no incluidos en el cluster 1 o 2 y que se encuentran bajo el control del represor KstR (Tabla 18)

Aparte de las dos grandes regiones del genoma de M. smegmatis que se acaban de describir (cluster 1 y 2) que incluyen una gran cantidad de genes supuestamente relacionados con el catabolismo del colesterol, a lo largo de todo el genoma de M. smegmatis nos encontramos con genes no agrupados en ningún gran cluster metabólico definido que se encuentran inducidos en colesterol según se ha comprobado en los experimentos de expresión mediante microarrays. En este apartado se tratará de aquellos genes que, además de inducirse en presencia del esteroide, están precedidos por secuencias que pueden funcionar como operadores para el regulador KstR, lo que sugiere que se inducen directamente por colesterol y por tanto estarían muy probablemente implicados en su metabolismo. Cabe destacar que ninguno de los genes incluidos en este apartado tienen ortólogos en R. jostii RHA1 que se hayan observado inducidos por colesterol en esta bacteria (van der Geize et al., 2007). El gen MSMEG_0302, aunque no presentó inducción en colesterol mediante microarrays se ha incluido en este grupo de genes, ya que se encuentra formando parte de un operón que sí presentó inducción en colesterol. El primero y más significativo de estos genes es el gen MSMEG_0217, que codifica una alcohol deshidrogenasa B, y es muy similar a genes implicados en la oxidación de alcoholes primarios. Se induce de manera muy notable en colesterol, más de 20 veces, y su mutagénesis produce una disminución de la capacidad de crecimiento en colesterol de M. smegmatis (véase el apartado 4.4 de Resultados).

158 Resultados

Por todo ello postulamos que podría catalizar la oxidación de la 26-hidroxi-4- colesten-3-ona a ácido 4-colesten-3-ona-26-oico (figura 5 de Introducción, estructuras 5A y 6A). La región situada desde el gen MSMEG_0302 al gen MSMEG_0310 incluye 8 genes organizados en 3 supuestos operones, i) MSMEG_0305_0304_0302, ii) MSMEG_0306_0307_0308 y iii) MSMEG_0309_0310, de los cuales el primero y el último poseen sitios de unión para KstR en las regiones que los preceden. En los ensayos de expresión con microarrays aparecen inducidos en colesterol los genes MSMEG_0304, MSMEG_0305 y MSMEG_0309. El producto del gen MSMEG_0305 presenta similitud con aciltransferasas implicadas en la biosíntesis de fosfolípidos; el gen MSMEG_0304 codifica una posible acil-CoA sintetasa y el gen MSMEG_0302 codifica una posible esterasa. El gen MSMEG_0309 codifica una proteína que tiene similitud con las 5-carboximetil-2-hidroximuconato semialdehido deshidrogenasas y succinato-semialdehido deshidrogenasas, por lo que podría participar en los pasos finales de degradación de colesterol a succinato. El gen MSMEG_0310 codifica una proteína que presenta similitud con la familia de las metiltransferasas S-adenosilmetionina dependientes (SAM o AdoMet-MTase) de clase I. El gen MSMEG_1098 (fadD18) codifica una acil-CoA sintetasa y el gen MSMEG_1410 una deshidrogenasa/reductasa de cadena corta, y ambos podrían estar implicados en la degradación de la cadena lateral del colesterol. Los genes MSMEG_3515, MSMEG_3516 y MSMEG_3519 están bajo el control de KstR y también aparecen inducidos en presencia de colesterol. Aunque están localizados próximos en el cromosoma no forman parte de un operón, ya que el gen MSMEG_3515 es divergente a los genes MSMEG_3516 y MSMEG_3519. Se desconoce el papel que podrían jugar estos genes en la ruta catabólica del colesterol. El gen MSMEG_3515 codifica una hidroxiesteroide deshidrogenasa, el gen MSMEG_3516 una proteína hipotética conservada que parece relacionada con la actividad dihidrodipicolinato reductasa que participa en la biosíntesis de la lisina y el producto del gen MSMEG_3519 ha sido identificado como una 2-nitropropano dioxigenasa (NDP), enzima implicada en la desnitrificación oxidativa de nitroalcanos a sus correspondientes compuestos

159 Resultados carbonilo y nitritos. NDP pertenece a la familia de las flavin oxidorreductasas NADP(H)-dependientes. La mutación de este gen en M. smegmatis no altera la capacidad de crecimiento en colesterol de la bacteria (véase el apartado 4.6 de Resultados). El posible operón formado por los genes MSMEG_3843_3844 también se encuentra inducido en colesterol. El gen MSMEG_3843 presenta un dominio de función desconocida, y el gen MSMEG_3844 podría estar relacionado con la biosíntesis y degradación de polisacáridos y lipopolisacáridos de superficie. El gen MSMEG_5228, que codifica una 3β-hidroxiesteroide deshidrogenasa/isomerasa (3-β HSDMS) y que se ha estudiado en profundidad en esta Tesis doctoral, se sitúa dentro de este conjunto de genes. Las observaciones de que presente un motivo de unión para KstR y de que se induzca en colesterol en los ensayos de expresión con microarrays apoyan su implicación directa en esta ruta catabólica actuando en la transformación de colesterol en 4-colesten-3- ona. Relacionado con este aspecto hay que señalar que se ha demostrado en este trabajo que el gen MSMEG_5233, que codifica una deshidrogenasa de cadena corta (SDRMS), puede también catalizar el paso de colesterol a 4-colesten-3-ona. Además este gen presenta en la región que lo precede un motivo de unión para KstR, aunque curiosamente este gen no se encuentra inducido en una cepa con el regulador KstR delecionado (Kendall et al., 2007). Así mismo, este gen no aparece inducido en colesterol en los ensayos de expresión con microarrays, aunque se puede apreciar una ligera inducción en RTq-PCR (véase apartado 2.8.2 de resultados) lo que sugiere que también podría estar directamente implicado en esta ruta de degradación. Por último, el gen MSMEG_5520, que codifica una proteína hipotética, también se encuentra claramente inducido en colesterol.

160 Resultados

1 2 3 4 5 6 MSMEG_0217 22.92* Rv0162c 31 Alcohol deshidrogenasa B (adhE1) _ MSMEG_0302 _ Rv1426c 59 Esterasa (lipO) _ MSMEG_0304 8.61 Rv1427c 76 Acil-CoA sintasa (fadD12) _ MSMEG_0305 18.89* Rv1428c 65 Proteína de dominio aciltransferasa _

MSMEG_0309 9.89 Rv0223c 68 Aldehido deshidrogenasa _

MSMEG_1098 8.04 Rv0551c 80 Acil-CoA sintasa (fadD8) _

MSMEG_1410 9.25 Rv0687 76 Deshidrogenasa/reductasa de cadena corta _

MSMEG_3515 10.42 Rv2002 60 3-α-(o 20-β)-hidroxiesteroide deshidrogenasa _

MSMEG_3516 10.20 Rv0926c 60 Proteína hipotética conservada _ MSMEG_3519 10.90 Rv1894c 89 Oxidorreductasa, 2-nitropropano dioxigenasa _ MSMEG_3843 9.3 Rv1628c 73 Proteína hipotética conservada _ MSMEG_3844 5.52 Rv1627c 91 Proteína de transferencia de lípidos _ MSMEG_5228 5.01 Rv1106c 77 3-β hidroxiesteroide deshidrogenasa/isomerasa _

MSMEG_5520 16.77* Rv0953c 84 Proteína hipotética conservada _

Tabla 18. Genes inducidos en colesterol en M. smegmatis mc2155 no incluidos en el cluster 1 o 2 y que se encuentran bajo el control del represor KstR. Columna 1. Anotación de los genes de M. smegmatis mc2155 que presentan inducción en colesterol. Se seleccionaron aquellos como mínimo más de 3 veces inducidos y con un valor máximo de P de 0,1, tras un análisis visual previo de las imágenes escaneadas de los microarrays. Columna 2. Se muestra el número de veces que cada gen está inducido. Los valores marcados con un asterisco tienen un valor de P ajustado (FDR) <0,05. Se marcan con una línea aquellos casos en los que los valores de inducción no se ajustaban a los parámetros seleccionados y por tanto fueron descartados. Columna 3. Genes similares en M. tuberculosis H37Rv. Columna 4. Porcentaje de identidad (ClustalW) entre los genes de M. smegmatis y M. tuberculosis. Columna 5. Descripción de los productos de los genes. Entre paréntesis se indica, de tener uno asignado, el nombre del gen. Columna 6. Genes similares en R. jostii RHA1 que también presentan inducción en colesterol (van der Geize et al., 2007). Como se muestra en la tabla, no se halló ningún gen similar a los genes de Mycobacterium en este microorganismo que estuviese inducido en colesterol en los microarrays.

Genes inducidos en colesterol que no presentan motivos de unión para KstR o KstR2 (Tabla 19)

Existen 37 genes a lo largo del genoma de M. smegmatis que presentan inducción en colesterol en los microarrays pero que no están precedidos por secuencias que puedan funcionar como operadores para los reguladores KstR o

161 Resultados

KstR2. Muchos de ellos parecen estar inducidos por una respuesta de estrés general provocada por el cultivo del microorganismo en un medio que incluye un compuesto altamente hidrofóbico como es el colesterol. Otros parecen poder participar genuinamente en el catabolismo de este compuesto, y para otros su posible función y el motivo de su inducción en colesterol es desconocido. La región MSMEG_1203-1205-1206 incluye dos genes que forman un posible operón (MSMEG_1205_1203) y poseen ortólogos en M. tuberculosis (Rv0644c y Rv0645c, respectivamente) y el gen MSMEG_1206, situado a 220 bp en la región 5’ de este operón, y que codifica una proteína hipotética sin ortólogo en M. tuberculosis. La inducción del operón MSMEG_1205_1203 en presencia de colesterol podría deberse a una respuesta a estrés, ya que los productos de MSMEG_1203 y MSMEG_1205 pueden identificarse como una sintasa 1 de ácido metoximicólico y una sintasa 1 de ciclopropano-acil-fosfolípido respectivamente, y están muy probablemente implicadas en la biosíntesis de ácidos micólicos, que podría ser necesaria para reparar el posible daño causado por el colesterol en la pared celular micobacteriana. Un caso diferente es el del gen MSMEG_1366 (mceG en M. tuberculosis), muy probablemente implicado en el transporte del colesterol junto con el locus mce, situado en otra región del genoma. Se ha postulado que el gen mceG codifica una ATPasa responsable de aportar la energía necesaria para la traslocación del colesterol (Pandey y Sassetti, 2008). En esta Tesis doctoral se ha comprobado que un mutante en este gen tiene reducida drásticamente su capacidad de crecimiento en colesterol (véase el apartado 4.2 de Resultados), por lo que su implicación en esta ruta catabólica parece demostrada. El gen MSMEG_1543 codifica una aldehido deshidrogenasa inducible por EPTC (S-etil dipropiltiocarbamato). Un mutante en este gen no tiene alterada su capacidad de crecimiento en colesterol (véase apartado 4.5 de resultados), por lo que posiblemente se trate de un gen inducido por respuesta a estrés. Un supuesto operón que también parece inducido como consecuencia de una respuesta a estrés es el constituido por los genes MSMEG_1683_1682_1681_1680_1679_1677. Las proteínas codificadas por estos genes no parecen estar en absoluto relacionadas con el catabolismo del

162 Resultados colesterol: el gen MSMEG_1677 codifica una supuesta aspartato-amonio liasa, el gen MSMEG_1679 una amidasa/aminoacilasa/carboxipeptidasa metal- dependiente, el gen MSMEG_1680 una proteína de función desconocida, el gen MSMEG_1681 un dominio conservado (que ha sido implicado en diferentes funciones como la biosíntesis de isoleucina y purina, la degradación anaeróbica de treonina y el mantenimiento del DNA mitocondrial), el gen MSMEG_1682 codifica una supuesta flavoproteína implicada en el transporte del ión potasio y el gen MSMEG_1683 una permeasa para citosina/purinas, uracilo, tiamina y alantoína. El gen MSMEG_1786 codifica un supuesto dominio STAS (transportador de sulfato y antagonista anti-sigma) que también podría inducirse en respuesta a estrés. Con respecto a los genes que parecen inducidos por una respuesta general a estrés, es particularmente interesante el caso de un operón que codifica una supuesta propano monooxigenasa multicomponente. Este operón contiene los genes MSMEG_1971_1972_1973_1974, que son muy similares a los genes prmABCD que codifican la propano monooxigenasa de Gordonia sp. cepa TY-5 (Kotani et al., 2003). Estos genes parecen formar un operón con cinco orfs adicionales MSMEG_1975_1976_1977_1978_1979. El mismo operón ha sido encontrado en R. jostii RHA1, y ha sido implicado en la degradación de N- nitrosodimetilamina (Sharp et al., 2007). El gen MSMEG_1970 que codifica una proteína similar a un factor sigma se localiza en sentido opuesto a este operón, y también aparece inducido. Aunque los genes prmABCD parecen participar en el metabolismo del propano, también están implicados en la respuesta a condiciones de estrés (Sharp et al., 2007) y son capaces de hidroxilar otros compuestos diferentes al propano (Shennan, 2006; Steffan et al., 1997). Por lo tanto, hemos asumido que estos genes no están directamente implicados en el metabolismo del colesterol sino que su inducción indica que las células se encuentran bajo condiciones de estrés. Otros genes de los que se desconoce su posible función en el catabolismo del colesterol y que podrían estar inducidos como respuesta a estrés son: el gen MSMEG_2303 (proteína hipotética conservada), el gen MSMEG_2514 (proteína hipotética), el gen MSMEG_2663 (proteína hipotética conservada), el gen

163 Resultados

MSMEG_3164 (proteína hipotética), el operón formado por los genes MSMEG_3330-3329-3328 (que codifica tres proteínas hipotéticas cortas, una de ellas (el producto del gen MSMEG_3330) similar a la proteína CsbD bacteriana de respuesta general a estrés), el gen MSMEG_3562 (proteína con dominio 4- carboximuconolactona decarboxilasa PcaC), el gen MSMEG_4298 (3-metil-2- oxobutanoato hidroximetiltransferasa, PanB), el gen MSMEG_4829 (citocromo P450) y el gen MSMEG_5230 (proteína hipotética conservada). La región MSMEG_3727 a MSMEG_3719 forma un supuesto operón que incluye una posible deshidrogenasa que utiliza pirrolo-quinolina quinona (PQQ) como cofactor (MSMEG_3726) similar a etanol, metanol y glucosa deshidrogenasas. Los genes MSMEG_3725-3721 codifican las proteínas A, B, C, D y E de biosíntesis de coenzima PQQ. Los genes MSMEG_3720 y MSMEG_3719 codifican una supuesta proteína activadora de recombinación 1 y un intercambiador de sodio/calcio, respectivamente. El papel de este operón en la degradación del colesterol es desconocido en la actualidad. Por último nos encontramos con el operón inducido en colesterol MSMEG_6645_6646_6647_6648, que codifica enzimas similares a una 2- metilcitrato deshidratasa (PrpD), una metilisocitrato liasa (PrpB), una citrato sintasa (PrpC) y una piruvato carboxilasa (Pyc), respectivamente. Su inducción sugiere que estos genes pueden estar implicados en el catabolismo del propionil CoA (Pandey y Sassetti, 2008). A este respecto, es interesante comentar el papel que la enzima Pyc podría desempeñar en este operón. Pyc transforma el piruvato en oxalacetato, que puede ser condensado con propionil-CoA por PrpC para formar 2-metilcitrato, el primer producto del ciclo del metilcitrato (Upton y McKinney, 2007) (Fig. 49), lo que sugeriría que este operón ha evolucionado específicamente para la degradación de colesterol. De acuerdo con esta hipótesis, se ha descrito que las enzimas Prp de M. smegmatis son responsables de la transformación del propionil-CoA en piruvato a través del ciclo del metilcitrato (Upton and McKinney, 2007) pero es también cierto que M. smegmatis puede crecer en propionato en ausencia de este operón usando los genes icl1 e icl2 (Upton and McKinney, 2007). Además, la presencia del gen pyc en este operón es única para M. smegmatis, ya que en otros casos el operón prpBCD contiene un

164 Resultados gen adicional prpE que codifica una propionil-CoA sintasa (Horswill y Escalante- Semerena, 1999) que no se requiere en este caso porque el propionil-CoA es el producto final de la ruta catabólica del colesterol junto con el piruvato. Por tanto, dado que no se requiere una propionol-CoA sintasa, una rápida transformación de piruvato en oxalacetato por Pyc debería reducir el tiempo de procesado del propionil-CoA.

2-metilcitrato PrpD Propionato PrpC

PrpE 2-metil-cis-aconitato

Propionil-CoA Ciclo del Acn Colesterol metilcitrato Pyc Piruvato Oxalacetato 2-metilisocitrato

Piruvato PrpB

Succinato

Figura 49. Representación esquemática del catabolismo del propionil-CoA. Particularidades propuestas para M. smegmatis. En la bacteria M. smegmatis el catabolismo del colesterol tiene como productos finales piruvato y propionil-CoA (señalados en azul). Los resultados obtenidos mediante microarrays sugieren que una piruvato carboxilasa (Pyc) transforma el piruvato en oxalacetato, que junto con el propionil-CoA entrarían en el ciclo del metilcitrato (cuyos intermediarios y productos se señalan en verde) transformándose en 2-metilcitrato por la enzima citrato sintasa (PrpC). El proceso metabólico seguiría a través de la enzima 2-metilcitrato deshidratasa (PrpD), una enzima aconitasa (Acn) y la enzima metilisocitrato liasa (PrpB), que tiene como productos piruvato y succinato. En el catabolismo del colesterol llevado a cabo por M. smegmatis no es necesaria por tanto una enzima propionil CoA sintasa (PrpE) que transforme el propionato (señalado en negro) en propionil CoA.

Utilizando este operón especializado, las células de M. smegmatis no requieren un ciclo real de metilcitrato porque el propionil-CoA y el piruvato son transformados directamente en piruvato y succinato a través de un proceso metabólico único constituido por las enzimas PrpBCD, Pyc y una aconitasa Acn adicional.

165 Resultados

1 2 3 4 5 6 MSMEG_1203 7.08 Rv0645c 58 Sintasa 1 de ácido metoxi micólico _ MSMEG_1205 6.59 Rv0644c 61 Sintasa 1 de ciclopropano-graso-acil-fosfolípidos _

MSMEG_1206 5.09 _ _ Proteína hipotética _

MSMEG_1366 7.80 Rv0655 79 Transportador ABC, proteína de unión a ATP _ MSMEG_1543 8.07 Rv0458 84 Aldehido deshidrogenasa eptc-inducible _ MSMEG_1677 _ Rv1098c 40 Aspartato-amonio liasa (aspA) _ MSMEG_1679 10.33 Rv3306c 46 AmiB _

MSMEG_1681 12.05* Rv2704 26 Proteína de la superfamilia endorribonucleasa L-PSP _

MSMEG_1682 10.21 _ _ Monooxigenase FMO contenedora de flavina _ MSMEG_1683 8.79 Rv3065 25 Proteína de la familia citosina/purina/uracilo/tiamina/alantoina permeasa _ MSMEG_1786 10.97 _ _ Posible dominio stas _ MSMEG_1970 13.28* _ _ Factor sigma ro00440

MSMEG_1971 17.15* _ _ Propano monooxigenasa hidroxilasa, subunidad grande ro00441

MSMEG_1972 _ _ _ Metano monooxigenasa, componente C (reductasa) ro00442 MSMEG_1973 4.64 _ _ Propano monooxigenasa hidroxilasa, subunidad pequeña ro00443 MSMEG_1974 6.33 _ _ Proteína de enganche de la propano monooxigenasa ro00444 MSMEG_1975 4.80 _ _ Amidohidrolasa 2 ro00445

MSMEG_1976 5.38 _ _ Proteína hipotética conservada ro00446

MSMEG_1977 5.45 Rv2259 29 Alcohol deshidrogenasa ro00447 MSMEG_1978 6.61 Rv0440 50 Chaperonina GroL (groL) ro00448 MSMEG_1979 11.84* Rv1117 58 Monooxigenasa de biosíntesis de antibiótico ro00449

MSMEG_2303 10.39 _ _ Transportador integral de membrana _

MSMEG_2514 7.49 _ _ Proteína hipotética conservada _ MSMEG_2663 8.77 Rv1128c 41 Proteína hipotética conservada _ MSMEG_3164 13.15* _ _ Proteína hipotética _ MSMEG_3328 5.70 _ _ Proteína hipotética _

MSMEG_3329 8.10 _ _ Proteína hipotética _

MSMEG_3330 9.66 _ _ Proteína hipotética conservada _ MSMEG_3562 11.88* _ _ Proteína con dominio 4-carboximuconolactona descarboxilasa (pcaC) _ MSMEG_3719 _ _ _ Proteína intercambiadora de sodio/calcio _ MSMEG_3720 _ _ _ Proteína activadora de recombinación 1 _

MSMEG_3721 _ _ _ Proteína E de biosíntesis de coenzima PQQ (pqqE) _

MSMEG_3722 _ _ _ Proteína bifuncional C/D de biosíntesis de coenzima PQQ _ MSMEG_3723 9.53 _ _ Proteína C de biosíntesis de coenzima PQQ (pqqC) _ MSMEG_3724 7.81 _ _ Proteína B de biosíntesis de coenzima PQQ (pqqB) _

MSMEG_3725 5.40 _ _ Proteína A de biosíntesis de coenzima PQQ (pqqA) _

MSMEG_3726 12.00* _ _ Alcohol deshidrogenasa _ MSMEG_3727 20.09* _ _ Proteína hipotética _ MSMEG_4298 10.23 Rv2225 79 3-metil-2-oxobutanoato hidroximetiltransferasa (panB) _ MSMEG_4829 10.71 Rv0766c 32 Citocromo P450 _

MSMEG_5230 5.99 Rv1738 34 Proteína hipotética conservada _

MSMEG_6645 11.35* Rv1130 81 2-metilcitrato deshidratasa 2 (prpD) _ MSMEG_6646 13.92* _ _ Metilisocitrato liasa (prpB) _ MSMEG_6647 _ Rv1131 79 Citrato sintasa 2 (prpC) _ MSMEG_6648 _ Rv2967c 80 Piruvato carboxilasa (pyc) _

166 Resultados

Tabla 19. Genes inducidos en colesterol en M. smegmatis mc2155 que no presentan motivos de unión para KstR o KstR2. Columna 1. Anotación de los genes de M. smegmatis mc2155 que presentan inducción en colesterol. Se seleccionaron aquellos como mínimo más de 3 veces inducidos y con un valor máximo de P de 0,1, tras un análisis visual previo de las imágenes escaneadas de los microarrays. Columna 2. Se muestra el número de veces que cada gen está inducido. Los valores marcados con un asterisco tienen un valor de P ajustado (FDR) <0,05. Se marcan con una línea aquellos casos en los que los valores de inducción no se ajustaban a los parámetros seleccionados y por tanto fueron descartados. Columna 3. Genes similares en M. tuberculosis H37Rv. Columna 4. Porcentaje de identidad (ClustalW) entre los genes de M. smegmatis y M. tuberculosis. Columna 5. Descripción de los productos de los genes. Entre paréntesis se indica, de tener uno asignado, el nombre del gen. Columna 6. Genes similares en R. jostii RHA1 que también presentan inducción en colesterol (van der Geize et al., 2007).

Genes bajo el control de KstR que no se encuentran inducidos en colesterol en nuestros experimentos (Tabla 20)

Por último, en este apartado se han querido reseñar aquellos genes situados fuera de los clusters 1 y 2 que, pese a presentar un motivo de unión para KstR precediéndolos y estar inducidos en una cepa con el regulador KstR delecionado (Kendall et al., 2007) no aparecen inducidos en colesterol en los ensayos de expresión con microarrays hibridados y analizados como parte del trabajo de esta tesis doctoral, ni forman parte de un operón que aparezca inducido. Muchos de estos genes codifican proteínas hipotéticas, por lo que su supuesta función en el catabolismo del colesterol es desconocida. Sin embargo, hay una excepción notable, el locus mce4, que está implicado en el transporte de colesterol (véase el apartado 4 de Introducción), lo que ha sido confirmado en R. jostii RHA1 (Mohn et al., 2008) y también en M. tuberculosis (Pandey y Sassetti, 2008). Este hecho unido a la presencia de un motivo para unión de KstR precediendo este operón hacía pensar que éste aparecería claramente inducido en colesterol, lo que sorprendentemente, según el resultado obtenido en los microarrays, no sucede (Tabla 20). Este locus mce4 se corresponde en M. smegmatis con los genes MSMEG_5893-MSMEG_5902. Como en el caso de M. tuberculosis y R. jostii RHA1, está formado por dos genes yrbE (denominados sup en Rhodococcus), que

167 Resultados presentan homología con permeasas de transportadores ABC, y seis genes mce, homólogos a proteínas de unión a sustrato. A continuación de lo genes mce se sitúan dos genes conservados que codifican proteínas asociadas a mce (mas4A y mas4B) (Casali y Riley, 2007) (Figura 50). Este operón se sitúa justo precediendo el cluster 1 antes definido, lo que concuerda con su implicación en el catabolismo de colesterol y nuevamente hace que el hecho de que no se induzcan estos genes sea extraño. Para descartar que la técnica de microarrays no fuese suficientemente sensible para captar la inducción de este operón, se llevó a cabo la RTq-PCR de uno de los genes del operón, MSMEG_5895. Los resultados mostraron que sí existe una inducción, aunque leve, de este gen (véase el apartado 3.2, figura 51) que no se detecta por lo tanto mediante la técnica de microarrays.

168 Resultados

1 2 3 4 5 MSMEG_2644 Rv2800 64 Supuesta hidrolasa _ MSMEG_2645 Rv2799 61 Proteína hipotética conservada _ MSMEG_2789 Rv2669 60 Acetiltransferasa, familia GNAT _ MSMEG_2790 Rv2668 49 Proteína hipotética conservada _

MSMEG_3658 _ _ Proteína hipotética conservada _ MSMEG_5202 Rv1132 72 Proteína hipotética conservada _ MSMEG_5286 Rv1059 71 Dihidrodipicolinato reductasa (dapB) _

MSMEG_5519 _ _ Monooxigenasa _ MSMEG_5554 _ _ Supuesto regulador de respuesta anti-terminador _ MSMEG_5555 Rv0940c 80 Proteína hipotética conservada _

MSMEG_5584 Rv0927c 81 Deshidrogenasa de cadena corta _ MSMEG_5586 Rv0926c 75 Proteína hipotética conservada _ MSMEG_5893 Rv3492c 58 Proteína hipotética conservada asociada a mce (mas4B) ro04705 (NI)

MSMEG_5894 Rv3493c 60 Proteína hipotética conservada asociada a mce (mas4A) ro04704 (NI) MSMEG_5895 Rv3494c 65 Proteína de la familia mce: operón mce4 (mce4F) ro04703 MSMEG_5896 Rv3495c 63 Proteína de la familia mce: operón mce4 (mce4E) ro04702 MSMEG_5897 Rv3496c 63 Proteína de la familia mce: operón mce4 (mce4D) ro04701 MSMEG_5898 Rv3497c 65 Proteína de la familia mce: operón mce4 (mce4C) ro04700 MSMEG_5899 Rv3498c 67 Proteína de la familia mce: operón mce4 (mce4B) ro04699 MSMEG_5900 Rv3499c 67 Proteína de la familia mce: operón mce4 (mce4A) ro04698 MSMEG_5901 Rv3500c 92 Supuesta subunidad permeasa de transporte de esteroles (transportador ABC) (yrbE4B) ro04697

MSMEG_5902 Rv3501c 90 Supuesta subunidad permeasa de transporte de esteroles (transportador ABC) (yrbE4A) ro04696 MSMEG_6474 Rv0139 67 Oxidorreductasa _ MSMEG_6475 Rv0138 71 Proteína hipotética conservada _

Tabla 20. Genes bajo el control de KstR que no se encuentran inducidos en colesterol en nuestros experimentos de expresión diferencial mediante microarrays. Columna 1. Anotación de los genes de M. smegmatis mc2155 que no presentan inducción en colesterol significativa en los microarrays (menos de 3 veces inducidos y/o con un valor de P > 0,1) pero sí presentan un motivo de unión para KstR precediendo su secuencia. Columna 2. Genes similares en M. tuberculosis H37Rv. Columna 3. Porcentaje de identidad (ClustalW) entre los genes de M. smegmatis y M. tuberculosis. Columna 4. Descripción de los productos de los genes. Entre paréntesis se indica, de tener uno asignado, el nombre del gen. Columna 5. Genes similares en R. jostii RHA1 que también presentan inducción en colesterol (van der Geize et al., 2007) (a excepción de los genes seguidos de las siglas NI, que indican que no están inducidos en colesterol).

169 Resultados

Mycobacterium tuberculosis H37Rv

mas4B mas4A mce4F mce4E mce4D mce4C mce4B mce4A yrbE4B yrbE4A 3910 3921 3492c 3493c 3494c 3495c 3496c 3497c 3498c 3499c 3500c 3501c [1] (0) [11] (3) (3) (10) [3] [20] [34]

Mycobacterium smegmatis mc²155

5952 mas4B mas4A mce4F mce4E mce4D mce4C mce4B mce4A yrbE4B yrbE4A 5964 5893 5894 5895 5896 5897 5898 5899 5900 5901 5902 (0) [68] (0) [59] (4) (8) (0) [6] [34]

Rhodococcus jostii RHA1 4949 supA supB mce4A mce4B mce4C mce4D mce4E mce4F mas4A mas4B 4960 04696 04697 04698 04699 04700 04701 04702 04703 04704 04705

[20] [12] [2] [2] (3) (4) (4) (4) (4)

Figura 50. Representación esquemática del locus mce4. Se representa la disposición en el genoma de M. tuberculosis, M. smegmatis y R. jostii RHA1 de este operón. La nomenclatura de los genes se sitúa por encima de los mismos. Los números que se muestran por debajo de los genes señalan el número de pb entre genes adyacentes. Los números entre corchetes indican separación y los números entre paréntesis solapamiento. Los números que aparecen sobre las líneas en diagonal indican las posiciones del genoma, en kb, entre las que se encuentran las distintas agrupaciones génicas.

3.2 Validación de los resultados de expresión obtenidos con los microarrays mediante RTq-PCR de diversos genes

Los análisis de expresión diferencial en colesterol mediante microarrays fueron validados para 12 de los genes mediante retrotranscripción-PCR en tiempo real (cuantitativa) (RTq-PCR) (véanse los apartados 7.3 y 7.4 de Materiales y Métodos). Dentro de los genes así analizados se encuentra un gen que presenta una inducción elevada en colesterol en los microarrays (MSMEG_0217), seis

170 Resultados genes con una inducción más discreta (MSMEG_1366, MSMEG_5906, MSMEG_5228, MSMEG_5925, MSMEG_6009, MSMEG_6036) y cinco genes que no presentaron inducción en colesterol a pesar de estar precedidos por secuencias de unión a KstR o dentro de operones inducidos (MSMEG_5895, MSMEG_5920, MSMEG_6012, MSMEG_6039 y MSMEG_6041) (Figura 51). Los resultados indicaron que todos los genes que muestran inducción en colesterol mediante microarrays también la muestran mediante RTq-PCR, siendo el gen MSMEG_0217 el que presenta unos niveles más elevados de inducción (Figura 52). Con respecto a los genes que no presentan inducción en colesterol en los microarrays, se comprobó que en tres de ellos esta inducción sin embargo existe, como se esperaba en un principio (MSMEG_6012, MSMEG_6039 y MSMEG_6041, que se inducen en colesterol respecto a en glicerol 9,7, 3,6 y 9 veces respectivamente). En los otros dos (MSMEG_5895 y MSMEG_5920) se corrobora sin embargo una inducción bastante más leve (1,6 y 1,9 veces, respectivamente) que por lo tanto no fue detectada en los microarrays.

171 Resultados

Expresión diferencial en colesterol 1,8 mM- glicerol 18 mM Expresión diferencial en colesterol 1,8 mM- glicerol 18 mM 4 9

8 3,5

7 3 6 2,5 Colesterol 5 Colesterol 2 Glicerol Glicerol 4 1,5 3 1 2 0,5

Nivel de transcripción (ng de tránscrito) (ng de transcripción de Nivel 1

0

Nivel de transcripción (ng de tránscrito) 0

6 8 0 5 2 6 9 1 7 36 906 22 92 92 01 3 03 4 _1 5 5 5 _5 _6009 6 _60 6 G_ G_ G_ G G_ G G_ G_60 EG E E EG E E E M M M M M M S S S S S S M MSME M MSMEG_5895M M MSME M MSME M MSM MSMEG_021

Figura 51. Expresión diferencial obtenida mediante RTq-PCR de los genes seleccionados de M. smegmatis mc2155 crecido en colesterol 1,8 mM comparado con M. smegmatis mc2155 crecido en glicerol 18 mM. Los niveles de transcripción se midieron mediante RTq-PCR como se describe en los apartados 7.3 y 7.4 de Materiales y Métodos. Las barras de error representan la desviación estándar calculada. Los niveles de transcripción del gen MSMEG_0217 se muestran separadamente, ya que son significativamente mayores que el del resto de los genes. Los valores de P del test t de Student no pareado fueron menores de 0,05 en todos los casos excepto para los genes MSMEG_5895 y MSMEG_5920 (datos no mostrados).

4. Estudio mediante mutagénesis insercional de diversos genes implicados en el catabolismo del colesterol

Para validar los datos obtenidos mediante RT-PCR y también los datos de expresión diferencial en colesterol/glicerol de M. smegmatis mc2155 obtenidos mediante microarrays, se llevó a cabo la mutagénesis insercional de distintos genes probablemente implicados en la degradación del colesterol. Los mutantes se obtuvieron mediante interrupción del gen de interés utilizando el plásmido suicida pJQ200x (véase apartado 4.6 de Materiales y Métodos). Posteriormente los mutantes así obtenidos fueron cultivados en medio mínimo con colesterol 1,8

172 Resultados mM en β-ciclodextrina como única fuente de carbono y se comparó su crecimiento con el de la cepa no mutada. Como se verá a continuación los resultados obtenidos indican que para la mayoría de los genes analizados la capacidad o la velocidad de crecimiento en colesterol de M. smegmatis mc2155 se encuentra atenuada cuando éstos son mutados, lo que apoya una implicación directa en su catabolismo.

4.1 Estudio mediante mutagénesis insercional del gen MSMEG_6036

El gen MSMEG_6036 es ortólogo al gen tesB de C. testosteroni (Horinouchi et al., 2001) en M. smegmatis mc2155. El gen correspondiente en R. erythropolis (van der Geize et al., 2007) y en M. tuberculosis (Yam et al., 2009) se denomina hsaC. La proteína codificada por este gen está anotada en M. smegmatis mc2155 como una bifenil-2,3-diol-1,2-dioxigenasa por su similitud con estradiol dioxigenasas que catalizan la apertura de 2,3-dihidroxibifenilo, pero su principal función, como en el caso de los microorganismos anteriormente expuestos, sería la apertura meta de 3,4-DHSA para producir 4,9-DSHA (Figura 5 de introducción, intermediarios (12) y (13)). En estos microorganismos se ha comprobado que la mutación de este gen conlleva efectivamente la acumulación de 4,9-DSHA y disminuye en gran medida la capacidad de crecimiento en colesterol. Así mismo, los mutantes presentan un rasgo fenotípico característico, que es la coloración rojiza que producen en el medio cuando crecen en colesterol. El color rojizo se aprecia a menudo cuando se acumulan derivados catecólicos durante la degradación microbiana de compuestos aromáticos, debido a que el catecol se oxida para producir derivados quinónicos que confieren un color rojizo oscuro al medio (Horinouchi et al., 2004a). En el caso de M. smegmatis mc2155 nuestros resultados demuestran que la mutación del gen MSMEG_6036 conlleva efectivamente una disminución notable en el crecimiento en colesterol (Figura 52), así como la aparición de una coloración rojiza en colesterol 1,8 mM a partir de las 48 horas de cultivo (Figura 53).

173 Resultados

Crecimiento en colesterol 1,8 mM. M. smegmatis::MSMEG_6036

10

1 M. smegmat is mc²155 600 M. smegmat is::MSMEG_6036

DO 0,1

0,01 0 20406080100

Tiempo (h)

Figura 52. Diferencia de crecimiento en colesterol de M. smegmatis::MSMEG_6036 y M. smegmatis mc2155. Crecimiento en medio mínimo 457 en colesterol 1,8 mM en β-ciclodextrina como fuente de carbono. M. smegmatis::MSMEG_6036 (línea naranja) representa a M. smegmatis mc2155 con el gen MSMEG_6036 interrumpido mediante inserción de pJQ200x. M. smegmatis mc²155 (línea azul) representa a la cepa no mutada M. smegmatis mc2155.

Estos resultados apoyan los obtenidos por RT-PCR (véase apartado 1.3 de Resultados) y microarrays (véase apartado 3.1 de Resultados, tabla 16), por lo que se ha confirmado el papel del producto del gen MSMEG_6036 en la ruta de degradación del colesterol.

174 Resultados

A B

Figura 53. Coloración del medio con colesterol producida por el mutante M. smegmatis::MSMEG_6036. A. Cultivo del mutante M. smegmatis::MSMEG_1366 en colesterol 1,8 mM en β-ciclodextrina de 96 horas. B. Cultivo de 96 horas de la cepa no mutada M. smegmatis mc2155.

4.2 Estudio mediante mutagénesis insercional del gen MSMEG_1366

Como se ha comentado en la introducción (apartado 4), el locus mce4 parece ser el responsable del transporte de colesterol en distintas actinobacterias. En M. smegmatis mc2155 el locus mce4 se corresponde, por homología de secuencia con M. tuberculosis, con los genes MSMEG_5893-MSMEG_5902, siendo el grado de similitud muy elevado (véase apartado 3.1 de Resultados, tabla 19). La ATPasa mceG de M. tuberculosis se corresponde así mismo con el gen MSMEG_1366. Este gen aparece inducido en los microarrays de expresión diferencial en colesterol/glicerol (véase apartado 3.1 de resultados), lo que apoya su participación en el transporte de colesterol. La interrupción de este gen con el plásmido suicida pJQ200x conlleva una reducción drástica en la capacidad de crecimiento en colesterol de M. smegmatis mc2155 (Figura 54). A diferencia de lo que sucede en M. tuberculosis (Pandey y Sassetti, 2008), la capacidad de

175 Resultados crecimiento en colesterol parece no recuperarse con el tiempo; el aumento en la

DO600 que puede ser atribuido al colesterol a las 98 h es de aproximadamente 0,3 unidades, una vez que se resta el crecimiento facilitado por la presencia de β- ciclodextrina. Sin embargo, al tratarse de una micobacteria de crecimiento rápido es difícil equiparar este resultado al obtenido para M. tuberculosis, ya que el tiempo final difiere en ambos experimentos.

Crecimiento en colesterol 1,8 mM. M. smegmatis::MSMEG_1366

10

1

600 mc2 155 M. smegmatis::MSMEG_1366

DO 0,1

0,01 0 20406080100

Tiempo (h)

Figura 54. Diferencia de crecimiento en colesterol de M. smegmatis::MSMEG_1366 y M. smegmatis mc2155. Crecimiento en medio mínimo 457 con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono. M. smegmatis::MSMEG_1366 (línea naranja) representa a M. smegmatis mc2155 con el gen MSMEG_1366 interrumpido mediante inserción de pJQ200x. M. smegmatis mc²155 (línea azul) representa a la cepa no mutada M. smegmatis mc2155.

Tras estos resultados, nos propusimos investigar si el colesterol podría ser transportado al interior de la micobacteria por algún otro sistema alternativo si se suministra energía al sistema de transporte a partir de otra fuente de carbono distinta del colesterol. Para ello M. smegmatis fue cultivado en glicerol 5 mM al que se añadió colesterol 1,8 mM en β-ciclodextrina como inductor o β-ciclodextrina únicamente como control. Los resultados indicaron que el mutante crecía en medio con glicerol y colesterol hasta una DO600 próxima a 2 a las 135 h, mientras que el medio sin colesterol en estas condiciones alcanzaba una DO600 de 0,8

(Figura 55). El valor de la DO600 alcanzado en el medio con glicerol y colesterol comparado con el valor alcanzado en medio con glicerol es mayor al esperado

176 Resultados teniendo en cuenta el comportamiento del mutante en medio sólo con colesterol. En el caso del colesterol era de 0,3 unidades y con glicerol y colesterol el aumento de DO600 atribuido al crecimiento en colesterol a las 98 h es aproximadamente el doble, es decir de 0,6 unidades. Este hecho podría deberse a que al disponer de una fuente de carbono adicional, el mutante puede utilizar la energía obtenida para activar otro/s sistema/s de transporte capaces de transportar colesterol. Esta hipótesis está en proceso de estudio en nuestro laboratorio.

Crecimiento en glicerol +/- colesterol de M. smegmatis ::MSMEG_1366

10

1 Glicerol

600 Glicerol + 0,1 DO Colesterol

0,01

0 50 100 150

Tiempo (h)

Figura 55. Diferencia de crecimiento de M. smegmatis::MSMEG_1366 en glicerol 5mM con/sin colesterol 1,8 mM. Crecimiento del mutante M. smegmatis::MSMEG_1366 en medio mínimo 457 con glicerol 5mM y colesterol 1,8 mM en β-ciclodextrina como fuente de carbono (línea rosa) o con glicerol 5 mM en β-cilcodextrina (línea azul). Los resultados mostrados son la media de tres experimentos independientes.

4.3 Estudio mediante mutagénesis insercional del gen MSMEG_5995

El gen MSMEG_5995 se encuentra en una región del genoma delimitada por los genes MSMEG_5990 y MSMEG_6004 cuyos genes se inducen en colesterol, como indican los resultados obtenidos mediante RT-PCR (véase apartado 1.3 de

177 Resultados

Resultados) y mediante microarrays (véase apartado 3.1 de Resultados, tabla 16). Aun así, hasta hace muy poco tiempo no se había empezado a dilucidar la posible función de ninguno de estos genes en la ruta de degradación del colesterol. Como se comentó en la introducción, estudios muy recientes han demostrado que la proteína codificada por el gen ro04679 de R. jostii RHA1 (Rosłoniec et al., 2009), que codifica el citocromo P450 125 (Cyp125), así como su homóloga en M. tuberculosis H37Rv, codificada por el gen Rv3545c (Capyk et al., 2009b), son responsables del primer paso de hidroxilación de la cadena lateral del colesterol. El supuesto gen ortólogo de ro04679 y Rv3545c en M. smegmatis es MSMEG_5995, cuyo producto presenta una identidad del 75% (cuantificado por ClustalW) con el del gen de M. tuberculosis. Como se puede apreciar en la figura 56, la mutagénesis insercional de MSMEG_5995 produce una reducción drástica del crecimiento en colesterol.

Crecimiento en colesterol 1,8 mM. M. smegmatis::MSMEG_5995

10

1 600 M. smegmat is mc²155 M. smegmat is::MSMEG_5995

DO 0,1

0,01 0204060

Tiempo (h)

Figura 56. Diferencia de crecimiento en colesterol de M. smegmatis::MSMEG_5995 y M. smegmatis mc2155. Crecimiento en medio mínimo 457 con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono. M. smegmatis::MSMEG_5995 (línea naranja) representa a M. smegmatis mc2155 con el gen MSMEG_5995 interrumpido mediante inserción de pJQ200x. M. smegmatis mc2155 (línea azul) representa a la cepa no mutada M. smegmatis mc2155.

Los mutantes de R. jostii RHA1 y M. bovis BCG en el gen ortólogo también pierden la capacidad de crecimiento en colesterol (Capyk et al., 2009; Rosłoniec et al., 2009), pero curiosamente, M. tuberculosis crece perfectamente en colesterol

178 Resultados cuando se deleciona el gen Rv3545c. La explicación más probable es que exista una enzima que complementa la pérdida de Cyp125. Se ha observado que existen tres genes que están presentes en el genoma de H37Rv pero no en el de M. bovis que codifican monooxigenasas que parecen implicadas en patogénesis (Rv1256c, Rv3121 y Rv3618) y se postula que alguno de ellos podría complementar a cyp125 en H37Rv (Capyk et al., 2009). Para comprobar si M. smegmatis mc2155 poseía ortólogos a estos genes, se hicieron comparaciones in silico y se encontraron dos genes con elevada similitud con Rv1256c y Rv3618 (Tabla 21). El gen Rv3121 no tiene un claro ortólogo en M. smegmatis; la proteína más similar, denominada FAS1, a pesar de codificar también un citocromo P450, presenta sólo una similitud del 28% (cuantificado por ClustalW).

Gen M. Función Gen M. smegmatis Función % ClustalW tuberculosis mc2155 Rv1256c Citocromo P450 MSMEG_5038 Posible citocromo 77 Cyp130 P450 Cyp123 Rv3121 Citocromo P450 MSMEG_0762 Citocromo P450 28 Cyp141 FAS1

Rv3618 Limoneno MSMEG_6107 Limoneno 1,2 81 monooxigenasa monooxigenasa

Tabla 21. Comparación de secuencias de monooxigenasas de M. tuberculosis H37Rv vs M. smegmatis mc2155.

El hecho de que R. jostii RHA1 tampoco posea ningún claro gen ortólogo a Rv3121 (Tabla 22) puede apoyar que Rv3121 podría efectivamente codificar la enzima que complementa la actividad de Cyp125 en M. tuberculosis.

179 Resultados

Gen M. Función Gen R. jostii RHA1 Función % ClustalW tuberculosis

Rv1256c Citocromo P450 ro05719 Citocromo P450 69 Cyp130 Cyp130 Rv3121 Citocromo P450 ro02604 Citocromo P450 29 Cyp141 Cyp105 Rv3618 Limoneno ro00392 Monooxigenasa 40 monooxigenasa

Tabla 22. Comparación de secuencias de monooxigenasas de M. tuberculosis H37Rv vs R. jostii RHA1.

4.4 Estudio mediante mutagénesis insercional del gen MSMEG_0217

El gen MSMEG_0217 es uno de los más interesantes hallados mediante análisis de expresión diferencial en colesterol mediante microarrays (véase apartado 3.1 de Resultados, tabla 18). La inducción en colesterol de este gen es muy clara, tanto en microarrays como en RT-PCR cuantitativa, y su expresión está sujeta al control del represor transcripcional KstR (Kendall et al., 2007). Este gen es muy similar a genes implicados en la oxidación de alcoholes primarios y aldehídos y es un candidato claro para ser el responsable de la transformación de 26-hidroxi-4-colesten-3-ona en ácido 4-colesten-3-ona-26-oico (estructuras (5A) y (6A) de la figura 5 de introducción). El mutante por inserción de pJQ200x crece lentamente en colesterol durante las primeras 50 horas de cultivo, llegando a

DO600 entre 0,6-0,8 a las 48 horas, mientras que la cepa salvaje alcanza en ese intervalo una DO600 próxima a 2 (Figura 57). Además, el cultivo presenta un fenotipo característico a partir de las 35-40 h, cuando las células comienzan a formar agregados. A tiempos más largos, la capacidad de crecer se recupera, y se ha comprobado que a estos tiempos se ha producido la reversión de la recombinación homóloga y se puede detectar mediante RT-PCR el gen completo no mutado en el genoma (resultados no mostrados). Debido a la inestabilidad de este mutante, en el presente se está construyendo en nuestro laboratorio el mutante por deleción para posteriores estudios, dado que los resultados hallados

180 Resultados con el mutante por inserción resultan prometedores y parecen apoyar la implicación directa de este gen en la ruta de degradación de colesterol.

Crecimiento en colesterol 1,8 mM. M. smegmatis::MSMEG_0217

10

1

600 M. smegmat is mc²155 M. smegmat is::MSMEG_0217

DO 0,1

0,01 020406080100

Tiempo (h)

Figura 57. Diferencia de crecimiento en colesterol de M. smegmatis::MSMEG_0217 y M. smegmatis mc2155. Crecimiento en medio mínimo 457 con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono. M. smegmatis::MSMEG_0217 (línea naranja) representa a M. smegmatis mc2155 con el gen MSMEG_0217 interrumpido mediante inserción de pJQ200x. M. smegmatis mc2155 (línea azul) representa a la cepa no mutada M. smegmatis mc2155.

4.5 Estudio mediante mutagénesis insercional del gen MSMEG_1543

El gen MSMEG_1543, que codifica una aldehído deshidrogenasa inducible por EPTC (S-etil dipropiltiocarbamato) aparece inducido en los microarrays de colesterol frente a glicerol (véase apartado 3.1 resultados, tabla 19). Este gen no parece estar regulado por KstR1 o KstR2 por lo que se postula que su inducción puede estar relacionada con una respuesta a estrés producida por el colesterol. La interrupción del gen mediante la inserción de pJQ200x no altera el crecimiento en colesterol (Figura 58), lo que apoya esta hipótesis.

181 Resultados

Crecimiento en colesterol 1,8 mM. M. smegmatis::MSMEG_1543

10

1

600 M. smegmat is mc²155 M. smegmat is::MSMEG_1543

DO 0,1

0,01 020406080100

Tiempo (h)

Figura 58. Diferencia de crecimiento en colesterol de M. smegmatis::MSMEG_1543 y M. smegmatis mc2155. Crecimiento en medio mínimo 457 con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono. M. smegmatis::MSMEG_1543 (línea naranja) representa a M. smegmatis mc2155 con el gen MSMEG_1543 interrumpido mediante inserción de pJQ200x. M. smegmatis mc2155 (línea azul) representa a la cepa no mutada M. smegmatis mc2155.

4.6 Estudio mediante mutagénesis insercional del gen MSMEG_3519

El producto de MSMEG_3519, un gen inducido diferencialmente en colesterol (véase apartado 3.1 de resultados, tabla 18), ha sido identificado como una 2- nitropropano dioxigenasa (NDP), una de las enzimas oxidantes de nitroalcanos, que catalizan la desnitrificación oxidativa de nitroalcanos a compuestos carbonílicos y nitritos. NDP es un miembro de la familia de las flavin oxidoreductasas NAD(P)H-dependientes. Este gen así como algunos genes adyacentes (MSMEG_3515, MSMEG_3516) parecen estar bajo el control de KstR1 (Kendall et al., 2007). Sin embargo, la interrupción del gen MSMEG_3519 no produce una disminución en el crecimiento de M. smegmatis en colesterol (Figura 59), lo que podría indicar que, en caso de que este gen efectivamente participe en la degradación del colesterol, podría ser complementado por otro gen alternativo.

182 Resultados

Crecimiento en colesterol 1,8 mM. M. smegmatis::MSMEG_3519

10

1

600 M. smegmat is mc²155 M. smegmat is::MSMEG_3519 DO 0,1

0,01 050100 Tiempo (h)

Figura 59. Diferencia de crecimiento en colesterol de M. smegmatis::MSMEG_3519 y M. smegmatis mc2155. Crecimiento en medio mínimo 457 con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono. M. smegmatis::MSMEG_3519 (línea naranja) representa a M. smegmatis mc2155 con el gen MSMEG_3519 interrumpido mediante inserción de pJQ200x. M. smegmatis mc2155 (línea azul) representa a la cepa no mutada M. smegmatis mc2155.

5. Introducción al estudio de la regulación transcripcional del catabolismo del colesterol por las proteínas represoras KstR y KstR2

Como se ha visto en el apartado 3 de esta sección de Resultados, gran parte de los genes que se han relacionado con el catabolismo del colesterol en M. smegmatis mc2155 están regulados por alguno de los dos represores descritos hasta la fecha: KstR (Kendall et al., 2007) o KstR2 (Kendall et al., 2010). Ambos pertenecen a la familia de reguladores transcripcionales TetR, una familia bien representada y ampliamente distribuida entre las bacterias, cuyos miembros presentan un motivo de unión a DNA hélice-giro-hélice (HTH) (Ramos et al., 2005). Para ambos reguladores se han identificado secuencias de unión en la región 5’ de distintos genes y operones en M. smegmatis mc2155, aproximadamente 32 secuencias para KstR y 3 para KstR2. En el caso de KstR, se ha podido demostrar su unión a la región 5’ del gen KstR en M. tuberculosis

183 Resultados

(Kendall et al., 2007). En el caso de KstR2, se ha demostrado su unión a tres regiones con secuencias consenso en M. tuberculosis (Kendall et al., 2010).

En este apartado se presentan los resultados de los estudios llevados a cabo sobre algunos aspectos funcionales de ambos reguladores.

5. 1 Ensayos de crecimiento con los mutantes de los reguladores KstR y KstR2

Para comenzar el estudio de estos reguladores, se analizó el efecto que tienen sobre el crecimiento de M. smegmatis mc2155 distintos mutantes en los genes reguladores. Estos mutantes se construyeron mediante deleción (Kendall et al., 2007; Kendall et al., 2010) y actualmente se dispone de tres mutantes: M. smegmatisΔkstR, M. smegmatisΔkstR2 y M. smegmatisΔkstR/ΔkstR2, que corresponden respectivamente a un mutante en el gen kstR (ΔkstR), otro en el gen kstR2 (ΔkstR2), y un tercer mutante doble que posee los dos genes reguladores delecionados (ΔkstR/ΔkstR2). Se comparó el crecimiento de estos tres mutantes en un medio con colesterol 1,8 mM en β-ciclodextrina como fuente de carbono frente al crecimiento de la cepa salvaje. Dado que en los tres mutantes se encuentran desreprimidos un gran número de genes relacionados con el catabolismo del colesterol, se podría esperar un aumento en la capacidad o velocidad de crecimiento en colesterol en los mismos, pero no se encontraron diferencias respecto a la cepa control en ninguno de ellos. (Figura 60). Este resultado parece indicar que KstR y KstR2 dejan de ejercer su acción represora de manera rápida cuando existe colesterol en el medio. Por este motivo no se aprecian diferencias en el crecimiento de la cepa salvaje en colesterol respecto a los mutantes en estos reguladores.

184 Resultados

1

mc²155 ΔkstR 600 0,1 ΔkstR2 DO ΔkstR/kstR2

0,01 0 50 100 150 Tiempo (h)

Figura 60. Crecimiento en colesterol 1,8 mM-ciclodextrina de los distintos mutantes en los reguladores KstR y KstR2 frente al crecimiento de la cepa M. smegmatis mc2155. Como se puede observar en la gráfica, no se aprecian diferencias en la capacidad o velocidad de crecimiento en colesterol de los distintos mutantes KstR y KstR2 frente a la cepa salvaje M. smegmatis mc2155.

5.2 Introducción al estudio del represor transcripcional KstR

El regulador KstR perteneciente a la familia TetR está implicado en el control directo de 83 genes en M. smegmatis y de 74 en M. tuberculosis (Kendall et al., 2007). En un primer momento, se apuntó que estos genes podrían estar implicados en la utilización de diversos lípidos, no solo el colesterol, como fuente de energía (Kendall et al., 2007). Los resultados presentados en el apartado 3 de esta sección sin embargo sugieren que el colesterol por sí solo es capaz de producir la inducción de la gran mayoría de ellos. Parece que, para ejercer su acción represora, KstR se une a un motivo conservado (TnnAACnnGTTnnA) que ha sido localizado en su propio promotor y en 31 regiones intergénicas del genoma de M. smegmatis que preceden a un gran número de genes y operones relacionados con el catabolismo del colesterol (Kendall et al., 2007). Se ha comprobado que la proteína KstR de M. tuberculosis (KstRMtb) se une a una sonda

185 Resultados de DNA que contiene este motivo conservado de su región promotora (Kendall et al., 2007). Así mismo, se comprobó mediante cromatografía de exclusión molecular (SEC) que la unión a DNA se lleva a cabo como un dímero (Kendall et al., 2007). Con el fin de estudiar la regulación mediada por la proteína KstR de M. smegmatis (KstRMsm), se procedió a la clonación del gen kstR y a la realización de distintos ensayos in vitro para estudiar la interacción de KstR con sus regiones operadoras. Para ello se eligió la región que precede al gen MSMEG_5228, uno de los genes pertenecientes al regulón de KstR (Kendall et al., 2007) que codifica la 3-β-hidroxiesteroide deshidrogenasa (3-β HSDMS) ampliamente estudiada en este trabajo y de la que se ha comprobado su capacidad de catalizar el primer paso en el catabolismo del colesterol, la transformación del colesterol en 4- colesten-3-ona (apartado 2 de Resultados).

5.2.1 Caracterización del promotor P5228

El gen MSMEG_5228 codifica la proteína 3-β HSDMS responsable (como se ha demostrado en este trabajo) de realizar el primer paso de la ruta de degradación del colesterol. El promotor de dicho gen, P5228, contiene una probable secuencia operadora para el regulador KstR (Kendall et al., 2007) aunque hasta la fecha no se había demostrado experimentalmente. Con el fin de caracterizar el promotor P5228, se realizó una fusión de la región promotora (situada entre los genes MSMEG_5227 y MSMEG_5228) con el gen marcador lacZ. El fragmento que portaba la región promotora se amplificó por PCR a partir de DNA cromosómico utilizando los oligonucleótidos 5228pUJ9 F y 5228pUJ9 R. El fragmento amplificado de 191 pb se digirió con las enzimas de restricción EcoRI y BamHI y se clonó en el plásmido pUJ9. El plásmido resultante pUJ9-5228 se secuenció para confirmar que la secuencia de nucleótidos del fragmento clonado era la correcta (Fig. 61 B).

186 Resultados

5.2.1.1 Identificación del sitio de inicio de la transcripción del promotor

P5228

Para determinar el sitio de inicio de la transcripción se utilizó la técnica de extensión del cebador o primer extension utilizando el oligonucleótido Lac57 y como molde el plásmido pUJ9-5228. Como resultado se obtuvo una monohebra de cDNA cuyo tamaño coincidía con el tránscrito debido al promotor P5228. Sorprendentemente se comprobó que la transcripción comienza en el codón de iniciación (ATG) de la traducción del gen MSMEG_5228 (Fig 61 A). Este resultado indica que por la posición del inicio el mRNA transcrito a partir de P5228 es un mRNA denominado leaderless, es decir, un mRNA que carece de la región 5’ no traducida (5’UTR) que normalmente contiene la secuencia Shine-Dalgarno (SD) (Moll et al., 2002). Justo aguas arriba del sitio de inicio de la transcripción se encuentra una posible caja −10 (TATGCT) cuya secuencia se ha reconocido en micobacterias (Gomez y Smith, 2000) y a 17 pb de ésta se encuentra una posible caja −35 (TCGAAA) que difiere en un nucleótido de regiones −35 consenso reconocidas en micobacterias (Gomez y Smith, 2000).

187 Resultados

+1 T G C A

A A A G T C A A T A C G A C G C C C G T A C

A

5228pUJ9 F

TTGGATGATTCGCTGCAGCTCTGGGAGCGTGGCGAGGCGCTGGCGAAACGCTGTGAAGAGCACTTAGCCGGAG CGCGTCAGCGCGTCGAGCAGGCGATCGCCGCCCGCGAGGCCGACGAGGACTGAAATGCGCGTAGTGCCCGCCG CTCACCATCGAAACTGGAACGTGTTTCAGTTATGCTGCGGGCATG

5228pUJ9 R B

Figura 61. Localización del sitio de inicio de la transcripción en el promotor P5228. A. Ensayo de extensión del cebador. El experimento de extensión del cebador se realizó según se detalla en el apartado 7.6 de Materiales y Métodos a partir del RNA total aislado de células de las cepas E. coli DH10B conteniendo el plásmido pUJ9-5228. Se utilizó el oligonucleótido Lac57, el cual hibrida entre los nucleótidos 39 y 62 en posición 3’ respecto al residuo de adenina del codón de inicio de la traducción del gen lacZ (Tabla 3) para producir la extensión. La localización del producto de extensión se determinó comparándolo con el patrón de secuencia del promotor utilizando el mismo oligonucleótido Lac57 (calles T, G, C, A). En el lateral derecho de la figura se muestra la secuencia

188 Resultados de nucleótidos que flanquea el sitio +1 (señalado en rojo), de la hebra no codificante. B. Secuencia del promotor P5228. En azul se han marcado las zonas donde hibridan los oligonucleótidos 5228pUJ9 F y 5228pUJ9 R utilizados para la amplificación de esta región promotora. En gris se ha marcado el supuesto sitio −10 de la región promotora del gen. El posible sitio −35 se ha señalado en rosa. En rojo se ha marcado el sitio +1 de inicio de la transcripción, que coincide con la adenina del codón de iniciación del gen MSMEG_5228, y en verde el final del gen (codón STOP) que precede a MSMEG_5228.

5.2.2 Regulación del promotor P5228 por KstR

La región promotora del gen MSMEG_5228 así como el principio de este gen se analizó con el fin de diseñar los oligonucleótidos necesarios para amplificar una sonda de DNA adecuada para el análisis de su regulación mediante KstR. Esta región se muestra en la figura 62 donde se pueden apreciar las zonas donde hibridan los oligonucleótidos 5228 FP F y 5228 FP R. La amplificación de la región comprendida entre estas zonas da lugar a la sonda 5228 FP (196 pb). En la figura se ha marcado el supuesto sitio −10 de la región promotora del gen. Este supuesto sitio −10 de MSMEG_5228 (TATGCT) se sitúa a una distancia de dos bases del motivo de unión a KstR (señalado en la figura). La posible caja −35 se encuentra a una base de distancia del motivo de unión a KstR. Aunque no coincide exactamente (por una posición de diferencia) con regiones −35 conocidas (Gomez y Smith, 2000), se sabe que las regiones −35 micobacterianas toleran una gran variedad de secuencias (Bashyam et al., 1996). En la figura también se han marcado el codón de iniciación de MSMEG_5228, y el final del gen (codón STOP) que precede a MSMEG_5228.

189 Resultados

5228 FP F TCAGCGCGTCGAGCAGGCGATCGCCGCCCGCGAGGCCGACGAGGACTGAAATGCGCGTAGTGCCCGCCGCTCA CCATCGAAACTGGAACGTGTTTCAGTTATGCTGCGGGCATGGCTGACTCCACCACCGACCTCGGGCG GATCCTGGTCACCGGGGGTTCCGGCTTCGTCGGCGCCAACCTGGTCACCGAACTGC 5228 FP R

Figura 62. Región amplificada por la sonda 5228 FP. En azul se han marcado las zonas donde hibridan los oligonucleótidos 5228 FP F y 5228 FP R. La amplificación de la región comprendida entre estas zonas da lugar a la sonda 5228 FP. En gris se ha marcado el supuesto sitio −10 de la región promotora del gen. El motivo de unión a KstR se ha señalado en rojo. El posible sitio −35 se ha señalado en rosa. En amarillo se ha marcado el codón de iniciación de MSMEG_5228, y en verde el final del gen (codón STOP) que precede a MSMEG_5228.

5.2.2.1 Clonación, hiperexpresión y purificación de la proteína KstRMsm

Para caracterizar el mecanismo de regulación mediado por KstRMsm se procedió en primer lugar a la clonación del gen kstRMsm (MSMEG_6042). Para ello, se amplificó por PCR y se subclonó en el vector de hiperexpresión pET-29a (+), fusionando 6 tripletes en fase en su extremo 3’ que codifican un tag de 6His, dando como resultado el plásmido pET6042 (Fig. 63). Este plásmido fue posteriormente transferido a la cepa E. coli BL21 (DE3) y los extractos proteicos de la cepa E. coli BL21 (DE3) (pET6042) fueron analizados mediante SDS-PAGE. Se probaron distintas condiciones de cultivo, y finalmente se seleccionaron las descritas en el apartado 5.3 de Materiales y Métodos (inducción de cultivos a

DO600 0,6 con IPTG 200 μM durante 3 h a 37 ºC), que dan lugar a la aparición de una banda de hiperproducción cuyo tamaño aproximado coincide con el predicho de 27,7 kDa (24,84 kDa + 2,86 kDa) para KstR fusionada con un tag de 6His (Kendall et al., 2007) (Figura 64). La proteína de fusión fue purificada a homogeneidad electroforética a partir del extracto de E. coli mediante cromatografía de afinidad utilizando columnas de níquel-nitrilotriacetato en gel de sílice (véase apartado 5.3 de Materiales y Métodos) (figura 64).

190 Resultados

NdeI XhoI ApR

MSMEG_6042

Ligación pGEM®-T Easy (3,0 kb)

pET6042 F pET6042 R ori

Polilinker

ApR KmR PT7

pGEM6042 pET-29a(+) lacI (3,7kb) (5,4 kb) Digestión

ori ori Ligación

KmR

PT7 pET6042 (6,1 kb)

lacI

ori

Figura 63. Representación esquemática de la construcción del plásmido pET6042. El gen kstR (MSMEG_6042) fue amplificado por PCR utilizando la pareja de oligonucleótidos pET6042 F y pET6042 R (Tabla 3 de Materiales y Métodos) y DNA genómico de M. smegmatis mc2155 como molde. El oligonucleótido pET6042 R fue diseñado eliminando el codón stop del gen kstR e introduciendo en su lugar la diana de restricción XhoI. El gen se clonó directamente en el vector pGEMT-easy originando el plásmido pGEMT6042. Posteriormente, el fragmento que contenía el gen kstR fue subclonado en el vector pET-29a (+) como un inserto NdeI/XhoI originando el plásmido pET6042 que expresa un gen kstR cuyo extremo 3’ tiene fusionados en fase 6 tripletes que codifican un tag de 6His. Las abreviaturas utilizadas son: ApR, gen que confiere resistencia a ampicilina; KmR, gen que confiere resistencia a kanamicina; lacI, gen que codifica el represor LacI; PT7, promotor del gen 10 del fago T7; ori, origen de replicación.

191 Resultados

Las fracciones de elución de la columna seleccionadas se concentraron y se eliminó el imidazol de las mismas (véase el apartado 5.3 de Materiales y Métodos). La concentración de proteína pura KstR-His se calculó espectrofotométricamente utilizando un Nanodrop. Siguiendo este protocolo, se obtuvieron concentraciones de entre 80-100 μM de proteína purificada a partir de 100 ml de cultivo inicial.

KDa 12345 6

200,0

116,0 97,4

66 ,0

45 ,0

31,0

21,5

14,4

Figura 64. Purificación de la proteína KstR-His a partir de extractos de E. coli BL21 (DE3) (pET6042). Se muestran las fracciones de la proteína KstR-His eluída desde columnas de níquel utilizando distintas concentraciones de imidazol. 1. Marcadores de peso molecular (en el margen izquierdo de la figura se detallan los pesos moleculares de los marcadores). 2-6. Fracciones de un extracto de E. coli BL21 (DE3) (pET6042) eluído tras la cromatografía de afinidad utilizando sucesivamente las distintas concentraciones de imidazol: 2. 10 mM. 3. 200 mM. 4. 300 mM. 5. 500 mM. 6. 1 M. En todas las calles se cargaron 5 μl de muestra.

5.2.2.2 Unión de KstR a la región intergénica 5228

Con el fin de estudiar el mecanismo de represión ejercido por KstR se realizaron ensayos de retardo en gel para analizar la capacidad de unión de esta proteína a la región intergénica 5228. Para ello en primer lugar se utilizó como sonda de DNA el fragmento 5228 FP (196 pb) y concentraciones crecientes de extracto proteico E. coli BL21 (DE3) (pET6042) (0,5-10 μg totales) (Fig. 65). Los resultados muestran que el extracto que contiene la proteína KstR se une a la

192 Resultados región intergénica 5228, mientras que el extracto obtenido a partir de la cepa con el plásmido sin inserto no (Fig. 65). Además, esta unión es específica, ya que cuando se añade a la mezcla de reacción la sonda 5228 FP no marcada no se observó retardo debido a la proteína KstR (datos no mostrados).

Complejo 5228 FP/Extracto 6042

Sonda 5228 FP

1 2 3 4 5

Figura 65. Ensayos de retardo en gel con el extracto proteico E. coli BL21 (DE3) (pET6042) sobre la sonda 5228 FP. 1. Sonda sin proteína. 2. Sonda con extracto control E. coli BL21 (DE3) conteniendo el plásmido pET29 sin inserto. Se añadieron 20 μg de proteínas totales. 3-5, sonda con concentraciones crecientes de extracto proteico E. coli BL21 (DE3) (pET6042): 3. 0,5 μg de proteínas totales. 4. 5 μg de proteínas totales. 5. 10 μg de proteínas totales. Los ensayos de retardo en gel se realizaron como se indica en el apartado 6.2 de Materiales y Métodos. La localización de las sondas y los complejos sonda/proteína se indican con flechas.

Los ensayos de retardo en gel también se llevaron a cabo adicionando cantidades crecientes de KstR purificada (Fig. 66). El resultado muestra que el complejo KstR-DNA se observa ya a concentraciones muy bajas de la proteína cercanas a 20 nM. La mayoría de los represores transcripcionales descritos ejercen su efecto represor mediante un mecanismo de unión a la región operadora que bloquearía la unión de la RNA polimerasa, o bien la elongación del mRNA. La represión se anularía en presencia de la molécula inductora, que provocaría un cambio conformacional en el represor y la posterior desunión de éste al DNA, permitiendo así la transcripción. Para comprobar si KstR era capaz de desunirse del DNA en presencia de colesterol, se realizaron ensayos de retardo en gel en presencia de colesterol disuelto en Triton X-100 al 10% (0,25-4,00 mM). En todas las

193 Resultados condiciones ensayadas la proteína KstR permanecía unida a la sonda 5228 FP en presencia de este compuesto, y tampoco se observó una disminución de la afinidad del regulador por la sonda (resultados no mostrados).

Complejo 5228 FP/KstR

Sonda 5228 FP

1 2 3 4 5 6 7 8

Figura 66. Ensayo de retardo en gel con la proteína KstR purificada sobre la sonda 5228 FP. 1. Sonda sin proteína. 2-8, concentraciones crecientes de sonda con la proteína KstR-His6: 2. 2,5 nM. 3. 5 nM. 4. 10 nM. 5. 20 nM. 6. 40 nM. 7. 80 nM. 8. 100 nM. Los ensayos de retardo en gel se realizaron como se indica en el apartado 6.2 de Materiales y Métodos. La localización de las sondas y los complejos sonda/proteína se indican con flechas.

5.2.2.3 Determinación de las regiones operadoras de KstR en la región promotora de MSMEG_5228

Para identificar los sitios de unión de KstR a la región promotora de MSMEG_5228 se analizó el complejo KstR-DNA mediante un ensayo de protección de la sonda de DNA 5228 FP a la digestión con DNasaI con concentraciones crecientes de extracto proteico de E. coli BL21 (DE3) (pET6042) (Fig. 67, calles 4-6) y proteína KstR purificada (Fig. 67, calles 7-10) (véase el apartado 6.3 de Materiales y Métodos). El resultado reveló que el operador de KstR es una secuencia de 31 nucleótidos, localizados entre la posición −5 y −35 respecto al codón de inicio ATG del gen MSMEG_5228, siendo curiosamente la huella obtenida con extractos proteicos más nítida que la hallada con la proteína KstR pura. Esta región solapa por tanto con las posibles cajas −10 y −35, lo que sugiere que la unión de KstR al operador impediría la unión de la RNA polimerasa y con ello el inicio de la transcripción desde el promotor.

194 Resultados

A+G DNA Control Ep Ep6042 KstR DNA

1 2 3 4 5 6 7 8 9 10 11

C G T C G T A T T G A C T T T G T G C A A G G T C A A A G C T

Figura 67. Identificación de los sitios de unión de la proteína KstR a la región promotora de MSMEG_5228 mediante experimentos de protección frente a la digestión con DNasaI. La calle señalada como A+G muestra la reacción de secuenciación de la sonda 5228 FP por el método de Maxam y Gilbert. Como sonda se utilizó el fragmento 5228 FP marcado en el extremo 5’. Como control se utilizaron 5 y 20 μg de extracto de E. coli BL21 (DE3) conteniendo el plásmido pET29 sin inserto (calles 2 y 3, respectivamente). Los ensayos se llevaron a cabo tanto con extracto proteico E. coli BL21 (DE3) (pET6042) como con proteína KstR pura. Para los experimentos realizados con extractos se utilizaron 5, 10 y 20 μg de proteínas totales (calles 4, 5 y 6, respectivamente). Las concentraciones de proteína KstR pura utilizadas en los experimentos fueron 2,5, 40, 100 y 400 nM (calles 7, 8, 9 y 10, respectivamente). A la izquierda de la figura se muestra la secuencia de la región protegida por KstR, señalándose en rojo el motivo de unión a KstR (cuyas regiones palindrómicas se señalan con flechas), en azul el supuesto sitio −10 y en verde el supuesto sitio −35.

195 Resultados

5.3 Estudio de la regulación mediada por KstR2 mediante la técnica de microarrays La presencia y posible función del regulador transcripcional KstR2 se hizo evidente tras el análisis de la región regulada por KstR (Kendall et al., 2007) ya que dentro de esta región destacaba una zona formada por 19 genes (MSMEG_5999-MSMEG_6017) cuya expresión no estaba afectada en el mutante del regulador KstR. En R. jostii RHA1 los correspondientes genes ortólogos estaban inducidos en colesterol (van der Geize et al., 2007). Así mismo, genes de M. smegmatis mc2155 situados dentro de esta zona también presentaron inducción en colesterol en los experimentos con microarrays realizados durante esta tesis doctoral (véase apartado 3 de Resultados). Estas pruebas apoyaban la implicación de este conjunto de genes en el catabolismo del colesterol. Dentro de esta zona se localiza un gen que codifica una segunda proteína que presenta similitud con reguladores tipo TetR (MSMEG_6009), lo que sugería la posible implicación de esta proteína, denominada KstR2 (Kendall et al., 2010) en la regulación de estos genes, así como la posibilidad de que se tratase de un represor transcripcional, como en el caso de KstR y de la mayoría de los reguladores tipo TetR (Ramos et al., 2005). Mediante el programa MEME se identificó un posible motivo de unión para KstR2 (AnCAAGnnCTTGnT) y se encontraron tres de ellos en el genoma de M. smegmatis y M. tuberculosis, dos de ellos situados en regiones intergénicas de genes divergentes cercanos a kstR2 y el tercero en la región que lo precede (Kendall et al., 2010) (Fig. 68). Estos datos apoyaban el papel de KstR2 como regulador de genes relacionados con el catabolismo del colesterol. Para demostrar esta posible función reguladora, se llevaron a cabo experimentos de expresión diferencial de un mutante de deleción del gen kstR2 frente a la cepa salvaje M. smegmatis mc2155. Estos experimentos de expresión diferencial mediante microarrays se han realizado en colaboración con el grupo de Neil G. Stoker en el Departamento de Patología y enfermedades Infecciosas del Royal Veterinary College de Londres.

196 Resultados

5.3.1 Resultados de los análisis mediante microarrays de M. smegmatisΔkstR2

Para determinar los genes de M. smegmatis mc2155 regulados por KstR2, se realizaron estudios de expresión diferencial de una cepa con el gen kstR2 delecionado frente a la cepa salvaje, ambas crecidas en medio rico (7H9-ADC) utilizando la técnica de los microarrays (véase el apartado 7.5 de Materiales y métodos).

6064 6082

5999 6000 6001 6002 6003 6004 6005 6006 6007 6008 6009 6010 6011 6012 6013 6014 6015 6016 6017 [15] [61] (4) (4) (4) [43] (4) [7] [88] (8) [314] [125] (4) [105] (1) (4) (4) [17]

Figura 68. Región del genoma de M. smegmatis mc2155 controlada por KstR2. Se han señalado con una estrella aquellos genes cuya represión (o la del operón del que forman parte) por KstR2 se ha comprobado mediante microarrays o RTq-PCR. Con una flecha roja se han señalado las 3 regiones intergénicas donde se han hallado motivos de unión para KstR2. Los números que se muestran por debajo de los genes señalan el número de pb entre genes adyacentes. Los números entre corchetes indican separación y los números entre paréntesis solapamiento. Los números que aparecen sobre las líneas en diagonal indican las posiciones del genoma, en kb, entre las que se encuentra esta región.

Los resultados muestran un total de 8 genes significativamente inducidos (con un valor de P<0,05) en esta zona, sin embargo se ha asumido que en total son 14 los genes que presentan inducción en el mutante (Tabla 23), ya que aunque el valor de P es mayor de 0,05, se encuentran dentro de un operón inducido. Además en algunos de los genes se ha confirmado su inducción mediante RTq-PCR (Kendall et al., 2010). Los niveles de inducción de los genes MSMEG_5999-MSMEG_6004 en el mutante en KstR2 son muy elevados. Estos genes parecen estar organizados en dos operones divergentes, MSMEG_6001-MSMEG_6004 y MSMEG_6000-

197 Resultados

MSMEG_5999, y en la región intergénica de 61 pb que los separa se encuentra un motivo de unión para KstR2 (Fig.68). Los genes MSMEG_6005-MSMEG_6007 parecen no estar regulados por KstR2. Su expresión no está alterada significativamente en los microarrays y tampoco presentan motivos de unión para KstR2 en las regiones que los preceden. Estos datos se ven apoyados por el hecho de que estos genes no aparecen inducidos en colesterol en los microarrays de expresión diferencial en este esteroide (véase el apartado 3 de Resultados), y porque tampoco presentan genes ortólogos en M. tuberculosis o R. jostii (Kendall et al., 2010). El gen MSMEG_6009, que codifica la proteína KstR2, se encuentra ausente en el mutante, ya que está delecionado. El gen situado tras kstR2, MSMEG_6008, parece formar un operón con él, y se detectan niveles de expresión muy elevados en el mutante. Sin embargo, la expresión del gen MSMEG_6010 no se encuentra alterada en el mutante y tampoco muestra inducción en colesterol (véase el apartado 3 de Resultados), lo que sugiere que KstR2 se une a la región intergénica entre MSMEG_6009 y MSMEG_6010 para regular la expresión génica en una sola dirección (Kendall et al., 2010). Los genes MSMEG_6011-MSMEG_6017 también aparecen inducidos en el mutante y parecen organizarse en dos operones divergentes, MSMEG_6012- MSMEG_6011 y MSMEG_6013-MSMEG_6017 (Fig. 68). En la región intergénica de 105 pb que separa a MSMEG_6012 de MSMEG_6013 se encuentra un motivo de unión para KstR2.

198 Resultados

Gen de M. Smegmatis Fold Gen de M. mc²155 change tuberculosis Función MSMEG_5999 140,3* Rv3548c Deshidrogenasa de cadena corta MSMEG_6000 2017,0* Rv3549c Deshidrogenasa de cadena corta MSMEG_6001 250,7* Rv3550 Enoil-CoA hidratasa (echA20) MSMEG_6002 150,5* Rv3551 Coenzima A transferasa, subunidad A MSMEG_6003 110,6* Rv3552 Coenzima A transferasa, subunidad B

MSMEG_6004 5,2 Rv3553 Oxidorreductasa, familia 2-nitropropano dioxigenasas

MSMEG_6005 2,3 _ Proteína hipotética MSMEG_6006 1,1 _ Proteína hipotética MSMEG_6007 -1,1 _ Transportador de difusión de cationes MSMEG_6008 88,8* Rv3556c Acetil-CoA acetiltransferasa (fadA6) MSMEG_6009 -1,2 Rv3557c Regulador transcripcional de la familia TetR (kstR2) MSMEG_6010 -3,0 _ Proteína hipotética

MSMEG_6011 3,2 Rv3559c Deshidrogenasa de cadena corta

MSMEG_6012 173,6* Rv3560c Supuesta acil-CoA deshidrogenasa (fadE30) MSMEG_6013 2,2 Rv3561 Probable CoA sintetasa de ácidos grasos(fadD3) MSMEG_6014 1,6 Rv3562 Supuesta acil-CoA deshidrogenasa (fadE31) MSMEG_6015 15,5* Rv3563 Supuesta acil-CoA deshidrogenasa (fadE32) MSMEG_6016 9,5 Rv3564 Supuesta acil-CoA deshidrogenasa

MSMEG_6017 100,8 Rv3565 Aminotransferasa, clase I

Tabla 23. Análisis de expresión de ΔkstR2Msm y el regulón kstR2. Se muestran los valores de fold change de los genes de la región regulada por KstR2. Aquellos señalados con un asterisco presentaron un valor de P<0,05. Los genes MSMEG_6005-MSMEG_6007 y MSMEG_6010 no se consideran inducidos, así como el gen MSMEG_6009, que codifica KstR2 y por tanto está delecionado en el mutante. Se señalan los genes ortólogos en M. tuberculosis y la función de las proteínas codificadas. Tabla adaptada de Kendall et al., 2010.

199

200 Discusión

V. DISCUSIÓN

201 Discusión

202 Discusión V. DISCUSIÓN

1. Estudio del potencial catabólico de degradación de esteroides de M. smegmatis mc2155

A lo largo de esta tesis doctoral se ha abordado el estudio de la degradación de esteroides, principalmente el colesterol, llevado a cabo por la bacteria M. smegmatis mc2155. Así, uno de los primeros objetivos fue la realización de un perfil de los compuestos esteroideos que pueden ser utilizados como fuente de carbono y energía por este microorganismo. El crecimiento de M. smegmatis mc2155 en diferentes esteroides parece bastante específico para aquellos de cadena lateral de 8 átomos de carbono como son el colesterol y la 4-colesten-3-ona. Su crecimiento es bastante más limitado en derivados de estas moléculas que son intermediarios de la ruta de degradación del colesterol, como AD y ADD, y en otros esteroides sin cadena lateral o con una cadena lateral más corta que la del colesterol, como son la androsterona, dehidroandrosterona, β-estradiol o pregnenolona, entre otros (véase apartado 1.1 de Resultados). Este comportamiento sugiere la importancia que la presencia de la cadena lateral puede tener en la capacidad de crecimiento en esteroides de M. smegmatis. Comparativamente, en especies del género Rhodococcus se ha observado el crecimiento en un mayor rango de compuestos esteroídicos. Por ejemplo R. erythropolis SQ1 es capaz de degradar AD, ADD y 9α-hidroxi-4- androsten-3,17-diona (van der Geize et al., 2000). R. jostii RHA1 por su parte es capaz de crecer, además de en colesterol, en AD, 5-α-colestanol, 5-α-colestanona, ácido cólico, progesterona y β-sitosterol, aunque como en el caso de M. smegmatis, su crecimiento es deficiente en esteroides como el ergosterol o el estradiol (Mohn et al., 2008). Curiosamente, un mutante de R. jostii RHA1 en el locus mce4, que está implicado en el transporte de esteroides, pierde la capacidad de crecimiento en colesterol, 5-α-colestanol, 5-α-colestanona y en β- sitosterol, mientras que la conserva en AD, ácido cólico y progesterona (Mohn et al., 2008). El colesterol, 5-α-colestanol, 5-α-colestanona y β-sitosterol tienen

203 Discusión estructuras muy similares con largas cadenas laterales (de 8 átomos de carbono las 3 primeras y de 10 el β-sitosterol). Las estructuras de AD, ácido cólico y progesterona tienen cadenas laterales más cortas y polares (la AD presenta un grupo ceto en el C-17 y las cadenas laterales del ácido cólico y la progesterona son de 5 y de 2 átomos de carbono respectivamente). Este resultado sugiere que estos esteroides con cadena lateral más corta y polar podrían ser transportados en R. jostii RHA1 por otro sistema distinto del constituido por el locus mce4 (Mohn et al., 2008). Esta hipótesis podría explicar el crecimiento deficiente de M. smegmatis en esteroides con cadena lateral corta, ya que esta bacteria podría carecer de un sistema de transporte eficiente para los mismos, por lo que su capacidad degradativa se centraría principalmente en los esteroides con cadena lateral larga, que se transportarían por el sistema codificado por el locus mce4 que M. smegmatis posee. Un caso aparte parece ser el del ergosterol, que a pesar de poseer una cadena lateral de 9 átomos de carbono permite un crecimiento limitado a M. smegmatis, pero curiosamente este comportamiento también se observa en R. jostii RHA1. Este hecho sugiere que la dificultad de crecimiento en este esteroide podría estar relacionada con otras propiedades estructurales. A este respecto podría tener importancia la existencia de un doble enlace en la cadena lateral del ergosterol más que la longitud de su cadena lateral.

2. Análisis de las enzimas que catalizan la transformación de colesterol en 4-colesten-3-ona en M. smegmatis mc2155

Otro de los objetivos de este trabajo fue el estudio de distintas proteínas posiblemente implicadas en el primer paso de degradación del colesterol. Así, dentro del apartado 2 de Resultados se han analizado 3 enzimas que podrían catalizar la transformación de colesterol en 4-colesten-3-ona. Sin embargo, se ha constatado este paso solo en dos de ellas, 3-β HSDMS y SDRMS. La tercera enzima, ChoDMS, que presenta una elevada identidad (83% cuantificada por ClustalW) con la ChoD de M. tuberculosis no ha demostrado ser activa en nuestros experimentos. En M. tuberculosis se verificó que un mutante en el gen

204 Discusión ksdD (que es incapaz de transformar AD en ADD y por tanto continuar la degradación de colesterol a partir de este paso) complementado con el gen choD (expresado bajo un promotor micobacteriano fuerte, el promotor de choque térmico Phsp65, e integrado en el cromosoma utilizando el vector integrativo pMV306) podía acumular temporalmente 4-colesten-3-ona, lo que sugería la capacidad de catalizar la oxidación de colesterol por ChoD (Brzostek et al., 2007). En ese mismo trabajo también se apuntó que el gen choD de M. tuberculosis clonado en un sistema de expresión de E. coli bajo el control de un promotor inducible por IPTG mostró actividad utilizando un ensayo colorimétrico. Sin embargo, no se verificó la conversión de colesterol en 4-colesten-3-ona, por lo que algunos autores cuestionan este resultado (Kreit y Sampson, 2009), y se inclinan por la opinión de que las enzimas tipo ChoD podrían no poseer actividad colesterol oxidasa, aunque sí pertenecer al grupo de las glucosa-metanol-colina (GMC) oxidorreductasas (Navas et al., 2001). Nuestros intentos de ensayar la actividad enzimática de ChoDMS en un sistema de expresión de E. coli (en nuestro caso utilizando el vector pET29) que se realizaron, además de con ensayos colorimétricos, con ensayos de LC/MS y mediante visualización de intermediarios radiactivos mediante TLC, no dieron lugar a resultados positivos. Este hecho pone en duda también para nosotros los datos obtenidos por Brzostek et al. (2007), ya que aunque su trabajo está realizado con la ChoD de M. tuberculosis ésta es muy similar a ChoDMS, y cabría esperar por tanto un comportamiento similar en ambas enzimas. Sin embargo, tampoco se puede descartar que la falta de actividad de

ChoDMS pueda deberse a que la proteína no se excreta o se pliega de manera adecuada en el sistema heterólogo utilizado. Por otra parte, cabe destacar que en este trabajo se ha demostrado que un mutante en el gen choDMS no presenta alterado su crecimiento en colesterol, lo que no es sorprendente dado que, como ya se ha apuntado, en este trabajo se han encontrado otras dos enzimas capaces de catalizar este paso enzimático en M. smegmatis.

Por otro lado, el gen choDMS (MSMEG_1604) se localiza en una zona del genoma de M. smegmatis que no parece tener ninguna relación con la degradación de esteroides (Fig. 69).

205 Discusión

MSMEG_1599:MSMEG_1599: FactorFactorsigma-70 sigma-70 RNA RNA polimerasa polimerasa MSMEG_1605:MSMEG_1605: Protei´ Proteínana reguladora reguladora del de transportetransporte dede fosfatofosfato MSMEG_1600:MSMEG_1600: Protei´ Proteínahipotéticana hipote´tica conservada conservada MSMEG_1606MSMEG_1606: : Benzoilformatodecarboxilasa Benzoilformato decarboxilasa MSMEG_1601:MSMEG_1601: Protei´ Proteínana hipote´ hipotéticatica conservada conservada MSMEG_1607MSMEG_1607:: SupuestaSupuestatautomerasa tautomerasa MSMEG_1602:MSMEG_1602: Inosina-5-monofosfato Inosina-5-monofosfato deshidrogenasa deshidrogenasa MSMEG_1608MSMEG_1608:: Glicosiltransferasa Glicosil transferasa MSMEG_1603:MSMEG_1603: Protei´na Proteína de de la la familia familia IMP IMP deshidrogenasa deshidrogenasa MSMEG_1609MSMEG_1609:: BetaBeta-fosfoglucomutasahidrolasa -fosfoglucomutasa hidrolasa

Figura 69. Región del genoma de M. smegmatis mc2155 circundante al gen MSMEG_1604. En el cuadro se indica la posible función de los productos de los genes de la zona. Información extraída del servidor CMR: http://cmr.jcvi.org/tigr-scripts/CMR/CmrHomePage.cgi

Al igual que sucede en el gen choDMS, el cual se ha comprobado que no se induce en presencia de colesterol y que no posee en su región promotora secuencias operadoras de KstR o KstR2, ninguno de los genes circundantes se ha visto implicado en el metabolismo del colesterol o inducido en su presencia, y ninguno de ellos presenta en su región promotora secuencias consenso para la unión de KstR o KstR2, que aunque como hemos visto no es requisito indispensable para inducirse en la presencia de colesterol, podría indicar una posible implicación de esta zona con el catabolismo del colesterol. La secuencia completa del genoma de M. leprae, un patógeno intracelular obligado, muestra una reducción dramática de genes funcionales, con una capacidad codificante menor del 50%. A pesar de esta reducción masiva de genes, el bacilo de la lepra ha conseguido preservar un grupo mínimo de genes, la mayoría de ellos compartidos con M. tuberculosis, que permiten su supervivencia en el hospedador dando lugar a las consiguientes manifestaciones patológicas. Uno de estos genes conservados y cuya expresión se ha comprobado in vivo en M. leprae es choD (Marques et al., 2008). La proteína codificada por este gen se encuentra en la fracción de proteínas presentes en la pared celular, donde se produciría la oxidación del colesterol. La pared celular parece de hecho un compartimento celular muy activo en la degradación lipídica en general en este

206 Discusión patógeno (Marques et al., 2008). Aunque M. leprae no parece contener la maquinaria metabólica necesaria para catabolizar completamente el colesterol, se ha propuesto que el colesterol es un factor necesario para su crecimiento en macrógafos (Kato, 1978). Además M. leprae es capaz de adquirir colesterol del medio ambiente y parece que incluso podría sintetizarlo (Lamb et al., 1998). Se desconoce aún el porqué de la necesidad de colesterol en M. leprae, y para qué lo oxida (supuestamente utilizando ChoD). Estos datos sugieren que esta proteína presente en general en todas las micobacterias no estaría implicada exclusivamente en el catabolismo del colesterol para su aprovechamiento como fuente de carbono y energía. El hecho de que un mutante en este gen en M. tuberculosis esté atenuado en ratones (Brzostek et al., 2007) puede sugerir que podría actuar sobre el colesterol de algún modo que favorezca su patogenicidad (mecanismo que compartiría con M. leprae). Un estudio in vitro sugiere que durante la invasión de macrófagos por parte de Rhodococcus equi, la lisis de la membrana está facilitada por la inducción de una colesterol oxidasa extracelular (Fuhrmann et al., 2002). Esta posible implicación en un mecanismo invasivo explicaría la presencia de ChoD en M. leprae, aunque el hecho de que esté también presente en bacterias no patógenas parece indicar que en principio su función no está exclusivamente relacionada con mecanismos de patogenicidad. Curiosamente, de los posibles genes relacionados con la degradación del colesterol, M. leprae tan sólo posee ortólogos a choD y a MSMEG_5228, que codifica la proteína 3-β-HSDMS. El gen kstR está presente como un pseudogen. La presencia de estos dos genes transformadores de colesterol pero no de los demás genes catabólicos de esta ruta apoya la posible implicación de este paso enzimático en patogénesis en esta bacteria.

Al contrario que ChoD, la enzimas 3-β HSDMS y SDRMS sí han presentado actividad deshidrogenasa en nuestros ensayos y se ha podido constatar la producción de 4-colesten-3-ona a partir de ambas proteínas, tanto con ensayos de LC/MS como mediante visualización de intermediarios radiactivos mediante TLC. Los genes que codifican ambas enzimas (MSMEG_5228 y MSMEG_5233, respectivamente) se sitúan próximos en el genoma (Fig. 70).

207 Discusión

MSMEG_5223:MSMEG_5223: ProteínaProtei´na hipotéticahipote´tica conservada MSMEG_5232:MSMEG_5232: Protei´Proteínana hipote´hipotéticatica MSMEG_5224MSMEG_5224:: Difosfato reductasa (ispH) MSMEG_5234:MSMEG_5234: Oxidorreductasa de la familia SCD/R MSMEG_5225MSMEG_5225:: ProteínaProtei´na hipotéticahipote´tica conservada MSMEG_5235:MSMEG_5235: Oxidorreductasa de la familia SCD/R MSMEG_5226MSMEG_5226:: Exodesoxiribonucleasa VII sub. MSMEG_5236:MSMEG_5236: Protei´ Proteínana de la familia dienolactona hidrolasa MSMEG_5227MSMEG_5227:: Exodesoxiribonucleasa VII sub. MSMEG_5237:DominioMSMEG_5237: Dominio de funciónfuncio´ndesconocida desconocida MSMEG_5229MSMEG_5229:: ProteínaProtei´na hipotéticahipote´tica MSMEG_5238:MSMEG_5238: Protei´Proteínana hipote´hipotéticatica conservada MSMEG_5230MSMEG_5230:: ProteínaProtei´na hipotéticahipote´tica conservada MSMEG_5239:MSMEG_5239: fructosa-1,6-bisfosfatasa,Fructosa-1,6-bisfosfatasa, clase II MSMEG_5231MSMEG_5231:: ProteínaProtei´na hipotéticahipote´tica

Figura 70. Región del genoma circundante a los genes MSMEG_5228 y MSMEG_5233. En el cuadro se indica la la posible función de los productos de los genes de la zona. Información extraída del servidor CMR: http://cmr.jcvi.org/tigr-scripts/CMR/CmrHomePage.cgi

Sus regiones promotoras presentan secuencias consenso del operador KstR, pero tan sólo MSMEG_5228 aparece inducido en el mutante del regulador KstR mediante la técnica de microarrays (Kendall et al., 2007). Este gen también aparece inducido en colesterol en los ensayos de expresión diferencial de M. smegmatis mediante microarrays realizados en esta tesis. El gen MSMEG_5233 no se encuentra inducido en los microarrays del mutante de KstR, ni en los microarrays de expresión diferencial en M. smegmatis en colesterol, aunque sí se puede apreciar una ligera inducción mediante RTq-

PCR. El hecho de que la proteína codificada por este gen, SDRMS, presente la misma actividad colesterol deshidrogenasa que 3-β HSDMS, sugiere que podría suplir la carencia de esta enzima. Los mutantes tanto en el gen MSMEG_5228 como en el gen MSMEG_5233 no presentan alterada su capacidad de crecimiento en colesterol, lo que sugiere que ninguna de las enzimas codificadas por estos dos genes ejerce su función de manera exclusiva, lo que apunta la posibilidad de que existan más genes que puedan catalizar este paso. La redundancia de genes que codifican una misma función puede indicar la versatilidad metabólica de M. smegmatis.

208 Discusión

3. Análisis global de los genes inducidos diferencialmente en colesterol en M. smegmatis mc2155

Uno de los grandes objetivos de esta tesis doctoral fue la búsqueda global de los genes implicados en la degradación del colesterol en M. smegmatis mc2155. Tras confirmarse mediante análisis in silico la implicación en esta ruta catabólica de los genes ortólogos a los implicados en la degradación de testosterona en C. testosteroni, la técnica de microarrays, validada mediante RTq-PCR y mutagénesis, nos aportó gran cantidad de información acerca de los posibles genes implicados en la degradación del colesterol a lo largo de todo el genoma de M. smegmatis mc2155. Estos datos se han contrastado con los resultados anteriormente obtenidos por otros investigadores, en particular con los estudios sobre los genes regulados por KstR, que se ha identificado como un represor de gran número de genes relacionados con el catabolismo del colesterol (Kendall et al., 2007) y con los estudios de expresión diferencial en colesterol de R. jostii RHA1 (van der Geize et al., 2007). El regulón KstR está formado por 84 genes; este elevado número sugería que no todos ellos debían estar implicados en la degradación del colesterol (Kendall et al., 2007). Sin embargo, nuestros resultados de expresión diferencial en colesterol de M. smegmatis mc2155 mediante microarrays presentados en este trabajo muestran que de hecho el colesterol por sí solo es capaz de inducir la gran mayoría de los genes del regulón KstR (70 incluyendo el operón mce4, cuya inducción en colesterol es pequeña pero cuya implicación en su transporte está demostrada) y además inducir los genes regulados por KstR2. Dado que ha sido posible asignarles una función específica dentro del catabolismo del colesterol a gran parte de ellos, parecería que estos dos regulones se han especializado en la degradación de este esteroide. La ruta de degradación de colesterol parece estar altamente conservada en R. jostii RHA1 y M. smegmatis mc2155, y las comparaciones in silico indican que así mismo está conservada en otras especies micobacterianas como M. tuberculosis, M. bovis y M. avium (van der Geize et al., 2007). Sin embargo, cabe

209 Discusión destacar algunas diferencias entre los genes que se han relacionado con el catabolismo del colesterol en R. jostii RHA1 y M. smegmatis mc2155 teniendo en cuenta sus respectivos análisis de expresión diferencial en presencia de colesterol. En primer lugar se ha sugerido un catabolismo distinto de los anillos C y D de colesterol para R. jostii RHA1 frente a las especies micobacterianas (van der Geize et al., 2007). En R. jostii RHA1, aparece inducido en colesterol el cluster ro06687-ro06698 constituido por genes que podrían relacionarse con el metabolismo de cicloalcanonas, entre los que se incluyen ro06698 y ro06693, que codifican una probable monooxigenasa y una lactona hidrolasa, respectivamente, que podrían ser identificadas con la Baeyer-Villiger monooxigenasa y la hidrolasa típicamente asociadas con la fisión de anillos de cicloalcanonas. Por estos datos se sugiere que este cluster podría estar implicado en la degradación del anillo esteroideo D del DOHNAA (Figura 5 de introducción, estructura 15) (van der Geize et al., 2007). Este cluster de genes no está conservado en las especies micobacterianas. Los datos obtenidos en el presente trabajo sugieren que en la mineralización del DOHNAA en M. smegmatis mc2155 están implicados los genes MSMEG_5996-MSMEG_6017. La degradación de alcanos cíclicos y policíclicos no se ha estudiado en profundidad, y existe una información limitada para especular sobre los mecanismos implicados en la degradación de los anillos C y D del colesterol, sin embargo, teniendo en cuenta que muchas proteínas codificadas por los genes de la región MSMEG_5996 a MSMEG_6017 son similares a enzimas asociadas con la β-oxidación de ácidos grasos, se puede asumir que la apertura de los anillos C y D podría ser llevada a cabo por actividades tiolasa, aunque este tipo de mecanismo de apertura mediante tiolasas no ha sido descrito hasta la fecha para alcanos cíclicos. R. jostii RHA1 posee genes ortólogos a estos de M. smegmatis (con la excepción notable de MSMEG_5997, que curiosamente no está tampoco presente en M. tuberculosis, aunque sí en C. testosteroni (orf33)), con lo cual de confirmarse su implicación en el metabolismo del DOHNAA es posible que R. jostii RHA1 dispusiese de dos clusters distintos para la mineralización de este compuesto.

210 Discusión

La segunda diferencia que podría dar lugar a un metabolismo distinto de los anillos C y D en las especies micobacterianas es la presencia (observada concretamente en M. bovis BCG y M. tuberculosis H37Rv) de un gen que codifica una N-acetil-transferasa en el operón hsa (Anderton et al., 2006) (que como se ha visto en este trabajo es el encargado de la transformación de 3-HSA en DOHNAA y ácido 2-hidroxihexa-2,4-dienoico (Figura 5 de Introducción, estructuras 11-15)). Se ha sugerido que esta enzima podría ser utilizada para transformar esta porción de la molécula del colesterol para obtener una función alternativa a su metabolismo completo, posiblemente relacionada con señalización o con el mantenimiento de la integridad de la pared celular (van der Geize et al., 2007). Sin embargo, un análisis detallado muestra que aunque en M. bovis BCG sí existe este gen al final del operón posiblemente ortólogo a hsa, en M. tuberculosis H37Rv no. La afirmación de la presencia de una N-acetil-transferasa en el operón hsa de M. tuberculosis H37Rv (Anderton et al., 2006) está basada en la primera anotación completa del genoma de M. tuberculosis H37Rv (Cole et al., 1998), que fue posteriormente reanotado (Camus et al., 2002). En esta segunda anotación, la longitud del gen nat (el supuesto codificante de una N-acetil-transferasa en este operón) fue acortada 49 aminoácidos. Consultando la anotación del genoma de M. tuberculosis H37Rv en las bases de datos (Tuberculist, CMR) se observa que este gen no está formando parte de este operón, encontrándose a 286 pb del mismo (según Tuberculist) o a 181 pb (y divergente) según el servidor CMR. Además, ya es un hecho confirmado que M. tuberculosis H37Rv puede utilizar el colesterol como fuente de carbono y energía (Pandey y Sassetti, 2008), y por lo tanto este hecho apoya que su metabolismo no difiera del llevado a cabo por especies no patógenas como R. jostii RHA1 o M. smegmatis mc2155, que tampoco posee un gen en el operón hsa que codifique una N-acetil-transferasa. No obstante, la presencia del gen nat en M. bovis BCG, especie que también es capaz de crecer en colesterol, supone una incógnita. Otras diferencias entre el metabolismo del colesterol de R. jostii RHA1 y M. smegmatis mc2155 han sido observadas a partir de nuestros ensayos de expresión diferencial durante el crecimiento en este esteroide.

211 Discusión

En primer lugar cabe destacar un conjunto de genes controlados por KstR y con expresión diferencial en colesterol en M. smegmatis mc2155 demostrada mediante microarrays que sin embargo no aparecen inducidos en R. jostii RHA1 mediante la técnica de microarrays. Estos genes se muestran en la tabla 18 del apartado 3.1 de Resultados. Se desconoce la posible función para la mayoría de los genes situados dentro de este conjunto; sin embargo cabe destacar dos de los genes aquí presentes. El primero de ellos, MSMEG_0217, que codifica una alcohol deshidrogenasa B, presenta una inducción muy elevada en colesterol, y su mutagénesis afecta al crecimiento de M. smegmatis en el esteroide, lo que apoya su implicación directa en esta ruta degradativa; curiosamente, su probable ortólogo en R. jostii RHA1 ro01205 (67% de identidad cuantificada por ClustalW) no se induce en presencia de colesterol (van der Geize et al., 2007). El segundo de los genes que cabe destacar es MSMEG_5228, que codifica la proteína 3-β

HSDMS, una de las encargadas de catalizar el paso de colesterol a 4-colesten-3- ona en M. smegmatis. Este gen no presenta un claro ortólogo en R. jostii RHA1. Cabría esperar que la enzima encargada de oxidar el colesterol en esta bacteria fuera, al igual que sucede en R. equi, una colesterol oxidasa (Navas et al., 2001). Y efectivamente, dentro de los genes asignados específicamente a la ruta de degradación del colesterol en R. jostii RHA1 se encuentra una colesterol oxidasa, codificada por el gen ro04305 (van der Geize et al., 2007). Este gen, además de presentar similitud con colesterol oxidasas de distintas especies de Rhodococus y de otros actinomicetos degradadores de colesterol como Gordonia cholesterolivorans (Drzyzga et al., pendiente de publicación), comparte una identidad del 61% con la proteína ChoDMS, cuya implicación en este paso enzimático se cuestiona en este trabajo. Los resultados obtenidos en esta tesis parecen apuntar a que el género Rhodococcus y otras actinobacterias como Gordonia utilizan enzimas tipo colesterol oxidasa en esta ruta catabólica, mientras otros, como el género Mycobacterium o Nocardia (Horinouchi et al., 1991) utilizan enzimas tipo colesterol deshidrogenasa NAD(P) dependientes. En el análisis de la expresión diferencial en colesterol de M. smegmatis también nos encontramos un caso opuesto a los mencionados anteriormente: un operón regulado por KstR, inducido en R. jostii RHA1 pero no en M. smegmatis: el

212 Discusión operón mce4, del que se ha comprobado que está implicado en el transporte de colesterol en R. jostii RHA1 (Mohn et al., 2008) y en M. tuberculosis (Pandey y Sassetti, 2008) y que curiosamente apenas se encuentra inducido en colesterol en M. smegmatis, apreciándose tan sólo una leve inducción del mismo mediante RTq-PCR (apartado 3.2 de resultados). Este resultado contrasta con la inducción que se esperaba encontrar en colesterol de un operón especializado para el transporte de esteroides. Sin embargo, los resultados obtenidos en R. jostii RHA1 tampoco muestran una inducción elevada de este cluster, siendo el valor más elevado de fold change de 3,6 (yrbE4A; ro04696), e incluso los dos últimos genes del operón (mas4A y mas4B; ro04704 y ro04705, respectivamente) aparecen ligeramente reprimidos en colesterol (van der Geize, 2007). Por lo tanto, el hecho de que este operón no se induzca en colesterol de manera apreciable ni en R. jostii RHA1 ni en M. smegmatis podría ser debido a que se esté expresando de manera basal para poder captar de una manera más rápida y por tanto eficiente el esteroide que en momentos puntuales podría ponerse en contacto con la bacteria en el medio ambiente. De hecho, en R. jostii RHA1 se han hecho ensayos de transporte de colesterol por el operón mce4 con células no inducidas en el esteroide (Mohn et al., 2008) y el sistema de transporte funciona igualmente, lo que implica la existencia de una expresión basal del mismo. De las proteínas de esta ruta catabólica conservadas en R. jostii RHA1 y las micobacterias, las proteínas Mce4 son las que presentan una identidad más baja, lo que podría reflejar funciones distintas en los dos tipos de organismos aparte de su implicación en el transporte del colesterol, que es común para ambos. Aunque estas diferencias entre las proteínas Mce4 homólogas también podría reflejar las diferencias del medio del que estas bacterias obtienen el colesterol (van der Geize et al., 2007). Otro grupo de genes que aparece inducido en colesterol en M. smegmatis mc2155 pero no en R. jostii RHA1 (a excepción del operón MSMEG_1971- MSMEG1979 y el gen adyacente MSMEG_1970), se muestra en la tabla 19 del apartado de resultados 3.1. Estos genes no se encuentran regulados por KstR o KstR2, y de ellos una gran mayoría además de inducirse en colesterol, presentan la característica de que tienen una elevada expresión basal en glicerol, lo que

213 Discusión sugiere que su mayor inducción en el esteroide puede ser debida a condiciones de estrés y no a una implicación directa en su metabolismo. Además, no se ha podido asignar ninguna posible función claramente relacionada con el catabolismo del colesterol a estos genes. El hecho curioso de que los únicos genes que parecen inducirse como respuesta a estrés en R. jostii RHA1 de manera común con M. smegmatis sean los ortólogos a MSMEG_1970-MSMSEG_1979 podría indicar que el género Rhodococcus es más resistente a los posibles daños causados en la pared celular por el colesterol, o simplemente que ambos géneros de microorganismos tienen una maquinaria genética de respuesta a estrés por compuestos hidrofóbicos distinta. Existen dos excepciones dentro de este grupo de genes referidas a genes no relacionados con estrés; en primer lugar el gen MSMEG_1366, que codifica la probable ATPasa implicada en el sistema de transporte de colesterol. El supuesto ortólogo en R. jostii RHA1 (identidad del 74% a nivel de secuencia de aminoácidos cuantificado por ClustalW) es el gen ro02744. El hecho de que no aparezca inducido en colesterol puede deberse, como también hipotetizamos para la discreta inducción en colesterol del operón mce4 en ambas especies, a que en R. jostii RHA1 se exprese de manera basal para poder captar de manera eficiente el colesterol del medio. También podría suceder que esta actividad enzimática esté catalizada por una enzima diferente a la de M. smegmatis en R. jostii RHA1. Sin embargo, ninguna enzima ATPasa se ha visto inducida en colesterol en R. jostii RHA1 cuando se analiza la expresión mediante la técnica de microarrays (van der

Geize et al., 2007). La segunda excepción es el operón MSMEG_6648-MSMEG_6645, que puede estar implicado en el catabolismo del propionil-CoA (Pandey y Sassetti, 2008). En este caso, R. jostii RHA1 ni siquiera posee ortólogos a estos genes, lo que sugiere que en esta bacteria el metabolismo del propionil-CoA procedente de la degradación del colesterol es diferente al descrito para M. smegmatis. Dentro de las semejanzas entre ambas rutas, cabe destacar la presencia de varios grupos de genes en cada una de ellas que parecen implicados en una misma función: la degradación de la cadena lateral esteroidea. Esta redundancia en un proceso específico pone de manifiesto la importancia que este paso tiene en

214 Discusión la degradación de las moléculas esteroideas, y sugiere un gran potencial catabólico. En el presente estudio también se ha profundizado en el análisis de la regulación del catabolismo del colesterol mediada por KstR tomando como modelo de estudio el gen MSMEG_5228 que codifica la enzima 3-β HSDMS. Mediante estudios de retardo en gel (EMSA) se confirmó la unión específica del represor a una sonda de DNA formada por la región promotora del gen MSMEG_5228. Posteriormente los ensayos de footprinting demostraron por primera vez la unión del regulador al motivo de unión predicho in silico. Sin embargo, los resultados más sorprendentes se obtuvieron a partir del estudio mediante primer extension de la región promotora del gen MSMEG_5228. Este estudio mostró que el mRNA que se transcribe a partir de este gen es leaderless, es decir, carece de una región 5’ no traducida (5’UTR) y comienza directamente con el codón de iniciación 5’AUG. Los mRNAs leaderless son muy frecuentes en bacterias Gram-positivas como Streptococci, Lactococci, Streptomyces y Corynebacterium (Janssen, 1993), siendo menos comunes en bacterias Gram- negativas. El estudio de genomas completos de algunas arqueas sugiere que los mRNAs leaderless son también bastante comunes en este dominio (Slupska et al., 2001; Tolstrup et al., 2000). El hecho de que mRNAs leaderless heterólogos derivados de una bacteria puedan ser transcritos con éxito en sistemas eucariotas y arqueas justifica la suposición de que los mRNAs leaderless actuales podrían ser remanentes de mRNAs ancestrales (Moll et al., 2002). La presencia de ocho tránscritos leaderless en el pequeño genoma de las mitocondrias humanas (Janssen, 1993) apoya esta hipótesis. El hecho de la existencia de un mRNA leaderless dentro de los genes relacionados con el catabolismo del colesterol nos impulsó a realizar un análisis in silico de las regiones promotoras de otros genes/operones relacionados con este metabolismo para comprobar si se trata de un hecho extendido. Dentro de los genes/operones a analizar se seleccionaron tanto genes regulados por KstR (como es el caso del gen MSMEG_5228) como por KstR2 y también un gen no regulado por ninguno de estos dos represores pero sí inducido en colesterol (MSMEG_1366). En total se analizaron 17 genes. Como control se

215 Discusión estudiaron otros 17 genes adicionales no relacionados con el catabolismo del colesterol que fueron seleccionados al azar. Los resultados para los genes relacionados con el metabolismo del colesterol (Tabla 24) muestran que por una parte, la mayoría de los genes/operones investigados presentaron en su región promotora una secuencia que podría actuar como sitio de unión al ribosoma (RBS) y regiones −10 y −35 que se ajustan a las posiciones esperadas. Sin embargo se encontraron otros 5 genes además de MSMEG_5228 que podrían dar lugar a tránscritos leaderless. Todos estos casos se corresponden con genes regulados por KstR o KstR2, y en ellos la secuencia consenso de unión del regulador se sitúa entre las supuestas cajas −10 y −35, salvo en uno de los genes, en que se situaría 8 pb secuencia arriba de la región −35 (MSMEG_6013). De los genes analizados, los regulados por KstR que no presentan un posible RBS en su región promotora (MSMEG_0217, MSMEG_5228, MSMEG_5520), curiosamente se sitúan a lo largo del genoma de M. smegmatis, y no dentro de ninguno de los dos grandes clusters de catabolismo del colesterol descritos en este trabajo (véase apartado 3.1). Este resultado sugería que la ausencia de RBS quizás fuese una característica común a los genes regulados por KstR no agrupados en uno de los dos grandes clusters de catabolismo de colesterol, pero sin embargo el gen MSMEG_0305 que entra dentro de este grupo, sí presenta un posible RBS en su promotor. Caso especialmente curioso es el de los genes regulados por KstR2, que como ya se ha explicado en el apartado 5.3 se agrupan en 5 operones, 4 de ellos divergentes dos a dos, por lo que existen 3 secuencias de unión a KstR2 en el genoma. Los resultados indican que en el caso de los operones que comparten región intergénica por situarse divergentes en el genoma, uno de ellos presenta RBS, mientras el otro no (el operón que comienza con el gen MSMEG_6000 no presenta RBS, mientras que su operón divergente que comienza con el gen MSMEG_6001 sí, y lo mismo sucede con los operones que comienzan con MSMEG_6012, que no presenta RBS, y MSMEG_6013, que sí). En el caso de los genes divergentes MSMEG_6041/MSMEG_6042 que comparten secuencia de unión a KstR ambos presentan RBS.

216 Discusión

Por último, cabe mencionar que el gen kstR (MSMEG_6042) sí presenta RBS en su promotor, mientras que el gen kstR2 (MSMEG_6009) no.

Gen analizado Presencia de Características del gen/operón (región posible RBS promotora) MSMEG_0217 No Regulado por KstR. No situado en el cluster 1 o 2

MSMEG_0305 Sí Regulado por KstR. No situado en el cluster 1 o 2

MSMEG_1366 Sí No regulado por KstR ni KstR2. No situado en cluster 1 o 2

MSMEG_5228 No Regulado por KstR. No situado en el cluster 1 o 2

MSMEG_5520 No Regulado por KstR. No situado en el cluster 1 o 2

MSMEG_5902 Sí Regulado por KstR. Adyacente al cluster 2 MSMEG_5906 Sí Regulado por KstR. Situado en el cluster 2 MSMEG_5920 Sí Regulado por KstR. Situado en el cluster 2 MSMEG_5925 Sí Regulado por KstR. Situado en el cluster 2 MSMEG_6000 No Regulado por KstR2. Situado en el cluster 1 MSMEG_6001 Sí Regulado por KstR2. Situado en el cluster 1 MSMEG_6009 No Regulado por KstR2. Situado en el cluster 1 MSMEG_6012 No Regulado por KstR2. Situado en el cluster 1 MSMEG_6013 Sí Regulado por KstR2. Situado en el cluster 1 MSMEG_6038 Sí Regulado por KstR. Situado en el cluster 1 MSMEG_6041 Sí Regulado por KstR. Situado en el cluster 1 MSMEG_6042 Sí Regulado por KstR. Situado en el cluster 1

Tabla 24. Análisis de la región promotora de genes relacionados con el catabolismo del colesterol.

Los resultados obtenidos en el caso de los genes no relacionados con el metabolismo del colesterol son así mismo dispares; de las 17 regiones promotoras analizadas 9 presentaron un posible sitio RBS, mientras que las 8 restantes no (Tabla 25).

217 Discusión

Gen analizado Presencia de Función del gen (región promotora) posible RBS

MSMEG_0014 Sí Formil transferasa MSMEG_0041 No Proteína hipotética MSMEG_0088 Sí Fosfoenolpiruvato-proteína fosfotransferasa MSMEG_0181 Sí Tauria dioxigenasa alfa-cetoglutarato-dependiente MSMEG_0332 Sí 2-nitropropano dioxigenasa

MSMEG_0481 No Oxidorreductasa FAD dependiente MSMEG_0574 No Posible factor sigma RpoE1 MSMEG_0608 Sí Proteína de la familia glioxilasa MSMEG_0715 No 3-oxoacil-[ proteina transportadora de acilo] reductasa

MSMEG_0886 No serina/treonina-proteína quinasa PknD MSMEG_0938 No Proteína hipotética MSMEG_1114 Sí Deshidrogenasa de cadena corta MSMEG_1304 Sí Proteína de catabolismo de rizopina MSMEG_1852 No selenido, agua diquinasa

MSMEG_2125 Sí Proteína reguladora del operón glicerol MSMEG_3999 Sí Proteína periplásmica de unión de transportador ABC Yph MSMEG_5003 No O-metiltransferasa, familia de proteínas 3

Tabla 25. Análisis de la región promotora de genes no relacionados con el catabolismo del colesterol.

La eficiencia traduccional de los mRNAs leaderless comparada con la de los RNAs bacterianos canónicos no está intrínsecamente determinada, pero parece que puede alterarse dependiendo de la disponibilidad de los componentes de la maquinaria traduccional. Así, estudios en E. coli han mostrado que el ratio de los factores de iniciación IF2 e IF3 juega un papel decisivo en la iniciación de la traducción de mRNAs leaderless (Grill et al., 2001; Moll et al., 2002). Por tanto, se puede especular que la relativa deficiencia de IF3 que tiene lugar a velocidades de crecimiento elevadas podría favorecer el incremento de la velocidad de traducción de los mRNAs leaderless y una competición más eficiente de estos mRNAs con los mRNAs canónicos. Un efecto similar se ha observado debido a una elevación transitoria del nivel de IF2 (Grill et al., 2000; Grill et al., 2001), que tiene lugar cuando las células de E. coli son sometidas a un choque de frío (Jones et al., 1987). Así, parece concebible que cambios en las condiciones medioambientales

218 Discusión y diferentes tipos de estrés puedan incrementar las oscilaciones transitorias de los niveles relativos de los factores de iniciación y por tanto modular la eficiencia traduccional de los mRNAs leaderless en bacterias. Por otra parte, parece que los mRNAs leaderless, a diferencia de los mRNAs canónicos, no requieren de la presencia de la proteína ribosomal S1 para su traducción (Moll et al., 2002; Tedin et al., 1997). Existe la posibilidad de que, dado que no existen homólogos funcionales de S1 en todos los sistemas biológicos que contienen mRNAs leaderless, la población ribosomal sea heterogénea en lo que respecta a la presencia de S1, y esto podría contribuir al control traduccional de estos mRNAs. La traducción de mRNAs leaderless se ha estudiado in vivo en un rango de temperaturas desde 25 ºC a 42 ºC (Grill et al., 2000). Los ensayos de competición de traducción con extractos de E. coli revelaron que los mRNAs leaderless pueden competir eficazmente a baja temperatura (25 ºC) con mRNAs canónicos, mientras que a 42 ºC la traducción de mRNAs canónicos sobrepasa completamente a la de los mRNAs leaderless. La correlación inversa de la traduccionalidad de las dos clases de mRNA en función de la temperatura se ha atribuido a la proteína ribosómica S1, cuya actividad parece ser sensible al frío (Grill et al., 2000). Así, la reducción de la traducción de mRNAs canónicos causada por la reducción de S1 a bajas temperaturas parece conducir a un incremento en la traducción de mRNAs leaderless debido a una competición reducida frente a los mRNAs canónicos (Moll et al., 2002). Los mRNAs leaderless identificados en bacterias hasta el momento no codifican genes funcionalmente relacionados. Cabe señalar sin embargo que al menos tres mRNAs leaderless de elementos genéticos accesorios, dos en E. coli

(Baumeister et al., 1991; Walz et al., 1976) y uno en Lactococcus lactis (Nauta et al., 1996) codifican proteínas reguladoras. Para asegurar un estado latente de estos elementos genéticos, los represores correspondientes tienen que ser continuamente sintetizados, aunque a un nivel bajo. Se podría por tanto especular que el hecho de ser leaderless proporciona un medio para conseguir un bajo nivel de traducción en un rango de diferentes condiciones biológicas.

219 Discusión

El control traduccional de los mRNAs leaderless en las bacterias Gram- positivas, entre las que incluiríamos al género Mycobacterium, así como en arqueas requiere ser estudiado para comprobar si se lleva a cabo por los mismos mecanismos observados en E. coli.

4. Estudio de los reguladores transcripcionales KstR y KstR2

Los reguladores KstR y KstR2 implicados en la regulación de la ruta de degradación del colesterol pertenecen por homología de secuencia a la familia TetR de reguladores transcripcionales. Utilizando la base de datos PROSITE, que permite la búsqueda de dominios, familias y sitios funcionales de secuencias proteicas y que está alojada en el servidor ExPASy, se identifica tanto en la secuencia de KstR como en la de KstR2 el dominio HTH de la familia de reguladores TetR. Este es un dominio de unión a DNA hélice-giro-hélice de aproximadamente 60 residuos presente en esta familia de reguladores transcripcionales procariotas. El motivo de unión a DNA hélice-giro-hélice se localiza en el extremo N-terminal de estos reguladores (Aramaki et al., 1995). La región C-terminal de los reguladores TetR contiene varias regiones que pueden estar implicadas en i) la unión de inductores y ii) en oligomerización. La familia de reguladores TetR incluye más de 2000 secuencias no redundantes, mientras que la función específica regulada por los miembros de esta familia sólo es conocida para cerca de 90 de ellos. Estas proteínas controlan genes implicados en multiresistencia a fármacos, enzimas implicadas en distintas rutas catabólicas, biosíntesis de antibióticos, estrés osmótico y patogenicidad en bacterias Gram- positivas y Gram-negativas (Ramos et al., 2005). Utilizando la base de datos PROSITE no se ha encontrado ningún motivo conservado en la región C-terminal de KstR o KstR2. Tampoco haciendo una búsqueda frente a la base de secuencias de proteínas no redundante (nr) utilizando el programa BLASTP se encuentra una posible similitud de estas regiones C-terminal con regiones relacionadas con la unión a colesterol u otros esteroides derivados, que podrían ser los inductores de esta ruta de degradación y por tanto unirse a estos

220 Discusión represores para inhibir su unión al DNA. Ambos extremos C-terminal sólo presentan similitud con reguladores tipo TetR de micobacterias y otros actinomicetos principalmente, nada que las relacione con unión a esteroides, lo que no permite hacer conjeturas acerca de la posible molécula inductora. El hecho de no existir proteínas homólogas a la región C-terminal de estos dos reguladores unido a la posibilidad de que estos dominios reconozcan como ligandos estructuras esteroideas hace particularmente interesantes a estos dos reguladores para un estudio más detallado de los mismos que incluiría su cristalización y la posibilidad de construir a partir de los mismos sensores de estructuras esteroideas. Se han resuelto varias estructuras de reguladores transcripcionales TetR. Sus dominios de unión a DNA están formados por un conjunto de tres hélices (H1- H3) y la parte N-terminal de la siguiente hélice 4, que contribuye al centro hidrofóbico del dominio de unión a DNA y lo une al dominio regulador (Orth et al., 2000). En este estudio hemos llevado a cabo la predicción de la estructura tridimensional de KstR y KstR2 utilizando para ello el programa LOOPP, alojado en el servidor BioHPC. En el caso de KstR, se seleccionó como molde para la construcción del modelo la cadena A del represor transcripcional EthR (PDB: 1T56), miembro de la familia TetR/CamR presente en M. tuberculosis e implicado en la resistencia a etionamida (Dover et al., 2004). El programa en este caso fue capaz de comparar el 80 % de la secuencia de la proteína con una identidad de secuencia del 16 %. La proteína EthR es responsable de la regulación negativa de EthA, una monooxigenasa implicada en la activación del fármaco etionamida. Para ejercer su acción represora EthR se une a la región intergénica situada entre los genes ethA y ethR (Dover et al., 2004). En su dominio C-terminal, EthR presenta una larga cavidad hidrofóbica en forma de túnel (que podría aparecer de forma similar en KstR) que se especula que podría ser el sitio de unión de su ligando, todavía desconocido (Dover et al., 2004). En otro trabajo sobre la estructura de EthR, se observó la presencia de un ligando fortuito identificado como hexadecil octanoato,

221 Discusión que induce un estado conformacional en EthR incompatible con la función represora, lo que conduce a la inducción de ethA (Frénois et al., 2004). En el caso de KstR2, el molde utilizado fue el del supuesto regulador transcripcional de la familia TetR Rha06780 de Rhodococcus jostii RHA1 (PDB: 2NX4) (Zhang et al., pendiente de publicación). El programa comparó el 86 % de la secuencia de la proteína con una identidad de secuencia del 22 %. En las figuras 71 y 72 se representan los modelos de KstR y KstR2, respectivamente, junto con sus proteínas molde correspondientes. En rojo se ha marcado la región predicha por el programa PROSITE para ser el dominio de unión a DNA HTH.

A B Figura 71. Predicción de la estructura tridimensional de la proteína KstR tomando como modelo el represor transcripcional tipo TetR EthR de Mycobacterium tuberculosis (PDB: 1T56). A. La estructura corresponde con el modelo propuesto para KstR. B. Estructura del regulador transcripcional EthR de M. tuberculosis (PDB: 1T56) (Dover et al., 2004). Las zonas de las proteínas señaladas en rojo se corresponden con el dominio HTH de unión a DNA encontrado para ambas proteínas utilizando la base de datos PROSITE.

Como se puede observar, los modelos de ambas proteínas presentan una región que se ajusta muy bien al dominio HTH de los reguladores tipo TetR.

222 Discusión

En el caso concreto de KstR ya se había demostrado que se une a las regiones operadoras de los distintos promotores que regula en forma de dímero (Kendall et al., 2007), como la mayoría de los reguladores de la familia TetR (Ramos et al., 2005). En este trabajo se ha demostrado que el regulador KstR se une a su región operadora en el promotor del gen MSMEG_5228 y que esta unión es específica. Concretamente KstR se une a una región de 31 nucleótidos, localizados entre la posición −5 y −35 respecto al codón de inicio ATG de MSMEG_5228. Esta región solapa con las posibles cajas −10 y −35, lo que sugiere que la unión de KstR al operador impediría la unión de la RNA polimerasa y con ello el inicio de la transcripción desde el promotor. Concentraciones de hasta 4 mM de colesterol no causan la desunión de KstR en este promotor. Los ensayos de inhibición de retardo frente a un posible inductor de la ruta se deberían efectuar en un futuro también con intermediarios de la ruta de degradación como por ejemplo la 4-colesten-3-ona, o AD o ADD, y también con ácido palmítico, el cual se ha demostrado que induce 22 genes del regulón KstR (Kendall et al., 2007). Si la 4-colesten-3-ona fuese la molécula inductora de la ruta quizás se explicaría la existencia de enzimas redundantes encargadas de su producción a partir del colesterol, ya que sin este compuesto no se podría inducir la ruta de degradación del colesterol.

223 Discusión

A B

Figura 72. Predicción de la estructura tridimensional de la proteína KstR2 tomando como modelo el supuesto regulador transcripcional de la familia TetR Rha06780 de Rhodococcus jostii RHA1 (PDB: 2NX4). A. La estructura corresponde con el modelo propuesto para KstR2. B. Estructura del supuesto regulador transcripcional tipo TetR de Rha06780 de Rhodococcus jostii RHA1 (PDB: 2NX4) (Zhang et al., pendiente de publicación). Las zonas de las proteínas señaladas en rojo se corresponden con el dominio HTH de unión a DNA encontrado para ambas proteínas utilizando la base de datos PROSITE.

Como se ha indicado con anterioridad, 22 de los genes regulados por KstR e inducidos en colesterol también se inducen en ácido palmítico (ácido graso saturado de 16 átomos de carbono) en M. tuberculosis, incluido el propio KstR (Kendall et al., 2007; Schnappinger et al., 2003), por lo que se sugirió que el regulón KstR podría estar implicado en el transporte y catabolismo de una variedad de lípidos además del colesterol (Kendall et al., 2007). No obstante, no se puede descartar que la inducción de estos genes por palmitato se lleve a cabo de manera inespecífica. El hecho de que el palmitato no induzca todos los genes del regulón KstR parece indicar que no sería el efector para el regulador, o bien la existencia de otros posibles sistemas reguladores además del de KstR.

224 Discusión

También se ha observado que los genes homólogos a MSMEG_6008 y MSMEG_6013, que están bajo el control de KstR2, aparecen inducidos en presencia de palmitato en M. tuberculosis (Schnappinger et al., 2003). El hecho de que KstR2 también sea capaz de interaccionar con palmitato es intrigante, ya que los genes controlados por él parecen estar implicados en la degradación del DOHNAA, y cabría esperar que una molécula similar a ésta, que no posee una cadena lateral larga, fuera el inductor de este regulador. Se ha demostrado que ambos reguladores actúan independientemente el uno del otro, ya que la expresión de los genes del regulón de KstR2 no está afectada por una deleción en el gen que codifica KstR (Kendall et al., 2007), y así mismo la expresión del gen MSMEG_6038, controlado por KstR, no se ve afectada por un mutante en KstR2 (Kendall et al., 2010). Tanto KstR como KstR2 se autorregulan reprimiendo su propia expresión (Kendall et al., 2007; Kendall et al., 2010). Esta es una característica común en la regulación génica, y ocurre en más del 40% de los factores transcripcionales en E. coli (Shen-Orr et al., 2002). Recientemente se ha demostrado que la autorregulación negativa acelera el tiempo de respuesta, reduce el ruido producido por la expresión genética estocástica y es económico metabólicamente para la célula (Nevozhay et al., 2009). El hecho de que los genes responsables del catabolismo del colesterol estén controlados por, al menos, dos reguladores transcripcionales distintos parece indicar una inducción secuencial de los regulones. Los datos sugieren que el primero en inducirse sería el regulón de KstR, que aparentemente contiene los genes responsables de la degradación de la cadena lateral del colesterol y los genes necesarios para las consiguientes transformaciones desde el intermediario AD (Figura 5 de introducción, estructura 9A) hasta DOHNAA (Figura 5 de introducción, estructuras 15), propionil-CoA y piruvato. Posteriormente se podría inducir el regulón de KstR2, que parece contener los genes necesarios para la transformación de DOHNAA hasta succinato. Esta inducción secuencial de genes metabólicos podría ayudar al ahorro energético de la célula. Así mismo podría sugerir que ambos represores están regulados por distintas moléculas efectoras, que en el caso de KstR2 podría ser DOHNAA.

225 Discusión

En conclusión, los resultados presentados en esta tesis han permitido avanzar significativamente en el conocimiento global del metabolismo aeróbico del colesterol principalmente en Mycobacterium smegmatis, aunque muchos de los hallazgos son también extrapolables a la bacteria patógena Mycobacterium tuberculosis, cuyo metabolismo del colesterol ha cobrado recientemente una gran importancia. Al mismo tiempo este trabajo ha aportado una cantidad notable de material que presenta un gran interés para el desarrollo de futuros trabajos de investigación. Así mismo, el estudio de una ruta de degradación en un microorganismo Gram-positivo es un tema pionero en nuestro laboratorio, lo que ha servido para el aprendizaje y utilización de nuevas técnicas de trabajo diferentes a las utilizadas normalmente en nuestro grupo.

226 Conclusiones

VI.CONCLUSIONES

227 Conclusiones

228 Conclusiones VI. CONCLUSIONES

El trabajo descrito a lo largo de esta Tesis ha dado lugar a las siguientes conclusiones:

1. Micobacterium smegmatis mc2155 es capaz de utilizar diferentes compuestos con estructura esteroidea como única fuente de carbono y energía tales como colesterol, 4-colesten-3-ona, ADD, AD, testosterona y β-estradiol, siendo mayor el rendimiento obtenido con colesterol y 4-colesten-3-ona. Se han identificado 89 genes en el genoma de M. smegmatis mc2155 que presentan una expresión diferencial en colesterol frente a glicerol, de los cuales al menos 59 genes parecen implicados directamente en el metabolismo, regulación o transporte del colesterol. Estos genes se encuentran principalmente agrupados en 2 grandes clusters. Sin embargo, fuera de estos dos clusters también aparecen genes inducidos en este esteroide, y para algunos de ellos su implicación en el metabolismo del colesterol se ha constatado.

2. Se han identificado al menos dos genes en el genoma de M. smegmatis mc2155 implicados en la transformación de colesterol en 4-colesten-3-ona: MSMEG_5228 y MSMEG_5233, que codifican las enzimas 3-β HSDMS y SDRMS respectivamente, que pueden englobarse dentro de la familia de las deshidrogenasas de cadena corta. La actividad enzimática de estas dos proteínas ha sido comprobada mediante ensayos in vitro.

3. Resulta improbable que el gen homólogo de choD contenido en M. smegmatis, MSMEG_1604, codifique una colesterol oxidasa, ya que no ha podido asignarse a este gen una actividad colesterol oxidasa ni in vivo ni in vitro y el gen no se induce selectivamente en presencia de colesterol.

4. El regulador transcripcional KstR está implicado mayoritariamente en la represión de genes que se inducen en presencia de colesterol, lo que sugiere que

229 Conclusiones su acción se ejerce exclusivamente sobre genes relacionados con su catabolismo y no sobre genes adicionales relacionados con el metabolismo de otros lípidos, como había sido propuesto por otros autores.

5. Se ha confirmado la interacción de la proteína KstR con el promotor P5228 del gen MSMEG_5228 en su región operadora mediante estudios de footprinting y retardo en gel. Esta región operadora es una secuencia palindrómica de 31 pb centrada en la posición −5 respecto al inicio de la transcripción. Así mismo se ha comprobado que el mRNA derivado de la transcripción de este gen es leaderless, ya que la posición +1 coincide con el primer nucleótido del codón de inicio del gen.

6. El regulador KstR2 es un represor transcripcional implicado en la regulación de genes relacionados con el catabolismo del colesterol. Mediante la técnica de microarrays se han identificado 15 genes regulados por KstR2.

230 Bibliografía

VII.BIBLIOGRAFÍA

231 Bibliografía

232 Bibliografía

VII.BIBLIOGRAFÍA

Aínsa, J. A., Martín, C., Cabeza, M., De la Cruz, F. y Mendiola, M. V. (1996). Construction of a family of Mycobacterium/Escherichia coli shuttle vectors derived from pAL5000 and pACYC184: their use for cloning an antibiotic-resistance gene from . Gene 176, 23-26.

Altschul, S. F., Gish, W., Miller, W., Myers, E. W. y Lipman, D. (1990). Basic local alignment search tool. J Mol Biol 215, 403-410.

Allard, S. T. M., Cleland, W. W. y Holden, H. M. (2004). High Resolution X-ray Structure of dTDP-Glucose 4,6-Dehydratase from Streptomyces venezuelae. J Biol Chem 279, 2211-2220.

Amadou, C., Pascal, G., Mangenot, S., Glew, M., Bontemps, C., Capela, D., Carrère, S., Cruveiller, S., Dossat, C., Lajus, A., Marchetti, M., Poinsot, V., Rouy, Z., Servin, B., Saad, M., Schenowitz, C., Barbe, V., Batut, J., Médigue, C. y Masson-Boivin, C. (2008). Genome sequence of the β-rhizobium Cupriavidus taiwanensis and comparative genomics of rhizobia. Genome Res 18, 1472-1483.

Anderton, M. C., Bhakta, S., Besra, G. S., Jeavons, P., Eltis, L. D. y Sim, E. (2006). Characterization of the putative operon containing arylamine N-acetyltransferase (nat) in BCG. Mol Microbiol 59, 181-192.

Andor, A., Jekkel, A., Hopwood, D. A., Jeanplong, F., Ilkoy, E., Konya, A., Kurucz, I. y Ambrus, G. (2006). Generation of Useful Insertionally Blocked Sterol Degradation Pathway Mutants of Fast-Growing Mycobacteria and Cloning, Characterization, and Expression of the Terminal Oxygenase of the 3-Ketosteroid 9α-Hydroxylase in Mycobacterium smegmatis mc2155. Appl Environ Microbiol 72, 6554-6559.

Aparicio, J. F. y Martin, J. F. (2008). Microbial cholesterol oxidases: bioconversion enzymes or signal proteins? Mol Biosyst 4, 804-809.

Aramaki, H., Yagi, N. y Suzuki, M. (1995). Residues important for the function of a multihelical DNA binding in the new transcription factor family of Cam and Tet repressors. Protein Eng 8, 1259-1266.

Arima, K., Nagasawa, M., Bae, M. y Tamura, G. (1969). Microbial transformation of sterols. Part I. Decomposition of cholesterol by microorganisms. Agric Biol Chem 33, 1636-1643.

Arruda, S., Bomfim, G., Knights, R., Huima-Byron, T. y Riley, L. W. (1993). Cloning of an M. tuberculosis DNA fragment associated with entry and survival inside cells. Science 261, 1454-1457.

233 Bibliografía

Av-Gay, Y. y Sobouti, R. (2000). Cholesterol is accumulated by mycobacteria but its degradation is limited to non-pathogenic fast-growing mycobacteria. Can J Microbiol 46, 826-831.

Baker, M. E. y Blasco, R. (1992). Expansion of the mammalian 3β-hydroxysteroid dehydrogenase/plant dihydroflavonol reductase superfamily to include a bacterial cholesterol dehydrogenase, a bacterial UDP-galactose-4-epimerase, and open reading frames in vaccinia virus and fish lymphocystis disease virus. FEBS Lett 301, 89-93.

Bashyam, M. D., Kaushal, D., Dasgupta, S. K. y Tyagi, A. K. (1996). A study of mycobacterial transcriptional apparatus: identification of novel features in promoter elements. J Bacteriol 178, 4847-4853.

Baumeister, R., Flache, P., Melefors, O., Gabain, A. v. y Hillen, W. (1991). Lack of a 5' non-coding region in Tn 1721 encoded tetR mRNA is associated with a low efficiency of translation and a short half-life in Escherichia coli. Nucl Acids Res 19, 4595-4600.

Björkhem, I. y Eggertsen, G. (2001). Genes involved in initial steps of bile acid synthesis. Curr Opin Lipidol 12, 97-103.

Blankenfeldt, W., Kerr, I. D., Giraud, M. F., McMiken, H. J., Leonard, G., Whitfield, C., Messner, P., Graninger, M. y Naismith, J. H. (2002). Variation on a theme of SDR. dTDP-6-deoxy-L- lyxo-4-hexulose reductase (RmlD) shows a new Mg2+-dependent dimerization mode. Structure 10, 773-786.

Bloch, K. (1965). The Biological Synthesis of Cholesterol. Science 150, 19-28.

Bradford, M. M. (1976). A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein-dye binding. Anal Biochem 72, 248- 254.

Breitling, R., Armengaud, P., Amtmann, A. y Herzyk, P. (2004). Rank products: a simple, yet powerful, new method to detect differentially regulated genes in replicated microarray experiments. FEBS Lett 573, 83-92.

Brown, R. L. y Peterson, G. E. (1966). Cholesterol Oxidation By Soil Actinomycetes. J Gen Microbiol 45, 441-450.

Brzostek, A., Sliwinski, T., Rumijowska-Galewicz, A., Korycka-Machala, M. y Dziadek, J. (2005). Identification and targeted disruption of the gene encoding the main 3- ketosteroid dehydrogenase in Mycobacterium smegmatis. Microbiology 151, 2393-2402.

Brzostek, A., Dziadek, B., Rumijowska-Galewicz, A., Pawelczyk, J. y Dziadek, J. (2007). Cholesterol oxidase is required for virulence of Mycobacterium tuberculosis. FEMS Microbiol Lett 275, 106-112.

234 Bibliografía

Brzostek, A., Pawelczyk, J., Rumijowska-Galewicz, A., Dziadek, B. y Dziadek, J. (2009). Mycobacterium tuberculosis Is Able To Accumulate and Utilize Cholesterol. J Bacteriol 191, 6584-6591.

Camus, J.-C., Pryor, M. J., Medigue, C. y Cole, S. T. (2002). Re-annotation of the genome sequence of Mycobacterium tuberculosis H37Rv. Microbiology 148, 2967-2973.

Capyk, J. K., D'Angelo, I., Strynadka, N. C. y Eltis, L. D. (2009a). Characterization of 3-Ketosteroid 9α-Hydroxylase, a Rieske Oxygenase in the Cholesterol Degradation Pathway of Mycobacterium tuberculosis. J Biol Chem 284, 9937-9946.

Capyk, J. K., Kalscheuer, R., Stewart, G. R., Liu, J., Kwon, H., Zhao, R., Okamoto, S., Jacobs, W. R., Eltis, L. D. y Mohn, W. W. (2009b). Mycobacterial Cytochrome P450 125 (Cyp125) Catalyzes the Terminal Hydroxylation of C27 Steroids. J Biol Chem 284, 35534-35542.

Casali, N. y Riley, L. (2007). A phylogenomic analysis of the Actinomycetales mce operons. BMC Genomics 8, 60.

Cole, S. T., Brosch, R., Parkhill, J., Garnier, T., Churcher, C., Harris, D., Gordon, S. V., Eiglmeier, K., Gas, S., Barry, C. E., Tekaia, F., Badcock, K., Basham, D., Brown, D., Chillingworth, T., Connor, R., Davies, R., Devlin, K., Feltwell, T., Gentles, S., Hamlin, N., Holroyd, S., Hornsby, T., Jagels, K., Krogh, A., McLean, J., Moule, S., Murphy, L., Oliver, K., Osborne, J., Quail, M. A., Rajandream, M. A., Rogers, J., Rutter, S., Seeger, K., Skelton, J., Squares, R., Squares, S., Sulston, J. E., Taylor, K., Whitehead, S. y Barrell, B. G. (1998). Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence. Nature 393, 537-544.

Collins, M. D., Smida, J., Dorsch, M. y Stackebrandt, E. (1988). Tsukamurella gen. nov. Harboring Corynebacterium paurometabolum and Rhodococcus aurantiacus. Int J Syst Bacteriol 38, 385-391.

Coulombe, R., Yue, K. Q., Ghisla, S. y Vrielink, A. (2001). Oxygen Access to the Active Site of Cholesterol Oxidase through a Narrow Channel Is Gated by an Arg-Glu Pair. J Biol Chem 276, 30435-30441.

Cowley, S. C. y Av-Gay, Y. (2001). Monitoring promoter activity and protein localization in Mycobacterium spp using green fluorescent protein. Gene 264, 225-231.

Chang, J. C., Miner, M. D., Pandey, A. K., Gill, W. P., Harik, N. S., Sassetti, C. M. y Sherman, D. R. (2009). igr Genes and Mycobacterium tuberculosis Cholesterol Metabolism. J Bacteriol 191, 5232-5239.

Chiang, Y.-R., Ismail, W., Muller, M. y Fuchs, G. (2007). Initial Steps in the Anoxic Metabolism of Cholesterol by the Denitrifying Sterolibacterium denitrificans. J Biol Chem 282, 13240-13249.

235 Bibliografía

Chiang, Y.-R., Ismail, W., Gallien, S., Heintz, D., Van Dorsselaer, A. y Fuchs, G. (2008a). Cholest-4-En-3-One-Δ1-Dehydrogenase, a Flavoprotein Catalyzing the Second Step in Anoxic Cholesterol Metabolism. Appl Environ Microbiol 74, 107-113.

Chiang, Y.-R., Ismail, W., Heintz, D., Schaeffer, C., Van Dorsselaer, A. y Fuchs, G. (2008b). Study of Anoxic and Oxic Cholesterol Metabolism by Sterolibacterium denitrificans. J Bacteriol 190, 905-914.

Chipley, J. R., Dreyfuss, M. S. y Smucker, R. A. (1975). Cholesterol metabolism by Mycobacterium. Microbios 12, 199-207.

Daughton, C. G. y Ternes, T. A. (1999). Pharmaceuticals and Personal Care Products in the Environment: Agents of Subtle Change? Environ Health Perspect 107, 907-938. de Lorenzo, V., Herrero, M., Jakubzik, U. y Timmis, K. N. (1990). Mini-Tn5 transposon derivatives for insertion mutagenesis, promoter probing, and chromosomal insertion of cloned DNA in gram-negative eubacteria. J Bacteriol 172, 6568-6572.

DeLano, W. L. (2002). The PyMOL Molecular Graphics System Palo Alto, CA, USA.: DeLano Scientific.

Demain, A. L. (1992). Microbial secondary metabolism: a new theoretical frontier for academia, a new opportunity for industry. Ciba Found symp 171, 3-16.

Denke, M. A. (1995). Review of human studies evaluating individual dietary responsiveness in patients with hypercholesterolemia. Am J Clin Nutr 62, 471S-477.

Doukyu, N. y Aono, R. (1999). Two moles of O2 consumption and one mole of H2O2 formation during cholesterol peroxidation with cholesterol oxidase from Pseudomonas sp. strain ST-200. Biochem J 341, 621-627.

Doukyu, N., Shibata, K., Ogino, H. y Sagermann, M. (2008). Purification and characterization of Chromobacterium sp. DS-1 cholesterol oxidase with thermal, organic solvent, and detergent tolerance. Appl Microbiol Biotechnol 80, 59-70.

Doukyu, N. (2009). Characteristics and biotechnological applications of microbial cholesterol oxidases. Appl Microbiol Biotechnol 83, 825-837.

Dover, L. G., Corsino, P. E., Daniels, I. R., Cocklin, S. L., Tatituri, V., Besra, G. S. y Fütterer, K. (2004). Crystal Structure of the TetR/CamR Family Repressor Mycobacterium tuberculosis EthR Implicated in Ethionamide Resistance. J Mol Biol 340, 1095-1105.

Fahrbach, M., Kuever, J., Meinke, R., Kampfer, P. y Hollender, J. (2006). Denitratisoma oestradiolicum gen. nov., sp. nov., a 17β-oestradiol-degrading, denitrifying betaproteobacterium. Int J Syst Evol Microbiol 56, 1547-1552.

236 Bibliografía

Fahrbach, M., Kuever, J., Remesch, M., Huber, B. E., Kampfer, P., Dott, W. y Hollender, J. (2008). Steroidobacter denitrificans gen. nov., sp. nov., a steroidal hormone- degrading gammaproteobacterium. Int J Syst Evol Microbiol 58, 2215-2223.

Ferreira, N. P. y Tracey, R. P. (1984). Numerical of cholesterol-degrading soil bacteria. J Appl Microbiol 57, 429-446.

Florin, C., Kohler, T., Grandguillot, M. y Plesiat, P. (1996). Comamonas testosteroni 3- ketosteroid-Δ4(5 α)-dehydrogenase: gene and protein characterization. J Bacteriol 178, 3322-3330.

Frénois, F., Engohang-Ndong, J., Locht, C., Baulard, A. R. y Villeret, V. (2004). Structure of EthR in a ligand bound conformation reveals therapeutic perspectives against tuberculosis. Mol Cell 16, 301-307.

Fuhrmann, H., Dobeleit, G., Bellair, S. y Gück, T. (2002). Cholesterol Oxidase and Resistance of Rhodococcus equi to Peroxidative Stress in vitro in the Presence of Cholesterol. J Vet Med B 49, 310-311.

Gagné, F., Blaise, C. y André, C. (2006). Occurrence of pharmaceutical products in a municipal effluent and toxicity to rainbow trout (Oncorhynchus mykiss) hepatocytes. Ecotox Environ Saf 64, 329-336.

Gatfield, J. y Pieters, J. (2000). Essential Role for Cholesterol in Entry of Mycobacteria into Macrophages. Science 288, 1647-1651.

Gerard, P., Lepercq, P., Leclerc, M., Gavini, F., Raibaud, P. y Juste, C. (2007). Bacteroides sp. Strain D8, the First Cholesterol-Reducing Bacterium Isolated from Human Feces. Appl Environ Microbiol 73, 5742-5749.

Ghasemian, A., Yazdi, M., Sepehrizadeh, Z., Yazdi, Z. y Zarrini, G. (2009). Overexpression, one-step purification, and characterization of a type II cholesterol oxidase from a local isolate Rhodococcus sp. PTCC 1633. World J Microbiol Biotechnol 25, 773- 779.

Göhler, A., Xiong, G., Paulsen, S., Trentmann, G. y Maser, E. (2008). Testosterone- inducible Regulator Is a Kinase That Drives Steroid Sensing and Metabolism in Comamonas testosteroni. J Biol Chem 283, 17380-17390.

Gomez, M. y Smith, I. (2000). Determinants of mycobacterial gene expression. En Molecular Genetics of Mycobacteria, pp. 111-129. Editado por G. F. Hatfull y W. R. J. Jacobs. Washington, DC: American Society for Microbiology Press.

Grill, S., Gualerzi, C. O., Londei, P. y Blasi, U. (2000). Selective stimulation of translation of leaderless mRNA by initiation factor 2: evolutionary implications for translation. EMBO J 19, 4101-4110.

237 Bibliografía

Grill, S., Moll, I., Hasenöhrl, D., Gualerzi, C. O. y Bläsi, U. (2001). Modulation of ribosomal recruitment to 5'-terminal start codons by translation initiation factors IF2 and IF3. FEBS Lett 495, 167-171.

Groh, H., Schade, K. y Hörhold-Schubert, C. (1993). Steroid metabolism with intestinal microorganisms. J Basic Microbiol 33, 59-72.

Hanahan, D. (1983). Studies on transformation of Escherichia coli with plasmids. J Mol Biol 166, 557-580.

Hanselman, T. A., Graetz, D. A. y Wilkie, A. C. (2003). Manure-Borne Estrogens as Potential Environmental Contaminants: A Review. Environ Sci Technol 37, 5471-5478.

Harder, J. y Probian, C. (1997). Anaerobic mineralization of cholesterol by a novel type of denitrifying bacterium. Arch Microbiol 167, 269-274.

Hayami, M., Okabe, A., Sasai, K., Hayashi, H. y Kanemasa, Y. (1979). Presence and synthesis of cholesterol in stable staphylococcal L-forms. J Bacteriol 140, 859-863.

Holthaus, K. I. E., Johnson, A. C., rgens, M. D., Williams, R. J., Smith, J. J. L. y Carter, J. E. (2002). The potential for estradiol and ethinylestradiol to sorb to suspended and bed sediments in some English rivers. Environ Toxicol Chem 21, 2526-2535.

Hong, F., Breitling, R., McEntee, C. W., Wittner, B. S., Nemhauser, J. L. y Chory, J. (2006). RankProd: a bioconductor package for detecting differentially expressed genes in meta-analysis. Bioinformatics 22, 2825-2827.

Horinouchi, M., Yamamoto, T., Taguchi, K., Arai, H. y Kudo, T. (2001). Meta- cleavage enzyme gene tesB is necessary for testosterone degradation in Comamonas testosteroni TA441. Microbiology 147, 3367-3375.

Horinouchi, M., Hayashi, T., Koshino, H., Yamamoto, T. y Kudo, T. (2003a). Gene Encoding the Hydrolase for the Product of the meta-Cleavage Reaction in Testosterone Degradation by Comamonas testosteroni. Appl Environ Microbiol 69, 2139-2152.

Horinouchi, M., Hayashi, T., Yamamoto, T. y Kudo, T. (2003b). A New Bacterial Steroid Degradation Gene Cluster in Comamonas testosteroni TA441 Which Consists of Aromatic-Compound Degradation Genes for Seco-Steroids and 3-Ketosteroid Dehydrogenase Genes. Appl Environ Microbiol 69, 4421-4430.

Horinouchi, M., Hayashi, T. y Kudo, T. (2004a). The genes encoding the hydroxylase of 3-hydroxy-9,10-secoandrosta-1,3,5(10)-triene-9,17-dione in steroid degradation in Comamonas testosteroni TA441. J Steroid Biochem Mol Biol 92, 143-154.

Horinouchi, M., Kurita, T., Yamamoto, T., Hatori, E., Hayashi, T. y Kudo, T. (2004b). Steroid degradation gene cluster of Comamonas testosteroni consisting of 18 putative genes

238 Bibliografía from meta-cleavage enzyme gene tesB to regulator gene tesR. Biochem Biophys Res Commun 324, 597-604.

Horinouchi, M., Hayashi, T., Koshino, H., Kurita, T. y Kudo, T. (2005). Identification of 9,17-Dioxo-1,2,3,4,10,19-Hexanorandrostan-5-oic Acid, 4-Hydroxy-2-Oxohexanoic Acid, and 2-Hydroxyhexa-2,4-Dienoic Acid and Related Enzymes Involved in Testosterone Degradation in Comamonas testosteroni TA441. Appl Environ Microbiol 71, 5275-5281.

Horinouchi, S., Ishizuka, H. y Beppu, T. (1991). Cloning, nucleotide sequence, and transcriptional analysis of the NAD(P)-dependent cholesterol dehydrogenase gene from a Nocardia sp. and its hyperexpression in Streptomyces spp. Appl Environ Microbiol 57, 1386-1393.

Horswill, A. R. y Escalante-Semerena, J. C. (1999). The prpE gene of Salmonella typhimurium LT2 encodes propionyl-CoA synthetase. Microbiology 145, 1381-1388.

Horvath, J. y Kramli, A. (1947). Microbiological Oxidation of Cholesterol with Azotobacter. Nature 160, 639.

Hwang, C.-C., Chang, Y.-H., Hsu, C.-N., Hsu, H.-H., Li, C.-W. y Pon, H.-I. (2005). Mechanistic Roles of Ser-114, Tyr-155, and Lys-159 in 3α-Hydroxysteroid Dehydrogenase/Carbonyl Reductase from Comamonas testosteroni. J Biol Chem 280, 3522-3528.

Imachi, H., Sekiguchi, Y., Kamagata, Y., Hanada, S., Ohashi, A. y Harada, H. (2002). Pelotomaculum thermopropionicum gen. nov., sp. nov., an anaerobic, thermophilic, syntrophic propionate-oxidizing bacterium. Int J Syst Evol Microbiol 52, 1729-1735.

Ishikawa, J., Yamashita, A., Mikami, Y., Hoshino, Y., Kurita, H., Hotta, K., Shiba, T. y Hattori, M. (2004). The complete genomic sequence of Nocardia farcinica IFM 10152. Proc Natl Acad Sci USA 101, 14925-14930.

Ivshina, I., Grishko, V., Nogovitsina, E., Kukina, T. y Tolstikov, G. (2005). Bioconversion of β-Sitosterol and Its Esters by of the Genus Rhodococcus. Appl Biochem Microbiol 41, 551-557.

Jackson, M., Camacho, L. R., Gicquel, B. y Guilhot, C. (2001). Gene Replacement and Transposon Delivery Using the Negative Selection Marker sacB. En Mycobacterium tuberculosis Protocols, pp. 59-75. Editado por T. Parish y N. G. Stoker. Totowa, NJ: Humana Press Inc.

Janssen, G. R. (1993). Eubacterial, archaebacterial, and eukaryotic genes that encode leaderless mRNA. En Industrial Microorganisms: Basic and Applied Molecular Genetics, pp. 59–67. Editado por R. H. Baltz, G. D. Hegeman y P. L. Skatrud. Washington, DC: American Society for Microbiology Press.

JCBN (1989). Nomenclature of steroids. Pure & Appl Chem 61, 1783-1822.

239 Bibliografía

Jones, P. G., VanBogelen, R. A. y Neidhardt, F. C. (1987). Induction of proteins in response to low temperature in Escherichia coli. J Bacteriol 169, 2092-2095.

Joshi, S. M., Pandey, A. K., Capite, N., Fortune, S. M., Rubin, E. J. y Sassetti, C. M. (2006). Characterization of mycobacterial virulence genes through genetic interaction mapping. Proc Natl Acad Sci USA 103, 11760-11765.

Kato, L. (1978). Cholesterol, a factor which is required for growth of mycobacteria from leprous tissues. Int J Lepr Other Mycobact Dis 46, 133-143.

Kendall, S. L., Rison, S. C. G., Movahedzadeh, F., Frita, R. y Stoker, N. G. (2004). What do microarrays really tell us about M. tuberculosis? Trends Microbiol 12, 537-544.

Kendall, S. L., Withers, M., Soffair, C. N., Moreland, N. J., Gurcha, S., Sidders, B., Frita, R., ten Bokum, A., Besra, G. S., Lott, J. S. y Stoker, N. G. (2007). A highly conserved transcriptional repressor controls a large regulon involved in lipid degradation in Mycobacterium smegmatis and Mycobacterium tuberculosis. Mol Microbiol 65, 684-699.

Kendall, S. L., Burgess, P., Balhana, R., Withers, M., ten Bokum, A., Lott, J. S., Gao, C., Uhia Castro, I. y Stoker, N. G. (2010). Cholesterol utilisation in mycobacteria is controlled by two TetR-type transcriptional regulators; kstR and kstR2. Microbiology, mic.0.034538-034530.

Keum, Y. S., Lee, Y. J. y Kim, J.-H. (2008). Metabolism of Nitrodiphenyl Ether Herbicides by Dioxin-Degrading Bacterium Sphingomonas wittichii RW1. J Agric Food Chem 56, 9146-9151.

Kieslich, K. (1985). Microbial side-chain degradation of sterols. J Basic Microbiol 25, 461-474.

King, J., D., Harmer, N., J., Preston, A., Palmer, C., M., Rejzek, M., Field, R., A., Blundell, T., L. y Maskell, D., J. (2007). Predicting protein function from structure : The roles of short-chain dehydrogenase/reductase enzymes in Bordetella O-antigen biosynthesis. J Mol Biol 374, 749-763.

Klein, U., Gimpl, G. y Fahrenholz, F. (1995). Alteration of the Myometrial Plasma Membrane Cholesterol Content with β-Cyclodextrin Modulates the Binding Affinity of the Oxytocin Receptor. Biochemistry 34, 13784-13793.

Knol, J., Bodewits, K., Hessels, G. I., Dijkhuizen, L. y van der Geize, R. (2008). 3- Keto-5α-steroid Δ1-dehydrogenase from Rhodococcus erythropolis SQ1 and its orthologue in Mycobacterium tuberculosis H37Rv are highly specific enzymes that function in cholesterol catabolism Biochem J 410, 339-346.

240 Bibliografía

Kotani, T., Yamamoto, T., Yurimoto, H., Sakai, Y. y Kato, N. (2003). Propane Monooxygenase and NAD+-Dependent Secondary Alcohol Dehydrogenase in Propane Metabolism by Gordonia sp. Strain TY-5. J Bacteriol 185, 7120-7128.

Kreit, J. y Sampson, N. S. (2009). Cholesterol oxidase: physiological functions. FEBS J 276, 6844-6856.

Krumme, M. L., Timmis, K. N. y Dwyer, D. F. (1993). Degradation of trichloroethylene by Pseudomonas cepacia G4 and the constitutive mutant strain G4 5223 PR1 in aquifer microcosms. Appl Environ Microbiol 59, 2746-2749.

Kuliopulos, A., Shortle, D. y Talalay, P. (1987). Isolation and sequencing of the gene encoding Δ5-3-ketosteroid isomerase of Pseudomonas testosteroni: overexpression of the protein. Proc Natl Acad Sci USA 84, 8893-8897.

Lack, N., Lowe, E. D., Liu, J., Eltis, L. D., Noble, M. E. M., Sima, E. y Westwooda, I. M. (2008). Structure of HsaD, a steroid-degrading hydrolase, from Mycobacterium tuberculosis. Acta Cryst F64, 2-7.

Lack, N. A., Yam, K. C., Lowe, E. D., Horsman, G. P., Owen, R. L., Sim, E. y Eltis, L. D. (2009). Characterization of a Carbon-Carbon Hydrolase from Mycobacterium tuberculosis Involved in Cholesterol Metabolism. J Biol Chem 285, 434-443.

Laemmli, U. K. (1970). Cleavage of structural proteins during the assembly of the head of bacteriophage T4. Nature 227, 680-685.

Lamb, D. C., Kelly, D. E., Manning, N. J. y Kelly, S. L. (1998). A sterol biosynthetic pathway in Mycobacterium. FEBS Lett 437, 142-144.

Lamberti, Y., Perez Vidakovics, M. L., van der Pol, L.-W. y Rodríguez, M. E. (2008). Cholesterol-rich domains are involved in Bordetella pertussis phagocytosis and intracellular survival in neutrophils. Microb Pathog 44, 501-511.

Lario, P. I., Sampson, N. y Vrielink, A. (2003). Sub-atomic Resolution Crystal Structure of Cholesterol Oxidase: What Atomic Resolution Crystallography Reveals about Enzyme Mechanism and the Role of the FAD Cofactor in Redox Activity. J Mol Biol 326, 1635- 1650.

Larkin, M. J., Kulakov, L. A. y Allen, C. C. R. (2005). Biodegradation and Rhodococcus - masters of catabolic versatility. Curr Opin Biotechnol 16, 282-290.

Lee, L. S., Strock, T. J., Sarmah, A. K. y Rao, P. S. C. (2003). Sorption and Dissipation of Testosterone, Estrogens, and Their Primary Transformation Products in Soils and Sediment. Environ Sci Technol 37, 4098-4105.

Leonardo, M. R., Moser, D. P., Barbieri, E., Brantner, C. A., MacGregor, B. J., Paster, B. J., Stackebrandt, E. y Nealson, K. H. (1999). Shewanella pealeana sp. nov., a

241 Bibliografía member of the microbial community associated with the accessory nidamental gland of the squid Loligo pealei. Int J Syst Bacteriol 49, 1341-1351.

Li, J., Vrielink, A., Brick, P. y Blow, D. M. (1993). Crystal structure of cholesterol oxidase complexed with a steroid substrate: Implications for flavin adenine dinucleotide dependent alcohol oxidases. Biochemistry 32, 11507-11515.

Linares, M., Pruneda-Paz, J. L., Reyna, L. y Genti-Raimondi, S. (2008). Regulation of testosterone degradation in Comamonas testosteroni. J Steroid Biochem Mol Biol 112, 145- 150.

Maldonado, L. A., Fenical, W., Jensen, P. R., Kauffman, C. A., Mincer, T. J., Ward, A. C., Bull, A. T. y Goodfellow, M. (2005). Salinispora arenicola gen. nov., sp. nov. and Salinispora tropica sp. nov., obligate marine actinomycetes belonging to the family Micromonosporaceae. Int J Syst Evol Microbiol 55, 1759-1766.

Marques, M. A., Neves-Ferreira, A. G., da Silveira, E. K., Valente, R. H., Chapeaurouge, A., Perales, J., da Silva Bernardes, R., Dobos, K. M., Spencer, J. S., Brennan, P. J. y Pessolani, M. C. (2008). Deciphering the proteomic profile of Mycobacterium leprae cell envelope. Proteomics 8, 2477-2491.

Martin, C. K. A. (1977). Microbial cleavage of sterol side chains. Adv Appl Microbiol 22, 29-58.

Maxam, A. M. y Gilbert, W. (1977). A new method for sequencing DNA. Proc Natl Acad Sci USA 74, 560-564.

McLeod, M. P., Warren, R. L., Hsiao, W. W. L., Araki, N., Myhre, M., Fernandes, C., Miyazawa, D., Wong, W., Lillquist, A. L., Wang, D., Dosanjh, M., Hara, H., Petrescu, A., Morin, R. D., Yang, G., Stott, J. M., Schein, J. E., Shin, H., Smailus, D., Siddiqui, A. S., Marra, M. A., Jones, S. J. M., Holt, R., Brinkman, F. S. L., Miyauchi, K., Fukuda, M., Davies, J. E., Mohn, W. W. y Eltis, L. D. (2006). The complete genome of Rhodococcus sp. RHA1 provides insights into a catabolic powerhouse. Proc Natl Acad Sci USA 103, 15582-15587.

Miller, W. L. (1988). Molecular Biology of Steroid Hormone Synthesis. Endocr Rev 9, 295-318.

Mindnich, R., Moller, G. y Adamski, J. (2004). The role of 17β-hydroxysteroid dehydrogenases. Mol Cell Endocrinol 218, 7-20.

Miner, M. D., Chang, J. C., Pandey, A. K., Sassetti, C. M. y Sherman, D. R. (2009). Role of cholesterol in Mycobacterium tuberculosis infection. Indian J Exp Biol 47, 407- 411.

242 Bibliografía

Mohn, W. W., van der Geize, R., Stewart, G. R., Okamoto, S., Liu, J., Dijkhuizen, L. y Eltis, L. D. (2008). The Actinobacterial mce4 Locus Encodes a Steroid Transporter. J Biol Chem 283, 35368-35374.

Moll, I., Grill, S., Gualerzi, C. O. y Bläsi, U. (2002). Leaderless mRNAs in bacteria: surprises in ribosomal recruitment and translational control. Mol Microbiol 43, 239-246.

Morii, S., Fujii, C., Miyoshi, T., Iwami, M. y Itagaki, E. (1998). 3-Ketosteroid-Δ1- dehydrogenase of Rhodococcus rhodochrous: sequencing of the genomic DNA and hyperexpression, purification, and characterization of the recombinant enzyme. J Biochem 124, 1026-1032.

Nagasawa, M., Bae, M., Tamura, G. y Arima, K. (1969). Microbial transformation of steroids. Part II. Cleavage os sterols side chains by microorganisms. Agric Biol Chem 33, 1644-1650.

Nauta, A., Sinderen, O., Karsens, H., Smit, E., Venema, G. y Kok, J. (1996). Inducible gene expression mediated by a repressor-operator system isolated from Lactococcus lactis bacteriophage r1t. Molecular Microbiology 19, 1331-1341.

Navas, J., Gonzalez-Zorn, B., Ladron, N., Garrido, P. y Vazquez-Boland, J. A. (2001). Identification and Mutagenesis by Allelic Exchange of choE, Encoding a Cholesterol Oxidase from the Intracellular Pathogen Rhodococcus equi. J Bacteriol 183, 4796-4805.

Nelson, D. L. y Cox, M. M. (2004). Lehninger Principles of Biochemistry, 4th edn: Freeman, W. H.

Nevozhay, D., Adams, R. M., Murphy, K. F., Josic, K. y Balázsi, G. (2009). Negative autoregulation linearizes the dose-response and suppresses the heterogeneity of gene expression. Proc Natl Acad Sci USA 106, 5123-5128.

Oppermann, U., Filling, C., Hult, M., Shafqat, N., Wu, X., Lindh, M., Shafqat, J., Nordling, E., Kallberg, Y., Persson, B. y Jörnvall, H. (2003). Short-chain dehydrogenases/reductases (SDR): the 2002 update. Chem Biol Interact 143-144, 247-253.

Orth, P., Schnappinger, D., Hillen, W., Saenger, W. y Hinrichs, W. (2000). Structural basis of gene regulation by the tetracycline inducible Tet repressor-operator system. Nat Struct Mol Biol 7, 215-219.

Owen, R. W., Mason, A. N. y Bilton, R. F. (1983). The degradation of cholesterol by Pseudomonas sp. NCIB 10590 under aerobic conditions. J Lipid Res 24, 1500-1511.

Pandey, A. K. y Sassetti, C. M. (2008). Mycobacterial persistence requires the utilization of host cholesterol. Proc Natl Acad Sci USA 105, 4376-4380.

243 Bibliografía

Papa, R., Parrilli, E. y Sannia, G. (2009). Engineered marine Antarctic bacterium Pseudoalteromonas haloplanktis TAC125: a promising micro-organism for the bioremediation of aromatic compounds. J appl microbiol 106, 49-56.

Parish, T. y Stoker, N. G. (1998). Electroporation of Mycobacteria. En Mycobacteria Protocols, pp. 129-144. Editado por T. Parish y N. G. Stoker: Humana Press.

Park, S. J. y Lee, S. Y. (2003). Identification and Characterization of a New Enoyl Coenzyme A Hydratase Involved in Biosynthesis of Medium-Chain-Length Polyhydroxyalkanoates in Recombinant Escherichia coli. J Bacteriol 185, 5391-5397.

Peyron, P., Bordier, C., N'Diaye, E.-N. y Maridonneau-Parini, I. (2000). Nonopsonic Phagocytosis of Mycobacterium kansasii by Human Neutrophils Depends on Cholesterol and Is Mediated by CR3 Associated with Glycosylphosphatidylinositol-Anchored Proteins. J Immunol 165, 5186-5191.

Podust, L. M., Poulos, T. L. y Waterman, M. R. (2001). Crystal structure of cytochrome P450 14α-sterol demethylase (CYP51) from Mycobacterium tuberculosis in complex with azole inhibitors. Proc Natl Acad Sci USA 98, 3068-3073.

Poole, A. J. y Cord-Ruwisch, R. (2004). Treatment of strongflow wool scouring effluent by biological emulsion destabilisation. Water Res 38, 1419-1426.

Pruneda-Paz, J. L., Linares, M., Cabrera, J. E. y Genti-Raimondi, S. (2004). TeiR, a LuxR-Type Transcription Factor Required for Testosterone Degradation in Comamonas testosteroni. J Bacteriol 186, 1430-1437.

Raman, D. R., Williams, E. L., Layton, A. C., Burns, R. T., Easter, J. P., Daugherty, A. S., Mullen, M. D. y Sayler, G. S. (2004). Estrogen Content of Dairy and Swine Wastes. Environ Sci Technol 38, 3567-3573.

Ramos, J. L., Martinez-Bueno, M., Molina-Henares, A. J., Teran, W., Watanabe, K., Zhang, X., Gallegos, M. T., Brennan, R. y Tobes, R. (2005). The TetR Family of Transcriptional Repressors. Microbiol Mol Biol Rev 69, 326-356.

Richet, H. M., Craven, P. C., Brown, J. M., Lasker, B. A., Cox, C. D., McNeil, M. M., Tice, A. D., Jarvis, W. R. y Tablan, O. C. (1991). A cluster of Rhodococcus (Gordona) Bronchialis sternal-wound infections after coronary-artery bypass surgery. N Engl J Med 324, 104-109.

Romine, M. F., Stillwell, L. C., Wong, K.-K., Thurston, S. J., Sisk, E. C., Sensen, C., Gaasterland, T., Fredrickson, J. K. y Saffer, J. D. (1999). Complete Sequence of a 184- Kilobase Catabolic Plasmid from Sphingomonas aromaticivorans F199. J Bacteriol 181, 1585-1602.

Rosłoniec, K. Z., Wilbrink, M., Capyk, J. K., Mohn, W. W., Ostendorf, M., van der Geize, R., Dijkhuizen, L. y Eltis, L. D. (2009). Cytochrome P450 125 (CYP125) catalyzes

244 Bibliografía

C26-hydroxylation to initiate sterol side chain degradation in Rhodococcus jostii RHA1. Mol Microbiol 74, 1031-1043.

Routledge, E. J., Sheahan, D., Desbrow, C., Brighty, G. C., Waldock, M. y Sumpter, J. P. (1998). Identification of Estrogenic Chemicals in STW Effluent. 2. In Vivo Responses in Trout and Roach. Environ Sci Technol 32, 1559-1565.

Saeed, A. I., Sharov, V., White, J., Li, J., Liang, W., Bhagabati, N., Braisted, J., Klapa, M., Currier, T., Thiagarajan, M., Sturn, A., Snuffin, M., Rezantsev, A., Popov, D., Ryltsov, A., Kostukovich, E., Borisovsky, I., Liu, Z., Vinsavich, A., Trush, V. y Quackenbush, J. (2003). TM4: a free, open-source system for microarray data management and analysis. Biotechniques 34, 374-378.

Saiki, T., Kobayashi, Y., Kawagoe, K. y Beppu, T. (1985). Dictyoglomus thermophilum gen. nov., sp. nov., a Chemoorganotrophic, Anaerobic, Thermophilic Bacterium. Int J Syst Bacteriol 35, 253-259.

Sambrook, J. y Russell, D. W. (2001). Molecular cloning: A laboratory manual, 3rd edn: Cold Spring Harbor Laboratory Press

Sanger, F., Nicklen, S. y Coulson, A. R. (1977). DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci USA 74, 5463–5467.

Sassetti, C. M. y Rubin, E. J. (2003). Genetic requirements for mycobacterial survival during infection. Proc Natl Acad Sci USA 100, 12989-12994.

Scrutton, N. S., Berry, A. y Perham, R. N. (1990). Redesign of the coenzyme specificity of a dehydrogenase by protein engineering. Nature 343, 38-43.

Schnappinger, D., Ehrt, S., Voskuil, M. I., Liu, Y., Mangan, J. A., Monahan, I. M., Dolganov, G., Efron, B., Butcher, P. D., Nathan, C. y Schoolnik, G. K. (2003). Transcriptional Adaptation of Mycobacterium tuberculosis within Macrophages: Insights into the Phagosomal Environment. J Exp Med 198, 693-704.

Schoemer, U. y Martin, C. K. A. (1980). Microbial transformation of sterols. Biotechnol Bioeng 22, 11-25.

Sedlaczek, L. y Smith, L. L. (1988). Biotransformations of Steroids. Crit Rev Biotechnol 7, 187-236.

Sharp, J. O., Sales, C. M., LeBlanc, J. C., Liu, J., Wood, T. K., Eltis, L. D., Mohn, W. W. y Alvarez-Cohen, L. (2007). An Inducible Propane Monooxygenase Is Responsible for N-Nitrosodimethylamine Degradation by Rhodococcus sp. Strain RHA1. Appl Environ Microbiol 73, 6930-6938.

Shen-Orr, S. S., Milo, R., Mangan, S. y Alon, U. (2002). Network motifs in the transcriptional regulation network of Escherichia coli. Nat Genet 31, 64-68.

245 Bibliografía

Shennan, J. L. (2006). Utilization of C2-C4 gaseous hydrocarbons and isoprene by microorganisms. J Chem Technol Biotechnol 81, 237-256.

Slupska, M. M., King, A. G., Fitz-Gibbon, S., Besemer, J., Borodovsky, M. y Miller, J. H. (2001). Leaderless transcripts of the crenarchaeal hyperthermophile Pyrobaculum aerophilum. J Mol Biol 309, 347-360.

Smith, A. G. y Brooks, C. J. W. (1974). Application of Cholesterol oxidase in the analysis of steroids. J Chromatogr 101, 373-378.

Snapper, S. B., Melton, R. E., Mustafa, S., Kieser, T. y Jacobs, W. R. J. (1990). Isolation and characterization of efficient plasmid transformation mutants of Mycobacterium smegmatis. Mol Microbiol 4, 1911-1919.

Söhngen, N. L. (1913). Benzin, Petroleum, Paraffinöl und Paraffin als Kohlenstoff- und Energiequelle für Mikroben. Zentr Bacteriol Parasitenk Abt II 37, 595-609.

Steffan, R. J., McClay, K., Vainberg, S., Condee, C. W. y Zhang, D. (1997). Biodegradation of the gasoline oxygenates methyl tert-butyl ether, ethyl tert-butyl ether, and tert-amyl methyl ether by propane-oxidizing bacteria. Appl Environ Microbiol 63, 4216-4222.

Studier, F. W. y Moffatt, B. A. (1986). Use of bacteriophage T7 RNA polymerase to direct selective high-level expression of cloned genes. J Mol Biol 189, 113-130.

Stutzenberger, F. J. (1971). Cellulase Production by Thermomonospora curvata Isolated from Municipal Solid Waste Compost. Appl Environ Microbiol 22, 147-152.

Swank, R. T. y Munkres, K. D. (1971). Molecular weight analysis of oligopeptides by electrophoresis in polyacrylamide gel with sodium dodecyl sulfate. Anal Biochem 39, 462- 477.

Szentirmai, A. (1990). Microbial physiology of sidechain degradation of sterols. J Ind Microbiol Biotechnol 6, 101-115.

Tak, J. (1942). On bacteria decomposing cholesterol. Antonie van Leeuwenhoek 8, 32-40.

Tarlera, S. y Denner, E. B. M. (2003). Sterolibacterium denitrificans gen. nov., sp. nov., a novel cholesterol-oxidizing, denitrifying member of the β-. Int J Syst Evol Microbiol 53, 1085-1091.

Taylor, C. D., Smith, S. O. y Gagosian, R. B. (1981). Use of microbial enrichments for the study of the anaerobic degradation of cholesterol. Geochim Cosmochim Acta 45, 2161- 2168.

246 Bibliografía

Tedin, K., Resch, A. y Bläsi, U. (1997). Requirements for ribosomal protein S1 for translation initiation of mRNAs with and without a 5' leader sequence. Mol Microbiol 25, 189-199.

Thompson, J. D., Higgins, D. G. y Gibson, T. J. (1994). CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucl Acids Res 22, 4673-4680.

Tolstrup, N., Sensen, C. W., Garrett, R. A. y Clausen, I. G. (2000). Two different and highly organized mechanisms of translation initiation in the archaeon Sulfolobus solfataricus. Extremophiles 4, 175-179.

Trefault, N., Iglesia, R. D. l., Molina, A. M., Manzano, M., Ledger, T., Pérez-Pantoja, D., Sánchez, M. A., Stuardo, M. y González, B. (2004). Genetic organization of the catabolic plasmid pJP4 from Ralstonia eutropha JMP134 (pJP4) reveals mechanisms of adaptation to chloroaromatic pollutants and evolution of specialized chloroaromatic degradation pathways. Environ Microbiol 6, 655-668.

Tsuge, T., Fukui, T., Matsusaki, H., Taguchi, S., Kobayashi, G., Ishizaki, A. y Doi, Y. (2000). Molecular cloning of two (R)-specific enoyl-CoA hydratase genes from Pseudomonas aeruginosa and their use for polyhydroxyalkanoate synthesis. FEMS Microbiol Lett 184, 193-198.

Turfitt, G. E. (1944). Microbiological Agencies in the Degradation of Steroids: I. The Cholesterol-Decomposing Organisms of Soils. J Bacteriol 47, 487-493.

Turfitt, G. E. (1948). The microbiological degradation of steroids 4. Fission of the steroid molecule. Biochem J 42, 376-383.

Upton, A. M. y McKinney, J. D. (2007). Role of the methylcitrate cycle in propionate metabolism and detoxification in Mycobacterium smegmatis. Microbiology 153, 3973- 3982. van der Geize, R., Hessels, G. I., van Gerwen, R., Vrijbloed, J. W., van der Meijden, P. y Dijkhuizen, L. (2000). Targeted Disruption of the kstD Gene Encoding a 3- Ketosteroid Δ1-Dehydrogenase Isoenzyme of Rhodococcus erythropolis Strain SQ1. Appl Environ Microbiol 66, 2029-2036. van der Geize, R., Hessels, G. I., van Gerwen, R., van der Meijden, P. y Dijkhuizen, L. (2001). Unmarked gene deletion mutagenesis of kstD, encoding 3-ketosteroid Δ1- dehydrogenase, in Rhodococcus erythropolis SQ1 using sacB as counter-selectable marker. FEMS Microbiol Lett 205, 197-202. van der Geize, R., Hessels, G. I. y Dijkhuizen, L. (2002a). Molecular and functional characterization of the kstD2 gene of Rhodococcus erythropolis SQ1 encoding a second 3- ketosteroid Δ1-dehydrogenase isoenzyme. Microbiology 148, 3285-3292.

247 Bibliografía van der Geize, R., Hessels, G. I., van Gerwen, R., van der Meijden, P. y Dijkhuizen, L. (2002b). Molecular and functional characterization of kshA and kshB, encoding two components of 3-ketosteroid 9α-hydroxylase, a class IA monooxygenase, in Rhodococcus erythropolis strain SQ1. Mol Microbiol 45, 1007-1018. van der Geize, R. y Dijkhuizen, L. (2004). Harnessing the catabolic diversity of rhodococci for environmental and biotechnological applications. Curr Opin Microbiol 7, 255-261. van der Geize, R., Yam, K., Heuser, T., Wilbrink, M. H., Hara, H., Anderton, M. C., Sim, E., Dijkhuizen, L., Davies, J. E., Mohn, W. W. y Eltis, L. D. (2007). A gene cluster encoding cholesterol catabolism in a soil actinomycete provides insight into Mycobacterium tuberculosis survival in macrophages. Proc Natl Acad Sci USA 104, 1947- 1952. van der Geize, R., Hessels, G. I., Nienhuis-Kuiper, M. y Dijkhuizen, L. (2008). Characterization of a Second Rhodococcus erythropolis SQ1 3-Ketosteroid 9α-Hydroxylase Activity Comprising a Terminal Oxygenase Homologue, KshA2, Active with Oxygenase- Reductase Component KshB. Appl Environ Microbiol 74, 7197-7203.

Veiga, P., Juste, C., Lepercq, P., Saunier, K., Béguet, F. y Gérard, P. (2005). Correlation between faecal microbial community structure and cholesterol-to-coprostanol conversion in the human gut. FEMS Microbiol Lett 242, 81-86.

Vrielink, A., Lloyd, L. F. y Blow, D. M. (1991). Crystal structure of cholesterol oxidase from Brevibacterium sterolicum refined at 1.8 Å resolution. J Mol Biol 219, 533-554.

Walz, A., Pirrotta, V. y Ineichen, K. (1976). Lambda represser regulates the switch between PR and Prm promoters. Nature 262, 665-669.

Warren, R., Hsiao, W. W. L., Kudo, H., Myhre, M., Dosanjh, M., Petrescu, A., Kobayashi, H., Shimizu, S., Miyauchi, K., Masai, E., Yang, G., Stott, J. M., Schein, J. E., Shin, H., Khattra, J., Smailus, D., Butterfield, Y. S., Siddiqui, A., Holt, R., Marra, M. A., Jones, S. J. M., Mohn, W. W., Brinkman, F. S. L., Fukuda, M., Davies, J. y Eltis, L. D. (2004). Functional Characterization of a Catabolic Plasmid from Polychlorinated- Biphenyl-Degrading Rhodococcus sp. Strain RHA1. J Bacteriol 186, 7783-7795.

Weeks, O. B. y Francesconi, M. D. (1978). Occurrence of squalene and sterols in Cellulomonas dehydrogenans (Arnaudi 1942) comb. nov. Hester 1971. J Bacteriol 136, 614-624.

Whitmarsh, J. M. (1964). Intermediates of microbiological metabolism of cholesterol. Biochem J 90, 23.

248 Bibliografía

Xiong, G., Martin, H.-J., Blum, A., Schäfers, C. y Maser, E. (2001). A model on the regulation of 3α-hydroxysteroid dehydrogenase/carbonyl reductase expression in Comamonas testosteroni. Chem Biol Interact 130-132, 723-736.

Xiong, G., Martin, H.-J. y Maser, E. (2003). Characterization and recombinant expression of the translational repressor RepB of 3α-hydroxysteroid dehydrogenase/carbonyl reductase in Comamonas testosteroni. Chem-Biol Interact 143- 144, 425-433.

Yam, K. C., D'Angelo, I., Kalscheuer, R., Zhu, H., Wang, J.-X., Snieckus, V., Ly, L. H., Converse, P. J., Jacobs, W. R., Jr., Strynadka, N. y Eltis, L. D. (2009). Studies of a Ring-Cleaving Dioxygenase Illuminate the Role of Cholesterol Metabolism in the Pathogenesis of Mycobacterium tuberculosis. PLoS Pathog 5, e1000344.

Yang, X., Dubnau, E., Smith, I. y Sampson, N. S. (2007). Rv1106c from Mycobacterium tuberculosis Is a 3β-Hydroxysteroid Dehydrogenase. Biochemistry 46, 9058-9067.

Yue, Q. K., Kass, I. J., Sampson, N. S. y Vrielink, A. (1999). Crystal Structure Determination of Cholesterol Oxidase from Streptomyces and Structural Characterization of Key Active Site Mutants. Biochemistry 38, 4277-4286.

Zhao, J.-S., Manno, D., Leggiadro, C., O'Neil, D. y Hawari, J. (2006). Shewanella halifaxensis sp. nov., a novel obligately respiratory and denitrifying psychrophile. Int J Syst Evol Microbiol 56, 205-212.

249