“I could be bounded in a nutshell and count myself the king of infinite space were it not that I have bad dreams…”

William Shakespeare,1609. Hamlet . Acto II. Escena IV.

“…the characters which naturalists consider as showing true affinity between any two or more species, are those which have been inherited from a common parent, all true classification being genealogical;—that community of descent is the hidden bond which naturalists have been unconsciously seeking, and not some unknown plan of creation, or the enunciation of general propositions, and the mere putting together and separating objects more or less alike.”

Charles Robert Darwin, 1859. The origin of Species.

“Nothing in biology makes sense except in the light of evolution.“

Theodosius Dobzhansky, 1973. The American Biology Teacher.

1

AISLAMIENTO DE CANDIDATOS A GENES DE RESISTENCIA CONTRA LA MANCHA ANGULAR DE LA HOJA EN EL FRIJOL COMUN

Fausto Rodríguez Zapata.

Trabajo de grado presentado como requisito parcial para optar al título de biólogo.

Director: Joe Tohmé, Genetista, Ph.D.

Primer Codirector: Catalina Romero, Bióloga.

Segundo Codirector: Alfredo Badillo, Biólogo, Ph.D.

.

UNIVERSIDAD DE LOS ANDES Facultad de Ciencias Departamento de Ciencias Biológicas Bogotá D. C.

2

AISLAMIENTO DE CANDIDATOS A GENES DE RESISTENCIA CONTRA LA...... 2 1. OBJETIVOS...... 8

1.1. OBJETIVO GENERAL...... 8 1.2. OBJETIVOS ESPECÍFICOS...... 8 2. MARCO TEORICO...... 10 2.1. FRÍJOL...... 10 2.1.1. Caracteres vegetativos...... 10 2.1.2. Caracteres reproductivos...... 11 2.1.3. El fríjol como producto alimenticio y de importancia económica...... 12 2.1.4. Diversidad...... 14 2.1.4.1. Contexto filogenético de vugalris...... 14 2.1.4.2. Acervos genéticos del fríjol común y diversidad intraespecífica ...... 17 2.2. PLANTAS DE FRÍJOL UTILIZADAS EN EL AISLAMIENTO DE HOMÓLOGOS DE GENES DE RESISTENCIA DEL LOCUS RGC7...... 26 2.2.1. G19833...... 27 2.2.2. DOR364...... 28 2.2.3. ‘Sprite’...... 28 2.3. MANCHA ANGULAR DE LA HOJA...... 31 2.3.1. Distribución...... 32 2.3.2. Importancia económica...... 32 2.3.3. Taxonomía y afinidades evolutivas de P. griseola...... 34 2.3.4. Espectro de hospederos...... 36 2.3.5. Síntomas...... 36 2.3.6. Proceso de infección...... 37 2.3.7. Diversidad...... 41 2.3.8. Herencia y fuentes de resistencia contra la mancha angular en el fríjol común...... 44 2.4. RESISTENCIA A ENFERMEDADES EN PLANTAS...... 47 2.4.1. Sistema inmune innato...... 48 2.4.2. Hipótesis del “gen por gen”...... 51 2.4.3. Genes de resistencia como receptores del sistema inmune innato: las proteínas de resistencia poseen una arquitectura modular...... 52 2.4.3.1. Dominio TIR (Toll-Interleukin 1 receptor- Resistance)...... 54 2.4.3.2. Dominio de unión a nucleótido NBS (Nucleotide Binding Site)...... 55 2.4.3.3. Dominio de repeticiones ricas en leucina LRR (Leucine Rich repeats)...... 56 2.4.3.4. Dominio de bucles superenrollados CC (Coiled Coil)...... 59 2.4.3.5. Dominio de kinasa serina/treonina STK (Serine/Threonin Kinase)...... 59 2.4.3.6. Interacciones intramoleculares...... 61 2.4.3.7. Hipótesis del gen guardián...... 64 2.4.4. Estructura y evolución de clústers de genes de resistencia...... 67 2.4.4.1. Estructura y función...... 67 2.4.4.2. Evolución de los clústers de genes R...... 70 2.5. MAPEO DE QT L S Y AISLAMIENTO (CLONACIÓN) DE GENES DE RESISTENCIA...... 74 3. MATERIALES Y METODOS...... 76

3.1. MATERIAL VEGETAL...... 76 3.2. MAPEO DE MICROSATÉLITES Y ANÁLISIS DE QTL...... 76 3.3. AISLAMIENTO DE CANDIDATOS DE GENES DE RESISTENCIA HOMÓLOGOS A RGC7 EN EL GENOTIPO RESISTENTE G19833...... 79 3.4. ANÁLISIS BIOINFORMÁTICOS...... 84 3.4.1. Ensamblaje de contigs...... 84 3.4.2. Anotación de secuencias de ADN: determinación de exones e intrones...... 88 3.4.3. Anotación de las proteínas predichas: Determinación de dominios y motivos proteicos conservados...... 92

4

3.4.4. Método iterativo de anotación basado en la construcción de un alineamiento múltiple anotado...... 93 4. RESULTADOS Y DISCUSIÓN...... 96 4.1. MAPEO DE MICROSATÉLITES Y ANÁLISISIS DE QTL...... 96 CORRELACIÓN CON LA RESISTENCIA...... 102 MARCADOR...... 102 4.2. AISLAMIENTO DE HOMÓLOGOS A GENES DE RESISTENCIA DEL LOCUS RGC7...... 107 4.3. ANOTACIÓN DE LAS SECUENCIAS ENCONTRADAS...... 110 4.3.1. Anotación de secuencias de ADN: determinación de exones e intrones...... 114 4.3.2. Anotación de las proteínas predichas: Determinación de dominios y motivos proteicos conservados...... 119 4.3.2.1. Dominio TIR de la familia RGC7...... 123 4.3.2.2. Fragmentos NBS...... 130 4.3.2.3. Repeticiones Ricas en Leucina...... 131 5. CONCLUSIONES Y PERSPECTIVAS...... 133 APENDICE A. TABLAS DE SIMILITUD DE SECUENCIA DE LOS FRAGMENTOS AISLADOS DE LA FAMILIA RGC7...... 137 6. LITERATURA CITADA...... 141

5

INTRODUCCION

La mancha angular de la hoja del fríjol (ALS) causada por el hongo hemibiótrofo

Phaeoisariopsis griseola (Saccardo) Ferraris, 1909. es una enfermedad que produce enormes pérdidas en las cosechas (Schwartz et al., 1981). Se conoce que la capacidad de las plantas para resistir esta enfermedad es un carácter cuantitativo heredable que puede estar determinado por unos pocos genes y que en algunos casos podría tener una segregación mendeliana ( Jara et al., 2002; Mahuku et al., 2004; Ferreira et al., 2000). En el proyecto de Agrobiodiversidad y Biotecnología del CIAT se desarrollaron marcadores moleculares candidatos a genes de resistencia (RGC) mediante el uso de cebadores degenerados que amplifican regiones homólogas a los dominios conservados TIR y NBS de proteínas de resistencia conocidas (López et al., 2003). La segregación de uno de tales marcadores, RGC7, explica el 63.9% y el 47% de variabilidad de la resistencia contra los aislaminetos 12MEX y 30CRI de P. griseola respectivamente, lo cual sugiere que este marcador se encuentra estrechamente ligado a un locus de carácter cuantitativo (QTL) que determina la respuenta inmmune contra el hongo (López et al., 2003). Con el fin de delimitar una región cromosómica que sirviera como base para la disección y el aislamiento del locus de resistencia se hibridó una sonda basada en RGC7 con clones genómicos de la librería BAC proveniente de variedad susceptible ‘Sprite’ (VanHouten et al., 1999). La caracterízación de los clones hibridantes con huellas moleculares RFLP confirmó que RGC7 es un locus complejo que contiene múltiples homólogos de genes de resistencia adyacentes físicamente (López et al., 2003). Dado que el clon 57M14 contenía la mayor cantidad de homólogos putativos de RGC7 se procedió a su secuenciación

6

mediante el uso de estrategias que incluyeron la caminata cromosómica simple (primer walking), además de la generación de librerias de transposición y de subclonación

(Acosta et al., 2002). El análisis de la información obtenida a partir de este clon reveló que existen 5 candidatos a genes de resistencia en una extención de 90 Kb secuenciados

(Acosta et al., 2003).

El presente trabajo consistió en el aislamiento de la secuencia de nucleótidos de los homólogos a genes de resistencia del locus RGC7 en la raza criolla resistente G19833.

Con tal objeto se utilizaron como cebadores secuencias de esta región genómica obtenida a partir de la cultivar ‘Sprite’.

7

1. OBJETIVOS

1.1. Objetivo general.

Aislar la secuencia genómica de homólogos los genes de resistencia del locus RGC7 en la raza criolla G19833 utilizando como cebadores secuencias provenientes del BAC 57M14 de la variedad ‘Sprite’.

1.2. Objetivos específicos.

- Confirmar el ligamiento genético entre la región física comprendida por el BAC57M14 y el QTL de resistencia contra la mancha angular del fríjol por medio del mapeo de microsatélites.

- Anotar las secuencias de nucleótidos, lo cual incluye diferenciar entre zonas codificantes o exones, y zonas no codificantes como intrones y regiones no transcritas.

- Anotar las correspondientes proteínas predichas por medio de la detección de dominios y motivos proteícos conservados.

8

2. MARCO TEORICO

2.1. Fríjol.

2.1.1. Caracteres vegetativos.

Phaseolus vulgaris Linnaeous, 1753. es una especie de leguminosa que en estado silvestre se presenta como una liana trepadora, generalmente anual, y de crecimineto indeterminado (Toro et al., 1995). Prospera en bosques de roble y pino, o en ambientes perturbados entre los 800 y 2750 msnm (Freytag & Debouck, 2002, Toro et al., 1990).

Las raíces son fibrosas y tienen nódulos formados por la simbiosis con bacterias fijadoras de nitrógeno del género Rizhobium (CIAT, 1984; Allen & Allen 1981; Martínez-Romero,

2003). Su germinación es epígea, los cotiledones suelen secarse y desprederse del tallo luego de dos semanas de desarrollo de la plántula (CIAT, 1984). El tallo es erecto con una fuerte tendecia a la torsión, propiedad clave que determina su capacidad para trepar

(CIAT, 1984). En una planta madura es de 1 a 6 metros de longitud y tiene un espesor de

2 a 3 cm en la base, además se ramifica sobre todo en la parte superior (Freytag &

Debouck, 2002). El color del tallo y las ramas es variable, puede ser verde, rojo, púrpura o café y depende de condiciones ambientales tales como la exposisción al sol (Freytag &

Debouck 2002; CIAT, 1984). Las hojas del fríjol común son dimórficas pero todas son de margen entero y tienen pulvínulo y estípulas en la base. Las hojas primarias, que se insertan en el primer nudo después del nudo cotiledonar, son simples, opuestas, con la base auriculada y la punta ligeramente acuminada (CIAT, 1984). Las hojas compuestas de los nodos posteriores son trifolioladas con peciolo y peciólulo (o raquis foliar)

(Freytag & Debouck 2002; CIAT, 1984). El foliolo central es simétrico de forma ovalada

10

a triangular y tiene 2 estipelas mientras que los foliolos laterales son asimétricos y cada uno de ellos posee sólamente una estipela en la base del peciólulo (CIAT, 1984).

2.1.2. Caracteres reproductivos.

La inflorescencia de P. vulgaris consiste en un pseudoracimo o racimo de racimos

(Freytag & Debouck 2002; CIAT, 1984). La flor zigomórfica es típica de las papilonáceas con una corola compuesta por un estandarte adaxial, alas extendidas hacia adelante (Freytag & Debouck, 2002) y la quilla orientada abaxialmente (Judd, 2002).

Esta última tiene forma de espiral muy cerrada, es asimétrica y está formada por dos pétalos connados (CIAT, 1984). La quilla de P. vulgaris envuelve completamente el androceo y el gineceo (CIAT, 1984). El calix es bilobado y está subtendido por una bracteola grande de 4-6 mm (Freytag & Debouck, 2002). El color de la corola es usualmente púrpura, aunque también puede ser blanca, rosada o roja pero nunca amarilla

(CIAT, 1984). El androceo está compuesto por 9 estambres connados que forman un tubo y un estambre vexilar libre de aproximadamente 12 mm con anteras amarillas (CIAT,

1984; Freytag & Debouck, 2002). La mitad de la longitud del gineceo corresopende al ovario súpero de 6.5 milímetros de longitud que contiene generalmente de 6 a 8 óvulos, la otra mitad corresponde al estilo que termina en un estigma lateral e introrso (Freytag &

Debouck 2002). Esta morfología de la flor favorece el mecanismo de autopolinización

(CIAT, 1984) lo que hace de la endogamia el principal modo reproductivo del fríjol común (Gepts, 1993). De hecho cuando se produce la dehisencia de las anteras (antésis) el polen cae directamente sobre el estigma (CIAT, 1984). El fruto es una vaina con una longitud de 5 a 7.5 cm o más que contiene semillas pequeñas y romboides en las

11

poblaciones silvestres, mientras que en las variedades cultivadas las semillas tienden a ser más grandes y de forma reniforme a esférica (Freytag & Debouck, 2002). En los fríjoles silvestres la dehiscencia explosiva de la vaina, asociada a un alto contenido de fibra en las valvas, sirve como mecanismo de dispersión de las semillas. (CIAT, 1984;

Gepts, 1993).

2.1.3. El fríjol como producto alimenticio y de importancia económica.

Existen dos clases comerciales principales de fríjol común: habichuela y fríjol seco. Las cultivares habichuela poseen mesocarpo suculento y carecen o tienen muy poca fibra en las paredes de las vainas verdes y en las suturas (Singh, 2001). Sin embargo la mayor parte de la producción (más de 14 millones de hectáreas) y del consumo de P. vulgaris en el mundo es de fríjoles secos (Singh, 2001).

El fríjol común juega un papel importante en la nutrición humana al complementar fuentes primarias de carbohidratos (como el maíz en las montañas de Latinoamérica y

Africa, o el arroz en el Brasil) con un sustancial aporte de proteínas dietarias, vitaminas y minerales (CIAT, 2003; Broughton et al., 2003). El fríjol es un alimento de primera necesidad en Africa oriental y del sur, llegando a tener índices de consumo per capita tan altos como 66 Kg anuales en la región de Kisii, Kenya (Broughton et al., 2003). Cabe notar que un consumo de 15 Kg/año aporta el 27% del hierro, 20% del fósforo, y el 12% de las proteínas que hacen parte de los requerimientos nutricionales básicos diarios de un adulto (Broughton et al., 2003). En América Latina el consumo de fríjol también es notable. En M éxico el consumo anual percapita promedio es mayor a los 16 Kg, y en

Brasil llega hasta 17.2 K; en Colombia es de unos 4.2 Kg, con el mayor consumo

12

correspondiente a 12.8 Kg en Medellín (Broughton et al., 2003). En aquellos pocos casos en los que se ha podido discriminar según el estrato socioeconómico se ha observado que el consumo en las familias de ingresos más bajos puede ser hasta un 20% más alto que el promedio local por lo que en este sentido el fríjol es ¨la carne de los pobres¨

(Broughton et al., 2003), es decir una fuente de proteínas económicamente accesible a la población de escasos recursos.

Las semillas de fríjol contienen entre 20 y 25% de proteínas que en su mayor parte corresponden a la proteína de almacenamiento faseolina (Broughton et al., 2003). El fríjol también es una fuente importante de hierro, fósforo, magnesio, manganeso y en menor grado de zinc, cobre y calcio lo que le permite suplir los requerimientos básicos de estos minerales (Broughton et al., 2003). En contraste los cereales procesados en molino, como el arroz y el trigo, pierden los minerales almacenados en la cubierta seminal, o salvado, hecho que reduce notablemente su contenido de micronutrientes.

(Broughton et al., 2003).

Phaseolus vulgaris es la leguminosa para consumo humano más importante en el mundo

(Broughton et al., 2003). La cosecha anual de fríjoles secos casi que duplica la producción de garbanzo que es la segunda leguminosa que le sigue en importancia

(Broughton et al., 2003). La producción anual de fríjol seco es de 18.8 millones de toneladas métricas lo que representa un mercado de aproximadamente 10,700 millones de dólares (CGIAR, 2003). Los fríjoles son uno de los alimentos más importantes de

Latinoamérica y Africa con una producción de 5.4 y 1.9 millones de toneladas métricas

13

por año respectivamente (CGIAR, 2003). Gran parte de las cosechas se pierde debido a

enfermedades fúngicas, bacterianas y virales, como también debido a las pestes de

insectos o a la sequía, la baja fertilidad del suelo y a otras condiciones abióticas de estrés.

(Broughton et al., 2003).

2.1.4. Diversidad.

2.1.4.1. Contexto filogenético de Phaseolus vugalris.

Después de la familia de las plantas compuestas y de las orquídeas, las leguminosas,

Fabaceae, con cerca de 700 géneros y 20,000 especies constituyen la tercer familia de

plantas con flores con mayor diversidad en el mundo (Doyle & Luweck, 2003).

Tradicionalmente se diferencian tres subfamilias de leguminosas (Figura 1) (Judd et al.,

2002). Mimosoidae que incluye las mimosas y las acacias. Caesalpinoide, un grupo

parafilético dentro del cual están árboles como el mataratón (Albizia sp.) y arbustos como

el alcaparro (Casia sp.). Y finalmente Papillionoidae, que es la subfamilia del fríjol.

Dentro de la subfamilia Papillionoidae se pueden reconocer dos clados principales (Doyle

& Luweck, 2003). Uno de estos clados, el linaje de los galegoides, está compuesto en su mayoría por especies herbáceas de regiones templadas, e incluye a los tréboles como

Trifolium sp. o Medicago truncatula, a las habas (Vicia sp.) y a las alverjas (Pisum sp.)

(Doyle & Luweck, 2003; Wojciechowski, 2000; Cannon et al., 2004). El otro linaje distintivo, del cual se deriva la rama de los faseoloides, incluye primordialmente especies de distribución trópical, dentro de las cuales se encuentran algunos miembros de la tribu

Phaseolae como el fríjol común P. vulgaris, el fríjol mungo, Vigna radiata, y la soya,

Glycine soja, entre otros (Doyle & Luweck, 2003). La tribu Phaseolae es de lejos el

14

grupo de leguminosas con mayor importancia económica y contiene el 75% de las

leguminosas comercializadas en el mundo (Broughton et al., 2003). En especial se

utilizan como alimento para el hombre y como especies forrajeras (Broughton et al.,

2003).

Género Repres entante Número de Tamaño del genoma cromos omasa (1C; pg)a (Gb)b

Caesalpi noidae Cassia Senna 28 (7) 1.76 1.88

Acacia Ac acia 26 (13) 1.47 1.57 Mimosoidae Lupi nus Lupino 26 (13) 0.9 0.96 Arachis Maní, c acahuate 40 (10) 1.74 1.85

Phas eolus Fríjol común 22 (11) 0.59 0.63 Vigna Fríjol mungo 22 (11) 0.52 0.55 Papillionoidae Glycine Soya 40 (20) 1.1 1.17 Cajanus G uandul 22 (11) 0.86 0.92 Phas eolae

e Melilotus Meliloto 16 (8) 1.1 1.17 Trifolium Trébol 32 (8) 0.96 1.02 Medicago Alfalfa 16 (8) 0.47 0.5

Pisum Al verja 14 (7) 4.34 4.63

Viceae Vicia Haba 12 (6) 13. 06 13.92

Sesbania Sesbania 20 (10) 0.64 0.68

Lot eae Trifolia Lot us L. j aponicus 12 (6) 0.47 0.5

Figura 1 Una filogenia de las leguminosas que muestra las tres subfamilias principales y detalles de algunas especies cultivadas en las Papillionoidae. a Número de cromosomas, número haploide entre paréntesis, y valor C provenientes de C-Value Data Base Kew Royal Botannical Gardens. b El tamaño en gigabases (1Gb ~ 109 pb) se calculó según Dolezel et al. (2003). Modificado de Young (2003).

El género Phaseolus es de origen neotropical (Debouck, 1999). Se estima que está

conformado por entre 50 y 60 especies de las cuales se han domesticado solamente cinco:

P. vulgaris, P. polyanthus, P. coccineus, P. acutifolius y P. lunatus (Debouck, 1999).

Estudios evolutivos basados en el uso de datos morfológicos (Delgado-Salinas et al.,

15

Macroptilium atropurpureum Macroptilium erythroloma Mysanthus uleanus Dolichopsis paraguarensis Strophostyles helvola Strophostyles umbellata Vigna linearis Vigna peduncularis Vigna speciosa Vigna caracalla Vigna populnea Oxyrhynchus trinervius Oxyrhynchus volubilis Ramirezella micrantha Ramirezella strobilophora Vigna adenantha Vigna gentryi Phaseolus microcarpus Phaseolus oaxacanus Phaseolus glabellus Phaseolus pedicellatus Phaseolus grayanus Phaseolus neglectus Phaseolus macrolepis Phaseolus oligospermus Phaseolus tuerckheimii Phaseolus chiapasanus Phaseolus zimapanensis Phaseolus hintonii Phaseolus xanthotrichus Phaseolus angustissimus Phaseolus filiformis Phaseolus acutifolius Phaseolus vulgaris Phaseolus albescens Phaseolus coccineus Phaseolus costaricensis Phaseolus polyanthus Phaseolus perplexus Phaseolus pluriflorus Phaseolus amblyosepalus Phaseolus nelsonii Phaseolus plagiocylix Phaseolus pauciflorus Phaseolus parvulus Phaseolus tenellus Phaseolus macvaughii Phaseolus leptostachyus Phaseolus micranthus Phaseolus lunatus Phaseolus mollis Phaseolus lignosus Phaseolus viridis Phaseolus bolivianus Phaseolus augustii Phaseolus pachyrhizoides Phaseolus maculatus Phaseolus ritensis Phaseolus sonorensis Phaseolus jaliscanus Phaseolus polystachios Phaseolus sinuatus Phaseolus smilacifolius Phaseolus marechalii Phaseolus xolocotzii Phaseolus juquilensis Phaseolus salicifolius

Figura 2. Filogenia del género Phaseolus construida a partir de secuencias del espaciador transcrito interno de genes de ARN ribosomal ITS/ 5.8S y de otros datos no moleculares, mediante análisis de máxima parsimonia. Especies que constituyen el acervo genético secundario y terciario del fríjol común pertenecen a un mismo grupo monofilético (indicado por la barra) que incluye a P. vulgaris. Modificado de Delgado- Salinas et al.,(1999).

16

1999), bioquímicos (Zalochi & Pomilio, 1994) y moleculares — proteínas de semilla

(Debouck, 1999.), isozimas y ADN cromosómico (Delgado-Salinas et al., 1999), de

cloroplastos (Delgado-Salinas et al., 1993, Llaca et al., 1994), mitocondrial (Khairallah et

al., 1991), etc. — han confirmado que el género es monofilético. En una reconstrucción filogénetica que utiliza secuencias ITS y datos no moleculares de númerosas especies de

Phaseolus, tanto cultivadas como silvestres, Delgado-Salinas y colaboradores (1999) identifican a P. microcarpus como especie basal dentro del género que incluye por lo menos dos linajes con buen soporte: las especies cercanamente emparentadas con P. lunatus y la rama evolutiva constituida por P. vulgaris, P. coccineus y P. Polyanthus

(Figura 2). Existe una notable diversidad morfológica al interior de este grupo de especies

en cuanto a su hábito (de arbustos a trepadoras), adaptación (de ambientes desérticos a

montañas frías), y sistemas reproductivos (de la cleistogamia a la exogamia) (Broughton

et al., 2003). A pesar de tal divergencia morfológica las especies pertenecientes al

complejo de P. vulgaris tienen la capacidad de entrecruzarse aún cuando el grado de

dificultad y la viabilidad de los cruces recíprocos varían (Broughton et al., 2003).

2.1.4.2. Acervos genéticos del fríjol común y diversidad intraespecífica

El concepto de acervo genético ha sido introducido para describir la facilidad con la que se pueden utilizar los recursos genéticos disponibles para la reproducción y el mejoramiento de las plantas (Spillane & Gepts, 2001; Chrispeels & Sadava, 2003). El grado de dificultad de los cruzamientos entre genotipos define el rango de acervo genético constituido por determinado grupo (Debouck & Gepts, 1991). La diversidad de las especies de Phaseolus se puede organizar en relación a P. vulgaris, en acervos

17

genéticos primario, secundario y terciario (Debouck 1991, 1999; Singh, 2001) y reflejan las relaciones evolutivas inferidas a partir de los análisis filogenéticos mencionados con anterioridad (Figura 2).

El acervo genético primario del fríjol común está compuesto por las poblaciones cultivadas y silvestres de P. vulgaris dado que los cruces entre ambas son completamente fértiles (Debouck 1999; Singh, 2001). La única barrera reproductiva se presenta entre frijoles andinos y mesoamericanos tanto en poblaciones silvestres como cultivadas

(Singh, 2001). Los genes Dl-1 en los fríjoles mesoamericanos y Dl-2 en los andinos restringen el intercambio y la introgresión genética (Singh, 2001).

P. coccineus, P. costarricensis, y P polyanthus hacen parte del acervo genético secundario del fríjol común ya que estas especies se pueden cruzar con P vulgaris aún cuando producen híbridos parcialmente estériles (Singh, 2001).

Finalmente P. acutifolius y P. parvifolius conforman el acervo genético terciario del fríjol común por la dificultad extrema en la hibridación con P. vulgaris. Tales cruces requieren de rescate de embriones para obtener plantas viables (Debouck 1991, 1999;

Singh, 2001), y además necesitan una o varias rondas de retrocruza con el parental de fríjol común para restaurar completamente la fertilidad (Singh 2001).

Siguiendo la definición de Gepts (1988) un acervo genético es un conjunto de genotipos caracterizados por tener:

18

i. Frecuencias alélicas específicas.

ii. Asociaciones similares de alelos.

iii. Adaptación diferencial a las condiciones ambientales.

iv. Una distribución geográfica definida.

v. Aislamiento reproductivo con los genotipos de otros acervos genéticos.

El proceso de especiación esta correlacionado con el cumplimiento de las condiciones i,

ii, iii y principalmente con la condición v, además es facilitado por la separación

geográfica de las poblaciones (condición iv). De aquí que la formación y persistencia de acervos genéticos al interior de P vulgaris sea acorde con un proceso de especiación incipiente del fríjol común ( Gepts 1998, Debouck, 2000).

Tanto en las en las poblaciones silvestres (Toro et al., 1990) como en las variedades cultivadas (Singh, 1991) de Phaseolus vulgaris se pueden distinguir dos acervos genéticos principales: el acervo genético M esoamericano y el acervo genético Andino.

Evidencia genética (Gepts, 1988), morfológica (Singh et al., 1991), molecular (Gepts,

1993; MacClean et al. 2004), y bioquímica (Gepts, 1993; Islam et al., 2003) apoya dicha división del germoplasma, Además al lado de estos dos grupos existe un conjunto de poblaciones distintivas conforman un tercer acervo genético más reducido que se ha denominado acervo genético Norandino (Islam et al., 2003).

19

Las poblaciones silvestres de Phaseolus vulgaris están distribuidas desde Chihuahua en

el norte de México hasta San Luis en Argentina noroccidental (Toro et al. 1994; Singh,

2001). Se ha inferido que el fríjol común tiene por lo menos dos centros de domesticación

que corresponden a los dos acervos genéticos más importantes (Gepts, 1991;Chacón,

2001), y existe evidencia que podría apoyar otros eventos de domesticación en Colombia

(Chacón, 2001), Bolivia (Beeve et al., 2001), Argentina (Santalla et al., 2004), como

también en varias localidades de México (Gepts, 1988). Estos hechos sugieren que el

fríjol común es un cultivo con múltiples sitios de domesticación a través de su rango de

distribución en América central y en la región andina de Suramérica (Singh, 2001). Sin

embargo aún se desconoce el centro de origen de las poblaciones silvestres de P. vulgaris

(Chacón, 2001). Al respecto existen dos hipótesis contrastantes, una atribuye el origen

del fríjol común a una población ancestral mesoamericana y la otra ubica el origen de P.

vulgaris en los Andes. La hipótesis del origen mesoamericano del fríjol común se apoya en que la distribución geográfica actual de las especies más cercanas a P vulgaris se

restringe a México, Honduras y Nicaragua (Chacón, 2001; Freytag & Debouck, 2002),

además los fríjoles mesoamericanos tienen una base genética más amplia que los andinos

(Beeve et al., 2000, Tohme et al., 1996), hecho que se predeciría si el germoplasma

andino se originó de una muestra del mesoamericano. Más recientemente el origen

mesoamericano del fríjol común ha sido respaldado por la distribución de haplotipos de

ADN cloroplástico, (Chacón, 2001). De otra parte algunas poblaciones de Ecuador y el

norte del Perú pueden considerarse ancestrales con respecto a los dos acervos genéticos

principales con base en la secuencia del gen de faseolina (Kami et al., 1995) lo que

apoyaría la hipótesis del origen andino del fríjol común.

20

Los fríjoles cultivados de acervo genético Andino se caracterizan por una semilla grande

(más de 40g de peso por cada 100 semillas) mientras que en los del Mesoaméricano el tamaño de las semillas tiende a ser menor (entre 25 y 40g de peso por cada 100 semillas) (Figura 3; Singh, 2001). La existencia de estos acervos genéticos se ve respaldada por la asociación del tamaño de la semilla con características, morfológicas, y moleculares como se puede ver en la Tabla 1 y Tabla 2.

Tabla 1. Diferencias notables entre las plantas de fríjol de los dos principales acervos genéticos de fríjol común. Acervo Genético Carcterística Mesoamericano Andino Referencia Tamaño de la Pequeño a mediano Grande Singh et al., 1991 se m il la . Forma del foliolo Ovalado, Lanceolado, romboide Singh et al., 1991 central acorazonado Base del Rayado Sin rayas Singh et al., 1991 estandarte Faseolinas S, Sb, Sd, B T, C, H, A Singh et al., 1991 Alozimas Diap–195, Lap-310 0 , Diap–1100, Lap-3103, Singh et al., 1991 Rbcs100, Skdh19 3 Rbcs90, Skdh100 Genes Dl Dl-1 Dl-2 Singh, 2001 Base genética Amplia Estrecha Beeve et al . 2000

Los fríjoles cultivados pertenecientes a los acervos genéticos Andino y Mesoaméricano se pueden subdividir a su vez en seis razas principales (Singh et al., 1991).

Recientemente con base en estudios mas detallados de la colección del banco de germoplasma del CIAT se ha identificado una nueva raza mesomericana bautizada con el nombre de Guatemala (Beeve et al., 2002).

21

Tabla 2. Algunas características de las principales razas del fríjol común cultivado. Modificado de Singh, 1991, con datos de Beeve et al., 2000 y Beeve et al., 2002.

Acervo Genético Mesoamericano Raza Mesoamérica Durango Jalisco Guatemala Tamaño de semillaa Pequeño Mediano Mediano - Hábito predominanteb II o III III IV III Ti e rra s a lta s Guatemala y sur de Di stri b u ci ón A ti e rra s b aj a s Ti e rra s a lta s se ca s húmedas México Faseolina S, Sb, B S, Sd S -

Acerv o Genético Andino Raza Nueva Granada Chile Perú Tamaño de semillaa Mediano a grande Mediano Mediano a grande Hábito predominanteb I III IV Tierras bajas de Distribución Suramérica. Sur de los Andes Alturas > 2000 msnm Faseolina T C, H T, C, H a I = arbustivo determinado II =arbustivo indeterminado III = postrado indeterminado IV = trepador indeterminado b El tamaño de la semilla medido como el peso de 100 semillas. Se califica como pequeño<25g, mediano entre 25 y 40g, y grande > 40g.

La existencia de aislamiento reproductivo parcial entre los dos principales acervos genéticos geográficamente distintos permite que se puedan clasificar como subespecies

(Broughton et al., 2003). Alelos deletéreos de los genes Dl-1 y Dl-2, de acción complementaria, son responsables por el aislamiento dado que producen letalidad dependiente de dosis y una alteración del desarrollo conocida como debilidad híbrida

(Gepts, 1988, 1991; Debouck 1999; Reiber & Newmann 1999). Esta incompatibilidad entre los dos tipos de germoplasma hace que sea difícil obtener genotipos de alto rendimiento en cruces Andino por Mesoaméricano debido a la depresión exogámica

(Broughton et al., 2003).

22

Figura 3.Semillas de Phaseolus vulgaris que representan las distintas razas de fríjol cultivado. La columna de la izquierda corresponde al acervo genético Mesoamericano, más recientemente se reconoce una nueva raza dentro de este acervo, la raza Guatemala (Beebe et al.,2000). En la columna de la derecha se representan las razas del acervo genético Andino. Reproducido de Singh et al., (1991).

23

La distribución geográfica y la diferenciación entre los acervos genéticos Andino y

M esoamericano ya se habían establecido antes de que los fríjoles fueran sometidos a la

domesticación (Gepts 1998). Para estimar los tiempos de divergencia entre distintas

poblaciones de frijoles se han utilizado las secuencias codificantes de inhibidores de alfa-

amilasas como un reloj molecular con una tasa de 2 mutaciones por sitio cada 109 años

(Gepts, 2000). Con base en esto se ha calculado que los acervos genéticos Andino y

Mesoamericano divergieron por lo menos hace 500,000 años mientras que la divergencia entre las especies más cercanamente emparentadas con P. vulgaris se remonta a 2 millones de años (Broughton et al., 2003).

Desde su domesticación, hace por lo menos unos 4300 años (Debouck, 2000), el fríjol común ha pasado de tener un hábito trepador indeterminado a un hábito de arbusto erecto determinado, de ser sensible a un fotoperiodo largo a ser insensible, de semillas pequeñas a grandes, de dormancia en la semilla e impermeabilidad de la cubierta seminal a la ausencia de dormancia y cubierta seminal permeable al agua y de una vaina altamente fibrosa y dehiscente a carecer de fibras y no ser dehiscente (Debouck, 1999;

Singh 2000).

Junto a la domesticación inicial por parte de los pueblos precolombinos y de la selección posterior por los agricultores locales tanto en América como en centros secundarios de diversidad, el fríjol común ha sido el objeto de un programa de mejoramiento basado en el conocimiento de la genética mendeliana (Voysest, 2000). Dicho mejoramiento ha conducido a la producción de variedades adaptadas a las condiciones de distintos

24

agroecosistemas (Voysest, 2000). Durante este proceso se ha seleccionado para favorecer

los fenotipos con madurez temprana, adaptación a alturas elevadas, habito arbustivo

erecto, calidad de las vainas y alto rendimiento de semillas además de la resistencia al

virus del mosaico común del fríjol BCM V (Bean Common Mosaic Virus) y a la roya

causada por en hongo Uromyses apendiculatus (Singh, 2001). Sin embargo la mayoría de

la variabilidad genética disponible en la razas, acervos genéticos y parientes silvestres

permanece sin ser utilizada (Singh, 2001).

Niveles extremadamente altos de resistencia contra la mancha angular se han encontrado

el acervo genético secundario de P. vulgaris. Un 90% de las accesiones evaluadas de P.

polyanthus y P. coccineus demostraron ser casi inmunes a la infección por parte de los

dos grupos de virulencia* de P. griseola (Mahuku et al., 2002). Niveles altos y moderados se pueden encontrar en cultivares, razas criollas y genotipos silvestres del fríjol común (Singh; 2001). Precisamente en el presente estudio se pretende aislar las secuencias de genes candidatos a otorgar la resistencia al la raza criolla G19833 contra algunos aislamientos mesoamericanos de P. griseola. La resistencia a la infección por P. griseola es dependiente de la procedencia genética del patotipo (Guzmán et al., 1995). Al

parecer el patrón de herencia de esta capacidad es complejo y condicionado por más de

un gen (Mahuku et al., 2002; Ferreira et al., 2000; Sartorato, 2004).

* En la siguiente sección se explicará que existen dos grupos de virulencia del patógeno causante de la mancha angular: un grupo Mesoamericano y otro grupo Andino los cuales corresponden a los dos principales acervos genéticos intraespecíficos del fríjol común.

25

2.2. Plantas de fríjol utilizadas en el aislamiento de homólogos de genes de

resistencia del locus RGC7.

Aún no se ha publicado oficialmente la posición de ningún locus mendeliano de

resistencia contra P. griseola (o de algún marcador molecular asociado) sobre alguno de

los mapas genéticos realizado para el fríjol común (Vallejos et al., 1992; Freyre et al.,

1998; Gepts, 1999; Blair et al., 2003). Sin embargo en el proyecto de Agrobiodiversidad

y Biotecnología del CIAT se ha podido detectar presencia de un locus de carácter

cuantitativo (QTL) de resistencia contra dos aislamientos mesoamericanos de P. griseola

en el grupo de ligamiento B10I* (López et . al., 2003). La detección de dicho locus se logró mediante el mapeo de un marcador RFLP basado en una sonda homóloga a genes de resistencia en una población de 87 RILs generación F9 de la cruza DOR 364 (parental

susceptible) X G19833 (parental resistente). La segregación de este marcador, de aquí en

adelante denominado RGC7, explica el 63.9% y el 47% de variabilidad de la resistencia

contra los aislamientos 12MEX y 30CRI de P. griseola respectivamente.

El genotipo G19833 es altamente resistente a las razas mesoamericanas de P. griseola, pero susceptible a las razas andinas mientras que DOR364 es resistente a los aislamientos andinos pero altamente susceptible a las razas mesoamericanas. (Jara et al.,

2002). Además estos dos parentales tienen fenotipos contrastantes en cuanto a la resistencia a otros patógenos fúngicos y virales (López et al., 2003, Beebe et al., 1997); al

tipo de raíz y otros caracteres morfológicos (Rubio et al., 2001; Beebe et al., 1997); a la

* Trabajos previos con mapeo de microsatellites en el Proyecto de Fríjol del CIAT también habían demostrado la existencia de dicho QTL pero el nivel de asociación entre los marcadores y la resistencia no era tan alto como para el RGC7 (CIAT; 1998).

26

adaptación a una baja disponibilidad de fósforo en el suelo (Liao et al., 2001; Beebe et al., 1997), y a la tolerancia a la toxicidad por manganeso (Beebe et al., 1997).

2.2.1. G19833.

Es una raza criolla que pertenece a la raza Nueva Granada del acervo genético Andino del fríjol común (Rubio et al., 2001). Se cultiva en la región central del norte de los

Andes peruanos donde se le conoce con el nombre común de ‘Chaucha chuga’ (CIAT

2004). Produce semillas grandes, de color amarillo moteado con rojo y es de hábito rastrero indeterminado (tipo IIIa) (http://www.ciat.cgiar.org/urg/beans.htm CIAT, 2004).

En un principio se sostenía que era tolerante a suelos deficientes en fósforo (Yan et al.,

1995a, b), pero experimentos más recientes en el campo y en laboratorio muestran información contradictoria al respecto (Singh et al., 2003; Rubio et al., 2001; Liao et al.,

2001). Tiene raíces de tipo superficial (Rubio et al., 2001; Liao et al., 2001). Además es resistente a la antracnosis pero susceptible al virus del mosaico común del fríjol (BCM V) y al virus del mosaico dorado del fríjol (BGMV) (Broughton et al., 2003). En cuanto a la resistencia contra P. griseola evaluaciones tanto en campo como en invernadero llevadas a cabo entre 1996 y 1999, demuestran que es resistente a los aislamientos centroamericanos 66COL, 81COL, 8HND (raza 63-63), 12 MEX (12-55) y 30CRI (31-

47) (Jara, 1998; Mahuku & Jara 1999; 2000), mientras que es susceptible a los aislamientos andinos 260COL y 263COL (63-0) (Jara et al., 2002).

27

2.2.2. DOR364.

Es una variedad cultivada que ha sido el producto de cruzas selectivas de materiales de

origen Mesoamericano (BAT 1215 X (RAB 166 X DOR 125) y es clasificada dentro de

la raza M esoamérica (Rubio et al., 2001). A comienzos de la década de los 90 fue

lanzada en el mercado de Centroamérica con diferentes nombres comerciales (CIAT,

2004). Es de semilla pequeña, color rojo oscuro y de hábito arbustivo indeterminado (tipo

II). En contraste con G19833 tiene raíces de tipo profundo y es ineficiente en suelos

deficientes en fósforo (Rubio et al., 2001; Liao et al., 2001). Esta línea ha sido

seleccionada para un mayor rendimiento y resistencia al virus del mosaico dorado del

fríjol (Broughton et al., 2003). Las evaluaciones en invernadero muestran que DOR364

es resistente al aislamiento COL260 perteneciente a la raza más virulenta (63-0) del

grupo andino de P. griseola. (Mahuku et al., 2002).

2.2.3. ‘Sprite’.

Después de detectar la fuerte asociación entre RGC7 y el QTL que confiere la resistencia a G19833 se procedió a delimitar una región cromosómica que sirviera como base para la disección y el aislamiento de candidatos de genes de resistencia provenientes de Chaucha

Chuga. Con tal fin se hibridaron sondas basadas en RGC7 con clones de la librería BAC proveniente de una línea restaurada de Esterilidad M asculina Citoplásmica (Cytoplasmic

Male Sterility, CMS) de la cultivar ‘Sprite’ (Acosta et al., 2000;Van Houten et al., 1999).

La variedad comercial de habichuelas ‘Sprite’ producida en Estados unidos tiene

mesocarpo carnoso, semillas de color crema y pequeñas. Según la clasificación

morfológica basada en la semilla ‘Sprite’ pertenece al acervo genético Andino (M cClean

28

et al., 2004). Paul Gepts (1998) propone que en general las habichuelas parecen ser derivadas de poblaciones pertenecientes al acervo genético Andino del fríjol común, pero hay fuertes indicios de que si bien este puede ser el caso hay que considerar un cantidad significativa de introgresión de genes del acervo Mesoamericano en estos genotipos

(Tofiño et al., 2003). Otra evidencia que apunta hacia el origen andino de ‘Sprite’ es su patrón de susceptibilidad a la mancha angular (Carlos Jara, 2004 comunicación personal).

‘Sprite’ se ha mostrado susceptible a todos los aislamientos de Phaeoisariopsis griseola con los que se ha inoculado hasta ahora. Sin embargo los genotipos del acervo genético

Mesoamericano suelen mostrarse resistententes a los aislamientos de origen andino. Así que dada la frecuente virulencia de las razas andinas sobre los fríjoles andinos y el espectro amplio de virulencia de los aislamientos mesoamericanos ‘Sprite’ exhibe un patrón de susceptibilidad que correspondería a germoplasma de origen andino.

La Tabla 3. y la Figura 4 Resumen las características de tales materiales.

Figura 4. Semillas de los fríjoles utilizados en el aislamiento de genes de resistencia en el locus RGC7.

29

Tabla 3. Características de los fríjoles utilizados en el aislamiento de genes de resistencia en el locus RGC7. Nombre utilizado en el ‘Sprite’ G19833 DOR364 presente estudio Numero de accesión* G89996/ G19833 G51105 PI550248 Sinónimos Sprite NK Chaucha Chuga Dorado, Doricta, Centa Cuscatleco, Delicias 364 Resistencias conocidas Ninguna. 63-63, 12-55, 31-47 63-0 contra P. griseola susceptible a todos Razas del Grupo Raza del Grupo Andino los aislamientos Mesoamericano ensayados. Origen geográfico - Perú Centroamérica Acervo genético. Presumiblemente Andi no Mesoamericano Andi no Raza NA (habichuela) Nueva Granada Mesoamérica Hábito de crecimiento Arbustivo Rastrero Arbustivo indeterminado determinado (I) indeterminado (IIIa) con guías (II) Faseolina - H S Estado biológico Cultivado Cultivado Cultivado Tipo de germoplasma Cultivar Raza criolla línea de mejoramiento CIAT Peso de 100 semillas (g) 21,1/59,9 Entre 30 y 40 20,5 Color de la semilla Blanco Amarillo moteado Rojo oscuro con rojo Fuentes: Unidad de recursos genéticos CIAT. Patología de Fríjol CIAT. USDA National Germplasm System (NPGS).

La evaluación de una población F2 de la cruza DOR 364 X G19833 con el aislamiento

30CRI (raza 31-47) mostró una segregación estadísticamente aceptable de 1 resistente :

3 susceptibles, lo que sugeriría la acción de un único gen recesivo que confiere al resistencia a este patotipo en G19833. Esto concuerda con la segregación 1:1 observada en las RILs (Tabla 4). Sin embargo algunas RILs que eran resistentes a una raza mesoamericana eran susceptibles a la otra (Tabla 5), lo que podría indicar que existen especifidades diferentes muy cercanas en el cromosoma. Todo esto apunta a que hay al menos dos genes de resistencia a P. griseola en G19833 (CIAT, 2002a) . Cabe notar que la resistencia a la mancha angular no es un carácter fenotípico discreto contrastante entre

30

individuos susceptibles y resistentes, sino que va desde los inmunes pasando por los que

son infectados pero tienen pocas lesiones hasta los individuos en que la enfermedad

prospera produciendo defoliación masiva. Por ello existe el método de calificación de la

magnitud de la enfermedad (evaluación en escala CIAT de 1-9) y de clasificación de los

resistentes como los que obtienen calificaciones bajas (1 a 3) en las evaluaciones y los

susceptibles como el resto (4 a 9), pero la misma continuidad de la variación no permite

formular hipótesis mas precisas y contundentes sobre la naturaleza de la herencia de la

resistencia a P. griseola, como la existencia de dominancia incompleta o codominancia

entre los alelos de un mismo gen.

Tabla 4 Segregación de la resistencia a aislamientos Mesoamericanos de P. griseola en poblaciones de F1, F2 y RILs, derivadas de la cruza DOR 364 X G19833. Modificado de Mahuku et al., 2002.

Proporción

Aislamiento Raza Población Obs Esp χ2 P Hipótesis R:S R:S Pg 30 CRI 31-47 100 F1 33:67 Pg 30 CRI 31-47 100 F2 14:86 3:13 1,48 0,223 Epítasis entre un gen dominante y uno recesivo Pg 30 CRI 31-47 87 RIL 46:41 1:1 0,28 0,591 1 gen Pg 12 MEX 15-55 87 RIL 40:47 1:1 0,175 0,675 1 gen

Tabla 5. Respuesta a la inoculación con aislamientos Mesoamericanos de P. griseola en RILs derivadas de la cruza DOR 364 X G19833. Modificado de Mahuku et al., 2002.

Raza del patógeno Respuesta a la inoculación Pg 12 MEX Resistente Susceptible Susceptible Pg 30 CRI Resistente Susceptible Resistente Total de plantas con 31 41 11 tal fenotipo 2.3. Mancha Angular de la Hoja.

31

2.3.1. Distribución.

La mancha angular del fríjol es considerada junto con la antracnosis como una de las enfermedades fúngicas foliares más ampliamente distribuidas que causan pérdidas severas en las cosechas en América, Africa y otras partes del mundo (Singh, 2001).

Según la International Mycological Society (1996) esta enfermedad ocurre en mas de 60 países (Figura 5). Se desarrolla preferencialmente en trópicos y subtrópicos ya que requiere de condiciones húmedas y temperaturas cálidas para su proliferación (Sartorato

& Rava, 1994).

2.3.2. Importancia económica.

La mancha angular del fríjol es una restricción seria en la producción de fríjol en países tropicales y subtropicales (Mahuku et al., 2002). Dos factores que se suceden durante el proceso de la enfermedad están provocan la reducción del rendimiento de las cosechas.

Primero la disminución del área saludable y de la actividad fotosintética de las hojas enfermas y posteriormente la defoliación severa que resulta de una infección masiva

(Jesus-Junior et al., 2001).

32

Figura 5. Distribución de la mancha angular de la hoja del fríjol en el mundo. Las áreas donde se ha reportado la enfermedad se representan coloreadas de rojo o en su defecto delimitadas por una curva. Modificado de International Mycological Society (1996).

Las pérdidas causadas por esta enfermedad fúngica son enormes. En Colombia pueden alcanzar el 80% (Schwartz, 1981). En Brasil estas pérdidas pueden variar entre el 7 y el

70% de la cosecha dependiendo del grado de susceptibilidad de las cultivares, de las condiciones ambientales y del nivel de patogenicidad de los aislamientos (Sartorato &

Rava, 1994). En Africa, donde los fríjoles constituyen la fuente más importante de proteína dietaria, la mancha angular es considerada como la primer restricción biótica a la producción con pérdidas anuales estimadas 384,200 toneladas métricas siendo la segunda causa de pérdida de cosechas después de la deficiencia de nitrógeno en el suelo

(Wortmann et al.,1998).

33

2.3.3. Taxonomía y afinidades evolutivas de P. griseola.

Phaeoisariopsis griseola es un hongo filamentoso dematiáceo, con hifas septadas que se reproduce asexualmente mediante conidiosporas o conidias (Ellis, 1979). No se conoce la forma sexual (teleomorfo) de P. griseola (Deighton, 1990). Tradicionalmente se le ha ubicado el género Phaeoisariopsis dentro de la familia Stilbellaceae del orden M oniliales en los fungi imperfecti, Phylum Deuteromycota (Ellis, 1979). Se pueden distinguir 65 especies pertenecientes a este género (Kirk, et al. 2001), y por lo menos una de ellas es patógenica a otra leguminosa: P. personata, que es el agente causal de la mancha foliar tardía del maní (Suba-Rao et al., 1996). Los teleomorfos de P. personata, P. lyriodendri y P. magnoliae pertenecen al género Mycosphaerella (Deighton, 1990) razón por la cual se ha propuesto la siguiente clasificación alternativa para los miembros de

Phaeoisariopsis (Kirk, et al. 2001):

Phylum: Ascomycota.

Clase: Ascomycetes.

Subclase: Dothideomycetidae

Orden: Mycosphaerellales

Familia: Mycosphaerellaceae

Género: Phaeoisariopsis = anamorfo de Mycosphaerella.

Sin embargo otros autores consideran que las tres especies holomórficas de

Phaeoisariopsis mencionadas arriba se ubican en el género Passarola (Deighton, 1990;

Goodwin et al., 2001). P. griseola hace parte del complejo de los hongos cercosporoides

34

(Deighton, 1990) que agrupa a patógenos del fríjol como Cercospora canescens y C. cruenta (Cardona et al., 1995) y otros fitopatógenos de importancia económica en cereales, leguminosas y frutas (Goodwin et al., 2001). Debido a la escasez de caracteres fisiológicos y morfológicos informativos, la taxonomía del complejo cercosporoide permanece confusa y depende en gran parte del hospedero fúngico (Goodwin et al.,

2001). A partir de un análisis filogenético de la región ITS de los genes de ARN ribosomal de hongos pertenecientes al complejo cercosporoide (Goodwin et al., 2001), se ha podido concluir que el género Mycosphaerella es monofilético y tiene anamorfos en los géneros Cercospora, Cladosporium, Paracercospora, y Septoria entre otros. Se puede esperar que los miembros anarmóficos de Cercospora tengan sus teleomorfos dentro del gén ero Mycosphaerella (Goodwin et al., 2001), conclusión que se fundamenta el la monofilia bien soportada de Cercospora. De manera análoga se esperaría que el teleomorfo de P. griseola corresponda a un miembro de Mycosphaerella con la condición de que el género Phaeosiariopsis sea monofilético y como mínimo incluya tanto al causante de la mancha angular del fríjol como a Phaeoisariopsis personata (=

Passarola personata). La existencia de tal parentesco haría más parsimoniososo, en terminos evolutivos, el hecho de que ambas especies sean parásitos de leguminosas. Se requieren estudios filogéneticos sobre P. gr iseola para resolver su posición taxonómica en el complejo cercosporoide y aclarar las relaciones evolutivas respecto a sus especies congenéricas.

35

2.3.4. Espectro de hospederos.

Se ha reportado que P. griseola es patógeno de un pequeño grupo de leguminosas que no solamente incluye a P. vulgaris y a sus parientes cercanos P. acutifolius y P. lunatus, sino también a Desmodium gangeticum, Desmodium pulchellum, Lablab niger, y

Macroptilium atropurpureum (Farrman et al.,2003).

2.3.5. Síntomas.

El síntoma más conspicuo de la mancha angular es, como su nombre lo indica, la aparición en las hojas trifolioladas de lesiones de color castaño a gris en forma de polígonos delimitados por las venas (Figura 6a) (Sartorato & Rava, 1994).. Cuando las lesiones se presentan de forma masiva y coalescen en la superficie de la hoja (Figura 6b) producen defoliación prematura (Sartorato & Rava, 1994). En las vainas las lesiones son superficiales, casi circulares, de tamaño variable, de color castaño oscuro con bordes oscuros y cuando se han extendido pueden cubrir la totalidad de la superficie de la vaina.

Las vainas infectadas producen semillas mal desarrolladas y/o totalmente atrofiadas. En condiciones de alta humedad se pueden observar en la parte inferior de las hojas, las vainas, los tallos y pecíolos lesiones de color gris oscuro a negro formadas por los sinnemas del hongo (Sartorato & Rava, 1994).

36

a. b.

Figura 6. Lesiones producidas por la infección con P. griseola en las hojas trifolioladas del fríjol común.(a) Las lesiones poligonales típicas se pueden observar en esta planta susceptible. (b) Las lesiones individuales coalescen y luego provocan la caída de las hojas. Fotografías Carlos Jara, Patología de Fríjol. CIAT. (a) reproducida de Hernández (2000).

2.3.6. Proceso de infección.

La adhesión de las conidias a la superficie de la hoja es un paso imprescindible para el proceso de patogénesis en hongos como P. griseola. Tal unión asegura el contacto entre patógeno y el hospedero, además de que suele ser requerida para la transmisión de señales morfogénicas para la extensión del tubo germinal y la formación de estructuras de infección (Mendgen et al., 1996). Los conidias de P. griseola germinan sobre la superficie foliar liberando un tubo germinal por uno o ambos extremos del conidio. Los tubos germinales se elongan y forman protuberancias similares a apresorios tanto en las uniones entre células epiteliales como sobre los estomas, a partir de estas protuberancias se desarrollan algunas hifas que pueden ser o no invasivas (Monda & Sanders 2001).

Tales eventos de diferenciación podrían ser activados por estímulos como la dureza de la

37

superficie, hidrofobicidad, señales químicas provenientes de la planta, y la misma

topografía de la superficie (Mendgen et al., 1996). La infección del hospedero empieza cuando el hongo penetra a través de los estomas de las hojas, ya sea mediante la formación de estructuras similares a apresorios sobre los estomas o sin la formación de tales. Luego de penetrar en la hoja, la hifa invasiva crece intercelularmente en los espacios aéreos del mesófilo y el parénquima en empalizada. Durante este periodo temprano de la infección, la pared celular y la membrana celular del huésped se encuentran intactos en el punto de contacto con la hifa. Se puede observar la adherencia entre las hifas intercelulares y la pared del hospedero, además de la producción por parte del hongo de una matriz extracelular en la interfase. Más tarde la pared fúngica se engrosa y se recubre de múltiples capas de matriz extracelular entre las hifas. (Monda &

Sanders 2001). Tres días después de la penetración, las células guardianas y las del mesófilo adyacente mueren (Sartorato & Rava, 1994). En las células vegetales muertas por el ataque directo de P. griseola la membrana del cloroplasto se desintegra y el citoplasma queda desorganizado (Monda & Sanders, 2001). A medida que el hongo prolifera las células del hospededero van siendo destruidas, sin embargo el patógeno no es capaz de penetrar en las venas de las hojas, posiblemente debido a la falta de espacios intercelulares. Las observaciones de microscopia electrónica hechas por Monda y

Sanders (2001) muestran que todo el crecimiento de las hifas es intercelular y no se encuentran hifas al interior de las células del hospedero. Sin embargo en otros reportes basados en observaciones con microscopia de luz (Cardona-Alvarez & Walker, 1956,

Wagara et al. 1999; Carlos Jara, 2004 comunicación personal) y electrónica (Wagara et al. 1999) revelan que el hongo crece intracelularmente en el tejido afectado.

38

Figura 7. Algunas etapas de la infección de una hoja de fríjol susceptible por parte de P. griseola. (a) La conidia de P. griseola germina sobre la superficie de la hoja. (b) El tubo germinal crece produciendo una hifa que penetra por un estoma. (c) Las hifas invasivas avanzan por el parénquima esponjoso y en empalizada. (d) Estas hifas, H, se asocian estrechamente a la pared celular vegetal, nótese ausencia de las membranas del cloroplasto, CPP, y plasmática. (e) Luego de nueve días de haber crecido al interior de la hoja P. griseola provoca la muerte de las células adyacentes (izquierda) pero no puede crecer más allá de las venas (derecha). (f) En la fase reproductiva del hongo los conidióforos emergen por los estomas y (g) forman haces denominados sinnemas. Microfotografías electrónicas y de luz reproducidas de Monda & Sanders, 2001.

39

No es claro si la diferencia en tales observaciones sea un artificio experimental o pueda

deberse realmente a la variabilidad del mecanismo patogénico del hongo. A medida que

el hongo avanza intercelularmente la necrosis se extiende por el parénquima esponjoso,

el parénquima en empalizada y finalmente las células de la epidermis superior. Este

modo de infección hace que P. gr iseola sea clasificado como un hongo hemibiótrofo

(Bassanezi et al.,2002).

Ya que tanto las células que están en contacto con el hongo como las células que se

encuentran lejos son afectadas por el patógeno, esto podría implicar la liberación por

parte del patógeno de un producto difusible que destruye la membrana plasmática y de

los cloroplastos del hospedero causando la muerte celular y clorosis en la hoja (Monda &

Sanders 2001). Los desordenes de la membrana plasmática podrían ser un evento central

en la patogénesis ya que le permiten al patógeno el acceso a los nutrientes provenientes

del hospedero (Monda & Sanders 2001). Como no hay penetración de las células de la

planta por parte de P. griseola, por lo menos en las fase inicial de la enfermedad, el daño a las membranas plasmática y de cloroplastos podría ser atribuido posiblemente a la producción de una toxina por parte de P. griseola. (Monda & Sanders 2001). Luego de la destrucción de las células del hospedero el hongo forma una estructura somática compacta denominada estroma de la cual emergen las estructuras reproductivas. El estroma empuja a través de los estomas o la pared de la epidermis hasta llegar a la superficie de la hoja. A partir del estroma los conidióforos pueden emerger solos o por los estomas y se elongan para formar un haz conocido como sinnema o coremio. Los sinnemas se forman asociados a las lesiones en las hojas delimitadas por las venas. Los

40

conidias se forman en la punta del conidióforo. La formación del estroma luego de la

destrucción de las células del hospedero permite que el hongo permanezca dormante

hasta que predominen condiciones favorables para la esporulación. Por tal razón

Phaeoisariopsis griseola tiene la capacidad de sobrevivir en los tejidos infectados de la

planta bajo condiciones poco favorables. (Monda & Sanders 2001).

2.3.7. Diversidad.

Por lo menos desde hace dos décadas (CIAT, 1984) se reconoce que al interior de

Phaeoisariopsis griseola existe variación patógenica, es decir, que sus poblaciones se agrupan en númerosas razas cada una de las cuales ataca determinadas variedades de fríjol con diferentes grados de virulencia. Sin embargo, fue solamente hasta el primer lustro de los noventa (CIAT, 1993; Pastor-Corrales & Jara, 1995) que los esfuerzos encaminados a la evaluación sistemática de la diversidad del patógeno resultaron en el establecimiento de una serie de genotipos diferenciales reconocidos internacionalmente para la determinación de razas de virulencia. Este hecho fue concretado durante el primer

Taller Internacional sobre la Mancha Angular de Fríjol realizado en el CIAT en el año de

1995 (Ferreira et al., 2000, Carlos Jara 2004, comunicación personal). La evaluación del

germoplasma de fríjol con aislamientos de fenotipo de virulencia conocido se utiliza en el

desarrollo de estrategias para el mejoramiento de la resistencia contra la mancha angular.

La caracterización del fenotipo de virulencia se realiza inoculando cada aislamiento de P.

griseola por separado sobre un juego de los 12 genotipos diferenciales de fríjol

establecidos para la diferenciación de razas (Pastor-Corrales & Jara 1995; Pastor-Corrales

41

et al. 1998). Este juego esta constituido por dos grupos de seis genotipos cada uno compuesto a su vez por 4 razas criollas y por otros dos genotipos correspondientes a cultivares o líneas de mejoramiento (Pastor-Corrales et al. 1998). El primer grupo de seis genotipos es una muestra de las razas Chile, Perú, y Nueva Granada del acervo genético

Andino, mientras que el segundo grupo es una muestra de las razas Mesoamérica,

Durango, y Jalisco del acervo genético Mesoamericano (Tabla 6). De esta forma el juego completo de genotipos diferenciales representa la diversidad de germoplasma existente al interior de Phaseolus vulgaris (Pastor-Corrales & Jara 1995; Pastor-Corrales et al. 1998;

Carlos Jara 2004 comunicación personal).

Tabla 6. Serie de genotipos diferenciales de fríjol utilizados en la clasificación del fenotipo de virulencia de Phaeisariopsis griseola. (Pastor-Corrales & Jara, 1995).

Genotipo Tamaño de Raza de Faseolina Valor binario diferencial semilla Fríj ol cuando es susceptible Andinos Don Timoteo G Chile H 1 G11796 G Perú T 2 Bolón Mayo G Perú H 4 Montcalm G Nueva. Granada B 8 Amendoi m G Nueva. Granada T 16 G5686 G Nueva. Granada H 32 Mesoamericanos PAN72 M Mesoamérica B 1 G2858 P Durango B 2 Flor de Mayo M Jalisco B 4 Mex 54 P Jalisco B 8 BAT 332 P Mesoamérica B 16 Cornell 49242 P Mesoamérica S 32

Para denominar las razas de aislamientos, se utilizan dos números separados por un guión. Como ejemplo se analizarán los números binarios correspondientes a los dos patotipos de interés para el presente estudio: 12MEX y 30CRI. El aislamiento 30CRI corresponde a la raza 31-47. El primer número, 31, se obtiene al sumar los valores

42

binarios de los genotipos andinos que resultaron susceptibles a la inoculación con este

aislamiento: 1 + 2 + 4 + 8 + 16 = 31. El segundo número se obtuvo, de forma análoga, al

sumar los valores binarios de los genotipos mesoamericanos susceptibles: 1 + 2 + 4 + 8 +

32 = 47. De la misma manera 12-55 el número de raza correspondiente al aislamiento

12MEX se descompone de la siguiente forma: 4 + 8 = 12 y 1 + 2 + 4 + 16 + 32 = 55.

La inspección de la diversidad del fenotipo de virulencia en las poblaciones de P.

griseola en América y Africa (Pastor-Corrales & Jara, 1995; Guzmán et al., 1995; Pastor-

Corrales et al., 1998; Hernández, 2000; Jara et al., 2001; Mahuku et al., 2002) ha

permitido clasificar a los aislamientos de P. griseola en dos grupos, uno de origen

Andino y otro de origen Mesoaméricano. Además tal clasificación fenotípica está

respaldada a nivel genotípico por marcadores RAPD, y de isozimas (Mahuku et al., 2002;

Hernández 2000). Los aislamientos andinos poseen un estrecho espectro de hospederos

atacando únicamente fríjoles pertenecientes al acervo genético Andino. Aun cuando los

aislamientos colectados de los genotipos mesoamericanos son más virulentos y agresivos

sobre los fríjoles mesoamericanos, tienen un espectro de virulencia amplio ya que suelen

infectar fríjoles tanto de origen Mesoaméricano como de origen Andino (Pastor-Corrales

& Jara, 1995; Mahuku et al., 2002b; Mahuku et al., 2002a). Los dos grupos de virulencia

de Phaeoisariopsis griseola son el reflejo de la estructura genética de las poblaciones de

Phaseolus vulgaris y en un principio han resultado del proceso de coevolución planta- patógeno (Guzmán et al., 1995; Pastor-Corrales & Jara, 1995; Mahuku et al., 2002a;

Mahuku et al., 2002b). Otros estudios han permitido recoger evidencia a favor de la hipótesis de coevolución entre el fríjol y distintos patógenos como Colletotrichum

43

lindemuthianum (Creusot et al., 1999), y Xanthomonas phaseoli (Mkandawire, et al.

2004).

2.3.8. Herencia y fuentes de resistencia contra la mancha angular en el fríjol común.

Desde 1951 se conocen fuentes de resistencia contra la mancha angular (Pastor-Corrales et al., 1998). Durante los últimos 20 años se ha llevado cabo la evaluación sistemática de miles de accesiones de germoplasma de fríjol disponible en el CIAT con el fin de detectar nuevas fuentes de resistencia e incluirlas en el programa de mejoramiento (Pastor-

Corrales & Jara, 1995; Guzmán et al., 1995; Pastor-Corrales et al., 1998; Mahuku et al.,

2002; Islam et al., 2002). En uno de estos estudios (Pastor-Corrales et al., 1998) se evaluaron en campo 22,832 accesiones de fríjol con aislamientos de presencia natural en la estación de CIAT en Santander de Quilichao (3o 6’ N, 76o 31’ O, elevación 990 msnm, tempertura media anual 24°C, precipitación 1750 mm). De los fríjoles inoculados un subconjunto de 123 genotipos presentaron resistencia media o alta contra distintos aislamientos de P. griseola. Cuando estos 123 genotipos se evaluaron en invernadero 19 demostraron resistencia horizontal a 13 de 14 aislamientos inolulados (Pastor-Corrales et al., 1998).

Estudios previos al establecimiento de la serie de genotipos diferenciales indican que la resistencia a la mancha angular del fríjol puede estar condicionada por unos pocos genes y que es de naturaleza dominante o recesiva (Zaumeyer & M einers, 1975; Meiners

1981). En una evaluación conducida por el grupo de Cardona-Alvarez (1962) los genotipos de fríjol ‘Algarrobo’ y 223, ambos susceptibles a la infección por parte de P.

44

griseola, se cruzaron con una accesión resistente, 0258, resultando en una proporción de segregación 3 resistente: 1 susceptible lo que indica una resistencia monogénica y dominante. En India Singh y Saini (1980) reportaron que la resistencia al patógeno era monogénica y recesiva para la cruza entre el genotipo resistente PLB 257 y la cultivar susceptible ‘Contender’. En Brasil Jesus-Filho y colaboradores (1980) demostraron en una cruza entre Caraota 250 (resistente) y Venezuela 360 que la progenie segregaba en una proporción 1 resistencte: 3 susceptible lo que corresponde también a una resistencia monogénica recsiva. A pesar de que los datos muestran la naturaleza de la herencia de la resistencia contra P. griseola, los resultados de estos estudios no son comparables entre sí ni con estudios publicados a partir de 1995 (Carlos Jara 2004, comunicación personal), puesto que en ellos no se distingue la raza del patotipo utilizado en las inoculaciones. Sin embargo la conclusón general de estos experimentos, que la herencia de la resistencia contra P. griseola esta determinada por unos pocos genes, es respaldada por investigaciones recientes que tienen en cuenta la variabilidad en el patógeno.

Experimentos genéticos conducidos en BIOAGRO de la Universidade Federal de Visoça

(Brasil) muestran que que la progenie de las cruzas realizadas con M AR2 (resistente contra 63-39) X Rudá resultan en una segregación correspondiente a un gen de restencia dominante (Ferreira et al.,2000). En otro ensayo evaluaron la resistencia a dos patotipos diferentes con la cruza ‘Ouro Negro’ X ‘US Pinto 111’(Correa et al., 2002). El parental

‘Ouro Negro’, la F1 y 3/4 de la F2 se mostraron resistentes al patotipo 63-39 mientras que en un segundo cruce el parental ‘US Pinto 111’ y 3/4 de la F2 se mostraron resistentes a 31-23, estos datos sugieren que la resistencia de ‘Ouro Negro’ es conferida

45

por un gen dominante mientras que la resistencia de ‘US Pinto 111’ se debe a un gen recesivo y que estos dos genes segregan independientemente. Otros resultados de este grupo indican que la resistencia de los genotipos de la serie diferencial Cornell 49242 (vs

31-17)(Nietsche et al., 2000), Mexico54 (vs 61-19) (Sartorato et al., 1999) y BAT332 (vs

61-41) (Texeira et al., 2003); además de la línea AND277 (vs 63-23) (Carvalho et al.,

1998), parece estar conferida en cada uno de ellos por un único gen dominante.

Durante los últimos años en el CIAT también se han llevado a cabo investigaciones para dilucidar la herencia de la resistencia contra la mancha angular tanto en los genotipos de la serie diferencial como en otras fuentes. Estos estudios sugieren que en la resistencia a la mancha angular intervienen genes dominantes y recesivos de efecto mayor y genes menores, que pueden interactuar de forma aditiva, o con epistasis (Mahuku et al., 2002

CIAT). Las proporciones de segregación de F1, F2, y retrocruces muestran que un sólo gen dominante condiciona la resistencia a P. griseola en Don timoteo, G10474 (contra

63-63) (Mahuku et al., 2004) , y PAN 72 (vs 15-0), mientras que dos genes dominantes probablementee determinan la resistencia en Cornell 49242 (vs 63-31), G5686 (vs 63-63) y G10909 (vs 63-63) (Mahuku et al., 2002 CIAT). Según los datos obtenidos la resistencia del genotipo Mexico 54 contra el aislamiento 11MEX (31-55) se debe a un

único gen recesivo (Mahuku et al., 2002 CIAT), mientras que la resistencia del mismo genotipo contra el aislamiento mesoamericano 2A, al igual que en BAT332, es causada por un gen de carácter dominante (Namayanja et al. 2002). En Montcalm (vs 39-36) y

Amendoim (vs 15-0) pueden intervenir dos o tres genes recesivos. Al parecer el genotipo

G2858 (vs 7-17) tiene dos genes duplicados de resistemcia (Mahuku et al., 2002 CIAT).

46

En conjunto toda esta evidencia parece corresponder a un modelo de herencia donde la

resistencia contra razas específicas de P. griseola está determinada por uno o pocos

genes. Por ende la resistencia horizontal durable podría lograse a partir de la

piramidación de genes de resistencia con especificidades diferentes provenientes de

distintos genotipos de fríjol, lo que de inmediato apunta a la realización de cruces entre

acervos genéticos M esoamericano y Andino (M ahuku et al., 2002). Sín embargo con

algunas excepciones (Sartorato, 2004), aún se desconocen las relaciones de ligamiento,

alelismo y dominancia de estos loci putativos, información que sería clave para diseñar

mejores estrategias de mejoramiento. Avances significativos en este sentido ya se han

realizado en el estudio de la resistencia contra la antracnosis en el fríjol común. Una

revisión reciente (Kelly & Vallejo, 2004) da cuenta de númerosas pruebas de alelismo

entre distintos genes de resistencia encontrados en diferentes cruzas. De forma análoga a

lo que se espera que ocurra en la interacción entre el fríjol y P. griseola la herencia de la

resistencia contra la antracnosis está determinada por unos pocos genes. Esta revisión

muestra que se han detectado 9 genes de efecto mayor en la resistencia contra distintos

aislamientos de Colletotrichum lindemuthianum. De estos 9 genes por lo menos 6 se han podido ubicar con certeza en el mapa genético de fríjol. La consolidación de un mapa genético similar. que incluya cada uno de los genes de resistencia contra P. griseola que

han sido detectados hasta el momento, no parece preverse en un futuro inmediato.

2.4. Resistencia a enfermedades en plantas.

47

Como organismos fotosintéticos las plantas son el primer nivel de la red trófica de los

ecosistemas terrestres (Taiz, 1997).. Son los productores de biomasa y por ello

constituyen el eslabón entre la fuente de energía última, la radiación solar, y el resto de

consumidores biológicos. Miembros de dos de los principales linajes de organismos

vivos, los eucariotas y las bacterias utilizan directamente a las plantas vivas como fuentes

de energía y constituyentes moleculares. Las plantas son presa de herbívoros, vertebrados

e invertebrados (dentro de los que se encuentran cientos de miles de especies de insectos)

de parásitos animales como nematodos, y de enfermedades microbianas ocasionadas por

hongos, protozoos, bacterias y virus (Dangle & Jones, 2001). Durante cada momento de

su ciclo vital están siendo expuestas ante una multitud de agresores y aun así son una

forma de vida abundante. A pesar de carecer de locomoción, entre otros recursos cuentan

con espinas, pelos, cristales de oxalato y de silicio, producen alcaloides, glucósidos

cianogénicos y compuestos fenólicos, defensas que han evolucionado y las hacen poco

palatables, indigeribles, o tóxicas a sus predadores (Taiz, 1997). Aunque no poseen un

sistema inmune circulatorio con linfocitos, anticuerpos e inmunoglobulinas, las plantas se

sobreponen, a cada instante, a la miríada de microorganismos que pueden causarles

enfermedades (Michelmore & Meyers, 1998). Las plantas prosperan, entre otras razones,

por que poseen la capacidad innata para defenderse.

2.4.1. Sistema inmune innato.

Para hacer frente a la infección existen dos tipos conocidos de sistema inmune presentes en organismos multicelulares: el innato y el adaptativo.

48

En plantas e invertebrados la inmunidad innata es el único constituyente de la respuesta

inmune (Hoffmann et al., 2001), y es indispensable en el sistema de defensa de los

vertebrados (Beutler, 2003). Muchos productos génicos y rutas de señalización completas

involucradas en la inmunidad innata del hospedero parecen tener un origen antiguo,

anterior incluso a la divergencia entre plantas y metazoos hace unos 2000 millones de

años (Fluhr, 2001; Musheigan & Medzhitov, 2001; Cohn et al., 2001; Staskawitz et

al.,2001). Por ejemplo receptores que contienen los dominios TIR-LRR y NBS-LRR se

encuentran presentes en Arabidopsis (Meyers et al., 2003), Drosophila (Hoffmann et al.,

2001), ratones y humanos (Beutler, 2003; Harton et al., 2002). Además otros elementos corriente abajo en las rutas de señalización de estas moléculas como las cascadas de kinasas MAPK (Asai et al., 2002), e incluso algunos factores de transcripción utilizados en los sistemas de defensa de ambos grupos comparten una considerable homología de secuencia (Fluhr 2001; Cohn et al., 2000). Tanto en plantas como en animales las especies activas de oxígeno intervienen en la respuesta inmune cumpliendo funciones efectoras antimicrobianas (Beutler, 2004; Lamb & Dickson 1997) y de señalización

(Grant & Loake 2000, Lamb & Dickson 1997; Neill et al.,2002) y al menos existe una

ruta de síntesis de estas especies activas de oxígeno en la que intervienen enzimas

homólogas en ambos linajes (Torres et al., 2002). Todas las células vegetativas de un

organismo tienen las mismas especificidades del sistema inmune innato. Además están

fijadas en el genoma, no cambian durante el curso de la vida de un individuo, y se

heredan así a la próxima generación. Los receptores del sistema innato, tal vez con

excepción de ediciones alternativas de ARNm en plantas (Dinesh-Kumar & Baker, 2000;

), están codificados de una manera única en el genoma del organismo. El sistema inmune

49

innato aprende en tiempo evolutivo, requiere el paso de generaciones de individuos para que en la población surjan nuevas especifidades mediante mutación (Hammond-Kosack

& Jones, 1997) y sean objeto de selección natural.

Hace 450 millones de años los vertebrados, a partir de la modificación del sistema de replicación de un transposón, un evento evolutivo relativamente reciente en la historia evolutiva de los multicelulares, obtuvieron además del sistema inmune innato un sistema inmune adaptativo que complementa y esta supeditado al innato (Medzhitov & Janeway,

2000). El sistema inmune adaptativo, al parecer presente en el primer pez teleósteo y todos sus descendientes (Musheigan & Medzhitov, 2001), somáticamente genera una amplio repertorio de receptores, entre 1014 y 1018 inmunoglobulinas y receptores de células T (Medzhitov & Janeway, 2000; Fluhr 2000) con base en el rearreglo de unos pocos segmentos de genes. Sin embargo tal diversidad no es heredable a través de la línea germinal y cada nueva generación de organismos tiene que volver a inventar la colección completa de estas moléculas de reconocimiento (Medzhitov & Janeway, 2000). Distintas células de una misma clase pueden (y suelen) tener especificidades distintas. Mediante la selección clonal el sistema inmune adaptativo produce una población de células encargadas de la neutralización de la infección, y de la memoria inmune, con lo que en caso de que el organismo sea desafiado de nuevo por el mismo patógeno pueda reconocerlo en el acto y así responder más eficazmente. Por lo tanto un individuo susceptible puede adquirir inmunidad contra una enfermedad durante el transcurso de su vida (de allí el adjetivo de adaptativo). Sin embargo tal diversidad, producida de forma aleatoria, que permite reconocer virtualmente cualquier patógeno que se le presente,

50

simultáneamente produce el ries go de las enfermedades autoinmunes y el rechazo de transplantes. (Musheigan & Medzhitov, 2001).

2.4.2. Hipótesis del “gen por gen”.

La resistencia a las enfermedades en las plantas es una característica heredable y por ende en últimas se origina en genes particulares identificables en el genoma de cada organismo. El trabajo pionero de H.H. Flor realizado con el patosistema Linum utilisatisimum (lino) / Melampsora lini (roya del lino) (Flor, 1971) propone que la enfermedad en los organismos vegetales resulta de una interacción compatible entre planta y patógeno determinada por el genotipo de ambos agentes. Este modelo explicativo se conoce como “hipótesis de gen por gen” y postula que la activación de las defensas del hospedero, es decir una interacción incompatible entre ambos, requiere de la presencia simultánea de un gen de resistencia en la planta (gen R) y un gen avr correspondiente en el patógeno (gen de avirulencia). La ausencia del gen R en la planta o del gen avr en el patógeno tiene como resultado el progreso de la enfermedad en el vegetal (Baker et al., 1997). La versión más simple del modelo “gen por gen” supone que los genes R determinan el reconocimiento directo o indirecto de los productos de los gen es avr del patógeno (Hammond-Kosack & Jones, 1997). De esta forma una interacción incompatible se da cuando los centinelas del sistema inmune de la planta, codificados por los genes de resistencia, reconocen al patógeno que porta un gen avr delator de su propia naturaleza infecciosa. Cuando los portadores del gen avr son identificados se activan las defensas de la planta, y como consecuencia se inhibe el progreso de la enfermedad. Tal es la razón por la que se han denominado genes de

51

avirulencia a los genes avr. Sin embargo en algunos casos se ha comprobado que los gen es avr son necesarios o cumplen un papel importante durante la patogénesis, de manera que los organismos infecciosos tienden a conservarlos evolutivamente. Bajo esta interpretación simple de la hipótesis de “gen por gen” los genes de resistencia y los genes de avirulencia se heredarían de una forma dominante o codominante ya que en un principio desempeñan funciones positivas en su respectivo organismo (McDowell, 1997).

2.4.3. Genes de resistencia como receptores del sistema inmune innato: las

proteínas de resistencia poseen una arquitectura modular.

Es claro que la hipótesis del gen por gen es un modelo sobresimplificado de la realidad, pero también ha resultado de suma utilidad para desentrañar algunos detalles de la naturaleza de la resistencia en plantas (Chin et al.,1996; Michelmore & Meyers, 1998

Hammond-Kosack & Jones 1997), sirviendo de herramienta heurística para hacer predicciones en sistemas simples. Ahora bien se ha demostrado que el modelo gen por gen es explicativo en casos donde la proteína de resistencia no funciona como un receptor, de hecho el primer gen de resistencia clonado el Hm1 de maíz es una reductasa de la toxina HC producida por el hongo Cochliobolus carbonum (anamorfo

Helminthosporium maydis) (Hammond-Kosack & Jones, 1997). El resto de genes de resistencia aislados hasta el momento codifican proteínas de diversas arquitecturas generadas a través de la permutación, rearreglo, y diversificación de un reducido número

52

de dominios proteicos (Fluhr, 2000) pero su función bioquímica se desconoce y aún es materia de discusión y de investigación intensiva. La mayoría de genes R clonados corresponden a proteínas del tipo NBS-LRR (Dangl & Jones, 2001;Nimchuk et al., 2003;

Hammond-Kosack & Jones, 1997; Martin et al., 2003 ) esto es tienen como núcleo estructural un dominio de unión a nucleótido (Nucleotide Binding Site) y un dominio de repeticiones ricas en leucina (Leucin Rich Repeats). A su vez las proteínas NBS-LRR pueden tener carboxiterminal al dominio NBS, ya sea un dominio TIR, por Toll/

Interleukin receptor/ Revístanse, o un dominio de bucles súper enrollados CC (Coiled

Coil). Se han encontrado genes TIR-NBS-LRR en todas las eudicotiledoneas examinadas hasta ahora, con excepción de la remolacha azucarera (Tian et al., 2004). A pesar de que los genomas de cereales, pastos y otras monocotiledóneas cuentan con un amplio complemento de proteínas CC-NBS-LRR (CNL) al parecer carecen en la actualidad de genes TIR-NBS-LRR (TNL) (Cannon et al., 2002, Zhao et al., 2004). Existen rutas de bioseñalización asociadas a cada uno de los dos tipos de proteínas. La respuesta hipersensible mediada por los genes TNL depende de la proteína EDS1 implicada en la degradación de proteínas mediante ubiquitinación. Algunos genes CNL dependen de

NDR1, una proteína putativa asociada a membrana, para producir una reacción defensiva en la planta. Esta situación implica que la bioseñalización de la enfermedad en monocotiledóneas pudo haber divergido radicalmente del resto de las plantas con semillas, dado que se pueden encontrar genes TNL en algunas gimnospermas (Fluhr

2000). Los otros tres tipos principales de genes de resistencia codifican para kinasas de serina/treonina STK (Serine/Threonine Kinases), que incluyen al gen Pto de tomate; para kinasas semejantes a receptores RLK (Receptor like kinases) con un dominio STK

53

intracelular putativo, uno transmembranal (TM), y repeticiones ricas en leucina extracelulares como Xa21 de arroz; y para receptores de membrana putativos con un

domino transmembranal y un LRR extracelular, como la familia de genes Cf de tomate.

2.4.3.1. Dominio TIR (Toll-Interleukin 1 receptor- Resistance).

La estructura tridimensional del dominio TIR ha sido determinada para los receptores

TLR1 y TLR2 del sistema inmune humano (Xu et al., 2000). El núcleo de la estructura

terciaria del dominio TIR está constituido por entre 130 y 165 aminoácidos de longitud y

consiste en un pliegue relacionado a flavodoxina (Xu et al., 2000).. Dicho pliegue

tridimensional está conformado por 5 hojas beta paralelas rodeadas por sendas hélices

alfa (Rock et al.,1998; Xu et al., 2000). En Arabidopsis thaliana se pueden discernir por

lo menos 4 motivos conservados que definen el dominio TIR (Meyers et al., 2003). A

diferencia de las plantas, el dominio TIR es carboxiterminal al dominio LRR en los

receptores del sistema inmune de animales (Fluhr, 2001; Rock et al.,1998). En

Drosophila hace parte de la proteína Toll que interviene en la determinación del eje

anteroposterior del embrión y en la resistencia la infección fúngica (Hoffman et al.,

1999). En ratones y humanos es parte de el receptor de interleucina 1 (Interleukin-1

receptor) y de los receptores semejantes a Toll TLR (Toll like receptors) y se tienen

pruebas de que es indispensable para la transducción de señal luego del evento de

reconocimiento de patrones moleculares asociados a patógenos (Beutler, 2003). Un

heterodímero de TLR2 y TLR6 determina la especifidad de la respuesta inmune en

ratones contra un lipopolisacarido de micoplasmas mientras que un heterodimero entre

TLR3 y TLR6 probablemente reconoce un lipopolisacarido bacteriano (Akira et al.,

54

2003; Beutler et al., 2003). El dominio intracelular TIR de los TLR estimulados por sus respectivos ligandos interactúa con un dominio homólogo en la proteína adaptador

MyD88, que a su vez promueve su asociación con una kinasa serina/treonina mediante una interacción entre sus correspondientes dominios de muerte (death domain asociado a

apoptosis), por otra parte se ha encontrado que otras moléculas adaptadoras que

contienen dominio TIR son necesarias para la señalización dependiente de M yD88 (Akira

et al., 2003). Estos casos de interacción proteica indican que en el sistema inmune de

animales el dominio TIR es indispensable para la formación de complejos proteicos que

median la transducción de señal. En plantas el papel del dominio TIR en la ruta de

señalización que conduce a la defensa es menos claro. Residuos de aminoácidos

conservados entre los dominios de proteínas de plantas y animales y que son esenciales

para la señalización de Toll y IL-1R son también críticos para la función del gen N de

tabaco; la delación o mutaciones puntuales conducen a alelos con pérdida de función

parcial o a alelos dominantes negativos (Martin el al 2003). Además de participar en la

ruta de señalización el dominio TIR también podría jugar un papel en el reconocimiento

del patógeno, como se ha demostrado por comparaciones e intercambio de dominios

entre alelos del locus L (Luck et al., 2000).

2.4.3.2. Dominio de unión a nucleótido NBS (Nucleotide Binding Site).

También denominado NBD ha sido incluido las familias proteicas NB-ARC, NACHT y

CATERPILLER (Harton et al., 2002). El dominio de unión a nucleótido es diferente a los

dominios de kinasa y está presente en varias proteínas que se unen a ATP o GTP, que

incluyen ATPasas y proteínas G (Martin et al., 2003). El dominio NBS se define por

varios motivos proteicos conservados que comprenden de un extremo a otro cerca de 300

55

aminoacidos (M eyers et al., 1998). El motivo P-loop/Kin1 forma un asa rica en glicina

que contiene un residuo invariante de lisina involucrado en la unión a los fosfatos del

nucleótido. El dominio kinasa 2 tiene un aspartato invariante que coordina el ión

divalente que se necesita para la reacciones de fosfotranferencia. Y un tercer motivo es el

kinasa 3a que esta involucrado en la unión a la pentosa o la base nitrogenada del

nucleótido (Hammond-Kossack & Jones 1997; Tameling et al., 2002). El dominio NB-

ARC común a las proteínas R y a las proteínas NOD1 / APAF de animales contiene

otros 5 motivos conservados de función incierta (Martin et al., 2003; Meyers et al.,1999;

Meyers et al., 2003) que incluyen el dominio GLPL, en el que una mutación puntual que

cambia la glicina a glutamato induce susceptibilidad a la roya del lino en un genotipo

resistente (Dos et al.,2001). El dominio NBS es filogenéticamente antiguo, existen

homólogos de NBS en la bacteria Streptomyces coelicolor, además está presente

proteínas de plantas y animales. En animales hace parte de moléculas del sistema inmune

innato, como APAF y NOD1, que intervienen en la señalización para la apoptosis

mediante cambios conformacionales dependientes de unión a ATP (Harton et al.,2002).

El dominio NBS de las proteínas de resistencia a enfermedades en plantas no posee

dominios característicos de unión a GTP (Meyers el al 1999), y además se ha

demostrado que los dominios NBS de las proteínas de resistencia I2 y Mi-1 se unen a

ATP y poseen actividad ATPasa pero no se unen a GTP ni tienen actividad GTPasa

(Tameling et al., 2002) lo que podría indicar que los genes R codifican solamente para

ATPasas.

2.4.3.3. Dominio de repeticiones ricas en leucina LRR (Leucine Rich repeats)

56

Según el análisis de los genes NBS-LRR del genoma de Arabidopsis thaliana el dominio de repeticiones ricas en leucina de plantas se ajusta a la secuencia consenso

LXXLXXLXXLXLXX (N/C/T)X(X) LXXIPXX (correspondiente a LRR intracelular

(Hammond-Kosack & Jones, 2000)) donde L es leucina, X es cualquier aminoácido y las otras letras corresponden a un aminoácido específico (Mondragón-Palomino et al., 2002).

La estructura tridimensional resuelta de algunas proteínas LRR muestra que tales repeticiones de alrededor de 24 aminoácidos corresponden a elementos alternados de alfa hélices y hebra beta/retorno beta unidos por asas (Fluhr, 2001; Kajava & Kobe, 2001; Di

Matteo et al., 2003; Rock et al., 1998). Estas unidades estructurales se enrollan a su vez en una superhélice de mano derecha cuyo eje se dobla en forma de herradura, lo que clasifica a este tipo de proteínas como super-solenoides (Kajava & Kobe; 2001). El borde interno de la herradura está constituido por una hoja beta, estabilizada por una escalera de asparagina, donde se encuentran los residuos expuestos a solvente que brindan la especificidad de unión a ligando mientras que los residuos alifáticos tienden a estar hundidos en el núcleo hidrofóbico de la proteína (Di Matteo et al., 2003; Kajava & Kobe,

2001). En el inhibidor de poligalacturonasas de Phaseolus vulgaris hay presente una segunda hoja beta en el borde exterior de la herradura que se especula podría formar una segunda superficie de interacción (Di Matteo et al., 2003). Hay evidencia concluyente a favor de que los dominios de repeticiones ricas en leucina se unen a ligandos proteicos

(Di Matteo et al.,2003; Medzhitov & Janeway 2000; Kajava & Kobe 2001; Napier 2004), a brasinosteroides (Napier 2004) y median interacciones proteína-polisacárido .

57

El dominio LRR de las proteínas R de plantas brinda especifidad en el reconocimiento del patógeno. Un producto truncado de la proteína AvrPita, AvrPita176, de Magnaporthe grisea que es capaz de producir una respuesta hipersensible en el arroz (Oryza sativa) se une directamente al dominio LRR de la proteína de resistencia Pita que codifica para una kinasa semejante a receptor, además una mutación en el motivo proteasa de AvrPita que produce la pérdida de resistencia en la planta también interrumpe la interacción entre

AvrPita176 y Pita (Jia et al., 2000). En el patosistema lino/roya del lino se ha demostrado, mediante intercambio de dominios, que proteínas quiméricas con los dominios TIR-NBS de los alelos L6 y L11 unidos a la región LRR del alelo L2 expresaban la especificidad de L2 (Ellis et al., 1999) y que la diferencia de siete aminoácidos ubicados en la región xxLxLxx correspondiente a estructuras hebra beta/retorno beta putativas de 4 unidades LRR del gen P es suficiente para producir especificidades diferentes entre alelos P y P2 (Dodds et al., 2001). En otro experimento de intercambio de dominios entre el gen de resistencia Xa21, y el receptor de brasinosteroides BR1 de Arabidopsis thaliana, la proteína quimera con las porciones TIR-

NBS de Xa21 y los LRR provenientes de BR1 podía inducir una respuesta hipersensible dependiente de la aplicación ectópica de brasinosteriode (Martin et al.,2003). El dominio

LRR del gen RPS2 que confiere resistencia a Pseudomonas syringae al ecotipo Col-0 de

Arabidopsis thaliana no sólo determina la especificidad del reconocimiento de Avrpt2 sino que posiblemente también determina la interacción RPS2 con otras proteínas del hospedero que inducen la respuesta hipersensible (Banerjee et al.,2001).

58

2.4.3.4. Dominio de bucles superenrollados CC (Coiled Coil).

En los genes de resistencia de Arapidopsis el dominio de bucles superenrollados CC comprende cerca de 170 aminoácidos que empiezan a unos 50 aa del extremo aminoterminal de la proteína (M eyers et al.,2003). Está constituido por repeticiones de héptadas, donde los siete aminoácidos están nombrados a a g, los residuos en las posiciones a y d tienden a ser hidrofóbicos, y los residuos de las posiciones e y g tienden a ser polares o cargados (Fluhr, 2001). Estas repeticiones se pliegan produciendo hélices alfa, y tales hélices alfa a su vez se pliegan sobre si mismas produciendo haces que contienen de 2 a 5 de tales elementos. Uno de los ejemplos más conocidos es el dominio de cremallera de leucina (Leucine zipper), que sirve entre otras para la unión a ácidos nucleicos dependiente de homo o heterooligomerización (Hammond-Kossack & Jones,

1997; Martin et al., 2003). Conforme a esto es posible que los dominios CC participen en la transducción de señal aún cuando no se descarta totalmente que puedan interactuar intramolecularmente con otros dominios y participar en el reconocimiento de factores de avirulencia (Fluhr 2001, Martin 2003).

2.4.3.5. Dominio de kinasa serina/treonina STK (Serine/Threonin Kinase).

Las kinasas de serina/treonina comparten un dominio catalítico de 250 a 300 aa (Shiu et al., 2001) caracterizado por 11 motivos conservados, donde se ubican entre otros el motivo I aminoterminal rico en glicina cerca de un residuo de lisina que está involucrado en la unión a ATP, y el motivo VIB que se localiza en la parte central, y cuyo aspartato y siguiente residuo básico corriente abajo son claves para la actividad enzimática

(Kostich et al.,2002). Junto con las kinasas de tirosina conforman la superfamilia

59

eucariótica de kinasas (Hardie 1999). Las STK constituyen cerca del 4% del proteoma

predicho de Arabidopsis (Champion et al.,2004), siendo el 2.5% correspondiente a las

RLK (Shiu et al., 2001). Esta familia incluye además la mayoría de kinasas conocidas que actúan en la regulación de la actividad celular mediante fosforilación como las kinasas activadas por mitógeno MAPK, y sus kinasas de orden superior MAPKK,

MAPKKK, MAP4K, las kinasas dependientes de calcio/calmodulina, CDPK, y las kinasas dependientes de ciclinas CDK (Hardie,1999). Las STK de Arabidopsis que son codificadas por genes de resistencia pertenecen al grupo monofilético de RLK que incluye también a las kinasas citoplasmáticas RLCK (Receptor Like Cytoplasmic

Kinases) como PELLE, que es una kinasa de la ruta de señalización de TOLL en

Drosophila, y a PBS1 que confiere resistencia a Pseudomonas syringeae pv. phaseolica

(Shiu et al., 2001).

El caso de Pto, que comparte similitud de secuencia con IRAK de humanos y PELLE de

Drosophila, ilustra como el dominio de kinasa serina treonina de un gen de resistencia intervendría en la respuesta inmune innata mediante el reconocimiento de factores Avr y la transducción de señal a factores corriente abajo que regulan la actividad de moléculas efectoras de defensa. El gen Pto de tomate que le otorga resistencia contra Pseudomonas syringeae pv. tomato fue uno de los primeros genes de resistencia clonado, y caracterizado bioquímicamente (M artin et al., 2003; Bogdanove, 2003). Pto es una kinasa serina treonina intracelular. Usando ensayos de doble híbrido en levadura se ha demostrado que Pto interactúa directamente por lo menos con dos efectores bacterianos:

AvrPto y AvrPtoB, para lo que requiere de autofosforilación y la presencia de Prf, un gen

60

NBS-LRR intracelular. AvrPto y AvrPtoB comparten una baja similitud total de aminoácidos pero conservan algunos aminoácidos clave para el reconocimiento por Pto.

AvrPto es una proteína bacteriana con un dominio de miristilación y un péptido de señalización para la membrana plasmática vegetal. AvrPtoB impide la respuesta hipersensible ya que es un supresor de muerte celular programada (Abramowitch, 2003).

Al parecer tanto AvrPto como AvrPtoB necesitan de un sistema de transporte bacteriano tipo III, cuyas proteínas son codificadas por los genes hrp, para su translocación hacia el citoplasma vegetal. Pto interactúa además con las proteínas Pti1-6 del hospedero. Pti1 es una STK fosforilada por Pto que se piensa está involucrada en la señalización corriente abajo que conduce a la respuesta hipersensible. Mientras que Pti 4, 5 y 6 son factores de transcripción emparentados con proteínas de unión a elementos de respuesta a etileno de tabaco que reconocen la caja GCC que se encuentra frecuentemente en la región promotora de varios genes de defensa PR (Pathogenesis Related genes) (Bogdanove et al.,2002). La sobreexpresión de Pto provoca un aumento, independiente de la presencia de AvrPto, en la producción de transcritos asociados a la defensa en tomate, el 40% de los cuales tienen homología a los inducidos durante la respuesta inmune de Drosophila u

Homo sapiens (Kirankumar et al., 2003). La sustitución Y207D produce un mutante de ganancia de función que muestra una respuesta hipersensible, lesiones localizadas en las hojas, dependiente de prf en la ausencia de AvrPto (M artin et al., 2003) lo que muestra que prf actua corriente abajo de la cascada de señalizción de Pto.

2.4.3.6. Interacciones intramoleculares.

61

Conociendo únicamente la secuencia del dominio NBS de un gen de resistencia se puede predecir si posee un dominio TIR o de bucles superenrollados en el extremo aminoterminal con un 95% de probabilidad (M eyers et al., 2003). Las secuencias de las proteínas TNL se caracterizan por un aspartato conservado al final del motivo RNBS-D mientras que los genes sin dominio TIR suelen codificar para un residuo triptófano en la misma posición (M eyers et al.,1998). De igual forma otros muchos motivos conservados en la región NBS-LRR y carboxiterminal a estos muestran un consenso distinto dependiendo si hacen parte de una proteína TNL o CNL (M eyers et al., 2003). La filogenia resuelta de dominios TIR de plantas permite reconocer que los dominios TIR que corresponden a proteínas TNL o CNL conforman un grupo monofilético aparte de las proteínas que tienen un dominio TIR solitario o asociado con dominios desconocidos

(Fluhr, 2000; Pan, 1999). Dentro los RLK las kinasas que comparten cada tipo de dominio receptor (repeticiones LRR, WD40, dominios inmunoglobulina, etc.) conforman un grupo monofilético basado solamente en las secuencias de su domino kinasa (Shiu et al., 2000). Por tanto existe una correlación en la identidad de residuos específicos, e incluso motivos, que se encuentran distantes en la estructura primaria de las proteínas de resistencia. Aparte del hecho mismo de la historia compartida, tales correlaciones se pueden explicar si existe una limitación evolutiva que impida la variación independiente de estas regiones. El proceso de plegamiento de la proteína, la estabilidad de la estructura nativa y la funcionalidad de un sitio catalítico pueden llegar a depender de la interacción correcta de aminoácidos separados por un largo trecho de secuencia lineal pero que en algún momento quedan próximos en el espacio tridimensional. De allí que debe existir una presión intensa de selección natural que conserve la identidad y/o propiedades

62

fisicoquímicas de grupos de aminoácidos involucrados en interacciones intramoleculares

que determinen el reconocimiento del patógeno y la transducción de señal corriente

abajo de las proteínas de resistencia, sin importar si están contiguos o no en la estructura

primaria.

Experimentos de coinmunoprecipitación y evaluación de la respuesta hipersensible en

ensayos de expresión transitoria de varias combinaciones de los dominios CC, NB-ARC,

y LRR del gen Rx de papa en N. benthamiana indican que existen interacciones intramoleculares entre los dominios de la proteína de resistencia que al ser interrumpidas

(directa o indirectamente) por la presencia de la correspondiente proteína de avirulencia disparan la señalización de defensa en la planta (M offet et al., 2002). La respuesta hipersensible mediada por Rx se pierde con una mutación que modifica el motivo P-loop, mientras que la interacción molecular entre LRR y CC-NB-ARC no requiere de la integridad este motivo pero sí es interrumpida por la presencia de la proteína de cápside funcional de PVX. Por analogía con las proteínas APAF-1 y CED-4 de mamíferos se infiere que la señalización para la muerte celular podría depender de la unión y/o hidrólisis del nucleótido trifosfato y que a su vez esta sea consecuencia de un cambio conformacional de la proteína de resistencia causado por la presencia del factor de avirulencia (M offet et al.,2002; Tameling et al.,2002). El hecho de que la especificidad de los genes R no solamente es consecuencia de los LRR, sino que los dominios aminoterminales de transducción de señal también puedan estar involucrados en tal reconocimiento es acorde con que la interacción entre los dominios pueda determinar la funcionalidad de la proteína R. Para el locus L del lino alelos recombinantes de origen

63

natural y sintetizados in vitro que producen proteínas con regiones TIR o TIR-NBS

diferentes pero dominios LRR idénticos que tienen específicidades distintas a las

predichas por el origen de las repeticiones ricas en leucina. Por ejemplo los alelos L6 y

L7 (que tienen especificidades distintas) poseen regiones LRR idénticas pero difieren en

11 aminoácidos en la región TIR. Los recombinantes naturales L2/L6 y LH/L6

(TIR/NBS-LRR) no poseen la especificidad de ninguno de los parentales sino que muestran la misma especificidad que la conferida por el alelo L7, tal diferencia en especificidad podría ser causada por una o más de tres substituciones claves de aminoácidos entre los dominios TIR de los tres alelos (Luck et al., 2000).

2.4.3.7. Hipótesis del gen guardián.

Una característica de los receptores del sistema inmune completamente codificados en la línea germinal es que han evolucionado por selección natural para tener especificidades definidas por microorganismos infecciosos. El problema es que cada organismo tiene un límite al número de genes que puede codificar en su genoma mientras que la cantidad de agresores potenciales es abrumadora. Se estima que e1 genoma humano cuenta con

32000 genes, y que puede generar somaticamente 1014 y 1018 receptores diferentes del tipo inmunoglobulinas o receptores de células T respectivamente a partir de unos pocos segmentos de genes (Musheigan & Medzhitov, 2001). El genoma de Arabidopsis thaliana que codifica para unos 26000 genes (TAIR, 2004), contiene cerca de 149 genes NBS-

LRR, (M eyers et al., 2003) y 216 kinasas semejantes a receptores que contienen

dominios LRR (Shiu et al., 2002) que podrían funcionar como receptores del sistema

64

inmune innato vegetal. No hay razón para creer que las plantas enfrenten una menor

cantidad de posibles patógenos que la que los mamíferos enfrentan con su sistema

inmune adaptativo (Dangl & Jones, 2001), por lo que de inmediato surge la pregunta de

como las plantas con un reducido repertorio de receptores pueden reconocer una amplia

variedad de organismos patogénicos. La estrategia del sistema inmune innato animal es

reconocer patrones moleculares asociados a una clase amplia de patógenos o PAMPs. Por

ejemplo los receptores semejantes a TOLL son capaces, de reconocer lipopolisacaridos

característicos de las bacterias Gram-negativas, o a los ácidos lipoteicoicos provenientes

de bacterias Gram-positivas (Beutler, 2004). Tal vez las plantas también sigan una

estrategia similar en algunos casos, como el reconocimiento de la flagelina de las

bacterias gramnegativas (como Xanthomonas, Erwinia y Pseudomonas) por parte de

FLS2 (Hammond-Kossack & Parker, 2003).

Sin embargo existen muy pocas pruebas experimentales a favor de interacciones directas

entre proteínas R y sus correspondientes proteínas Avr, excepto por Pita / AvrPita y Pto /

AvrPto (Martin et al., 2003;Nimchuk Jia et al., 2000) por lo que se ha formulado “la hipótesis del gen guardián“ según la cual las proteínas de resistencia están encargadas del reconocimiento de alteraciones en la estructura y/o actividad de proteínas propias que son consecuencia de la acción virulenta del patógeno en vez de reconocer elicitores específicos provenientes del organismo agresor. Así pues las proteínas R serían como antenas que registran las interacciones entre los factores de avirulencia del patógeno y sus blancos en el hospedero. En la ausencia de la proteína R la proteína de avirulencia del patógeno podría interferir con la función de un regulador positivo de la defensa de la

65

planta o promover la actividad de un supresor de la defensa (Hammond-Kosack &

Parker, 2003). Existen varios ejemplos donde los datos extraídos de experimentos genéticos y bioquímicos sobre un sistema R/Avr caben dentro de dicha interpretación. La proteína RIN4 de Arabidopsis es el blanco de la actividad de por lo menos tres proteínas de avirulencia de Pseudomonas syringae que poseen una similitud de secuencia baja.

AvrRpm1 y AvrB interactúan con RIN4 y la fosforilan, lo que produce una respuesta hipersensible mediada por el gen de resistencia RPM 1. AvrRpt2 induce la desaparición post-transcripcional de RIN4, tal disminución es independiente del correspondiente gen de resistencia RPS2 e interfiere con la actividad de RPM 1. La sobre-expresión de RIN4 inhibe la función de RP S2 y aumenta la susceptibilidad de la planta a la infección por otros microorganismos, mientras que su carencia es letal, asociada a un fenotipo de muerte celular tipo HR dependiente de RPS2. Esto sugiere que RPS2 podría estar activando la respuesta de defensa al detectar la disminución de RIN4 ocasionada por la actividad de AvrRpt2 , y que por lo tanto RIN4 actúa como un supresor de la respuesta hipersensible (M ackey et al.,2003). Tal evidencia muestra que una proteína de resistencia puede poseer más de una única especificidad. Que tal especificidad está mediada por una tercer proteína. Que dos factores de avirulencia con homología de secuencia mínima tienen un efecto similar sobre una misma proteína del hospedero, y que a su vez el blanco de virulencia puede ser un regulador negativo de la respuesta de defensa a patógenos, lo que descarta inmediatamente una interacción específica receptor ligando. Los datos recogidos acerca de la resistencia mediada por Pto también se ajustan a la hipótesis del gen guardián (Schneider, 2002), en este caso Prf actuaría como un guardián cuya proteína custodiada sería Pto, que a su vez puede interactuar con por lo

66

menos dos proteínas de avirulencia AvrPto y AvrPtoB, y además, como se menciona

arriba, se tienen pruebas sobre la actividad supresora de la muerte celular programada

por parte de la proteína activa de AvrPtoB. El gen de resistencia RPS5 de Arabidopsis

otorga resistencia a la cepa de P. syringae que porta AvrPphB y requiere para la respuesta

de defensa a PBS1 que es una kinasa serina/treonina, es posible que AvrPtoB que tiene

actividad proteolítica digiera a PBS1 de tal forma que este cambio sea detectado por

RPS5 y se inicie la respuesta defensiva de la planta (Schneider, 20002).

2.4.4. Estructura y evolución de clústers* de genes de resistencia.

2.4.4.1. Estructura y función.

Los genes de resistencia pueden ubicarse en el genoma de una planta en un locus simple.

Algunos loci simples apenas cuentan con dos clases de alelos alternativos, unos producen un gen funcional que determina la especificidad contra una única raza de patógeno y la otra clase corresponde distintas variaciones de alelos nulos. A pesar de ello a nivel de secuencia de ADN se puede identificar una cantidad considerable de polimorfismo entre los alelos de resistencia y entre los alelos de susceptibilidad, como en los genes RPS2

(Caicedo et al., 1999) y RPM1 (Stahl et al., 1999) de Arabidopsis. En otros casos se

* A un conjunto de genes que están próximos físicamente y tienen identidad de secuencia y/o comparten una función común se les denomína con la palabra inglesa (gene) cluster. La ventaja del termino inglés cluster es que designa conjuntos de objetos clasificados bajo algún criterio que además están agrupados espacialmente. Términos como “grupo” o “agregado” no comprenden este sentido espacial necesariamente y por lo tanto son muy amplios . En astronomía galaxy cluster suele traducirse por “cúmulo de galaxias”, pero a mi parecer “cúmulo” implica una estructura tridimensional. De forma que no he encontrado una palabra única en español que pueda traducir adecuadamente el término cluster en el contexto de genética molecular. Así que que he decidido usar el anglicismo “clúster(s)” en el texto.

67

puede observar diversidad funcional en la serie alélica de un locus simple. Por ejemplo los alelos RPP13-Nd-1 y RPP13-Rld-2 determinan especificidades distintas a múltiples razas del patógeno Peronospora parasitica (Bitter-Eddy et al.,2000) y en el locus L de lino hay 14 alelos distintos que codifican para 13 especificidades diferentes contra la roya del lino (Ellis et al.,1999).

Es más frecuente que los genes que codifican para proteínas de resistencia se agrupen en familias génicas de miembros estrechamente ligados, (Michelmore & Meyers, 1998;

Hammond-Kosack & Jones, 1997; Martin, 1996). El 76% de las 535 secuencias NBS-

LRR de arroz se ubican en loci multigénicos de al menos cuatro miembros (Zhou et al.,

2004). Se conoce la estructura genómica de clústers de genes de resistencia en la planta modelo Arabidopsis thaliana (M eyers et al.,2003) y en especies cultivadas como arroz

(Zhu et al.,2004), maíz, sorgo, (Ramakrishna et al., 2002), cebada (Wei et al.,2003), lechuga (M eyers et al., 1998a), soya (Kanazin et al.,1996; Shoemaker et al.,2003), papa

(Gebhardt et al.,2001), y tomate (Parniske et al., 1997) entre otros. El tamaño y número de copias por clúster varía muchísimo dependiendo de la densidad génica de la especie

(Hulbert et al., 2001), en Arabidopsis thaliana accesión Col-0 el locus RPP8 contiene dos copias de un gen CNL en una región que ocupa 15kb, en el otro extremo de tamaño está el locus multigénico Dm3 de lechuga que contiene 24 copias de genes XNL dispersas a lo largo de 3.5 Mb (Meyers et al., 1998). Los genes pertenecientes a un clúster pueden conformar un grupo monofilético o ser el resultado de reorganizaciones cromosómicas que conduzcan disponer de forma contigua genes que descienden de loci ancestrales física y filogenéticamente lejanos. De los 43 clústers en los que se organizan 109 de las

68

150 copias de genes NBS-LRR de Arabidopsis 4 corresponden a agrupaciones de genes de distintos linajes (M eyers et al., 2003; Richly et al., 2002). También se pueden encontrar clústers heterogéneos de homólogos a genes de resistencia que mapean en regiones no sinténicas entre arroz, millo y cebada, lo que puede ser consecuencia de una rápida reorganización genómica entre los cereales (Leister et al., 1998).

Los distintos miembros de un clúster o familia de genes de resistencia pueden codificar para numerosas especificidades completamente distintas. El gen de resistencia contra

Peronospora parasitica RPP8 y una copia de función desconocida RPH8 constituyen el haplotipo del locus RPP8 de A. thaliana en la accesión Col-0 (M cDowell, et al.,1998). El mismo locus en la accesión Di-17 corresponde a un gen de copia única HRT comparte con RPH8 un 92% de identidad y determina la respuesta hipersensible contra el virus de la arruga del nabo TCV (Turnip Crinkle Virus) (Cooley et al., 2000). Por último en el ecotipo Ws el alelo RCY1 correspondiente al locus RPP8 ofrece resistencia contra el virus del mosaico del pepino CMV (Cucumber Mosaic Virus) (Takahashi et al., 2002).

Lo que prueba que distintos alelos de un mismo locus multigénico especifican para la resistencia contra patógenos carentes de parentesco. Más sorprendente aún es el caso en que diferentes parálogos en el mismo haplotipo confieren resistencia a distintas especies de agresores filogenéticamente lejanos. Los genes de resistencia de papa Gpa2 y Rx1 comparten más del 88% de identidad de aminoácidos predichos y pertenecen a una misma familia multigénica de 4 miembros que abarcan una región de 115 kb. A pesar de mostrar una homología de secuencia tan alta Gpa2 controla la resistencia contra algunas poblaciones del nematodo Globodera pallida, y Rx1 induce la respuesta de defensa

69

contra el virus de papa Y PVY (Potato Virus Y) (van der Vossen et al., 2000). El gen Mi

de tomate pertenece a un cluster que contiene dos parálogos con ORFs completos Mi1-1

y Mi1-2 y un pseudogen (Milligan et al.,1998), en principio se clonó porque confería

resistencia al nematodo de raíz y se sostenía que un gen estrechamente ligado, el

hipotético Meu-1, le brindaba resistencia al áfido de papa (Kaloshian et al.,1995). Más tarde no sólo se comprobó que el mismo Mi1-1 era el gen responsable de la resistencia contra el nematodo y el áfido (Rossi et al.,1998), sino que también determina la resistencia contra algunos biotipos de la mosca blanca Bemiscia tabaci (Nombela et al.,

2003). Esto es un ejemplo de como el mismo gen, exactamente la misma secuencia de

ADN, pude ser responsable de la resistencia a varias enfermades distintas causadas por

animales emparentados lejanamente. En contraste en el locus Cf4/9 de tomate se

encuentran dos miembros parálogos del mismo loci complejo que codifican para la

misma especificidad (Parniske & Jones, 1999). Además, como se indicó con anterioridad,

una misma proteína R puede intervenir en la resistencia causada por más de una proteína

Avr (Schneider, 2002; MacKay, 2003). Las plantas cuentan con una variedad de

estrategias de utilización de la información contenida en distintos clusters de genes de

resistencia. Estos ejemplos cubren los principales casos en los que la variabilidad entre

los miembros de un clúster de genes, resulta en resistencia a distintos agresores.

Diferentes especificidades conferidas por distintos alelos, diferentes resistencias

determinadas por distintos parálogos de un mismo locus y diferentes especificidades

otorgados por un único gen.

2.4.4.2. Evolución de los clústers de genes R.

70

Parece claro que los clústers de genes R son principalmente el producto de duplicaciones

en tándem de genes ancestrales (Leister 2004). Nuevas especificidades pueden generarse

a partir de la recombinación intragénica de distintos alelos previamente existentes en la

población (Ellis et al., 1999; Bergelson et al., 2001; Hulbert, 2001). Pero en este contexto también es posible el intercambio de secuencias entre distintos parálogos del mismo locus complejo mediante recombinación ilegítima (Hulbert 2001, Bergelson et al., 2001;

Hammond-kosack & Jones 1997). La recombinación ectópica a su vez puede generar clústers heterólogos de miembros filogenéticamente lejanos pertenecientes a distintos loci ancestrales (M eyers et al., 2003; Richly et al., 2002; Leister 2004; Leister et al., 1998).

Así pues, la diversidad actual entre los distintos miembros de un clúster de genes R, como en el caso de otras familias génicas, es el resultado de una historia compleja de divergencia y reticulación evolutivas (Leister, 2004; Hulbert, 2001; Trowsdale 2002)

Los arreglos de genes en repeticiones en tándem o invertidas corresponden a eventos de recombinación locales (microestructura) o de segmentos cromosómicos a gran escala

(macroestructura) (Bancroft, 2001). La duplicación de genes puede producirse mediante eventos de poliploidización, recombinación homóloga o a través de la acción de retrotransposones (Wagner, 2002). La multiplicación de genes de resistencia en algunas familias génicas de Arabidopsis se puede asociar con duplicaciones de segmentos

(detectadas mediante análisis de secuencia) que contienen más de 10 genes (Shillion et al., 2002; Visión et al., 2000) pero tal reorganización no puede explicar la multiplicidad del complemento NBS-LRR. Teniendo en cuenta que el 80% del genoma de Arabidopsis está involucrado en eventos de duplicación a gran escala (Shillion et al.,2002), sólo 9 de

71

43 clústers TNL y CNL tienen miembros ubicados en ambos segmentos involucrados en tales duplicaciones (M eyers et al., 2003). Sin embargo la mayoría de clústers de genes

NBS-LRR en Arabidopsis conforman un grupo monofilético de parálogos, lo que indica que estos grupos son resultado de duplicaciones en tándem recientes a nivel local

(Meyers et al., 2003).

M ediante el análisis de la secuencia de clústers de genes de resistencia en, tomate

(Parniske et al., 1997; Parniske & Jones, 1999), lechuga (Chin et al., 2001; Meyers et al.,

1998 ), lino (Dodds et al., 2001) y Arabidopsis (M cDowell et al., 1998; Meyers et al.,

2003; Noel et al., 1999), se ha detectado evidencia de recombinación intragénica y de conversión génica entre las distintas copias. Cuando la recombinación génica es común en un locus complejo, el conjunto de ortólogos y parálogos pertenecientes a un clúster son un mosaico de segmentos compartidos, como es en el caso del locus RPP5 de

Arabidopsis (Noel et al., 1999). La recombinación entre dominios LRR puede ser sustancial (Noel et al., 1999, Chin et al., 2001), e incluso en efecto puede generar nuevas especificidades (Parniske et al., 1997). La otra cara de la moneda consiste en que el exceso de recombinación y conversión génica puede conducir a la homogenización de las secuencias y la pérdida de especificidades (Hulbert, 1999). Respecto a esto se reconoce que siendo la recombinación un proceso que depende de la homología entre las secuencias cercanas al punto de recombinación (Shibata, 2001), el grado de similitud entre los distintos parálogos de un clúster incide en la tasa de recombinación (Chin et al.,

2001, Parniske & Jones 1999). Por ejemplo se espera que durante la evolución de los genes de resistencia de un clúster se presenten dos etapas (Ellis et al., 2000a, 2000b). En

72

una etapa temprana existe la tendencia hacia una mayor tasa de recombinación

intragenica e ilegítima, por la similitud casi completa entre parálogos, mientras que más

tarde a medida que las diversas copias divergen la tasa de recombinación disminuye

(Dodds et al., 2001) y los distintos parálogos pueden adquirir funciones propias y

evolucionar independientemente.

En contraste con la homogenización en las secuencias como resultado de la evolución en

concierto, se ha propuesto que los genes R de un cluster evolucionan principalmenmte

según un modelo de nacimiento y muerte (Michelmore & Meyers, 1998) , que se ha

aplicado a proteinas del sistema inmune humano ( Nei et al., 1998 MHC; Nei et al., 2001

IG V), y a la familia de ubiquitinas (Nei et al., 2000). Según esta hipótesis la generación de nuevos parálogos se dá por entrecruzamiento desigual, mientras que la posterior evolución de las copias individuales es impulsada por selección diversificante (Leister

2004; Michelmore & Meyers, 1998). A favor de dicho modelo se cita como evidencia el hecho de que los ortólogos de genes de resistencia se parecen más entre sí que los parálogos de un mismo clúster, lo que implicaría un papel menor de las fuerzas homogenizadoras de secuencias entre parálogos (Michelmore & Meyers, 1998). Por otra parte por medio del cáculo de la proporción entre mutaciones sustitutivas y mutaciones sinónimas, Ka/Ks, se ha mostrado la existencia de una presión selectiva diversificante principalmente en la región LRR de genes de resistencia (Mondragón-Palomino et al.,

2003, ). Una tasa Ka/Ks > 1 es congruente con el hecho de que la región LRR juega un papel primordial en la determinación de la especificidad de las proteínas de resistencia,

Una mayor variabilidad en la región LRR de los genes de resistencia implicaría un

73

aumento potencial en el espectro de agresores que pueden ser identificados por el sitema

inmune.

2.5. Mapeo de QTLs y aislamiento (clonación) de genes de resistencia.

Para el caso de los genes de resistencia la conservación de los dominios proteícos de la

familia de genes NBS-LRR funcionales como L6 de lino, N de tabaco, y RPM8, RPS2 de

A.. thaliana, ha permitido el diseño de estrategias basadas en primers degenerados para el aislamiento de candidatos a genes de resistencia en una multitud de plantas (Kanazin et

al.,1996; Yu et al., 1996, Leister et al., 1998) . Además se ha demostrado que tales candidatos suelen estar ligados a genes de resistencia o QTLs mapeados ( Leister et al.,

1998; Shoemaker et al. 2002). Mediante la ‘aproximación del gen candidato’ se detecta la asociación entre el fenotipo observable y un marcador genético cuya secuencia tiene homología a genes que hayan sido funcionalmente implicados en la determinación del fenotipo de interés. La evidencia experimental que demuestre la función de los genes a partir de los que se identifican los candidatos puede ser genética, bioquímica o fisiológica

(Lynch & Walsh 1998). En este sentido la aproximación del gen candidato consiste en la reducción del espacio de búsqueda de determinantes genéticos de un carácter complejo a un conjunto de secuencias presumiblemente involucradas en la función subyacente al fenotipo de interés. La homología con genes de funcionalidad demostrada permite hacer la supocición razonable de que los genes candidatos tienen una mayor probabilidad de determinar el fenotipo de resistencia que los marcadores de secuencia anónima. Es en este punto donde existe un contraste entre esta aproximación basada en secuencia y el método tradicional de clonación basado en mapeo. La clonación basada en mapeo

74

requiere de la saturación de marcadores al rededor del gen de interés, mientras que los estudios de asociación con genes candidatos se pueden llevar a cabo sin un conocimiento a priori de ligamiento entre el QTL y el marcador (Mackay, 2002). No obstante cabe anotar que estas estrategias no son mutuamente excluyentes sino que por lo contrario pueden ser utilizadas de forma complementaria durante el proceso de clonación de genes.

75

3. MATERIALES Y METODOS

3.1. Material vegetal.

En el curso del presente trabajo se utilizó ADN proveniente de las siguientes plantas de

frijol:

- G19833: Raza criolla del acervo genético Andino resistente a los aislamientos

12MEX y 30CRI de Phaeoisariopsis griseola.

- DOR364: Variedad del acervo genético M esoamericano susceptible a los

aislamientos 12MEX y 30CRI de Phaeoisariopsis griseola.

- 87 RILS generación F9 derivadas del cruce DOR364 X G19833.

- ‘Sprite’: Habichuela susceptible a todos los aislamientos conocidos de P.

griseola, además es la cultivar de la que proviene el clon BAC 57M14 que

contiene el marcador RFLP detectado por hibridación con una sonda derivada de

RGC7.

El ADN genómico de G19833, DOR364, y ‘Sprite’ fue extraído mediante el método de

CTAB modificado a partir de plantas crecidas en invernadero. El ADN de las 87 RILs fue

extraído por Fabio Pedraza según la metodolgía descrita en Tohme et al., (1996).

3.2. Mapeo de microsatélites y análisis de QTL.

Los 12 contigs que correspondían a los 90 Kb de la secuencia obtenida para el BAC

57M14 fueron sometidos a una búsqueda de microsatélites mediante la herramienta

SSRIT (Simple Sequence Repeat Identification Tool http://www.gramene.org/db/

searches/ssrtool) de Gramene (Acosta et al., 2002). De las repeticiones encontradas por

76

este programa se escogieron dos regiones propicias para el diseño de cebadores y la amplificación por PCR. Los marcadores resultantes fueron nombrados SSR06 y SSR07

(Acosta et al., 2002). Posteriormente se condujo la optimización de las condiciones de la reacción de amplificación de los dos microsatélites variando la concentración de

o cebadores, M gCl2, y la temperatura de fusión (entre 50 y 60 C). Sin embargo sólamente el SSR07 resultó polimórfico entre los parentales de interés. La visualización del polimorfismo se realizó en geles de poliacrilamida al 6%. Para la genotipificación del marcador SSR07 se realizaron 3 PCRs independientes sobre las 87 RILs y los parentales, los cuales se evaluaron en geles separados. Adicionalmente se revisaron las lecturas de las autoradiografías de la hibridación del marcador RGC7 realizadas previamente (López et al., 2003) dada la presencia de heterocigosis en la población de RILs incluso en una generación F11 (Beeve et al., 2003)

Los datos de la segregación del SSR07 y las lecturas corregidas del RFLP correspodientes al marcador RGC7 fueron agregados a la matriz del mapa utilizado por

Lopez et al. (2002). Dicho mapa derivado del de Beeve et al., (1998) fué construído con marcadores RFLP, microsatélites, AFLPs y RAPDs. La estimación de los grupos de ligamiento se llevó a cabo en el programa MapMaker 3.0 (Lander et al., 1987) para Mac con criterios muy exigentes. En principio se agruparon los marcadores mediante la orden group con un LOD mínimo de 15 y una distancia máxima de 25 cM. Los marcadores

RGC7 y SSR07 conformaban el mismo grupo de ligamiento junto con marcadores pertenecientes al grupo B10I de los mapas de Beeve et al., (1998) y Blair et al., (2003), a este conjunto de marcadores se les denominó la vecindad de RGC7. De allí en adelante se

77

procedió a construir el marco (framework) de B10I únicamente ya que este es en escencia

el grupo de ligamiento de interés para el presente estudio. El mapa final se obtuvo a partir

del orden más verosímil estimado mediante los comandos compare y ripple. Como

los otros 10 grupos de ligamiento restantes son unidades de segregación independiente

respecto a B10I se asumió que en ellos se conservaría el orden de los marcadores

estimado por López et al., (2002).

Por otra parte los datos del fenótipo de resistencia contra los aislamientos 12MEX y

30CRI de la población segregante corresponden a los utilizados por López et al., (2002).

Dichas evaluaciones fenotípicas se hicieron de acuerdo a la escala visual CIAT del

impacto de la enfermedad a los 10, 12, 14, 17 y 21 días posteriores a la inoculación de las

plantas (van Schoonhoven & Pastor-Corrales, 1987). En esta escala visual 1 corresponde

a la carencia de síntomas visibles y 9 a más del 25 % del área foliar afectada por lesiones

esporulantes y coalescentes (van SchoonHoven & Pastor-Corrales 2002). Con estos

puntajes visuales se calculó el área bajo la curva de progreso de la enfermedad AUDPC

(Area Under Disease Progress Curve) como medida de susceptibilidad, según la siguiente ecuación (Mahuku et al., 2004):

∑()Di − Di−1 ()ti − ti−1 AUDPC = i (Shaner & Finney, 1977) 2

Donde D es el puntaje de la enfermedad en la escala CIAT, t representa el tiempo de la evaluación e i es el índice para los eventos de evaluación. Estos valores fueron

78

expresados como AUDPC realtivo, es decir como una fracción del AUDPC máxima posible con el objeto de hacerlos comparables con las mediciones realizadas en otros experimentos. Un desarrollo tardío de la enfermedad y un área foliar afectada menor, tal como se dá en las plantas resistentes, se traduce en un AUDPC bajo.

Así pues los datos utilizados en el análisis de QTL fueron los puntajes de AUDPC relativo y la versión final del mapa genético de fríjol con la configuración del grupo B10I corregida por los datos generados en el presente trabajo. La relación entre la segregación de los marcadores genéticos y la resistencia a los aislamientos 12MEX y 30 CRI de

Phaeoisariopsis griseola fue evaluada mediante la ulización del análisis de marcadores individuales (Single Marker Analysis) en el programa QGene 3.5 (Nelson, 1997). En este análisis se calcula para cada marcador del mapa el coeficiente de correalción entre el puntaje del fenotipo de resistencia (AUDPC bajo) y la categoría genotípica de los individuos de la población. Este coeficiente de correlación se interpreta como la proporción de la varianza fenotípica que puede ser explicada por la variación en el genotipo de cada locus.

3.3. Aislamiento de candidatos de genes de resistencia homólogos a RGC7 en el genotipo resistente G19833.

La secuencia obtenida apartir del clon BAC 57M14 de la variedad susceptible ‘Sprite’ constituyó la base para el aislamiento de los candidatos a genes de resistencia presentes en el locus RGC7 en la raza criolla resistente G19833. Los cinco miembros de la familia génica de RGC7 aislados del BAC57M14 muestran una alta conservación de su

79

secuencia de nucleótidos, principalmente en las regiones codificantes (Acosta et al.,

2003). Por ejemplo la identidad de nucleótidos en el dominio TIR entre parálogos de

‘Sprite’es del 82%, con un máximo de 89% de identidad entre RGC7D y RGC7A

(Apendice A1). Es por tal motivo que el alineamiento de secuencias múltiples entre los distintos parálogos del BAC57M14 permitió el diseño de cebadores consenso sobre regiones conservadas de los dominios putativos TIR y NBS (Figura 8). El diseño de cebadores consenso, específicos para esta familia, tiene como objetivo maximizar el número de miembros del clúster de RGC7 amplificados en G19833 mediante el uso de la técnica conocida como PCR vectorette . Pruebas preliminares demuestran la presencia de por lo menos 9 fragmentos TIR y 11 fragmentos NBS en el genoma de G19833 (Acosta,

2003, datos sin publicar).

Micro 07 P132 P132 P98 Univ P98 TIR NBS LRR Micro 06

Figura 8. Ubicación relativa los cebadores utilizados en el aislamiento de candidatos a genes de resistencia de la familia RGC7.

El PCR vectorette permite la amplificación de zonas genómicas desconocidas aledañas a una secuencia de ADN conocida (Hagiwara & Harris, 1996; Arnold & Hogson, 1991).

Para tal efecto se utiliza un cebador específico diseñado sobre la región de secuencia conocida y otro cebador que reside dentro de los adapatadores vectorette. El proceso parte de una digestión completa de ADN genómico donde se generan fragmentos de

80

restricción que posteriormente son ligados con adapadores vectorette por ambos extremos

(5’ y 3’). Cada uno de los adaptadores vectorette es una cadena duplex de ADN con secuencias complementarias en los extremos y que en el medio posee un tramo de secuencias no complementarias que generan una estructura en forma de burbuja.

Precisamente, el cebador del adapatador vectorette es idéntico en secuencia a una de las hebras de la burbuja y por lo tanto no es complementario a ninguna de ellas. Este diseño asegura que la síntesis de ADN necesariamente proceda en primer lugar desde el cebador específico. Durante el primer ciclo de PCR se sintetiza el sitio de unión al cebador del adaptador y a partir del segundo ciclo se obtiene la amplificación del fragmento deseado.

De esta forma se evita la amplificación de artefactos vectorette-vectorette o vectorette- fragmento-vectorette (Strachan & Read, 1999). Adicionalmente este método tiene la ventaja de que no se necesita la secuenciación exaustiva de clones de ADN cromósomico como es lo común en las estrategias de clonación basadas en mapeo. Lo cual implica que se pudo prescindir de la construcción de una librería genómica para G19833. y de la detección de clones hibridantes con sondas RGC7 en dicha librería.

Para el presente trabajo se relizaron 3 digestiones-ligaciones del ADN genómico de

G19833 con 3 enzimas de corte raro (6 bases de sitio de reconocimiento) que producen fragmentos de extremos romos: EcoRV, DraI, HincII . Estas diferentes digestiones- ligaciones generan fragmentos sobrelapantes adecuados para la secuenciación y útiles para aumentar el cubrimiento de las regiones adyacentes a los cebadores conservados de

RGC7.

81

Como siguiente paso se procedió a detectar la amplificación de fragmentos sobre las digestiones-ligaciones vectorette de cada enzima de restricción a partir de 6 cebadores específicos para RGC7 (Tabla 7). para un total de 18 combinaciones cebador / enzima de restricción. Con tal objeto de realizaba un PCR prueba cuyo perfil térmico y condiciones de reacción facilitaban la sintésis de fragmentos largos. Posteriormente se optimizó la tempetura de fusión de las reacciones con cada cebador específico y se visualizaron los productos en un gel de agarosa al 2%. En todos los casos en que la amplificación era positiva se observaron multiples bandas por cada reacción de PCR.

Como los cebadores específicos para la familia RGC7 se diseñaron con base en la secuencia consenso de varios genes parálogos cada cebador tiene el potencial de amplificar más de un único producto en una reacción de PCR vectorette en G19833. De allí que se esperaba que una misma banda observada correspondiera a varias secuencias amplificadas a partir de de distintos parálogos de RGC7. En consecuencia se procedió a separar los productos de PCR por clonación. Las bandas observadas se agruparon en distintas categorías de tamaño, se escindieron del gel, y se purificaron mediante

(Quiagen). Los fragmentos amplificados por PCR se clonaron en el vector pGEM-T easy

(Promega), y los plásmidos resultantes utilizaron para transfomar células de Escherichia coli DH5-α. Los clones recombinantes fueron seleccionados en placas de agar LB con ampicilina 0.1 mg/ml y X-gal 0,02 mg/mL. De estas placas se picaron aleatoriamente una cantidad de colonias proporcional a las bandas observables por cada cebador (entre 16 y

48 colonias). Finalmente esto permitió la construcción de una librería de fragmentos PCR vectorette (que incluía los clones generados con las 3 digestiones-ligaciones vectorette)

82

compuestas por un número de clones proporcional a el número de productos de PCR

diferenciables por tamaño de cada combinación cebador / enzima(Tabla 7).

Posteriormente se hizo una reamplificación del inserto con los cebadores (224M13f y

224M13r) flanquenates al sitio múltiple de clonación (multiple cloning site) a partir del

cultivo de bacteria para un volumen final de 60µL. La observación de 5 µL de producto en un gel de agarosa al 2% permitió la reclasificación de los clones según el tamaño y la estimación de la redundancia. Con base en esta observación se escogíeron varios clones que representaran cada uno de los tamaños amplificados. Los 55µL restantes del producto de PCR directo sobre el cultivo bacteriano se purificaban mediante precipitación con etanol. El ADN purificado se utilizaba como molde para la reacción de secuencia con el kit Big Dye Terminator (Applied Biosystems) y finalmente las secuencias eran extraídas mediante el secuenciador automático AbiPrism 377. En la medida de lo posible cada clon fue secuenciado por los dos extremos, SP6 y T7, del sitio múltiple de clonación.

Tabla 7. Clones pertenecientes a la librería PCR vectorette de fragmentos amplificados con cebadores específicos para RGC7. Cebadores Enzima de restricción específicos para RGC7 EcoRV DraI HIncII Micro006L 23 22 7DL 24

1325 16 48

1326 16 48

P980 32

Univ1 23 23 34

83

P981 32 45

3.4. Análisis bioinformáticos.

3.4.1. Ensamblaje de contigs.

Las secuencias que resultan del proceso de secuenciación automática tienen una longitud

muy corta (alrededor de 500 pb aproximadamente) respecto al tamaño esperado de los

genes de resistencia, entre 3 y 7kb (Hammond Kossack & Jones, 1997; Acosta et al.,

2003). Es por esto que las lecturas individuales arrojadas por el secuenciador automático

han de ser ensambladas para generar secuencias de regiones contiguas de fragmentos

sobrelapantes, conocidas como contigs, que concuerden con la secuencia original del

ADN cromosómico proveniente de G19833.

La construcción de contigs confiables fue de crucial importancia para la realización de la

presente investigación. Por tal motivo a continuación se discuten ampliamente algunos

puntos clave en el desarrollo de la metodología utilizada.

El ensamblaje de contigs fue realizado con el programa Sequencher 4.1 el cual utiliza

para este fin un algoritmo de Smith-Waterman modificado (GeneCodes). Sequencher 4.1

realiza alineamientos pareados locales utilizando dos parámetros de entrada: la longitud

de solapamiento mínimo requerido entre lecturas y el porcentaje de similitud de las

disntintas lecturas en las regiones sobrelapantes. A partir de dichos alineamientos locales

el programa computa contigs que impliquen alineamientos multiples óptimos. De esta

manera el ensamblaje automático puede realizarse con una sensibilidad alta o baja a los

84

errores de secuenciación dependiendo de los parámetros de entrada especificados por el

usuario. Dados un conjunto de lecturas y una frecuencia de errores de secuenciación, el

empleo de parámetros más laxos (una longitud de solapamiento y un porcentaje de

similitud menores) produce menos contigs, cada uno de ellos con mayor número de lecturas constituyentes y con más desacuerdos que un ensamblaje con parámetros más restrictivos.

Este punto es de especial trascendencia cuando se aislan secuencias de una familia génica a partir de cebadores conservados ya que en este caso existen dos fuentes de discrepancias entre las secuencias. En primer lugar dos lecturas pueden conformar un contig real pero mostrar desacuerdos en algunas posiciones del alineamiento debido a errores de secuenciación. En segundo lugar dos lecturas pueden provenir de parálogos distintos que comparten regiones conservadas con algunas discrepancias entre sus secuencias. No obstante, dichas discrepancias son reales ya que se originan en la divergencia evolutiva de dos entidades biológicas naturales. Cuiando se presenta la segunda situación existe el riesgo de ensamblar un contig que contenga fragmentos de

distintos parálogos si los parámetros de entrada del algoritmo de ensamblaje son muy

laxos, lo cual resulta en la construcción de un artificio quimérico que no existe en el

genoma. En contraste si los parámetros de ensamblaje son exesivamente restrictivos el

algoritmo tendería hacer que ensamblajes que se diferenciaran solamente por errores de

secuenciación fuesen cons iderados como contigs distintos. La técnica de PCR vectorette

hace que el aislamiento de secuencias dependa inevitablemente de las amplificaciones

PCR y por ende existe una considerable oportunidad para se den errores de secuenciación

85

por ocurrencia y fijación de mutaciones en la población de fragmentos amplificados. Los

errores de la Taq polimerasa no solamente producen sustituciones puntuales sino que también pueden provocar la aparición de inserciones-deleciones de repeticiones de secuencia simple como p. ej. en los microsatélites localizados en el BAC57M14.

En resumen existía un compromiso en la utilización de los parámetros de ensamblaje de contigs en el presente trabajo. Al usar parámetros de ensamblaje muy laxos se puede subestimar la cantidad de miembros de una familia génica porque secuencias originarias de distintos parálogos se considerarían partes del mismo contig. Mientras que cuando se

emplean parámetros muy restrictivos se puede sobreestimar el número de parálogos al

tener en cuenta los errores de secuenciación como diferencias legítimas entre copias

génicas distintas. El objetivo de la investigación era el aislamiento del conjunto de

candidatos a genes de resistencia del locus RGC7, dentro de los cuales se esperaba incluir

al gen responsable de la resistencia contra P. griseola. Por tal razón se optó por seguir un

método de ensamblaje de contigs que minimizara la construcción de quimeras entre

parálogos utilizando parámetros de ensamblaje relativamente restrictivos. De esta manera se pretendió detectar la mayor cantidad de candidatos para poder ‘pescar’ entre ellos el gen de resistencia, corriendo el riesgo de que eventualmente se sobreestimara la cantidad de parálogos de la familia RGC7 localizados en el genoma de G19833,

Como primer paso en el tratamiento de las secuencias en Sequencher 4.1 se ‘podaron’ de forma interactiva las regiones correspondientes al adaptador vectorette y al vector de clonación, como también las regiones terminales de la secuencia. Para aprovechar al

86

máximo la información obtenida por el secuenciador automático las secuencias eran

editadas de forma manual mediante la corrección de errores en la asignación automática

de bases (base calling) a partir de la observación directa de los electroferogramas. Por

medio de este procedimiento se pudieron obtener lecturas individuales entre 300 y 600

bp.

El ensamblaje de contigs consistió en un proceso iterativo que implicaba ciclos de ensamblaje y corrección de errores de secuenciación. En un principio se procedía a ensamblar todas las secuencias con los parámetros más restrictivos del algoritmo: (20 bps de longitud de solapamiento mínimo y 100% de similitud). Si de esta manera no se obtenían contigs el conjunto completo de secuencias se volvía someter al ensamblaje automático con valores cada vez más bajos del parámetro requerido de similitud hasta que se conformara por lo menos un contig. La conformación de un contig (o conjunto de contigs) inicial(es) permitía hacer una nueva edición para corregir errores de asignación automática de bases comparando electroferogramas superpuestos pertenecientes al mismo contig de reacciones de secuencia independientes. En subsiguientes rondas de ensamblaje se conservaban los contigs obtenidos en la ronda anterior y se ensamblaban una a una las secuencias carentes de asignación. Este proceso se repetía con un parametro de similitud menor en cada ronda hasta llegar a un umbral mínimo de similitud de 90%. En este punto se procedía a desarmar los contigs que se habían conformado por la adición de secuencias una a una. Acto seguido, a partir de todas las lecturas individuales corregidas se volvían a ensamblar los contigs empezando por un 100% de similitud. De esta forma las lecturas corregidas podían incluirse en contigs diferentes a los asignados previamente

87

sin correcciones en la asignación automática de bases. Con el fin de limitar el trabajo a

las secuencias pertinentes, durante varias fases del proceso se confirmaba el hecho de que

los clones codificaran para proteínas de resistencia utilizando búsquedas tBLASTP y

BLASTn contra la base de Datos no redundante del NCBI.

3.4.2. Anotación de secuencias de ADN: determinación de exones e intrones.

Una vez se obtuvieron contigs estables* y altamente confiables se procedió a la anotación de las todas las secuencias detectando la presencia de los sitios de unión a los cebadores específicos para la familia RGC7 y otros cebadores utilizados en la secuenciación del

BAC57M14. Esta tarea se realizó en un principio mediante Sequencher 4.1. y más tarde con la herramienta de búsqueda de oligos de Vector NTI Suite 7.0 (Informatix).

Como se describirá más adelante, la mayoría de las secuencias derivadas de G198833 no podían contener un intrón completo (sección 4.3.2). La anotación previa de las copias génicas del BAC57M 14 de ‘Sprite’ demostraba que los miembros de la familia RGC7 que poseían un dominio TIR acoplado a un dominio NBS contenían por lo menos un intrón (Acosta et al., 2003). De manera que RGC7A, B, C y D del BAC57M14 incluían uno o más posibles intrones. La búsqueda de similitud con BLASTX sobre la base de datos no redundante del NCBI sugería de forma análoga que el contig G0506 de G19833 podría abarcar por lo menos un intrón. Así es como la anotación de los parálogos del

BAC57M14 de ‘Sprite’ y del contig G0506 de G19833 se consolidó como la base para

* De aquí en adelante hará referencia a estos contigs estables como las secuencias o framentos obtenidos en la presente investigación.

88

delimitar las regiones codificantes de los fragmentos restantes aislados de G19833. Por

tal motivo RGC7A, B, C y D de ‘Sprite’ y el contig G0506 de G19833 se sometieron a la

determinación de intrones y exones mediante los tres programas descritos a continuación.

GenS can (http://genes.mit.edu/GENSCAN.html; Burge & Karlin, 1998): Este programa

utiliza un modelo oculto de Markov o HMM (Hidden Markov Model) para modelar

estadísticamente la estructura de genes eucarióticos. El modelo probabilístico integra

información extraída de los sesgos en la composición y la distribución de longitudes de

intrones y exones, con la descripción de la principales señales reconocidas durante los

siguientes procesos:

i. Transcripción: promotor caja TATA, señal de poliadenilación .

ii. Traducción: Señal de inicio (incluye el codón de inico) , codón de parada.

iii. Edición de pre-ARNm: Sitios donadores y sitios aceptores .

Los parámetros del modelo utilizado en el presente estudio fueron los estimados para

Arabidopsis thaliana a partir de un conjunto de genes con estructura conocida. La salida

del programa consiste en una tabla con la posición y la longitud de las señales de

transcripción y de los exones, además reporta un valor de probabilidad que indica con

buena precisión la confiabilidad de los exones predichos.

NetGene2 (http://www.cbs.dtu.dk/NetGene2.html; Hebsgaard, et al., 1996): Este programa hace predicciones de estructura génica con base en redes neurales (neural

89

networks) entrenadas con una base de datos de genes conocidos de Arabidopsis thaliana

para llevar a cabo dos tareas. Primero, la detección de nucleótidos codificantes y

segundo, la predicción de sitios de edición de pre-ARNm. La información global

proveniente de la predicción de zonas codificantes establece un umbral de aceptación

para la predicción local de sitios de edición. Este enfoque reduce el número de falsos

positivos usualmente predichos por programas de detección de sitios de edición. Los

resultados del análisis arrojan, entre otros, un nivel de confianza (como probabilidad

estimada de que la predicción sea correcta) para cada sitio de edición.

GeneSeqer (http://gremlinl.zool.iastate.edu/cgi-bin/gs.cgi; Usuka et al, 2000): Con esta aplicación se realizan predicciones de estructura génica basadas en la estimación de sitios de edición de pre-ARNm y en el alineamiento entre ADN genómico y ADNc. Partiendo de un modelo oculto de Markov modificado, GeneSeqer optimiza un alineamiento editado (spliced alignment) restringido por los sitios de edición de pre-ARNm predichos.

A cada posición de este alineamiento se le asigna un puntaje que incorpora simultáneamente la calidad de la predicción de los sitios de edición y la similitud entre las secuencias de ADN genómico y ADNc. Este programa ha demostrado ser útil en casos donde GenScan falla en predecir una organización intrón-exón correcta. En la salida de GeneSeqer se incluye una probabilidad estimada para cada sitio de edición recalculada según el alineamiento editado.

Para la utilización de GeneSeqer era necesaria la secuencia del ADNc de un ortólogo putativo de la familia RGC7, preferiblemente de una leguminosa faseoloide, ya que no se

90

contaba con el ADNc de un miembro de RGC7 en G19833. Así que las secuencias de

RGC7A, B, C y D de ‘Sprite’ y el contig G0506 de G19833 se utilizaron para buscar un

ortólogo mediante BLASTn en la base de datos de unigenes de Lotus japonicus,

Medicago truncatula, y Glycine max (TIGR Gene Indices, http://tigrblast.tigr.org/tgi/).

Un unigen es un contig ensamblado a partir de múltiples ESTs, lo cual implica que

proviene únicamente de secuencias de ARNm. De esta manera se encontró que la

secuencia de soya con el número de accesión TC178433 tenía la mayor similitud a los 5

miembros de RGC7 con un valor E < 1x10-100 en todos los casos. Adicionalmente este unigen abarcaba la zona codificante aledaña a ambos lados del intrón putativo entre el dominio TIR y el dominio NBS de genes de resistencia. Por dichas razones se decidió utilizar la secuencia TC178433 como secuencia de entrada para la predicción de estructura génica de los miembros de la familia RGC7 en P. vulgaris mediante

GeneSeqer.

No se utilizaron programas de predicción génica basados en homología con proteínas.

Para una anotación, de alta resolución como la que se pretendía, la predicción basada en homología hubiera requerido de la secuencia de una proteína de resistencia funcional cercanamente emparentada con la familia RGC7. Pero para leguminosas, en la base de datos del NCBI, se encontraban solamente secuencias de proteínas predichas de candidatos a genes de resistencia. La anotación foránea de otros genes candidatos podría contener errores que se heredarían al análisis en curso generando ruido e imprecisiones indeseables.

91

3.4.3. Anotación de las proteínas predichas: Determinación de dominios y motivos

proteicos conservados.

Todas las secuencias de ADN obtenidas en el presente estudio, además de los RGCs del

BAC57M14, fueron sometidas a una búsqueda de motivos proteicos distintivos de

dominios de genes de resistencia. Con tal fin se descargó la base de datos de motivos

conservados de genes NBS-LRR del genoma de A. thaliana para los dominios CC, TIR,

NBS y LRR (http://niblrrs.ucdavis.edu/; M eyers et al., 2003) en formato de la salida de

MEME (Multiple Maximization-Expectation for Motif Elicitation; http://www.sdsc.edu/MEME/meme/website/meme.html; Bailey & Elkan, 1994). En este

formato los motivos se almacenan como una matriz de puntajes específicos por posición

PSSM (Position Specific Scoring Matrix). Es decir, mediante una PSSM un motivo se representa como una matriz en cuyas columnas se asignan puntajes a la frecuencia relativa de los 20 aminoácidos en cada posición conservada. Mediante el programa

MAST (Motif Alignment Search Tool; http://www.sdsc.edu/MEME/meme/website/

mast.html; Bailey & Gribscov, 1998) se buscaron los motivos que mejor se ajustaran a la

secuencias de nucleótidos traducidos en los 6 marcos de lectura. La salida del programa

incluye un alineamiento anotado donde se reporta la secuencia, fuerza estadística y

posición de los motivos proteicos hallados en cada secuencia de ADN examinada. Se

consideró que un motivo estaba presente dentro de una secuencia si se alineaba con un

valor E < 1 x 10-6. Esta anotación permite describir con detalle la estructura de las regiones codificantes de las secuencias parciales de genes de resistencia, además facilita la búsqueda y asignación de homología entre los miembros de una misma familia multigénica.

92

Dada la variabilidad observada en el dominio LRR de genes de resistencia la detección mediante MAST de motivos conservados en esta región fue muy imprecisa. Por lo tanto se decidió utilizar la herramienta REP del EM BL (http://www.emblheidelberg.de/

~andrade/papers/rep/search.html, Andrade et al., 2000) sin especificar el umbral de valor

E de aceptación para complementar de manera sensible la búsqueda de repeticiones observables en los dominios LRR.

3.4.4. Método iterativo de anotación basado en la construcción de un alineamiento

múltiple anotado.

Con anterioridad se explicó que la predicción de la estructura génica de los parálogos de

RGC7 se realizó solamente con las secuencias que incluían un dominio TIR acoplado a un dominio NBS. Para utilizar esta información en la definición de los límites de las regiones codificantes del resto de fragmentos obtenidos fue necesaria la construcción de un alineamiento múltiple entre los miembros putativos de RGC7. Además este alineamiento múltiple se aprovechó para registrar de forma simultánea en todas las secuencias la predicción de estructura génica y la detección de motivos conservados sobre la secuencia codificante. Tal procedimiento permitía comparar las predicciones generadas de manera independiente para cada una de las secuencias analizadas, además también permitía extrapolar la anotación a los miembros de RGC7 que carecían de ella.

Dada las diferencias en longitud y compasión de las secuencias aisladas de G19833 y las limitaciones del algoritmo de ClustalW 1.82 la primera estimación del alineamiento

93

múltiple a partir todas las secuencias de G19833 y del BAC57M14 fue tremendamente inadecuada. Consecuentemente como primer paso para obtener un alineamiento óptimo se alinearon de manera independiente 2 conjuntos distintos de secuencias con el programa Clustal W 1.82 con parámetros por descarte. Tales conjuntos correspondían por una parte a los segmentos que contenían únicamente el dominio TIR y por otra a las secuencias que incluían solamente al dominio NBS. Cada uno de estos dos alineamientos primarios se utilizaron como perfil para incluir las secuencias con TIR-NBS acoplados.

Estas dos matrices modificadas se combinaron y editaron manualmente con MacClade

4.06 (Sinauer Associates). Como resultado se obtuvo un alineamiento total en el que se utilizaron las secuencias con TIR-NBS acoplados para anclar los alineamientos de los fragmentos TIR hacia el extremo 5’ y los alineamientos de los fragmentos NBS hacia el extremo 3’. Los alineamientos en estas dos regiones codificantes fueron recalculados con la herramienta de alineamiento parcial de AlignX en VectorNTI suite 7.0 (Informatix).

Para incluir en el alineamiento de nucleótidos la información de los motivos conservados en zonas codificantes se resolvió que el alineamiento total estuviese basado en codones.

Con tal objeto se realizó un alineamiento múltiple de los péptidos predichos a partir de la estimación de intrones y exones de todas las secuencias sujetas a análisis (Clustal W 1.82, parámetros por descarte). Con base en este alineamiento de aminoácidos se corregía a mano el alineamiento de nucleótidos de las secuencias codificantes en MacClade 4.06

(Sinauer Associates). Esto permitió la identificación de tripletas parciales de nucleótidos

(correspondientes a irrupciones en el marco abierto de lectura) y en algunos casos obligaba a la introducción de brechas en múltiplos de 3 bases nitrogenadas correspondientes a inserciones-deleciones de aminoácidos.

94

A partir de este punto la anotación de las secuencias se alternaba con la edición manual del alineamiento múltiple. La anotación de los límites de zonas codificantes y los motivos conservados permitía la detección de homología en regiones de baja similitud e inserciones-deleciones de hasta 80 pb que no eran identificables por el algoritmo de

ClustalW. Esto a su vez implicaba la modificación del alineamiento múltiple para tener encuentra la homología recientemente detectada. Adicionalmente se utilizó una búsqueda

BLASTn de todas las secuencias aisladas de RGC7 sobre si mismas para identificar en los HSPs de puntajes intermedios y bajos ( 0.01 < valor E < 1 X 10-6) regiones repetitivas y zonas de homología no detectadas hasta el momento.

La construcción de este alineamiento múltiple anotado facilitaría el diseño de cebadores con el objetivo de seguir completando las secuencias de todos los miembros putativos de este clúster de genes en el genotipo resistente G19833.

95

4. Resultados y discusión.

4.1. Mapeo de microsatélites y Análisisis de QTL.

Solo uno de los dos pares de cebadores diseñados para amplificar marcadores

microsatélites asociados a RGC7 produjo un patrón de bandas polimórfico entre los

parentales G19833 y DOR364. El marcador polimórfico resultante fue nombrado SSR07

y se puede observar su amplificación en la Figura 9 . En los geles de poliacrilamida el

patrón observado en el parental resistente G19833 correspondíó a dos bandas una al

rededor de 245 bp y otra de unos 255 pb. En el parental susceptible DOR364 se

amplificaron tres bandas una en 285, y otras dos en 270 y 250 pb aproximadamente.

Con base en la anotación previa del BAC57M14 y los análisis conducidos en el presente

trabajo (ver sección 4.3.1) se encontró que el microsatélite asociado a SSR07 está

ubicado al principio del primer exón de algunos de los miembros aislados de la familia

RGC7. La secuencia de dicho microsatélite es (TCT)n y codifica para un trecho de

poliserina en el motivo MA(S)n que precede al dominio TIR de proteínas NBS-LRR

(Meyers et al., 2003). Se propone según esta anotación que la variación en el número de bandas observadas puede ser el reflejo de la variación en el número de parálogos del clúster RGC7 o por lo menos de la presencia / ausencia de los sitios de unión a los cebadores de SSR07 en los miembros presentes. Así mismo se infiere que la diferencia en el tamaño de las bandas amplificadas para un genotipo no es causada únicamente por la variación en el número de secuencias repetitivas de los microsatélites. Es probable que el polimorfismo observado se deba principalmente a inserciones y deleciones en la zona 5’ aledaña a la región de repeticiones simples. Una búsqueda de los sitios de unión a los

96

Genotipo GGGDDDDGGDH

heterocigoto

a. b. c.

97

Figura 9. Página anterior. Polimorfismo demostrado por el marcador SSR07. a. Bandas predichas según las secuencias obtenidas para el BAC57M14 y G19833 nótese la ausencia de la banda predicha de 279 bps correspondiente al fragmento TIR04 y la aparición en su lugar de una banda alrededor de 255bp. b. Amplificación en los parentales y a partir del BAC57M14 y del ADN genómico de ‘Sprite’. c. Una muestra de la amplificación en la progenie, el último carril corresponde a un heterocigoto.

cebadores de SSR07 (Vector NTI suite 7.0, Informax) en el fragmento secuenciado

TIR04 conduce a predecir la amplificación de una banda de 279 pb en G19833 (Figura

9a). De forma símilar en el fragmento TIR03 se predice una banda de 250 pb. Una banda

con el tamaño correspondiente al fragmento predicho para TIR03 puede observarse

claramente en la Figura 9a. A pesar de que en el contig TIR04 los dos sitios de unión a

los cebadores de SSR07 se encuentran con un 100% de similitud en la posición adecuada

para la amplificación, el fragmento de tamaño esperado no se observa en el gel. En lugar

de ello en G19833 se aprecia una banda no esperada con un tamaño cercano a los 255 pb

(Figura 9b). Ya que aún no se tiene un cubrimiento completo de todos los miembros de

RGC7 esta banda observada de 255 pb puede estar siendo aplificada sobre uno de los

parálogos que aún quedan por secuenciar. No obstante la falta de amplificación del

fragmento de 279 pb del contig TIR04, no puede explicarse por falta de cubrimiento en

definitiva no fue resuelta con la evidencia recogida hasta el momento. Adicionalmente

los cebadores del marcador SSR07 amplificaron una banda alrededor de 450 pb, y otra

banda de 280 bps en la cultivar Sprite. El tamaño de estas bandas corresponde

plenamente con segmento identificados en la secuencia de RGC7A y RGC7D

respectivamente (Figura 9 a y b).

98

Durante la evaluación del marcador SSR07 en la progenie se presentaron discrepancias entre las tres lecturas independientes. Dependiendo de las condiciones de tinción y revelado, la genotipificación de algunos individuos podía confundirse entre el patrón observado para los parentales y el patrón de un heterocigoto (Figura 9c).

De allí que de 87 RILs originales se hallan excluido del análisis 9 casos de conflicto entre heterocigotos y genotipos parentales. Además se excluyeron los datos de 3 casos de conflicto en la lectura donde se registraban los dos genotipos parentales, 1 RIL donde nunca hubo amplificación y 1 heterocigoto respaldado por las tres lecturas. Con el conjunto definitivo de 73 meiosis informativas el patrón de segregación de SSR07 concordaba exactamente con la segregación de el RFLP basado en la sonda RGC7.. De igual manera contemplando el peor de los casos, esto es, si las 14 lecturas dudosas fuesen incluidas en el análisis como individuos recombinantes, el marcador SSR07 no segregaría independientemente de RGC7 (Tabla de contingencia 2 X2, p=3x10-7). Estos resultados son evidencia del ligamiento genético entre SSR07 y RGC7. Como se esperaba las RILs muestran una segregación de genotipos 1:1 en los dos loci (prueba de bondad de ajuste,

RGC7 p = 0,73, SSR07 p = 0,56) de lo que se puede inferir que no hay un mecanismo que ocasione distorsión en la segregación sobre esta región cromosómica (como por ejemplo la presencia de alelos letales). Al corregir la lectura del RFLP y hacer el mapeo genético, tanto el marcador RGC7 como el SSR07 se ubican dentro el grupo de ligamiento B10I (LOD = 15.8) en la vecindad de la región asociada con anterioridad al

QTL de resistencia (Figura 10). El hecho de que un marcador molecular presente en el

BAC57M14 cosegregue con el maracador RGC7 confirma el ligamiento genético entre la

99 Rec Dist Marker Frac. cM Id Name

(373) M9DB1D (12.3 %) 12.5 (176) U012G

(20.6 %) 21.9

(289) TIR3.3tA 10 órdenes más verosímiles: LogLike (13.3 %) 13.6 1: 186 295 251 250 185 299 375 287 376 298 : 0.00 2: 295 186 251 250 185 299 375 287 376 298 : -0.31 (354) F602G ( 7.2 %) 7.3 3: 298 299 375 287 376 185 250 251 295 186 : -0.34 (177) GC09 4: 298 299 375 287 376 185 250 251 186 295 : -0.65 ( 9.4 %) 9.5 5: 186 295 251 250 185 298 299 375 287 376 : -0.91 ( 0.8 %) 0.8 (288) TIR3.2t 6: 299 375 287 376 298 185 250 251 295 186 : -1.18 ( 3.9 %) 3.9 (292) TIR2.23 7: 298 299 375 376 287 185 250 251 295 186 : -1.18 ( 2.4 %) 2.4 (178) H201G 8: 295 186 251 250 185 298 299 375 287 376 : -1.22 ( 6.6 %) 6.6 (179) I072D 9: 186 295 251 185 250 299 375 287 376 298 : -1.46 (248) AS8.1560 ( 4.4 %) 4.4 10: 299 375 287 376 298 185 250 251 186 295 : -1.49 ( 2.1 %) 2.1 (180) E19.990 ( 0.7 %) 0.7 (181) DC08 ( 6.7 %) 6.7 (182) DA25 ( 9.3 %) 9.4 (183) GA26 ( 2.5 %) 2.5 (281) M1116 ( 3.2 %) 3.2 (275) V10123D (291) TIR3.3tC

(27.2 %) 30.4 (186) DC52 6.0 (295) TIR2.28B ( 2.9 %) 2.9 (185) Bng042 (250) H204G 7.6 ( 7.3 %) 7.3 (251) A144G (251) A144G ( 7.7 %) 7.7 7.3 (295) TIR2.28B (250) H204G ( 5.9 %) 5.9 2.9 (186) DC52 (185) Bng042

(19.1 %) 20.1 15.9

(187) AA1910D 3.1 (299) GATS11 ( 9.5 %) 9.7 3.0 (375) M9DB2G ( 3.1 %) 3.1 (237) Hind434 (385) SSR07.1 (298) GATS11B 0.1 ( 3.6 %) 3.6 (287) M111.9 ( 0.4 %) 0.4 (287) M111.9 RGC7 3.0 (376) M904D ( 2.3 %) 2.3 (385) SSR07.1 3.0 ( 1.2 %) 1.2 (376) M904D (298) GATS11B ( 3.7 %) 3.7 (188) A142D SSR07 ( 3.7 %) 3.7 (189) G161G ( 2.4 %) 2.4 (349) U1402G ( 5.1 %) 5.1 (337) U1003G ( 2.4 %) 2.4 (342) B1DB1D ( 3.3 %) 3.3 (368) P701D ( 4.2 %) 4.2 (299) GATS11 ( 4.4 %) 4.4 (375) M9DB2G ( 8.2 %) 8.3 (190) D052G (14.7 %) 15.2 (184) GA23 (191) H181D (15.8 %) 16.3

(192) DC87

a. B10I b. Vecindad de SSR07

100

Figura 10. Página anterior Mapeo genético del marcador SS R07. a) Grupo de ligamiento B10I del fríjol común. SSR07 cosegrega con RGC7. La distancia 0,4 cM es un estimativo de la distancia genética generada por el algoritmo de esperanza- maximización de MapMaker 3.0 a partir de las frcuencias observadas de recombinación. Marco estimado por López et al., 2002. b) Orden más verosímil de algunos marcadores en la vecindad de RGC7. Existen muchas hipótesis con una verosimilitud estadísticamente equivalente (caja). Notése que la posición relativa de los marcadores alrededor de RGC7 (287 en negrilla cajas pequeñas) es distinta a la posición en a).

región física constituída por este clon y el QTL de resistencia detectado por RGC7. Sin embargo este resultado debe ser tomado con precaución dado que las lecturas del microsatélite no fueron reproducibles por completo. Para tener la plena seguridad del ligamiento genético entre la región coprendida por el BAC57M14 y el QTL de resistencia será necesario el diseño y mapeo de marcadores moleculares, de preferencia codominantes, como CAPS y SNPs.

En el análisis de QTL por marcadores individuales, el marcador RGC7 (corregido) explica el 69,9% de la variación en el fenotipo de resistencia contra 12MEX (12-55) y el

49,0% contra 30CRI (31-47) (Figura 11a). De la misma manera el SSR07 explica el

70,7% de la variación de la resistencia contra 12MEX y el 49,4% contra 30CRI (Figura

11b). Las diferencias en los índices de correlación corresponden a que los individuos con datos faltantes en uno de los marcadores pueden tener los datos completos en el otro y viceversa. En todo caso estas diferencias no son estadísticamente significativas. De todos los marcadores en el mapa, la segregación en RGC7 y SSR07 tiene la mayor correlación con la resistencia a estos dos aislamientos mesoamericanos. Las correlaciones de ambos marcadores superan con una diferencia de más de 0,1 (10%) el coeficiente de correlación del siguiente marcador explicativo ( Tabla 7 y Figura 11c).

101

Tabla 7 . Comparación del porcentaje de explicación de la variación del fenotipo de resistencia (coeficiente de correlación) de los marcadores RGC7 y SS R07 y los siguientes marcadores más explicativos.

Correlación con la resistencia Marcador vs. 12MEX vs. 30CRI SSR7 70.7% 49.4% RGC7 69.9% 49.0% U1402G 52.2% 34.3% A142D 48.5% 37.3%

Mediante el análisis realizado por el método de marcadores individuales no se puede distinguir entre la variación producida por el efecto del QTL y la que es consecuencia de la distancia del (los) gen(es) de interés con el marcador (Lynch & Walsh, 1994). En general, para poder evaluar el efecto de la distancia se someten los datos a un análisis de intervalos que presupone el hecho de contar con un mapa genético de una precisión considerable alrededor de la región de interés (Doerge, 2002; Liu 1999; Lynch & Walsh,

1994). Para este estudio no se realizó un análisis de intervalos. Este tipo de análisis no brindaría más información que el análisis de marcador simple dado que no hay recombinantes confiables entre los dos marcadores en cuestión. Bajo esta condición el análisis de intervalos de inmediato asignaría el QTL a la región entre SSR07 y RGC7.

Dado que estos marcadores se encuentran en el mismo clon BAC se estima que la distancia genética entre ellos está muy por debajo de la resolución del mapa (que debe ser del orden de 1,2 cM, o un recombinate entre 87 RILs). Además es de resaltar que el orden de los distintos marcadores en la vecindad de SSR07 y RGC7 no fue reproducible durante la reconstrucción en MapMaker (Figura 10). Dos hechos son muestra de ello: primero, los datos soportan de una forma estadísticamente equivalente varias hipótesis acerca del orden de los marcadores en esta región. Distintos órdenes posibles tenían respecto al

102

orden más verosímil una magnitud de log-verosimilitud relativa (Log Likelihood Ratio)

menor que 2. (Figura 9b); y segundo, en la reconstrucción de los grupos de ligamiento el

orden de los marcadores alrededor de RGC7 fue distinto del encontrado anteriormente en

el trabajo de López et al., 2002.

Un análisis de QTL de resistencia es tan sólido como el método de evaluación fenotípica

utilizado (Young et al., 1996). A pesar de que la medición de la susceptibilidad con base en la escala CIAT de 1 a 9 es un método funcional para la evaluación de miles de plantas en la búsqueda de fuentes de resistencia, puede ser un método subóptimo para el análisis de la herencia cuantitativa. La escala CIAT para evaluar la reacción del germoplasma de fríjol contra las enfermedades fúngicas no constituye una escala métrica, es una escala ordinal. Esto quiere decir que una planta que sea calificada con 9 es más susceptible que otra planta con una calificación de 3, sin embargo esto no se puede interpretar como si la primer planta fuese tres veces más susceptible que la última.

El área bajo la curva de progreso de la enfermedad (AUDPC) es proporcional a la rapidez con la que avanza de la infección. Sin embargo el análisis de correlación de estos datos heredaría en gran parte los inconvenientes de falta de precisión y los sesgos de la escala

CIAT. El AUDPC utilizada en este estudio se deriva de mediciones hechas con la escala

CIAT y por lo tanto es de alguna forma una escala ordinal modificada. Este AUDPC tiene la ventaja de contener más información que una única medición con la escala CIAT en una determinada etapa de la enfermedad. Aunque las categorías de la escala CIAT en un principio corresponden a rangos específicos del área foliar afectada por las lesiones

103

a) RGC7

12MEX 30CRI

100 100 80 80 2 2 60 R = 0.6986 60 R = 0.4903 40 40

20 20 0 0 0202

Nœmero de alelos de G198 Nœmero de alelos de G198

b) SSR07

12MEX 30CRI

100 100 80 80 2 2 R = 0.4945 R = 0.7067 60 60 40 40 20 20 0 0 02 02 Nœmero de alelos de G19 Nœmero de alelos de G19

Media por categoría genotípica Puntaje fenotípico por cada RIL

104

c) Análisis del mapa total

B01HB01H B02D B02D B03C B03C B04B B04B B05EB05E B06G B06G B07A B07A B08F B08F B09K B09K B10I B10I B11J B11J DESLIG DESLIG

R2

RGC7/SSR07

MarcadoresMarker loci en on el map mapa 12MexAUDPC 30CriAUDPC 12MEX 30CRI

Figura 11. Página anterior y arriba. Análisis de QTL para la resistencia contra dos aislamientos mesoamericanos de P. griseola (Método de marca dores individuales). a) y b) gráficas de dispersión para la regresión lineal entre susceptibilidad y número de alelos del parental resistente en los dos loci. La medida de susceptibilidad (ordenadas) es el AUDPC. En las abcisas se representa la clase fenotípica de cada RIL, 0 = homocigoto para el alelo de DOR364, 2 = homocigoto para el alelo de G19833. c) Coeficientes de correlación para el resto de marcadores en el mapa. El máximo está ubicado en los loci RGC7 y SSR07 para la resistencia contra los dos aislamientos mesoamericanos (— 12MEX, — 30CRI) .

105

y/o clorosis (Sonochen & Pastor-Corrales, 1985), en el invernadero la evaluación se hace

mediante una estimación visual del investigador. En estudios enfocados en la estimación

de las pérdidas económicas causadas por P. Griseola se mide directamente el área foliar

afectada, lo cual brinda una información cuantitativa más precisa (Junior, 2002, Jesus-

Filho et al.; Basanezi et al., 2002). Sin embargo este tipo de métodos no se han utilizado en estudios orientados hacia la detección de QTLs. En una evaluación con la escala

CIAT debe haber una mayor incertidumbre en las categorías intermedias de susceptibilidad-resistencia, dado que es más fácil distinguir los estadíos extremos de la enfermedad, por ejemplo cuando un individuo es completamente inmune.

A pesar de los inconvenientes expuestos en cuanto a la calificación fenotípica, el análisis de correlación detecta la asociación estadística entre los marcadores RGC7, SSR07 y la resistencia, medida como AUDPC, contra los dos aislamientos mesoamericanos de P. griseola.

Esta dificultad en la cuantificación de la severidad de la enfermedad arroja una sombra de duda sobre la magnitud del efecto del QTL en la resistencia. El efecto del QTL puede ser mayor pero debido al ruido introducido en el sistema de medición no se puede identificar la herencia mendeliana de la resistencia. Young (1996) plantea que en algunos casos la respuesta de defensa puede ser muy sensible a las condiciones ambientales y que tal situación conduce a que la enfermedad sea difícil de evaluar. El aumento de la incertidumbre en las mediciones produce una variación estadística más amplia en los resultados. En casos extremos este exceso de variación podría ocultar la distribución

106

bimodal subyacente de la resistencia. Cuando la resistencia a una enfermedad se reporta como parcial o cuantitativa, lo que usualmente significa esto es que los estudios críticos para descubrir la herencia mendeliana del carácter no han sido llevados a cabo (Young,

1996). En un principio la búsqueda de condiciones experimentales aún más controladas

(como por ejemplo una población donde la única diferencia entre sus individuos fuera la variación en el gen de interés) permitiría la resolución del carácter mendeliano de la resistencia. Para el caso del QTL asociado al RGC7 no se ha estimado cuanta información adicional podría brindar un esfuerzo de estandarización semejante.

Es posible que el QTL detectado corresponda a más de un locus de efecto mayor y que estos loci se encuentren estrechamente ligados a los marcadores RGC7 y SSR07 pero que no puedan ser distinguidos con claridad por el análisis de marcadores individuales. Como los marcadores RGC7 y SSR07 cosegregan en este mapa el QTL de resistencia bien podrían ubicarse tanto en el pequeño intervalo definido por estos dos marcadores o inmediatamente adyacentes a cualquier extremo de dicho intervalo genético. Dado que la resolución del mapa no es suficiente la resistencia puede ser un carácter complejo que está controlado simultáneamente por varios genes ubicados en esta zona del grupo de ligamiento B10I.

4.2. Aislamiento de homólogos a genes de resistencia del locus RGC7.

Con base en la caracterización de las secuencias de los miembros de la familia RGC7 presentes en el BAC57M14 de la cv. Sprite se planteó aislar los homólogos a genes de resistencia ubicados en esta región genómica de la raza criolla resistente G19833 por

107

medio del método de PCR vectorette (Hagiwara y Harris, 1996). A partir de la utilización de tres enzimas de restricción y seis cebadores diseñados sobre regiones conservadas de los parálogos secuenciados en ‘Sprite’ se obtuvieron fragmentos por PCR vectorette que oscilaban entre 450 y 2200 pb. Con estos fragmentos se construyó una librería con un total de 388 clones. De estos 388 clones iniciales se secuenció una muestra de 125, de los cuales un subconjunto de 87 clones contenían similitud a los dominios TIR, NBS, o LRR de genes de resistencia. Además de estos 87 clones, se pudo contar con 7 secuencias facilitadas por Iván Felipe Acosta desde la Universidad de Ahile y 8 secuencias obtenidas previamente mediante la amplificación genómica sobre G19833 en el CIAT (Acosta et al., 2002). De esta forma se alcanzó un total de 17Kb se secuencia de homólogos a genes de resistencia que fueron ensamblados en 18 contigs o fragmentos constituidos por lecturas sobrelapantes. En un principio las búsquedas de similitud mediante el programa tBLASTp y tBLASTx (valor E < 1x10-100) sobre la base de datos no redundante del

NCBI permitieron reconocer 7 fragmentos TIR, 10 NBS, y 2 fragmentos con LRR en estos 18 contigs, lo cual incluye 1 fragmento con TIR-NBS acoplados y un fragmento con NBS-LRR acoplados (Figura 12) Los 38 clones restantes correspondían a fragmentos con similitud a retrotransposones, arcelinas, beta-glucosidasas, y clatrinas o no tenían similitud significativa en la base de datos no redundante del NCBI. Esto evidencia que el método de PCR vectorette no aisla exclusivamente la secuencias objetivo, sino que los cebadores diseñados para amplificar miembros de la clase RGC7 de genes de resistencia eventualmente también encuentran sitios de unión en otras regiones genómicas del fríjol común.

108

Durante el aislamiento de estas secuencias se observó una eficacia diferencial en el uso de los cebadores empleados debido principalmente a dos factores. Primero, el grado de discrepancia entre los cebadores y el sitio de unión presente en daca copia génica.

Cuando se obtuvo la secuencia del segmento correspondiente al sitio de unión del cebador se pudo dar cuenta de una diferencia de hasta 5 nucleótidos con respecto a la secuencia original del cebador. Frecuentemente tales diferencias se encontarban situadas en el extremo 3’ del cebador, factor que inhibe la amplificación. Por otra parte la distancia entre el sitio de unión al cebador y el sitio de corte de cada enzima de restricción también era determinante en la eficacia del aislamiento de secuencias. Por ejemplo, los fragmentos NBS obtenidos a partir de la digestión-ligación realizada con

EcoRV fueron aislados en su mayoría por amplificación con el cebador P980. Mientras tanto los fragmentos NBS generados a partir de la digestión con HincII fueron preferencialmente amplificados con el cebador P981. Estos hechos demuestran la necesidad de construir la librería de fragmentos PCR vectorette a partir de digestiones- ligaciones generadas por diversas enzimas de restricción para asegurar la producción de tamaños adecuados para que puedan ser amplificados.

La distribución de las zonas aisladas en este proyecto se debe, como es natural, a la disposición de los cebadores utilizados. Los cebadores 1325 y 1326 se encontraban separados por 500 pb y cubrían así la totalidad del dominio TIR. De forma análoga los cebadores P980 y P981 estaban separados por 700 pb en los extremos del dominio NBS.

Adicionalmente se empleó un cebador ubicado sobre el NBS (universal1) con el fin de abarcar el extremo 3’ de este dominio y eventualmente amplificar la región del dominio

109

LRR. De esta forma la distribución de los cebadores empleados permitió un buen

cubrimiento de los dominios TIR y NBS. Con la información parcial obtenida se

diseñaron siete nuevos cebadores para suplir las deficiencias de información de estos

ensayos en un futuro inmediato.

4.3. Anotación de las secuencias encontradas.

Los resultados de la anotación se resumen en la Figura 12. En primer lugar se expondrá

un modelo general sobre la organización y la estructura génica de los miembros de la

clase RGC7 para hacer más fácil la comprensión de los detalles. Se procede de esta

manera porque la anotación fue un proceso que incluyó muchas tareas que fueron

realizadas en paralelo (sección 3.4.4) y los resultados de los análisis fueron consignados

sobre un alineamiento múltiple de todos los homólogos a genes de resistencia tanto de

G19833 como de ‘Sprite’.

La organización de un miembro ‘generalizado’ de la clase RGC7 se puede reducir a la

siguiente forma. Empezando desde el extremo 5’ hay una región hipervariable donde la

similitud entre los miembros es baja y precede el codón de iniciación. La zona

codificante comienza con un codón para metionina (ATG) que está incluida en un motivo

denominado MA(S)n. El trecho de poliserina del motivo MA(S)nes codificado en el ADN

por la repetición de trinucleótidos (TCT)- amplificada por los cebadores del marcador

SSR07. El primer dominio proteico detectado en sentido 5’-3’ fue el dominio TIR que en

6 de los 7 miembros que lo contienen incluye los cuatro motivos completos, TIR1-TIR4, descritos por Meyers y colaboradores (2003). El dominio TIR termina justo antes del sitio

110

donador del intrón 1. Este intrón de fase 2 es una región hipervariable caracterizada por una cantidad considerable de inserciones-deleciones entre los distintos homólogos. El final del intrón 1, señalado por su sitio aceptor, se ubica antes del enlace entre el dominio

TIR y el dominio NBS, que de ahora en adelante se mencionar· como enlace TN.

El enlace TN da paso al primer motivo conservado del dominio NBS, el motivo kinasa1 o

P-loop que en estos fragmentos incluye la secuencia consenso IGKTT. De ahí en adelante se pudo detectar de manera general sobre el alineamiento múltiple anotado los 8 motivos conservados del dominio NB-ARC, diagnosticados por Jones y colaboradores (1997). El

último motivo conservado de este dominio es el MHDV. En los 4 miembros donde se pudo hallar este último motivo (Figura 12), los aminoácidos homólogos a MHDV corresponden a MHRLL. Corriente abajo del dominio NBS se encuentra el intrón 2 probablemente de fase 0, que precede a un motivo proteico de transición que esta justo antes las repeticiones ricas en leucina y por tal razón se le ha nombrado enlace NL. El extremo 3’ de estos homólogos a genes de resistencia se compone del dominio de repeticiones ricas en leucina (LRR) probablemente interrumpido por varios intrones.

Este modelo general permite ubicarse en la discusión de cada una de las características específicas encontradas durante el proceso de anotación.

111

TIR NBS Enlace TN Enlace NL MA(S)n P-loop Ψ CHITIN01 TIR1 RNBS-A LRR 214 434 780 Kin-2 TIR2 Codón de parada TIR01 Ψ 361 872 1150 1332 RNBS-B TIR3 Irrupción del marco

GLPL abierto de lectura TIR01B 1 481 627 TIR4 RNBS-C RNBS-D Secuencia no codificante Ψ TIR02 1 496 MHDV Secuencia incompleta

TIR03 Pseudogen 374 850 Ψ TIR04 245 741 855

G0506 55 564 808 971 1526

11 156 307 874 Ψ NBS01 NBS02 200 1794 1202 1359 1490

NBS03 1 59 759 909 Ψ Ψ NBS05 1 100 987

1 1583 NBS07 846 989 1223 1365

Ψ NBS08 1 849 997 11 00

Ψ NBS9 15 177 329 1080

NBS10 48 200 771 Ψ Ψ NBS13 1 492

a. G19833

112

TIR NBS Enlace TN Enlace NL MA(S)n P-loop TIR1 RNBS-A LRR Kin-2 TIR2 Codón de parada RNBS-B TIR3 Irrupción del marco GLPL abierto de lectura TIR4 RNBS-C RNBS-D Secuencia no codificante

MHDV Secuencia incompleta

RGC7A Ψ Pseudogen

Ψ 549 1041 1254 1408 2067 RGC7B

Ψ 1636 864 1379 1794 2789 2921 3174 3315 4094 4149 4 221 5102 RGC7C

1552 Ψ 864 1373 1703 2521 2677 2896 3030 3847 3902 3 967 4329 RGC7D

Ψ 494 990 1169 1321 3009 2094 2498 2 644 RGC7E

Ψ 2511 1018 1530 1773 1864

b. Sprite

Figura 12. Candidatos a genes de resistencia contra la mancha angular en el fríjol común. Representación del alineamiento múltiple anotado. en a) G19833 y b) ‘Sprite’. Los motivos conservados de los dominios proteicos se ilustran como cajas blanco y negro (TIR) de colores (NBS) y con interior a rayas (LRR) .Los pseudogenes putativos se señalan con la letra griega psi (Ψ ).

113

4.3.1. Anotación de secuencias de ADN: determinación de exones e intrones.

Las búsquedas mediante el algoritmo BLAST, permiten hacer una aproximación somera

a la delimitación de zonas codificantes y no codificantes con base en el alineamiento con

proteínas aisladas o predichas (tBLASTx), o con secuencias de ADN codificante

(tBLASTn). Estas búsquedas no son precisas para hacer la predicción ab initio de

estructuras génicas por dos razones. Primero, la base de datos de proteínas contiene

proteínas hipotéticas que pueden tener errores de anotación, y por lo tanto conducir a una

estimación inadecuada de los sitios de edición del pre-ARNm. Segundo los sitios de

edición del pre-ARNm pueden estar conservados entre varios genes, por lo que el

alineamiento en esta zona no implica la existencia de una región codificante. De allí que

para definir con exactitud sitios donadores y aceptores de intrones se recurrió en primer lugar a las aplicaciones GenScan y NetGene2 cuya utlilidad específica es predecir la estructura de exones e intrones en una secuencia de ADN. Estos programas hacen predicciones génicas principalmente con base en la secuencias de los sitios de edición de preARNm de genes conocidos, pero también tienen en cuenta información adicional que define la estructura génica (codones de inicio y parada, señal de poliadenilación etc.).

Posteriormente se utilizó el programa GenSequer que simultánemente estima la posición

de sitios de edición de preARNm y realiza un alinemamiento con ADNc.

Con GenScan y NetGene2 se pudo determinar que el primer exón de los genes de la

familia RGC7 contiene en su totalidad al dominio TIR. Este exón (GenScan p = 0.96)

empieza en el codón de iniciación ATG que codifica para metionina y precede a la zona

114

de repeticiones de trinucleótidos TCT correspondiente al microsatélite amplificado por

los cebadores del marcador SSR7 (ver sección 4.1). Tanto el codón de iniciación como el

microsatélite Tcrn. codifican para el motivo MA(S)n encontrado frecuentemente al inicio de las proteínas NBS-LRR de A. thaliana (M eyers, et al., 2003). El final del primer exón,

determinado por el sitio donador del intrón, fué localizado tanto por GenScan como

NetGene2 sobre una pequeña región altísimamente conservada entre todos los fragmentos

examinados. El sitio donador del intrón 1, tiene la secuencia consenso

AGAAAATGAG^GTAAAATAAT (NetGene2 p = 1.00), e interrumpe el codón de la última

lisina del motivo TIR-4 (DIRNK^SQC) en la segunda posición.

Las mejores predicciones de GenScan y NetGene2 ubicaban erróneamente el sitio de

edición 3’ del intrón 1 en medio de una región codificante que posteriormente se

identificaría con el enlace TN (ver anotación de motivos proteicos sección 4.3.2). Este

error al estimar la posición correcta del sitio aceptor del intrón 1 hace pensar que este

sitio de edición de preARNm no tiene similitud significativa con los sitios aceptores de

Arabidopsis thaliana. Afortunadamente, al encontrar en la soya un posible ortólogo de

los genes de la clase RGC7 se decidió realizar una determinación del sitio donador

mediante el alineamiento entre las secuencias genómicas obtenidas en este estudio y

ADNc del ortólogo putativo. Este probable ortólogo fue hallado en la base de datos de

unigenes de leguminosas de TIGR (TIGR Gene Indices), con el número de accesión

TC178433 mediante una búsqueda con BLASTn (valor E < 1 x10-100). El fragmento de

750 pb corresponde al ensamblaje de varias EST (Expressed Sequence Tags), extraídas del tejido de embriones somáticos de soya. Como en el caso de NetGene2 y GenScan,

115

GeneSeq también respaldó la posición del sitio donador del intrón 1 al final del dominio

TIR (p =0,999), pero a diferencia de los dos programas anteriores este algoritmo sí pudo detectar la presencia del sitio aceptor del intrón 1 AAATTTTCAG^GTCAACAGTG con un buen soporte estadístico (p= 0,982) en una posición que tiene sentido biológico. La búsqueda computarizada del intrón 1, confirmó una anotación hecha manualmente. Dicha anotación se basaba en tres razones biólogicas. Primero, el intrón uno debía preceder al dominio NBS y al enlace TN. Segundo el sitio aceptor de intrón tenía que interrumpir un codón en la misma fase que el sitio donador, esto quiere decir que debería ser fase 2. Y tercero los nucleótidos de los intrones nucleares de pre-ARNm tienen la secuencia consenso AG^N.

Tabla 8. Predicción de exones e intrones de la familia RGC7. Por cada característica génica predicha sólo se muestra (excepto para el sitio aceptor del intrón2) la predicción de máxima probabilidad entre las calculadas y el fragmento donde se encontró. a)Intrones

Sitio de Secuencia Fase p Programa Fragmento edición donador 2 0.99 NetGene2 RGC7D Introd. 1 TCCGAAACAA^GTGAGTAATC aceptor AAATTTTCAG^TCACAGTGTG 2 0.98 GenSeqer G0506 donador AGAAAATGAG^GTAAAATAAT 0 1.00 NetGene2 RGC7B aceptor 1 0.93 NetGene2 NBS02 Intrón 2 GGTGTTTCAG^GGACTGTGAG GGTGTTTCAG^GGACTGTGAG 1 0.93 NetGene2 RGC7B TGGCATAG^GGGGACTGTTAA 2 0.94 NetGene2 NBS07 donador 0 1.00 NetGene2 RGC7B Intrón 3 AGGCACAAAG^GTAATGTATA aceptor ? ? ? ? ? b)Exones predichos por GenScan.

P Fragmento Exón 1 0.96 G0506 Exón 2 0.84 RGC7B Exón 3 0.81 RGC7B

116

De forma semejante a como el primer exón incluye al dominio TIR, el exón 2 predicho

para la familia RGC7 contiene por completo el dominio NBS. El exón 2 empieza con la

región que codifica para el enlace TN entre el final dominio TIR y el primer motivo del

dominio NBS. A su vez, el final del exón 2, marcado por el sitio donador del intrón 2

(AGGCACAAAG^GTAATGTATA, fase 0, p = 1.00), se ubica después del motivo MHDV

que es el último motivo conservado del dominio NB-ARC.

En cuanto al sitio aceptor del intrón 2 solamente se pudo hacer una predicción aproximada de su ubicación. El final del segundo intrón predicho a partir de RGC7B (p =

0.93) es de fase 1 y no se encuentra en una región conservada como si lo está el sitio aceptor del intrón 1. Por otra parte, en la secuencia RGC7C no se encontró evidencia de este sitio aceptor en una posición biológicamente aceptable. Por tales razones se realizaron predicciones génicas en las copias NBS07 y NBS02 de G19833 para confirmar el primer análisis. El sitio aceptor del intrón 2 predicho en NBS 02 coincide con el derivado de RGC7B, mientras que el sitio aceptor predicho en NBS07 (fase 2, p = 0.93) se encuentra desplazado una base hacia 5’ en el alineamiento múltiple anotado (Tabla 8).

Recogiendo esta evidencia se puede ver que aunque el nivel de confianza de las predicciones es aceptable no habría concordancia en las fases del sitio aceptor (0) y las de los posibles sitios donadores (1 o 2). Aún así, se anotó el sitio donador del intrón 2 hallado en RGC7B, como la mejor aproximación con la que se cuenta hasta el momento, por haberse predicho independientemente en otra copia. También se identificó un sitio donador de un tercer intrón (p = 1.00) que es compatible con la anotación de las repeticiones LRR codificadas en esta zona, entre tanto no se encontró un sitio aceptor

117

correspondiente adecuado. Este sería el tercer caso en el cual el sitio donador es predicho fácilmente por GenScan y NetGene2 mientras que el sitio donador permanece desconocido. Esto podría sugerir que por lo menos para los genes de la familia RGC7C los sitios aceptores de intrones tienden a divergir en mayor medida que los sitios donadores respecto a las secuencias halladas en Arabidopsis. Consecuentemente tal patrón evolutivo podría verse reflejado en una divergencia interespecífica mayor en la unidad de procesamiento del extremo 5’ que en la unidad de procesamiento 3’ de los intrones (proteínas U1 y U5 del spliceosome respectivamente, Buchanan et al 2002).

Corriente abajo del extremo 3’ del exón 2 los programas de predicción génica no permitieron definir otros sitios de edición de pre-ARNm adecuados. Sólo se pudo identificar las regiones exóticas mediante la predicción de secuencias codificantes de proteínas. Esta tarea se realizó con el programa REP del EMBL, y haciendo búsquedas de motivos conservados con los genes TIR-NBS-LRR de Arabidopsis mediante la herramienta MAST. De tal manera se pudo detectar la región codificante del enlace NL y algunas repeticiones ricas en leucina en las copias NBS02, NBS07 y NBS08 de G19833 y

RGC7A y RGC7B de.’Sprite’. Para el intrón 2 y los siguientes intrones hipotéticos no se encontró un ortólogo de leguminosa adecuado para la predicción génica mediante alineamiento con ADNc. Por lo tanto la descripción de zonas intrónicas en la región LRR de los homólogos a genes de resistencia de la clase RGC7 es solamente tentativa sin mayor soporte estadístico.

118

4.3.2. Anotación de las proteínas predichas: Determinación de dominios y motivos

proteicos conservados.

Un dominio conservado o dominio homólogo es un patrón extendido (hasta cientos de aminoácidos) de secuencias conservadas entre distintas proteínas que contiene generalmente varios motivos característicos (Mount, 2001). Se dice que tales dominios que son homólogos por que la conservación de la secuencia es evidencia del origen evolutivo común entre moléculas similares (Mount, 2001). Los dominios conservados usualmente coinciden con dominios estructurales que poseen un pliegue tridimensional propio y una función bioquímica determinada como catálisis, unión a ligando, etc. De forma análoga, un motivo es un patrón más corto (hasta un par de decenas de posiciones) de secuencias conservadas que aparece en un grupo de moléculas emparentadas (M ount,

2001). En ocasiones un motivo determina características locales de importancia como un sitio activo, o un sitio de unión a ligando y por lo tanto equivale eventualmente a un motivo estructural y/o funcional (Mount, 2001).

Existen varias definiciones para los tres dominios conservados de las proteínas codificadas por las secuencias aisladas en este estudio. Esto quiere decir que las secuencias calificadas como conservadas para los dominios TIR y NBS difieren dependiendo de la base de datos que se consulte. Por ejemplo los modelos almacenados de TIR y de NBS en PFAM, y SMART son diferentes entre sí debido a que cada una de estas bases de datos se construye a partir de un algoritmo de búsqueda distinto. Para la anotación de la familia RGC7 se utilizó la base de datos de motivos conservados encontrados mediante el programa MEME en el conjunto de todas las secuencias de

119

genes NBS-LRR de Arabidopsis thaliana (Meyers et al., 2003). Tal elección se basó en dos razones principales. Primero, A. thaliana es la planta más cercanamente emparentada con P. vulgaris cuyo complemento completo de genes NBS-LRR ha sido caracterizado a nivel se secuencia (siendo el arroz la otra posible alternativa, Zhu et al., 2004). Y segundo, una ventaja de utilizar esta base de datos consiste en que en el estudio de

Meyers et al., (2003) se especifican los motivos distintivos de los dominios TIR y NBS de proteínas de resistencia. Por ejemplo, de allí se derivaron las convenciones para nombrar las regiones de transición entre dominios (enlace TN y enlace NL) y los motivos conservados al interior de cada dominio. En contraste el resto bases de datos de dominios conservados (CDD, PFAM, SMART, BLOCKS, entre otras) carecen de una resolución y anotación tan precisa. Partir de una definición explícita de la posible estructura de los genes que eran objeto de estudio fue una cuestión crítica para este proyecto. Esto es porque que los dominios aquí mencionados no corresponden a ninguna evidencia experimental directa de función bioquímica sino que se construyen sobre el criterio de conservación de las secuencias proteicas codificadas por distintos genes.

A partir de la base de datos escogida una búsqueda con el programa MAST permitió detectar la presencia de los distintos motivos conservados en las proteínas codificadas por los miembros aislados de la familia RGC7. Un resumen de los resultados hallados en esa búsqueda se puede encontrar en las Tablas 9 y 10.

120

Tabla 9. Principales motivos conservados de proteínas TIR-NBS -LRR. Comparación entre los motivos encontrados por Meyers y colaboradores (2003) mediante un análisis del genoma completo de Arapidopsis thaliana y los encontrados en la presente investigación con base en la familia génica RGC7 de Phaseolus vulgaris. Nótese que los motivos descritos para Arabidopsis se utilizaron para buscar mediante el programa M AST los motivos homólogos presentes en RGC7.

Dominio Motiv o Genes NBS-LRR de Arapdopsis thaliana Familia RGC7 Phaseolus vulgaris TI R TIR-1 DVFPSFRGEDVRKTFLSHLLKEF DVFVSFRGEDTRNSFTGFLFQAL TIR-2 IGPELIQAIRESRIAIVVLSKNYASSSWCLDELVEIMKC AIQASRLFIVVFSQNYASSTTWCLRELA TIR-3 ELGQIVMPIFYGVDPSDVRKQ RVIIPIFYDVDPDVVRKQSGCYEKAF TIR-4 WRKALTDVANIAGEHS WRKALTDVANLSGWDIRNK Enlace TN NxTPSRDFDDLVGIEAHLEKMKSLLCLES LSRLPKDELVGIESRVEELTNLLRLES TN NBS P-loop VGIWGPPGIGKTTIARALF RVVGISGMGGIGKTTLARALY RNBS-A DYGMKLHLQEQFLSEILNQKDIKIxHLGV ERIYHQYDFxCFIDDVSNIYRD Kinasa2 RLKDKKVLIVLDDVD WTRLHNARTLIVLDNVDQGEQ RNBS-B QLDALAGETxWFGPGSRIIVTTEDK TGNRDIRRCGGGSRIIIISRDEHILK RNBS-C NHIYEVxFPSxEEALQIFCQYAFGQNSPP NDVYQVQPLSWKNAVQLFCRNAFKDEDEDEVNYL GLPL EVAxLAGGLPLGLKVL DYEELAREVLSHAQGHPLAIEVIGSSLFG RNBS-D EDKDLFLHIACFFNG QWRSALxKLRYNKxRNIMDVLRISFDQLEEEKEIFLDIACFL MHDV MHNLLQQLGREIV NIYMHRLLDLGxSIVREKSP Enlace NL QFLVDAEDICDVLTDDTGTEK ADGLSKIRHLNxLSLKGVNFS NL LRR M oti f1 LHWLDLKGCRKLVSLPQLPDSLQYLDAHGCESLETVACP LxNLKxLDLSYSEDLVEMPDVREALNLEKIELKGCIKLRKIN (LDL) PSIGLLKKLA

121

Tabla 10. Patrones predichos de motivos conservados de proteínas TIR-NBS -LRR para la familia RGC7. Ver leyenda página siguiente.

TIR ENLACE NBS ENLACE LRR PATRON DE SECUENCIA PATRON DE MOTIVOS TN PATRON DE MOTIVOS NL MOTIVOS

VALOR-E VALOR-E VALOR-E COMBINADO COMBINADO COMBINADO

MA(S)n TIR-1 TIR-2 TIR-3 TIR-4 TN P-loop RNBS-A Kinasa2 RNBS-B RNBS-C GLPL RNBS-D MHDV NL Motif1 CHITIN01 2.60E-4 4a* 1b 7.30E-17 7c 3b 6b TIR01 1.20E-54 9a 3a 6a 4a 1a 2a 4.90E-03 6b TIR01B 2.30E-65 3c 6c 4c 1c 2c TIR02 2.30E-57 9b 3b 6b 4b 1a TIR03 4.90E-49 3b 6b 4b 1b TIR04 1.70E-54 3b 6b 4b 1b 2b G0506 9.20E-59 3c 6c 4c 1c 2c 5c 2.90E-40 1c 13c 7c 2c 3c 6c NBS01 0.13 5a 1.30E-40 1a 13a 7c 2c 3c 6c NBS02 0.0045 5b 1.00E-65 1b 13c 7c 2c 3c 6c 4c 12c 10c NBS03 7.00E-27 1b 13b 7b 2b 3b NBS05 1.90E-25 1b 13b 7b 2a 3a 6a 4a NBS07 2.10E-80 7a 2a 3a 6a 4a 12a 10a 11c 14c 5.20E-47 8a 11c 1c 20c NBS08 1.10E-31 7a 2a 3a 6a 4a 10b 11b NBS09 0.065 5b 6.90E-44 1b 13b 7b 2b 3b 6b 4b NBS10 0.054 5b 1.80E-36 1b 13a 7c 2c 3c 6c NBS13 2.90E-10 3b 6b RGC7A 1.40E-47 3b 6b 4b 1b 2b 5a 1.80E-31 1a 13a 7a 2a 3a 6a RGC7B 6.90E-58 3a 6a 4a 1a 2a 5c 6.90E-84 1c 13c 7c 2c 3c 6c 4c 12c 10c 14c 1.70E-47 1c 8c 9c 6b RGC7C 5.50E-36 9c 9a 3a 6a 4a 1a 2a 5c 1.00E-20 1b 13b 2b 3b 6b 4c RGC7D 2.30E-53 3b 6b 4b 1b 2b 5a 2.10E-33 1a 13a 7a 2a 3a 6a 4a RGC7E 7.80E-51 3b 6b 4b 1b 2b

* 0.0001

122

Tabla 10. (continuación) Patrones predichos de motivos conservados de proteínas TIR-NBS-LRR para la familia RGC7 (Viene de la página anterior). Cada motivo fue encontrado por MAST con un valor E mínimo de 1 X 10–6. Adicionalmente se presenta el valor E combinado de cada dominio proteico. En cada dominio los motivos son representados por una caja de distinto color que lleva el número identificador en la base de datos de Meyers et al., 2003. La letra corresponde al marco abierto de lectura en la secuencia de ADN (a = 1, b =2, c=3). El cambio de letra entre un motivo y otro en una misma secuencia se debe a dos razones: la presencia de un intrón o la irrupción o del marco abierto de lectura.

4.3.2.1. Dominio TIR de la familia RGC7.

Se puede observar en algunos de los miembros secuenciados la presencia del motivo

MA(S)n que contiene la metionina codificada por el codón de iniciación. Aunque este motivo no hace parte del dominio TIR sensu stricto, pertenece al primer exón de los genes de la familia RGC7 y precede de manera inmediata al motivo TIR-1 (Tabla 10). El trecho de poliserina característico del motivo M A(S)n es de particular interés para este

proyecto porque su secuencia codificante, (TCT)n, es el microsatélite amplificado por los

cebadores del marcador SSR7 (ver sección 4.1). Se ha demostrado que las serinas de una

secuencia aminoterminal similar al motivo M A(S)n aumentan la estabilidad de proteínas

reporteras (GUS, GFP) frente a condiciones degradantes (Sawant et al., 2002). Sin

embargo el MA(S)n detectado en los fragmentos G0506, TIR01 y en RGC7A, RGC7B,

RGC7C y RGC7E tiene la secuencia consenso M ASNAIIQYT(S)n (Figura 13). Por lo tanto este motivo se diferencia con las secuencias estudiadas por Sawant y colaboradores

(2002) por la inclusión de los aminoácidos NAIIQYT entre la tripleta MAS y el trecho de poliserina. De aquí que no sea inmediata la transferencia de información funcional entre los experimentos de estabilidad de proteínas reporteras con una poliserina aminoterminal

(Sawant et al., 2002) y las proteínas predichas de RGC7.

123

Mediante la búsqueda MAST se determinó que el dominio TIR completo se encuentra presente en seis de los fragmentos aislados de G19833. Adicionalmente se localizó un dominio TIR truncado con dos motivos incompletos en la copia CHITIN01. La anotación de las proteínas predichas permitió distinguir claramente los motivos TIR-1, TIR-2, TIR-

3 y TIR-4 que definen el dominio (Tablas 9 y 10). Sin embargo en el alineamiento múltiple de dichos fragmentos (Figura 13) se observa que en general la secuencia entera del dominio TIR está conservada entre los miembros de la familia RGC7. Una identidad promedio de 85% de nucleótidos y una similitud del 82% de aminoácidos son muestra de que la similitud del dominio TIR de los diferentes segmentos aislados se extiende más allá de los motivos conservados con los TNL de Arabidopsis thaliana.

Para caracterizar con más detalle el dominio TIR de la familia RGC7 se hizo una estimación de las estructuras secundarias correspondientes a cada uno de los 4 motivos encontrados. Con tal objeto se construyó un alineamiento múltiple de las secuencias TIR de RGC7 con una proteína TIR de estructura conocida y una proteína TIR-NBS-LRR de plantas cuya estructura secundaria había sido predicha con anterioridad (Rock et al.,

1998). La proteína de estructura conocida fue el TLR2 de humano (número de accesión

GenBank AAH33756), que participa en la respuesta inmune contra bacterias Gram- negativas y levaduras (Xu et al., 2002). La estructura secundaria predicha para el dominio

TIR de la proteína de resistencia L6 (número de accesión GenBank AAA91022, Rock et al., 1998) sirvió de vínculo para establecer la homología estructural entre TLR2 y las proteínas de la familia RGC7. Adicionalmente, para brindar más información al

124

alineamiento se incluyeron en este análisis a los receptores TLR3 y TLR4 del sistema inmune humano (números de accesión GenBank NP_003256 y EMBL CAD99157).

125

a.

Asa BB

b.

MA(S)n TIR1 TIR2

βA αA βB Asa BB αB βC αC

TIR2 TIR3 TIR4

αC βD αD βE αB

126

Figura 13. Página anterior. Patrón estructural del dominio TIR de TLR2 comparado con la familia RGC7. a. Estructura tridimensional del receptor del sistema inmune humano TLR2 denotando las 5 hélices alfa (αΑ− α E), y las cinco hebras beta (βA- β E) (reproducida de Xu et al., 2002) b. Alineamiento del dominio TIR de los miembros de la familia RGC7 con la región homóloga de TLR2, TLR3 y TLR4 y con L6 del lino, una proteína de resistencia con función comprobada. Las cabezas de flecha indican posiciones en las que los cambios del aa provocan un fenotipo distinto. polimorfismos en el locus L6 del lino. V mutaciones en el locus N del tabaco.

Este alineamiento múltiple (Figura ) permite formular algunas hipótesis sobre la estructura secundaria del dominio TIR en la familia RGC7. A continuación se enuncian algunas de estas inferencias en el orden amino-carboxil. En primer lugar se puede esperar que el motivo TIR 1 incluiría la primer hebra β (βA) y por lo menos parcialmente la primer hélice α (αA). Entre el dominio TIR1 y TIR2 se encontraría la el asa BB (BB loop), la cual comprende el intervalo entre la hebra βB y la hélice αB. El motivo TIR2 por su parte contendría a la hebra βC que en los fragmentos de la familia RGC7 tendría la secuencia de aminoácidos hidrofóbicos LFIVVFS. El dominio TIR3 probablemente contiene a la siguiente hebra beta en orden lineal, βD, que también es de naturaleza hidrofóbica y podría incluir los aminoácidos IIPIF o IPIFYD. Finalmente en el dominio

TIR4 estaría localizada la mayor parte de la última hélice alfa, αE.

Los sitios conservados en los motivos TIR1, TIR2, y TIR4 pueden estar determinando la defensa contra los patógenos en plantas y animales. Por ejemplo la mutagénesis de los residuos situados en los motivos homólogos de TIR1 y TIR2 en el receptor de interleucina 1 (IL1-R) de animales provoca la disminución del desempeño de la proteína

127

en la unión a ligando, la activación de kinasas y la expresión en la membrana celular

(Slack et al., 2000). De otra parte las mutaciones en los residuos homólogos al motivo

TIR4 no alteran las propiedades de transducción de señal de IL1-R , sin embargo sí

producen una menor expresión del receptor en la membrana celular (Slack et al., 2000).

De esto se infiere que los motivos TIR1 y TIR2 de animales son requeridos para la

transducción de señal de defensa mientras que el motivo homólogo a TIR4 puede estar

involucrado en el transporte del receptor hacia su destino celular (Slack et al., 2000). La

mutación de aminoácidos conservados entre plantas y animales de los motivos TIR1,

TIR2 y TIR 4 (Figura 13 )producen fenotipos de pérdida parcial de función del gen N en

el tabaco (Dinesh-Kumar et al., 2000) . De forma similar la diferencia en tres sitios del

dominio TIR del gen L del lino, uno de ellos en el motivo TIR1 y otro en el asa BB estimados en este trabajo (Figura 13), determina las distintas especificidades otorgadas por los alelos L6 y L7 (Luck, et al., 2000). Los aminoácidos expuestos al solvente del asa

BB determinan la especificidad del TLR2 en el ratón y en el hombre (Xu et al., 2000).

Considerando la información funcional y la anotación expuestas hasta este punto se estimó que hay 3 pseudogenes entre las secuencias aisladas de G19833 que tienen homología con el dominio TIR.

De los 7 fragmentos TIR encontrados 2 resultaron ser quiméricos y posiblemente son pseudogenes del clúster RGC7 (Figura 12). El primero TIR01 tiene un dominio 5’ TIR completo, una zona no codificante y el final 3´ LRR. El fragmento TIR01 por tanto no incluye ninguna región que corresponda al dominio NBS. Aún cuando se ha demostrado la existencia de una familia numerosa de genes con dominio TIR que no están asociados

128

a NBS (M eyers et al., 2002, 2003), en la anotación realizada no se identificaron señales de procesamiento adecuadas para que TIR01 pueda ser expresado. El segundo fragmento quimérico, CHITIN01, contenía tres motivos 5´TIR contiguos a dos motivos 3´NBS

(Figura 12). Las quimeras encontradas deben ser el resultado de deleciones de zonas codificantes en genes ancestrales, o bien el producto de recombinación ilegitima. Por lo menos en el caso de TIR01 existe evidencia para pensar que ha sido el resultado de la fusión de dos miembros ancestrales de familia RGC7. La región LRR de TIR 01 tenía una mayor similitud con la región LRR de la copia RGC7B (búsqueda BLASTn valor E

< 10-7) de ‘Sprite’ mientras que la porción TIR era más similar a la copia RGC7E (ver sección 4.3.3).

Entre los 5 fragmentos que no son quiméricos (incluyendo al contig G0506 que tiene un dominio TIR acoplado a un NBS), el contig TIR02 parece ser un pseudo gen por una mutación que irrumpe el marco de lectura justo antes del motivo TIR-3, lo que se puede ver en la anotación de MAST.

[TIR3...... Arg Asn Cys Val Glu Thr Ser Pro Arg Arg Val Ile Ile Pro TIR01 658 TGT AAC TGC TGT GAA ACT TCG CCA AGA AGT GTT ATT ATA CCT TIR02 273 CGT AAC TGC GTT GAA AA------AGT GTT ATT ATA CCT TIR03 652 TGT AAC TGC TTT GAA ACT TCG CCA AGA CGT GTT ATT ATA CCT TIR04 533 CGT AAC TGC GAT GAA ------AGA CCT GTT ATT ATA CCT G0506 347 CGT AAC TGC GTT GAA ACT TCA CCA AGA CCT GTT ATT ATA CCT

Los cuatro fragmentos restantes, TIR01B, TIR03, TIR04, G0506, tienen el marco de lectura abierto íntegro lo que es un indicio de su posible funcionalidad en el contexto célular de G19833.

129

4.3.2.2. Fragmentos NBS.

Un rastro del sitio donador del intrón 1 se puede observar en los fragmentos NBS01 y

NBS09, lo que sugiere que en estas dos copias ya se ha alcanzado el extremo 3´del correspondiente dominio TIR. Secuencias parciales o totales del intrón 1 pueden encontrarse en las copias G0506, NBS01, NBS02, NBS05 y NBS06. Solamente 3 fragmentos con homología a NBS tienen un marco de lectura abierto íntegro. Estos son los contigs G0506, NBS02 y NBS07. El contig G0506 incluye también el dominio TIR completo lo que implica que sólo resta el aislamiento de las secuencias LRR correspondiente a esta copia. Tanto en el contig NBS02 como en el NBS07 existe una región que codifica para el enlace TN y algunas repeticiones LRR en el caso de NBS07.

Estos resultados parciales hacen pensar que los más fuertes candidatos a genes funcionales, son precisamente estos tres contigs, G0506, NBS02 y NBS07. Los genes representados por estos tres fragmentos en principio podrían ser los responsables de la resistencia por parte de G19833 contra los aislamientos 12MEX y 30CRI de P.griseola.

El resto de los fragmentos NBS son pseudogenes aparentes debido a irrupciones varias en sus marcos abiertos de lectura. Es de notar que ninguno de los miembros aislados del

BAC57M14 tiene un marco abierto de lectura íntegro. De especial atención es una deleción de aproximadamente 120 pares de bases que incluye el dominio kinasa-2 de

RGC7C,. De no ser por el alineamiento múltiple y el análisis de motivos conservados tal evento hubiese sido pasado por alto. La copia RGC7E posee un segmento pequeño con similitud al enlace TN y al motivo kinasa-1 IGKTT. De no ser por esta porción RGC7E

130

contendría únicamente al dominio TIR. La mayoría de los fragmentos codifican de manera continua entre los motivos LVLD (kinasa-2) y GLPL. Las irrupciones de los marcos abiertos de lectura incluyen inserciones-deleciones, mutaciones puntuales que provocan un codón de parada prematuro o cambios de una sola posición en el marco. El contig NBS08 al perecer está constituido por secuencias de calidad deficiente por lo que no se puede descartar del todo como candidato funcional.

4.3.2.3. Repeticiones Ricas en Leucina.

El programa REP del EMBL, y las búsquedas de motivos conservados con los genes

TIR-NBS-LRR de Arabidopsis mediante la herramienta M AST permitieron identificar el enlace y repeticiones ricas en leucina en algunos de los fragmentos aislados (Tabla 11).

En las copias NBS02, NBS07 y NBS08 de G19833 y RGC7A y RGC7B de.’ Sprite’ se pudo identificarla región codificante que corresponde lal enlace TN. Esta región de transición se encuentra separada del domiio NBS por el itrón 2 que probablemente es de fase 0. De manera similar en los candidato NBS02 y NBS 07 se pudo caracterizar un segmento corto del domimi LRR . M ientras tanto en la la región codificante de RGC7B y

RGC7C de ’ Sprite’ se pudo observar una sección mas larga de repeticiones ricas en leuciana. La zona codificante para el dominio LRR podría estar interrumpida por varios exones, de fase 0 posiblemente, de manera análoga a lo encontrado en los genes NBS-

LRR de la clase A caractericzada por Meyers y colaboradores (2003) en Arabidopsis thaliana.

131

Tabla 11. Motivos conservados del enlace NL y del domino LRR. Comparación de los resultados encontrados por los programas MAST y REP. El número ID es el identificador del motivo en las base de datos de Meyers y colaboradores (2003).

Dominio ID Motivo encontrado por MAST Valor E Repetición LRR REP Valor E NL NBS07 11 RGTVKADGLSKIRHLKLLKFM 2.40E-04 NL RGC7B 14 RMNYIMYLNWSEYPFKCLPQSFQPEQPVALCLVDSSIKRLW 8.90E-16 LRR RGC7B 1 PLHNLKILD LSYFEQ LVEMPDVREALNLEKIE LQGCIKLRKINPSIGN A 6.00E-19 LHNLKILD LSYFEQ LVEMPDVREALNL 1.34E-05 LRR NBS07 20 KKLAFLNLGNCKNLVSLPHTI 7.30E-09 KKLAFLNLGNCKNLVSLPHTILD L 3E-05* LRR RGC7B 8 KVVVLN LENCKNLESLPNT IWGLN SLEYL 1.30E-12 LKKVVVLN LENCKNLESLPNT IWGL 2.03E-04 LRR RGC7B 9 HILSQLTFSLTCLRELNLSFCNLVRIPDVIGKLMCLEW LNL 3.90E-09 CLRELNLSFCNLVRIPDVIGKL 2.39E-05 LRR RGC7B MCLEWLNLKGNNFTTLPNLQNLFRL 4.60E-05 LRR NBS07 11 NLFRLYHLNLQHCKQLRHLPV 9.10E-06 LRHLPVLP LQTDYFSEFCKLPLTYSTD 1.69E-04 LRR RGC7B 6 IPGSEIPRWFNNRFVVSTDNS 1.40E-05

132

5. Conclusiones y Perspectivas.

Los resultados de la presente investigación son un avance hacia la identificación de los determinantes genéticos que le permiten a los fríjoles de la raza criolla G19833 iniciar la respuesta de defensa en contra de los aislamientos 12MEX y 30CRI de Phaeoisariopsis griseola. A partir de la caracterización previa de la secuencia de clon BAC57M 14 se desarrolló el marcador genético SSR07 que cosegrega con el marcador RGC7 asociado a la resistencia contra P. griseola, tal como se esperaba en un principio. De forma consecuente con estaa proximidad genética , la segregación en el locus SSR07 explica el

70.7 y 49.4% de la variabilidad del fenotipo de resistencia contra los ailamientos 12MEX y 30CRI respectivamente. En conjunto, esta evidencia confirma el ligamiento genético entre la región genómica correspondiente al clon BAC57M14 y el QTL de resistencia detectado previamente. La principal consecuencia de estos resultados es que validan la caracterización de la familia RGC7 como un método para la identificación de los candidatos a genes de resistencia responsables de la respuesta de defensa exhibida por

G19833.

La amplificación con cebadores diseñados a partir de los parálogos de la familia RGC7 del BAC 57M14 permitió el aislamiento de 17 fragmentos con homología a genes de resistencia en el genotipo resistente G19833. Mediante la anotación de motivos conservados se encontró que las secuencias aisladas corresponden a 7 dominios TIR, 10

NBS, y 3 LRR. La anotación exhaustiva de estas secuencias permitió distinguir entre los

17 fragmentos obtenidos de G19833, apenas 6 fragmentos candidatos a genes de

133

resistencia potencialmente funcionales con marcos abiertos de lectura íntegros. El resto de miembros de la familia se podrían calificar como pseudogenes porque eran quimeras no funcionales entre dominios proteicos, o sufrían de irrupciones en el marco abierto de lectura tales como codones de parada prematuros, deleciones del motivos proteicos, o cambios de una o dos posiciones en el marco. A pesar de estar cercanamente emparentados se observó una cantidad apreciable de variabilidad entre los parálogos de la familia RGC7. Dicha variabilidad puede ser consecuencia, entre otros, de procesos evolutivos dinámicos de nacimiento y muerte de genes de resistencia y, como en el caso de las quimeras génicas encontradas, de recombinación homóloga o ilegítima.

A partir de este punto todavía queda un cantidad ingente de investigación para establecer con precisión y de forma inequívoca la relación entre el fenotipo de resistencia encontrado en G19833 y los distintos candidatos a genes de resistencia encontrados en el locus RGC7. En primer lugar es necesario recoger más evidencia que confirme el ligamiento genético entre los distintos candidatos secuenciados y el QTL de resistencia.

De esta forma es necesario el desarrollo de más marcadores genéticos, como CAPS y

SNPs, para ser mapeados en la misma población de 87 RILs G19833 X DOR364. Una opción adicional consistiría en la generación de una población que permita construir un mapa con resolución más alta. En el curso del diseño de estos marcadores genéticos sería necesaria la caracterización de los parálogos encontrados en el parental susceptible

DOR364.

134

La los análisis bioinformáticos permiten hacer una anotación precisa de los candidatos encontrados, hasta el punto de identificar pseudogenes hipotéicos. Pero las inferencias realizadas in silico han de ser confirmadas mediante la recolección de evidencia biológica. En este orden de ideas sería útil evaluar la expresión diferencial entre parentales de los distintos candidatos por medio de PCR cuantitativo en tiempo real.

La identificación de los genes de resistencia de la familia RGC7 necesarios y suficientes para iniciar la respuesta de defensa contra P.griseola, el fin último de la investigación llevada a cabo en el CIAT, puede realizarse mediante dos metodologías. Una primer alternativa es la transformación con cada uno de los candidatos a genes de resistencia encontrados en G19833 de una población de plantas del genotipo susceptible DOR364.

Todas las plantas de esta población de DOR364 serían susceptibles excepto aquellas que hallan sido trasnformadas con el gen responsable de la resistencia en G19833. La segunda alternativa es el silenciamiento de genes inducido por virus, o VIGS, puede utilizarse para ‘noquear’ el gen de resistencia. Con este método se usa un vector viral que incluya la secuencia de cada uno de los candidatos para realizar la infección de una población de plantas de G198833. De tal forma que las plantas infectadas con el vector que contenga al gen de resistencia se mostraría susceptibles, de forma contraria a lo usual, debido al silenciamiento mediado por ARNs de doble cadena. La similitud de los miembros de la familia RGC7 se presenta como un obstáculo para el VIGS dado que el silenciamiento mediado por virus depende de la similitud de la secuencia objetivo y la secuencia endógena, Por lo tanto la estrategia silenciamiento debe realizarse con las secuencias divergentes entre los distintos candidatos de la familia RGC7.

135

APENDICE A. TABLAS DE SIMILITUD DE SECUENCIA DE LOS FRAGMENTOS AISLADOS DE LA FAMILIA RGC7.

A1. Exón 1 = MA(S)n+ TIR MEDIA MIN MAX SIMILITUD DE SECUENCIAS \ADN 85.3 76 99 PROTEINA\ 82.7 76 99

Longitud Fragmento ADN (bp) G0506 TIR01 TIR01B TIR02 TIR03 TIR04 RGC7A RGC7B RGC7C RGC7D RGC7E G0506 512 - 90 85 84 84 84 88 91 89 84 90 TIR01 512 87- 87 86 85 84 88 93 91 84 95 TIR01B 476 80 84 - 94 88 91 92 87 89 91 86 TIR02 464 78 81 90 - 90 88 88 85 86 88 85 TIR03 477 78 80 84 85 - 87 87 85 83 88 83 TIR04 497 80 80 86 82 83 - 92 84 87 99 82 RGC7A 494 82 83 88 83 82 88 - 89 92 93 87 RGC7B 515 84 88 84 78 79 79 81 - 92 85 91 RGC7C 509 83 87 86 80 79 82 86 86 - 87 89 RGC7D 497 81 81 86 82 83 99 89 79 83 - 83 RGC7E 512 83 89 80 77 76 76 79 83 80 76 - Media 496.8 Desv. Est. 17.6 % Variación 4% Mínima 464 Máxima 515

* Excluido al hacer el cálculo de la media y la variación por ser un fragmento que aún no se ha secuenciado por completo. Diagonal superior similitud en la secuencia de ADN, Diagonal inferior similitud en la secuencia de la proteína predicha.

137

A2. Intrón 1

SIMILITUD DE SECUENCIAS MEDIA MIN MAX \ADN 55.9 25 100 Longitud Fragmento ADN (bp) G0506 NBS01 NBS02 NBS09 NBS10 GTIR01 GTIR01B GTIR04 RGC7A RGC7B RGC7C RGC7D RGC7E G0506 243 - 61 37 66 37 69 41 54 79 89 70 72 58 NBS01 144 - 48 44 48 75 57 86 73 59 43 82 64 NBS02 48* - 59 100 29 39 49 47 34 55 40 27 NBS09 166 - 59 49 48 42 59 64 86 52 39 NBS10 48* - 29 39 49 47 34 55 40 27 TIR01 178 - 64 75 58 70 55 67 48 TIR01B 146 - 65 36 43 45 45 25 TIR04 114 - 67 52 40 77 56 RGC7A 212 - 77 58 86 73 RGC7B 257 - 70 70 57 RGC7C 179 - 55 39 RGC7D 179 - 75 RGC7E 244 - Media 186.1 Desv. Est. 45.3 % Variación 24% Mínima 114 Máxima 257

* Excluido al hacer el cálculo de la media y la variación por ser un fragmento que aún no se ha secuenciado por completo. Diagonal superior similitud en la secuencia de ADN, Diagonal inferior similitud en la secuencia de la proteína predicha.

138

A3. Enlace TN

MEDIA MIN MAX SIMILITUD DE SECUENCIAS \ADN 63.8 5 99 PROTEINA\ 51.8 0 98 Longitud Fragmento ADN (bp) G506 NBS01 NBS02 NBS03 NBS05 NBS09 NBS10 RGC7A RGC7B RGC7C RGC7D RGC7E G0506 155 - 92 85 33 30 86 84 85 84 86 86 51 NBS01 155 84 - 84 34 32 84 83 85 83 84 84 49 NBS02 155 69 70 - 33 34 82 99 88 99 82 87 50 NBS03 62* 18 20 20 - 60 32 32 38 33 33 36 5 NBS05 103* 18 18 22 60 - 31 34 34 34 30 34 8 NBS09 155 65 69 65 20 20 - 81 82 82 88 82 49 NBS10 155 69 70 98 20 22 65 - 87 98 81 86 50 RGC7A 155 70 72 78 25 22 67 78 - 88 83 92 50 RGC7B 155 67 69 98 22 24 65 96 76 - 82 86 50 RGC7C 154 67 69 65 16 18 72 65 67 65 - 84 51 RGC7D 155 74 70 72 24 22 70 72 82 70 69 - 48 RGC7E 90 43 39 43 6 0 39 43 41 43 43 39 - Media 147.7 Desv. Est. 21.6 % Variación 15% Mínima 90 Máxima 155

* Excluido al hacer el cálculo de la media y la variación por ser un fragmento que aún no se ha secuenciado por completo. Diagonal superior similitud en la secuencia de ADN, Diagonal inferior similitud en la secuencia de la proteína predicha.

139

A4. NBS (de Kin1 a RNBS- D) MEDIA MIN MAXI

SIMILITUD DE SECUENCIAS \ADN 63.6 25 100 PROTEINA\ 56.7 10 100

Longitud Fragment o ADN G0506 NBS01 NBS02 NBS03 NBS05 NBS07 NBS08 NBS09 NBS10 NBS13 RGC7 RGC7A RGC7B RGC7C RGC7D RGC7E G0506 566* - 95 74 71 61 63 58 72 92 35 74 78 73 58 62 41 NBS01 566* 93 - 73 72 62 62 57 72 92 35 73 78 73 58 62 41 NBS02 718 72 72 - 83 75 78 73 88 76 46 82 79 100 72 75 36 NBS03 709* 65 65 76 - 80 70 65 79 72 51 75 87 83 64 80 38 NBS05 786* 51 52 61 69 - 63 58 72 61 42 68 77 75 57 98 30 NBS07 602* 61 61 75 61 50 - 87 76 60 61 88 67 78 60 63 34 NBS08 609* 54 53 64 54 43 79 - 70 56 57 75 62 73 58 59 33 NBS09 720 69 68 83 68 58 71 61 - 72 44 81 76 88 72 73 35 NBS10 570* 86 88 74 67 52 57 50 68 - 35 71 78 76 58 62 42 NBS13 363* 32 32 38 46 34 52 49 36 32 - 50 51 46 62 42 25 RGC7 644* 70 70 79 66 56 89 67 76 66 43 - 78 82 64 68 43 RGC7A 660* 70 70 72 84 70 57 50 65 72 49 66 - 79 62 78 44 RGC7B 718 72 71 100 75 61 75 64 83 74 38 79 71 - 72 75 36 RGC7C 565 56 55 67 56 44 57 50 66 55 53 60 54 67 - 57 30 RGC7D 789 52 54 63 72 94 51 44 60 54 34 56 72 63 45 - 30 RGC7E 648 32 31 15 19 10 16 15 16 31 14 21 22 15 14 10 - Media 688.0 Desv.Est, 84.9 % Variación 12% Mínima 565 Máxima 789

* Excluido al hac er el cálc ulo de la media y la variación por s er un fragment o que aún no s e ha s ecuenciado por completo. Diagonal superior similitud en la secuenci a de ADN, Diagonal inferior similitud en la secuencia de la proteína predicha.

140

6. Literatura Citada

Acosta, I.F., E. Gaitan, and J. Tohme. 2000. Use of resistance gene analogs to initiate the

dissection of resistance gene clusters in common beans. In SB-2 Project Annual

Reppport. CIAT, Palmira (Colombia).

Acosta, I.F., C. Romero, and J. Tohme. 2002. Sequence analysis of a cluster of resistance

gene analogs associated with resistance to angular leaf spot (ALS) in common

bean (II). In SB-2 Project Annual Reppport. CIAT, Palmira (Colombia).

------2003. Dissection of a cluster of Resistance Gene Candidates (RGCs) associated

with resistance to angular leaf spot (ALS) in common bean (III). In SB-2 Project

Annual Reppport. CIAT, Palmira (Colombia).

Akira, S., M. Yamamoto, and K. Takeda. 2003. Role of adapters in Toll-like receptor

signalling. Biochem Soc Trans 31: 637-42.

Akita, M. and J.P. Valkonen. 2002. A novel gene family in moss (Physcomitrella patens)

shows sequence homology and a phylogenetic relationship with the TIR-NBS

class of plant disease resistance genes. J Mol Evol 55: 595-605.

Aravind, L., V.M. Dixit, and E.V. Koonin. 2001. Apoptotic molecular machinery: vastly

increased complexity in vertebrates revealed by genome comparisons. Science

291: 1279-84.

Axtell, M .J., T.W. McNellis, M.B. Mudgett, C.S. Hsu, and B.J. Staskawicz. 2001.

M utational analysis of the Arabidopsis RPS2 disease resistance gene and the

corresponding pseudomonas syringae avrRpt2 avirulence gene. Mol Plant

Microbe Interact 14: 181-8.

Baker, B., P. Zambryski, B. Staskawicz, and S.P. Dinesh-Kumar. 1997. Signaling in

141

plant-microbe interactions. Science 276: 726-33.

Banerjee, D., X. Zhang, and A.F. Bent. 2001. The leucine-rich repeat domain can

determine effective interaction between RPS2 and other host factors in

arabidopsis RPS2-mediated disease resistance. Genetics 158: 439-50.

Baumgarten, A., S. Cannon, R. Spangler, and G. May. 2003. Genome-level evolution of

resistance genes in Arabidopsis thaliana. Genetics 165: 309-19.

Beebe, S., J.P. Lynch, N. Galwey, J. Tohme, and I. Ochoa. 1997. A geographical

approach to identify phosphorus-efficient genotypes among landraces and wild

ancestors of common bean. Euphytica : international journal of plant breeding 95:

325-336.

Beebe, S., F. Other Author: Pedraza, M. Rojas, J. Gutierrez, and J. Thome. 1998. A

genetic map of common bean combining RFLP, RAPD, SCAR and AFLP

markers. Bean Improvement Cooperative 41: 95-96.

Beebe, S., J. Rengifo, E. Gait an, M.C. Duque, and J. Tohme. 2001. Diversity and origin

of Andean landraces of common bean. Crop science 41: 854-862.

Beebe, S., P.W. Skroch, J. Tohme, M.C. Duque, F. Pedraza, and J. Nienhuis. 2000.

Structure of genetic diversity among common bean landraces of Middle American

origin based on correspondence analysis of RAPD. Crop science 40: 264-273.

Beebe, S., O. Toro, A.V. Gonz·lez, M.I. ChacÛn, and D.G. Debouck. 1997. Wild-weed-

crop complexes of common bean (Phaseolus vulgaris L., ) in the

Andes of Peru and Colombia, and their implications for conservation and

breeding. Genetic Resources and Crop Evolution 44: 73-91.

Bergamin Filho, A., S.M.T.P.G. Carneiro, C.V. Godoy, L. Amorim, R.D. Berger, and B.

142

Hau. 1997. Angular leaf spot of Phaseolus beans: relationships between disease,

healthy leaf area, and yield. Phytopathology 87: 506-515.

Bertioli, D.J., S.C. Leal-Bertioli, M.B. Lion, V.L. Santos, G. Pappas, Jr., S.B. Cannon,

and P.M. Guimaraes. 2003. A large scale analysis of resistance gene homologues

in Arachis. Mol Genet Genomics 270: 34-45.

Beutler, B. 2004. Innate immunity: an overview. M ol Immunol 40: 845-59.

Blair, M.W., F. Other Author: Pedraza, H.F. Buendia, E. Gaitan-Solis, S.E. Beebe, P.

Gepts, and J. Tohme. 2003. Development of a genome-wide anchored

microsatellite mapfor common bean (Phaseolus vulgaris L.). Theoretical and

applied genetics 107: 1362-74.

Botella, M.A., J.E. Parker, L.N. Frost, P.D. Bittner-Eddy, J.L. Beynon, M.J. Daniels, E.B.

Holub, and J.D. Jones. 1998. Three genes of the Arabidopsis RPP1 complex

resistance locus recognize distinct Peronospora parasitica avirulence

determinants. Plant Cell 10: 1847-60.

Broughton, W.J., G. Hernandez, M. Blair, S. Beebe, P. Gepts, and J. Vanderleyden. 2003.

Beans (Phaseolus spp.)--model food legumes. Plant and soil 252: 55-128.

Caicedo, A.L., E. Gait·n, M.C. Duque, O.T. Chica, D.G. Debouck, and J. Tohme. 1999.

AFLP fingerprinting of Phaseolus lunatus L. and related wild species from

South America. Crop Science 39: 1497-1507.

Cannon, S.B., H. Zhu, A.M. Baumgarten, R. Spangler, G. May, D.R. Cook, and N.D.

Young. 2002. Diversity, distribution, and ancient taxonomic relationships within

the TIR and non-TIR NBS-LRR resistance gene subfamilies. J Mol Evol 54: 548-

62.

143

Cardona, C., C.A. Flor, F. Morales, and M.A. Pastor-Corrales. 1995. Problemas de

Campo en los cultivos de frijol en le trópico. Centro Internacional de Agricultura

Tropical, CIAT, Cali, Colombioa.

Chacón, M.I. 2001. Chloroplast DNA polymorphisms and the evolution and

domestrication of the common bean (Phaseolus vulgaris L.). In Department of

Agricultural Botany, pp. 223. University of Reading, School of Plant Sciences,

Reading, GB.

Chin, D.B., R. Arroyo-Garcia, O.E. Ochoa, R.V. Kesseli, D.O. Lavelle, and R.W.

Michelmore. 2001. Recombination and spontaneous mutation at the major cluster

of resistance genes in lettuce (Lactuca sativa). Genetics 157: 831-49.

Chrispeels, M.J. and D.E. Sadava. 2002. , Genes and Crop Biotechnology. Jones &

Bartlett Publishers, Sudbury, MA.

CIAT. 1984. Morfología de la planta de fríjol común; guía de estudio, Cali, Colombia.

-. 2003. Common Bean: The Nearly Perfect Food. In. CIAT in focus: Crop

Commitments, Palmira (Colombia).

Cohn, J., G. Sessa, and G.B. Martin. 2001. Innate immunity in plants. Curr Opin

Immunol 13: 55-62.

Corrêa, R.X., P.I.V. Good-God, M.L.P. Oliveira, S. Nietsche, M.A. Moreira, and E.G.

Barros. 2001. Herança da resistência à mancha-angular do feijoeiro e

identificação de marcadores moleculares flanqueando o loco de resistência.

Fitopatologia Brasileira 26: 27-32.

Creusot, F., C. Macadre, E. Ferrier Cana, C. Riou, V. Geffroy, M. Sevignac, M. Dron,

and T. Langin. 1999. Cloning and molecular characterization of three members of

144

the NBS-LRR subfamily located in the vicinity of the Co-2 locus for anthracnose

resistance in Phaseolus vulgaris. Genome 42: 254-64.

Dangl, J.L. and J.D. Jones. 2001. Plant pathogens and integrated defence responses to

infection. Nature 411: 826-33.

De Lorenzo, G. and S. Ferrari. 2002. Polygalacturonase-inhibiting proteins in defense

against phytopathogenic fungi. Curr Opin Plant Biol 5: 295-9.

Debouck, D. 1991. Systematics and morphology. In Common beans: research for croop

improvement (ed. A.v. Schoonhoven and O. Voysest). C.A.B. International,

Wallingford, UK.

-. 2000. Genetic Resources of Phaseolus beans: Patterns in time, space, and people. In

Seminario de Judia de la Península Ibérica, pp. 17-39. Asociación Española de la

Lengua, Villaviciosa, España.

Debouck, D.G. 1999. Diversity in Phaseolus species in relation to the common bean. In

Common bean improvement in the twenty-first century (ed. P.K. Singh), pp. 25-

52. Kluwer Academic Publishers, Dordrecht, Nethelands.

-. 1999. Development of an integrated linkage map. In Common bean improvement in the

twenty-first century (ed. P.K. Singh), pp. 389–400. Kluwer Academic Publishers,

Dordrecht, Nethelands.

Debouck, D.G., O. Toro, O.M. Paredes, W.C. Johnson, and P. Gepts. 1993. Genetic

diversity and ecological distribution of Phaseolus vulgaris (Fabaceae) in

northwestern South America. Economic Botany 47: 408-423.

Deighton, F.C. 1990. Observations on Phaeoisariopsis. Mycological research 94: 1096-

1102.

145

Delgado-Salinas, A., A. Bruneau, and J.J. Doyle. 1993. Chloroplast DNA phylogentic

studies in New World Phaseolinae (Leguminosae: Papilionoidae: ).

Systematic botany 18: 6-17.

Delgado-Salinas, A., T. Turley, A. Richman, and M. Lavin. 1999. Phylogenetic analysis

of the cultivated and wild species of Phaseolus (Fabaceae). Systematic botany 24:

438-460.

Deslandes, L., J. Olivier, N. Peeters, D.X. Feng, M. Khounlotham, C. Boucher, I.

Somssich, S. Genin, and Y. Marco. 2003. Physical interaction between RRS1-R, a

protein conferring resistance to bacterial wilt, and PopP2, a type III effector

targeted to the plant nucleus. Proc Natl Acad Sci U S A 100: 8024-9.

Di Matteo, A., L. Federici, B. Mattei, G. Salvi, K.A. Johnson, C. Savino, G. De Lorenzo,

D. Tsernoglou, and F. Cervone. 2003. The crystal structure of polygalacturonase-

inhibiting protein (PGIP), a leucine-rich repeat protein involved in plant defense.

Proc Natl Acad Sci U S A 100: 10124-8.

Dinesh-Kumar, S.P., W.H. Tham, and B.J. Baker. 2000. Structure-function analysis of

the tobacco mosaic virus resistance gene N. Proc Natl Acad Sci U S A 97: 14789-

94.

Dodds, P.N., G.J. Lawrence, and J.G. Ellis. 2001. Six amino acid changes confined to the

leucine-rich repeat beta-strand/beta-turn motif determine the difference between

the P and P2 rust resistance specificities in flax. Plant Cell 13: 163-78.

Dolezel, J., J. Bartos, H. Voglmayr, and J. Greilhuber. 2003. Nuclear DNA content and

genome size of trout and human. Cytometry 51: 127-128.

Doyle, J.J. and M.A. Luckow. 2003. The Rest of the Iceberg. Legume Diversity and

146

Evolution in a Phylogenetic Context. Plant Physiology 131: 900-910.

Dunne, A. and L.A. O'Neill. 2003. The interleukin-1 receptor/toll-like receptor

superfamily: signal transduction during inflammation and host defense. Science

STKE: re3(2003).

Ellis, J., P. Dodds, and T. Pryor. 2000. Structure, function and evolution of plant disease

resistance genes. Curr Opin Plant Biol 3: 278-84.

Ellis, J., P. Dodds, and T. Pryor. 2000. The generation of plant disease resistance gene

specificities. Trends Plant Sci 5: 373-9.

Ellis, J.G., G.J. Lawrence, J.E. Luck, and P.N. Dodds. 1999. Identification of regions in

alleles of the flax rust resistance gene L that determine differences in gene-for-

gene specificity. Plant Cell 11: 495-506.

Ellis, M .B. 1979. Dematiaceous hyphomycetes. Commonwealth Mycological Institute,

Kew, United Kingdom.

Farr, D.F., A.Y. Rossman, M.E. Palm, and E.B. McCray. 2004. Fungal Databases,

Systematic Botany & Mycology Laboratory. In. http://nt.ars-

grin.gov/fungaldatabases/.

Ferreira, C.F., A. Borem, G.A. Carvalho, S. Nietsche, T.J. Paula, Jr., E.G. Barros, and

M.A. Moreira. 2000. Inheritance of angular leaf spot resistance in common bean

and identification of a RAPD marker linked to a resistance gene. Crop science 40:

1130-1133.

Ferrier-Cana, E., V. Geffroy, C. Macadre, F. Creusot, P. Imbert-Bollore, M . Sevignac,

and T. Langin. 2003. Characterization of expressed NBS-LRR resistance gene

candidates from common bean. Theor Appl Genet 106: 251-61.

147

Fluhr, R. 2001. Sentinels of disease. Plant resistance genes. Plant Physiol 127: 1367-74.

Fluhr, R. and R.N. Kaplan-Levy. 2002. Plant disease resistance: commonality and

novelty in multicellular innate immunity. Curr Top Microbiol Immunol 270: 23-

46.

Fofana, B., J.P. Baudoin, X. Vekemans, D.G. Debouck, and P. Du Jardin. 1999.

M olecular evidence for an Andean origin and a secondary gene pool for the Lima

bean (Phaseolus lunatus L.) using chloroplast DNA. Theoretical and applied

genetics 98: 202-212.

Fofana, B., J.P. Baudoin, X. Vekemans, D.G. Debouck, and P.d. Jardin. 1999. Molecular

evidence for an Andean origin and a secondary gene pool for the Lima bean

(Phaseolus lunatus L.) using chloroplast DNA. Theoretical and Applied

Genetics 98: 202-212.

Freyre, R., P.W. Other Author: Skroch, V. Geffroy, A.F. Adam-Blondon, A.

Shirmohamadali, W.C. Johnson, V. Llaca, R.O. Nodari, P.A. Pereira, and S.M .

Tsai. 1998. Towards an integrated linkage map of common bean. 4. Development

of a core linkage map and alignment of RFLP maps. Theoretical and applied

genetics 97: 847-856.

Freytag, G.F. and D.G. Debouck. 2002. Taxonomy, distribution and ecology of the genus

Phaseolus (Leguminosae-papilionoidae) in North America, Mexico, and Central

America. Bitanical Research institute of Texas (BRIT), Forth Worth, TX.

Gebhardt, C. and J.P. Valkonen. 2001. Organization of genes controlling disease

resistance in the potato genome. Annu Rev Phytopathol 39: 79-102.

Geffroy, V., D. Sicard, J.C.F.d. Oliveira, M. Sevignac, S. Cohen, P. Gepts, C. Neeman,

148

T. Langin, and M. Dron. 1999. Identification of an ancestral resistance gene

cluster involved in the coevolution process between Phaseolus vulgaris and its

fungal pathogen Colletotrichum lindemuthianum. Molecular plant-microbe

interactions : MPMI 12: 774-784.

Gepts, P. 1988. A Middle American and an Andean common bean gene pool. In Genetic

resources of Phaseolus beans; their maintenance, domestication, evolution, and

utilization (ed. P. Gepts), pp. 375-390. Kluwer Academic Publishers, Dordrecht,

Netherlands.

-. 1993. The use of molecular and biochemical markers in crop evolution studies. In

Evolutionary Biology (ed. M.K. Hecht). Plenum Press, New York.

-. 1998. Origin and evolution of common bean: past events and recent trends.

HortScience 33: 1124-1130.

-. 1998. Genome mapping resources in common bean: towards a unified linkage map in

recombinant inbred population BAT93 x Jalo EEP558. Bean Improvement

Cooperative 41: 91-92.

Gepts, P. and D. Debouck. 1991. Origin, domestication, and evolution of the common

bean (Phaseolus vulgaris L.). In Common beans: research for crop

improvement. (ed. A.v. Schoonhoven and O. Voysest), pp. 7-53. CAB

International, Wallingford

UK.

Gepts, P., R. Papa, S. Coulibaly, A.G. MejÌa, and R. Pasquet. 2000. Wild legume

diversity and domestication - insights from molecular methods. In The Seventh

Ministry of Agriculture, Forestry and Fisheries (MAFF), Japan, International

149

Workshop on Genetic Resources, Ibaraki, Japan, 13-15 October, 1999: Part 1,

wild legumes. (ed. K. Oono, D. Vaughan, N. Tomooka, A. Kaga, and S.

Miyazaki), pp. 19-31. National Institute of Agrobiological Resources (NIAR),

Tsukuba

Japan.

Goel, S., S.N. Raina, and Y. Ogihara. 2002. Molecular evolution and phylogenetic

implications of internal transcribed spacer sequences of nuclear ribosomal DNA

in the Phaseolus–Vigna Complex. Molecular Phylogenetics and Evolution 22: 1-

19.

Goodwin, S.B., L.D. Dunkle, and V.L. Zismann. 2001. Phylogenetic analysis of

Cercospora and Mycosphaerella based on the internal transcribed spacer region of

ribosomal DNA. Phytopathology 91: 648-658.

Graham, M.A., L.F. Marek, and R.C. Shoemaker. 2002. Organization, expressión and

evolution of a disease resistance gene cluster in soybean. Genetics 162: 1961-77.

Guzman, P., R.L. Gilbertson, R. Nodari, W.C. Johnson, S.R. Temple, D. Mandala,

A.B.C. Mkandawire, and P. Gepts. 1995. Characterization of variability in the

fungus Phaeoisariopsis griseola suggests coevolution with the common bean

(Phaseolus vulgaris). Phytopathology 85: 600-607.

Hammond-Kosack, K.E. and J.D. Jones. 1997. Plant Disease Resistance Genes. Annu

Rev Plant Physiol Plant Mol Biol 48: 575-607.

Hardie, D.G. 1999. PLANT PROTEIN SERINE/THREONINE KINASES: Classification

and Functions. Annu Rev Plant Physiol Plant Mol Biol 50: 97-131.

Harton, J.A., M.W. Linhoff, J. Zhang, and J.P. Ting. 2002. Cutting edge:

150

CATERPILLER: a large family of mammalian genes containing CARD, pyrin,

nucleotide-binding, and leucine-rich repeat domains. J Immunol 169: 4088-93.

He, Z., Z.Y. Wang, J. Li, Q. Zhu, C. Lamb, P. Ronald, and J. Chory. 2000. Perception of

brassinosteroids by the extracellular domain of the receptor kinase BRI1. Science

288: 2360-3.

Hoffmann, J.A., F.C. Kafatos, C.A. Janeway, and R.A. Ezekowitz. 1999. Phylogenetic

perspectives in innate immunity. Science 284: 1313-8.

Holt, B.F., 3rd, D.A. Hubert, and J.L. Dangl. 2003. Resistance gene signaling in plants--

complex similarities to animal innate immunity. Curr Opin Immunol 15: 20-5.

Hulbert, S.H., C.A. Webb, S.M. Smith, and Q. Sun. 2001. Resistance gene complexes:

evolution and utilization. Annu Rev Phytopathol 39: 285-312.

Hwang, C.F., A.V. Bhakta, G.M . Truesdell, W.M . Pudlo, and V.M . Williamson. 2000.

Evidence for a role of the N terminus and leucine-rich repeat region of the Mi

gene product in regulation of localized cell death. Plant Cell 12: 1319-29.

International Mycological Society. 1996. Pathogen: Phaeoisariopsis griseola. Distribution

Maps of Plant Diseases. Edition 4: Map 328.

Islam, F.M., S. Beebe, M. Munoz, J. Tohme, R.J. Redden, and K.E. Basford. 2004. Using

molecular markers to assess the effect of introgressión on quantitative attributes

of common bean in the Andean gene pool. Theor Appl Genet 108: 243-52.

Islam, F.M.A., K.E. Basford, C. Jara, R.J. Redden, and S. Beebe. 2002. Seed

compositional and disease resistance differences among gene pools in cultivated

common bean. Genetic resources and crop evolution 49: 285-293.

Islam, F.M.A., K.E. Basford, R.J. Redden, A.V. Gonzalez, P.M. Kroonenberg, and S.

151

Beebe. 2002. Genetic variability in cultivated common bean beyond the two

major gene pools. Genetic resources and crop evolution 49: 271-283.

Janeway, C.A., Jr. and R. Medzhitov. 2002. Innate immune recognition. Annu Rev

Immunol 20: 197-216.

Jara, C., G.S. Mahuku, and J. Tohme. 1998. Evaluating sources of resistance to Central

American isolates of Phaeoisariopsis griseola. In IP-1 Project Annual Report.

CIAT, Palmira (Colombia).

-. 2002. Inheritance of angular leaf spot (ALS) resistance in a population derived from

DOR 364 x G 19833. In IP-1 Project Annual Report. CIAT, Palmira (Colombia).

Jesus Junior, W.C.d., F.X.R.d. Vale, R.R. Coelho, B. Hau, L. Zambolim, L.C. Costa, and

A. Bergamin Filho. 2001. Effects of angular leaf spot and rust on yield loss of

Phaseolus vulgaris. Phytopathology 91: 1045-1053.

Jesus Junior, W.C.d., F.X.R.d. Vale, R.R. Coelho, P.A. Paul, B. Hau, A. Bergamin Filho,

L. Zambolim, and R.D. Berger. 2003. Relationships between angular leaf spot,

healthy leaf area, effective leaf area and yield of Phaseolus vulgaris. European

Journal of Plant Pathology 109: 625-632.

Judd, W.S., J.S. Campbell, E.A. Kellogg, P. Stevens, and M.J. Donoghue. 2002. Plant

Systematics: A Phylogenetic Approach. Sinauer Asssociates, Sunderland, MA.

Kajava, A.V. 1998. Structural diversity of leucine-rich repeat proteins. J Mol Biol 277:

519-27.

Kami, J., V.B. Velasquez, D.G. Debouck, and P. Gepts. 1995. Identification of presumed

ancestral DNA sequences of phaseolin in Phaseolus vulgaris. Proc Natl Acad Sci

U S A 92: 1101-4.

152

Kanazin, V., L.F. Marek, and R.C. Shoemaker. 1996. Resistance gene analogs are

conserved and clustered in soybean. Proc Natl Acad Sci U S A 93: 11746-50.

Khairallah, M.M., M.W. Adams, and B.B. Sears. 1991. Mitochondrial genome size

variation and restriction fragment length polymorphisms in three Phaseolus

species. Theoretical and applied genetics 82: 321-328.

Kirk, P.M., G.R. Bisby, P.F. Cannon, J.C. David, and J.A. Stalpers. 2001. Ainsworth and

Bisby's Dictionary of the Fungi, 9th Edition. In. CABI Biosciences.

Leister, D. 2004. Tandem and segmental gene duplication and recombination in the

evolution of plant disease resistance gene. Trends Genet 20: 116-22.

Leister, D., J. Kurth, D.A. Laurie, M. Yano, T. Sasaki, K. Devos, A. Graner, and P.

Schulze-Lefert. 1998. Rapid reorganization of resistance gene homologues in

cereal genomes. Proc Natl Acad Sci U S A 95: 370-5.

Liao, H., G. Rubio, X. Yan, A. Cao, K.M. Brown, and J.P. Lynch. 2001. Effect of

phosphorus availability on basal root shallowness in common bean. Plant Soil

232: 69-79.

Llaca, V., A. Delgado Salinas, and P. Gepts. 1994. Chloroplast DNA as an evolutionary

marker in the Phaseolus vulgaris complex. Theoretical and applied genetics 88:

646-652.

Luck, J.E., G.J. Lawrence, P.N. Dodds, K.W. Shepherd, and J.G. Ellis. 2000. Regions

outside of the leucine-rich repeats of flax rust resistance proteins play a role in

specificity determination. Plant Cell 12: 1367-77.

Mackey, D., Y. Belkhadir, J.M. Alonso, J.R. Ecker, and J.L. Dangl. 2003. Arabidopsis

RIN4 is a target of the type III virulence effector AvrRpt2 and modulates RPS2-

153

mediated resistance. Cell 112: 379-89.

Mahuku, G., C. Other Author: Montoya, M.A. Henriquez, C. Jara, H. Teran, and S.

Beebe. 2004. Inheritance and characterization of Angular Leaf Spot resistance

gene present in common bean accessión G 10474and identification of an AFLP

marker linked to the resistance gene. Crop science 44: 1817.

Mahuku, G.S., M.A. Henriquez, J. Munoz, and R.A. Buruchara. 2002. Molecular markers

dispute the existence of the Afro-Andean group of the bean angular leaf spot

pathogen, Phaeoisariopsis griseola. Phytopathology 92: 580-589.

Mahuku, G.S., C. Jara, C. Cajiao, and S. Beebe. 2003. Sources of resistance to angular

leaf spot (Phaeoisariopsis griseola) in common bean core collection, wild

Phaseolus vulgaris and secondary gene pool. Euphytica : Netherlands journal of

plant breeding 130: 300-313.

Mahuku, G.S., C. Montoya, M.A. Henriquez, Y. Mantilla, M . Contreras, and S. Beebe.

2002. Identifying and developing molecular markers linked to ALS resistance

genes. In IP-1 Annual Report. CIAT, Palmira, (Colombia).

Martin, G.B., A.J. Bogdanove, and G. Sessa. 2003. Understanding the functions of plant

disease resistance proteins. Annu Rev Plant Biol 54: 23-61.

Martínez-Romero, E. 2003. Diversity of Rhizobium-Phaseolus vulgaris symbiosis:

overview and perspectives. Plant and soil 252: 11-23.

McClean, P.E., R.K. Lee, and P.N. Miklas. 2004. Sequence diversity analysis of

dihydroflavonol

4-reductase intron 1 in common bean. Genome 47: 266-280.

154

McDowell, J.M., M. Dhandaydham, T.A. Long, M.G. Aarts, S. Goff, E.B. Holub, and

J.L. Dangl. 1998. Intragenic recombination and diversifying selection contribute

to the evolution of downy mildew resistance at the RPP8 locus of Arabidopsis.

Plant Cell 10: 1861-74.

McDowell, J.M. and B.J. Woffenden. 2003. Plant disease resistance genes: recent

insights and potential applications. Trends Biotechnol 21: 178-83.

Mendgen, K. and M. Hahn. 2002. Plant infection and the establishment of fungal

biotrophy. Trends Plant Sci 7: 352-6.

Mendgen, K., M. Hahn, and H. Deising. 1996. Morphogenesis and mechanisms of

penetration by plant pathogenic fungi. Annu Rev Phytopathol 34: 367-86.

Meyers, B.C., A.W. Dickerman, R.W. Michelmore, S. Sivaramakrishnan, B.W. Sobral,

and N.D. Young. 1999. Plant disease resistance genes encode members of an

ancient and diverse protein family within the nucleotide-binding superfamily.

Plant J 20: 317-32.

Meyers, B.C., A. Kozik, A. Griego, H. Kuang, and R.W. Michelmore. 2003. Genome-

wide analysis of NBS-LRR-encoding genes in Arabidopsis. Plant Cell 15: 809-34.

Meyers, B.C., M. Morgante, and R.W. Michelmore. 2002. TIR-X and TIR-NBS proteins:

two new families related to disease resistance TIR-NBS-LRR proteins encoded in

Arabidopsis and other plant genomes. Plant J 32: 77-92.

Michelmore, R. 2000. Genomic approaches to plant disease resistance. Curr Opin Plant

Biol 3: 125-31.

M illigan, S.B., J. Bodeau, J. Yaghoobi, I. Kaloshian, P. Zabel, and V.M. Williamson.

1998. The root knot nematode resistance gene Mi from tomato is a member of the

155

leucine zipper, nucleotide binding, leucine-rich repeat family of plant genes. Plant

Cell 10: 1307-19.

Moffett, P., G. Farnham, J. Peart, and D.C. Baulcombe. 2002. Interaction between

domains of a plant NBS-LRR protein in disease resistance-related cell death.

Embo J 21: 4511-9.

Monda, E.O., F.E. Sanders, and A. Hick. 2001. Infection and colonization of bean leaf by

Phaeoisariopsis griseola. Plant pathology 50: 103-110.

Mondragon-Palomino, M., B.C. Meyers, R.W. Michelmore, and B.S. Gaut. 2002.

Patterns of positive selection in the complete NBS-LRR gene family of

Arabidopsis thaliana. Genome Res 12: 1305-15.

Mushegian, A. and R. Medzhitov. 2001. Evolutionary perspective on innate immune

recognition. J Cell Biol 155: 705-10.

Napier, R. 2004. Plant hormone binding sites. Ann Bot (Lond) 93: 227-33.

Nimchuk, Z., T. Eulgem, B.F. Holt, 3rd, and J.L. Dangl. 2003. Recognition and response

in the plant immune system. Annu Rev Genet 37: 579-609.

Noel, L., T.L. Moores, E.A. van Der Biezen, M. Parniske, M.J. Daniels, J.E. Parker, and

J.D. Jones. 1999. Pronounced intraspecific haplotype divergence at the RPP5

complex disease resistance locus of Arabidopsis. Plant Cell 11: 2099-112.

Pan, Q., J. Wendel, and R. Fluhr. 2000. Divergent evolution of plant NBS-LRR

resistance gene homologues in dicot and cereal genomes. J Mol Evol 50: 203-13.

Parniske, M., K.E. Hammond-Kosack, C. Golstein, C.M. Thomas, D.A. Jones, K.

Harrison, B.B. Wulff, and J.D. Jones. 1997. Novel disease resistance specificities

result from sequence exchange between tandemly repeated genes at the Cf-4/9

156

locus of tomato. Cell 91: 821-32.

Parniske, M. and J.D. Jones. 1999. Recombination between diverged clusters of the

tomato Cf-9 plant disease resistance gene family. Proc Natl Acad Sci U S A 96:

5850-5.

Pastor-Corrales, M.A., C. Jara, and S.P. Singh. 1998. Pathogenic variation in, sources of,

and breeding for resistance to Phaeoisariopsis griseola causing angular leaf spot in

common bean. Euphytica : Netherlands journal of plant breeding 103: 161-171.

Ramakrishna, W., J. Emberton, P. SanMiguel, M. Ogden, V. Llaca, J. Messing, and J.L.

Bennetzen. 2002. Comparative sequence analysis of the sorghum Rph region and

the maize Rp1 resistance gene complex. Plant Physiol 130: 1728-38.

Reiber, J.M. and D.S. Neuman. 1999. Hybrid Weakness in Phaseolus vulgaris L. I.

Disruption of Development and Hormonal Allocation. J Plant Growth Regul 18:

101-106.

Richly, E., J. Kurth, and D. Leister. 2002. Mode of amplification and reorganization of

resistance genes during recent Arabidopsis thaliana evolution. Mol Biol Evol 19:

76-84.

Rock, F.L., G. Hardiman, J.C. Timans, R.A. Kastelein, and J.F. Bazan. 1998. A family of

human receptors structurally related to Drosophila Toll. Proc Natl Acad Sci U S A

95: 588-93.

Rubio, G., H. Liao, X. Yan, and J.P. Lynch. 2003. Topsoil Foraging and Its Role in Plant

Competitiveness for Phosphorus in Common Bean. Crop Sci. 43: 598-607.

Rubio, G., T. Walk, Z. Ge, X. Yan, H. Liao, and J.P. Lynch. 2001. Root Gravitropism

and Below-ground Competition among Neighbouring Plants: A Modelling

157

Approach. Ann. Bot. 88: 929-940.

Santalla, M ., M .C. M enendez-Sevillano, A.B. Monteagudo, and A.M.d. Ron. 2004.

Genetic diversity of Argentinean common bean and its evolution during

domestication. Euphytica : international journal of plant breeding: 75-87.

Sartorato, A. 2004. Pathogenic Variability and Genetic Diversity of Phaeoisariopsis

griseola Isolates from Two Counties in the State of Goias, Brazil. J Phytopathology 152: 385–390.

Sartorato, A. and C.A. Rava. 1994. Mancha angular. In Principais doenças do feijoeiro

comum e seu controle., pp. 41-68. Empresa Brasileira de Pesquisa Agropecuaria,

Centro Nacional de Pesquisa de Arroz e Feijao., BrasÌlia, D.F., Brasil.

Sawant, S.V., K. Kiran, P.K. Singh, and R. Tuli. 2001. Sequence architecture

downstream of the initiator codon enhances gene expressión and protein stability

in plants. Plant Physiol 126: 1630-6.

Schmit, V., P. Du Jardin, J.P. Boudoin, and D.G. Debouck. 1993. Use of chloroplast

DNA polymorphisms for the phylogenetic study of seven Phaseolus taxa

including O. vulgaris and P. coccineus. Theoretical and applied genetics 87: 506-

516.

Schneider, D.S. 2002. Plant immunity and film Noir: what gumshoe detectives can teach

us about plant-pathogen interactions. Cell 109: 537-40.

Schwartz, H.F., F. Correa, P.A. Pineda, M.M. Otoya, and M.J. Katherman. 1981. Dry

Bean Losses Caused by Aschochyta, Angular, and White leaf Spots in Colombia.

Plant Disease 65: 494-496.

Shirano, Y., P. Kachroo, J. Shah, and D.F. Klessig. 2002. A gain-of-function mutation in

158

an Arabidopsis Toll Interleukin1 receptor-nucleotide binding site-leucine-rich

repeat type R gene triggers defense responses and results in enhanced disease

resistance. Plant Cell 14: 3149-62.

Singh, S.P. 2001. Broadening the genetic base of common bean cultivars: a review. Crop

science 41: 1659-1675.

Singh, S.P., P. Gepts, and D.G. Debouck. 1991. Races of common bean (Phaseolus

vulgaris, Fabaceae). Economic Botany 45: 379-396.

Singh, S.P., H. Teran, J. Munoz, J.C. Osorno, C. Takegami, and M.D. Thung. 2001. Low

Soil Fertility Tolerance in Landraces and Improved Common Bean Genotypes.

Crop science 43: 110-119.

Spillane, C. and P. Gepts. 2001. Evolutionary and genetic perspectives on the dynamics

of crop gene pools. In Broadening the genetic base of crop production (ed. H.D.

Cooper, C. Spillane, and T. Hodgkin), pp. 25-70. CABI, Wallingford, UK.

Staskawicz, B.J. 2001. Genetics of plant-pathogen interactions specifying plant disease

resistance. Plant Physiol 125: 73-6.

Staskawicz, B.J., M.B. Mudgett, J.L. Dangl, and J.E. Galan. 2001. Common and

contrasting themes of plant and animal diseases. Science 292: 2285-9.

Subba Rao, P.V., K.D.R. Wadia, and R.N. Strange. 1996. Biotic and abiotic elicitation of

phytoalexins in leaves of groundnut (Arachis hypogaea L.). Physiological and

molecular plant pathology 49: 343-357.

Takahashi, H., J. Miller, Y. Nozaki, M . Takeda, J. Shah, S. Hase, M . Ikegami, Y. Ehara,

and S.P. Dinesh-Kumar. 2002. RCY1, an Arabidopsis thaliana RPP8/HRT family

resistance gene, conferring resistance to cucumber mosaic virus requires salicylic

159

acid, ethylene and a novel signal transduction mechanism. Plant J 32: 655-67.

Tameling, W.I., S.D. Elzinga, P.S. Darmin, J.H. Vossen, F.L. Takken, M.A. Haring, and

B.J. Cornelissen. 2002. The tomato R gene products I-2 and MI-1 are functional

ATP binding proteins with ATPase activity. Plant Cell 14: 2929-39.

Tao, Y., F. Yuan, R.T. Leister, F.M. Ausubel, and F. Katagiri. 2000. Mutational analysis

of the Arabidopsis nucleotide binding site-leucine-rich repeat resistance gene

RPS2. Plant Cell 12: 2541-2554.

Tian, Y., L. Fan, T. Thurau, C. Jung, and D. Cai. 2004. The absence of TIR-type

resistance gene analogues in the sugar beet (Beta vulgaris L.) genome. J Mol Evol

58: 40-53.

Tofiño, A. and C.H. Ocampo. 2003. Possible contribution of mesoamerican phenotype in

snap beans cultivated in secondary centers. Bean Improvement Cooperative 46:

35-36.

Tohme, J., D.O. González, S. Beebe, M.C. Duque, and v.p.-. . In: Crop Science (USA).

Sep.-Oct. 1996. AFLP analysis of gene pools of a wild bean core collection. Crop

Science 36: 1375-1384.

Toro, O., J. Tohme, and D.G. Debouck. 1990. Wild bean (Phaseolus vulgaris L.):

Description and distribution. CIAT, Cali, Colombia.

Trowsdale, J. 2002. The gentle art of gene arrangement: the meaning of gene clusters.

Genome Biol 3: COMMENT2002.

Van der Biezen, E.A. and J.D. Jones. 1998. The NB-ARC domain: a novel signalling

motif shared by plant resistance gene products and regulators of cell death in

animals. Curr Biol 8: R226-7.

160

van der Vossen, E., A. Sikkema, B.L. Hekkert, J. Gros, P. Stevens, M. Muskens, D.

Wouters, A. Pereira, W. Stiekema, and S. Allefs. 2003. An ancient R gene from

the wild potato species Solanum bulbocastanum confers broad-spectrum

resistance to Phytophthora infestans in cultivated potato and tomato. Plant J 36:

867-82.

VandenBosch, K.A. and G. Stacey. 2003. Summaries of Legume Genomics Projects from

around the Globe. Community Resources for Crops and Models. Plant Physiology

131: 840-865.

Vanhouten, W. and S. MacKenzie. 1999. Construction and characterization of a common

bean bacterial artificial chromosome library. Plant Mol Biol 40: 977-83.

Vision, T.J., D.G. Brown, and S.D. Tanksley. 2000. The origins of genomic duplications

in Arabidopsis. Science 290: 2114-7.

Voysest, O. 2000. Mejoramiento genético del fríjol (Phaseolus vulgaris L.): Legado de

variedades de América Latina 1930-1999. CIAT, Cali, Colombia.

Wagara, I.N., A.W. Mwang’ombe, and G.M. Siboe. 1999. Colonisation of resistant and

susceptible bean tissues by Phaeoisariopsis griseola (Sacc) Ferr. African Crop

Science Journal 7: 523-530.

Wei, F., R.A. Wing, and R.P. Wise. 2002. Genome dynamics and evolution of the Mla

(powdery mildew) resistance locus in barley. Plant Cell 14: 1903-17.

Wojciechowski, M.F., M.J. Sanderson, K.P. Steele, and A. Liston. 2000. Molecular

phylogeny of the “Temperate Herbaceous Tribes” of Papilionoid legumes: a

supertree approach. In Advances in Legume Systematics 9 (ed. P.S. Herendeen

and A. Bruneau), pp. 277–298. Royal Botanic Gardens, Kew.

161

Wortmann, C., R.A. Kirkby, C.A. Eledu, and D.J. Allen. 1998. Atlas of common bean

(Phaseolus vulgaris L.) production in Africa. Centro Internacional de Agricultura

Tropical (CIAT).

Wulff, B.B., C.M. Thomas, M. Smoker, M. Grant, and J.D. Jones. 2001. Domain

swapping and gene shuffling identify sequences required for induction of an Avr-

dependent hypersensitive response by the tomato Cf-4 and Cf-9 proteins. Plant

Cell 13: 255-72.

Xu, Y., X. Tao, B. Shen, T. Horng, R. Medzhitov, J.L. Manley, and L. Tong. 2000.

Structural basis for signal transduction by the Toll/interleukin-1 receptor domains.

Nature 408: 111-5.

Young, N.D. 2000. The genetic architecture of resistance. Curr Opin Plant Biol 3: 285-

90.

Young, N.D., J. Mudge, and T.H. Ellis. 2003. Legume genomes: more than peas in a pod.

Curr Opin Plant Biol 6: 199-204.

Young, R.A., M. Melotto, R. Nodari, and J.D. Kelly. 1998. Marker-assisted dissection of

the oligogenic anthracnose resistance in the common bean cultivar, ‘G 2333’. Theoretical and applied genetics 96: 87-94.

Zhou, T., Y. Wang, J.Q. Chen, H. Araki, Z. Jing, K. Jiang, J. Shen, and D. Tian. 2004.

Genome-wide identification of NBS genes in japonica rice reveals significant

expansión of divergent non-TIR NBS-LRR genes. Mol Genet Genomics.

162