PARTE I Herramientas Básicas

Biotecnología y Mejoramiento Vegetal II 15 16 Biotecnología y Mejoramiento Vegetal II I - CAPÍTULO 1 1. Objetivo del cultivo: si bien es difícil tratar de clasificar las aplicaciones que se persiguen con el cultivo de tejidos, se podría esquemati- Establecimiento de cultivos de zarlas en aplicaciones para: tejidos vegetales • Estudios básicos. En este caso, los explan- tes cultivados pueden ser diversos. Si lo único Luis Mroginski, Pedro Sansberro y que se quiere lograr es un sistema de callos Eduardo Flaschland para estudiar algún proceso fisiológico, se puede cultivar cualquier órgano, tejido o célula 1 Introducción viva. En este caso –en que lo único que se bus- ca es la inducción de callos– lo ideal es cultivar El cultivo de tejidos –en su acepción amplia– explantes jóvenes, derivados de semillas en puede ser definido como un conjunto muy hete- germinación, donde se obtienen respuestas rá- rogéneo de técnicas que presentan en común pidas y, en general, hay menores problemas de el hecho de que un explante (una parte sepa- contaminación con microorganismos. A veces rada del vegetal que pueden ser protoplastos – se hace uso del cultivo de tejidos porque repre- células desprovistas de pared celular– células, senta un sistema experimental que simplifica tejidos u órganos) se cultiva asépticamente en la complejidad generada por los fenómenos un medio artificial de composición química de- de correlación entre las distintas partes que finida y se incuba en condiciones ambientales normalmente están presentes en una planta controladas. La imprecisión de esta definición entera. El explante que se usará estará condi- puede generar muchas polémicas, pero es ac- cionado por lo que se quiere estudiar. Un buen tualmente aceptada. Generalmente es común ejemplo lo constituye el cultivo de ovarios fe- dividir las técnicas del cultivo de tejidos en dos cundados del tomate para estudiar los reque- grandes grupos: a) cultivos en medios semisó- rimientos nutricionales durante el crecimiento lidos y b) cultivos en medios líquidos, los que de los frutos. Asimismo, el cultivo de óvulos ha a su vez pueden ser agitados (mediante el em- sido muy útil para estudiar aspectos relaciona- pleo de agitadores de uso continuo) o estacio- dos con la formación de las fibras en algodón. narios. También es frecuente dividir al cultivo El cultivo de discos de tallos brindó una valiosa de tejidos atendiendo a los niveles de comple- ayuda para estudiar la rizogénesis in vitro. jidad en cultivo de órganos, cultivos celulares y • Obtención de plantas con sanidad contro- cultivo de protoplastos. Para el establecimien- lada. Es muy común la utilización del cultivo de to de los cultivos utilizando cualquiera de los tejidos para la obtención de plantas libres de sistemas es necesario tener en cuenta algunos virus (ver VIII.-9). El explante ideal para ello es aspectos generales comunes relacionados con el meristema (dependiendo de la especie, de el explante, la asepsia, el medio de cultivo y 0,2-0,5mm de longitud) consistente del domo y las condiciones de incubación. La discusión de de un par de primordios foliares. estos aspectos constituye el objetivo de este • Micropropagación. En este caso depende- capítulo. Adicionalmente se incluye el tema de rá del sistema que se quiere utilizar. Si lo que la aclimatación de las plantas regeneradas in se quiere explotar es la brotación de meris- vitro, que es de gran importancia en la mayoría temas, los ápices terminales y los segmentos de las aplicaciones del cultivo de tejidos en la uninodales de ramas jóvenes constituyen ex- agricultura. celentes explantes. En este caso el cultiva- dor de tejidos debe conocer perfectamente la biología de la reproducción de la planta para 2 Explante aprovechar aquellos explantes que en forma Varios factores deben ser tenidos en cuenta natural son propágulos. En cambio, si se pre- en la elección del explante apropiado para el tende micropropagar mediante el empleo de establecimiento de los cultivos in vitro, entre semillas sintéticas (ver Parte IV, capítulo 2) el ellos: explante original deberá posibilitar la inducción

Biotecnología y Mejoramiento Vegetal II 17 de la embriogénesis somática. En este caso, la • Establecimiento de suspensiones celula- utilización de embriones zigóticos inmaduros u res. En este caso se recomienda iniciar los cul- hojas, suelen ser frecuentes como explantes. tivos a partir de explantes extraídos de semillas • Obtención de híbridos interespecíficos. en germinación (hipocótilo, epicótilo, cotiledo- Una de las primeras aplicaciones del cultivo de nes, raíces). tejidos en la agricultura lo constituyó su empleo como ayuda para la obtención de híbridos deri- 2. Posibilidad de contaminación con mi- croorganismos. De ser posible, se deben cul- vados de cruzamientos interespecíficos, donde tivar explantes de plantas donantes que crecen se produce el aborto temprano de embriones. en condiciones de invernadero, con ello se En estos casos, el explante cultivado es el reduce sustancialmente las tasas de contami- embrión cigótico en estadios tempranos de su nación. Por otra parte, es recomendable evitar desarrollo. Con la misma finalidad también se el uso de «explantes sucios» (raíces, rizomas) utilizan ovarios u óvulos fecundados. que provienen de plantas crecidas en macetas • Obtención de plantas de semillas con em- o en el campo, dado que en la mayoría de los briones rudimentarios. Para esta finalidad los casos no es posible conseguir una buena des- explantes pueden ser semillas (por ej. orquí- infección de los mismos. deas) o bien, se aíslan los embriones en un es- tado temprano de desarrollo («corazón») como 3. Edad fisiológica. Este es un aspecto de en el caso de yerba mate o de algunas varieda- gran influencia en la morfogénesis. Como regla des de duraznero. general se puede decir que cuando más joven • Obtención de plantas haploides (consi- e indiferenciado se encuentre el explante a cul- tivar, mejor será su respuesta in vitro. Es por derando como haploide a un esporofito que ello que los meristemas apicales y axilares son contiene el complemento gamético de cromo- ampliamente usados en numerosas especies. somas). En este caso, los explantes más uti- En el caso de la micropropagación de plan- lizados son las anteras, aunque también pue- tas leñosas, la edad del explante es un factor den emplearse microsporas aisladas, óvulos y crítico. Si los tejidos son jóvenes, la micropro- ovarios no fertilizados. pagación tiene mayores posibilidades de ser • Inducción de variación somaclonal. En este exitosa que con tejidos maduros. Este hecho caso se pueden utilizar varios explantes, pero genera la necesidad de realizar tratamientos si la finalidad de su utilización es la aplicación de rejuvenecimiento de las plantas donantes en planes de mejoramiento genético de plan- de explantes. tas, los explantes utilizados deben posibilitar la regeneración de plantas enteras. 4. Tamaño. En general, cuanto más grande • Producción y/o conversión de sustancias sea el explante mayores serán las posibilida- útiles. Se puede utilizar una gran variedad des de inducir la proliferación de callos o la re- de explantes. Los de raíces suelen ser muy generación directa de órganos. Sin embargo, a mayor tamaño de explante también son ma- utilizados. yores las probabilidades de que los cultivos se • Obtención de híbridos somáticos. Para esta contaminen con microorganismos. También es finalidad se recurre a la fusión de protoplastos. necesario tener en cuenta que existe un ta- En la mayoría de los casos se aíslan los proto- maño mínimo del explante, que depende de la plastos de mesófilos de hojas y de suspensio- especie y del material vegetal, por debajo del nes celulares. cual no es fácil lograr el establecimiento de los • Conservación e intercambio de germo- cultivos. Los explantes muy pequeños suelen plasma. Los meristemas son los explantes requerir del empleo de medios más complejos preferidos para el desarrollo de sistemas de o de los denominados medios acondicionados. conservación a mediano y largo plazo (crío- 5. Epoca del año. Es un factor que suelen conservación con nitrógeno líquido) y para el tener mucha importancia en la micropropa intercambio de material genético. gación y que generalmente está asociado al

18 Biotecnología y Mejoramiento Vegetal II grado de dormición que presentan ciertos ex- te –con la ayuda de un microscopio estereos- plantes (yemas, por ejemplo) y también con la cópico– los cultivos en forma periódica (por lo posibilidad de mayor o menor proliferación de menos semanalmente). También se pueden microorganismos. realizar pruebas con medios de cultivo dife- renciales y «test» bioquímicos específicos. 3 Asepsia Para evitar y/o minimizar las contaminacio- nes de los cultivos con microorganismos es Uno de los principales problemas que se necesario: presentan cuando se tratan de establecer los cultivos es el de la contaminación de los mis- 1) Conocer el material vegetal con que se tra- mos con diversos tipos de microorganismos baja y los posibles contaminantes específicos. (hongos, levaduras, bacterias, fitoplasmas, vi- rus). El ambiente generado por explante-medio 2) Realizar una adecuada preparación de la de cultivo-condiciones físicas de incubación planta dadora de explantes, cultivándola pre- es altamente propicio para la proliferación de ferentemente en invernaderos tratadas con muchos de estos microorganismos que pue- productos químicos que eliminen patógenos y den provocar la destrucción de los cultivos. Es eventuales microorganismos endófitos. difícil cuantificar el impacto de estas pérdidas, pero en promedio, en laboratorios dedicados a 3) Proceder a la desinfección superficial de la micropropagación se lo puede estimar en al- los explantes mediante el uso de compuestos rededor del 10%. En el mejor de los casos, es- químicos con el objeto de eliminar los micro- tos microorganismos no destruyen los cultivos organismos con el menor daño posible para pero compiten con el explante por los nutrien- el explante. Si bien no es posible recomendar tes del medio de cultivo o bien lo modifican. un procedimiento general, se puede señalar Es muy difícil conseguir cultivos estrictamen- que el procedimiento más popularizado con- te asépticos dado que en la mayoría de los siste en una doble desinfección mediante la casos es altamente probable que los mismos inmersión de los explantes en etanol (70%v/v) contengan virus y fitoplasmas, por lo que en durante 20-60 segundos seguido de hipoclo- la práctica, cuando se refiere a cultivos asép- rito de sodio 1 -3%, contenido en el agua de ticos, en general se quiere significar que son lavandina comercial, durante 3 a 30 minutos, cultivos donde no se produce la proliferación dependiendo de la naturaleza del explante. de hongos y bacterias. Algunos procedimientos se basan en el em- Dos son las fuentes de contaminaciones: a) pleo de únicamente etanol o de hipoclorito de microorganismos presentes en el interior o en sodio. Finalmente, es necesario eliminar los la superficie de los explantes y b) fallas en los restos de estos productos mediante varios la- procedimientos de cultivo en el laboratorio. La vados con agua destilada estéril. correcta detección de estas fuentes y del tipo En este último punto hay que aconsejar que de microorganismo son aspectos importantes se utilice agua destilada estéril de reciente para el éxito de los cultivos, pues por un lado preparación, dado que está demostrado que el ayuda a determinar la fuente de contaminación almacenaje prolongado del agua estéril puede y por otro lado, ayuda a la planificación de los ser la causa de contaminaciones con bacte- procedimientos para controlarlos. Varios géne- rias. Es aconsejable realizar estas operacio- ros de bacterias (Pseudomonas, Xanthomonas, nes de desinfección superficial en una cámara Erwinia, Enterobacter, Agrobacterium, Bacillus, de transferencia con aire estéril. En lugar del Micrococcus, Staphylococcus, Lactobacillus, hipoclorito de sodio se puede utilizar hipoclori- Mycobacterium, Corynebacterium) y de hon- to de calcio (6 -12 %) o el cloruro de mercurio gos filamentosos (Aspergillus, Penicilium, (0,1%- 1,5%). Es preciso recomendar extrema Fusarium, Alternaria, Cladosporium y cautela con el empleo de este último compues- Neurospora) están frecuentemente en los cul- to, dado que es altamente tóxico y además no tivos. Es conveniente inspeccionar visualmen- es removido con facilidad del explante.

Biotecnología y Mejoramiento Vegetal II 19 En los casos en que no se utilice etanol, la croondas. El agua caliente también puede ser adición de agentes tensoactivos junto con el usada. En el caso de sustancias termolábiles, desinfectante es una práctica recomendada. la esterilización se puede hacer mediante fil- Entre los más usados figuran Tween-20 (0,01 tración a través de filtros bacteriológicos. – 0.1%) o unas gotas de Triton. El lavado pre- No es posible recomendar ningún sistema vio de los explantes con agua corriente y de- de esterilización dado que la exitosa destruc- tergentes, ayuda a una mejor desinfección. La ción de los microorganismos depende de múl- inmersión de los explantes en soluciones con- tiples factores entre los que interesan el tama- teniendo sustancias antibióticas y /o antimicó- ño del recipiente, el tiempo de esterilización y ticas (gentamicina, sulfato de estreptomicina, la naturaleza de la sustancia a esterilizar. Sin ampicilina, tetraciclina, carbenicilina, sulfato de embargo, se pueden dar algunas sugerencias: gentamicina, pentacloronitrobenceno, rifam- • La esterilización en estufas mediante calor picina, anfotericina B, benomil, carbendazim) seco (aire caliente) es recomendable para es- puede ser de utilidad, pero deben ser utilizados terilizar recipientes de vidrios secos (pipetas, en casos excepcionales. Estos productos tienen cápsulas de Petri, tubos). En estos casos, 2-4 el inconveniente de que alteran la composición horas en estufas a 180-200 ºC brindan exce- de los medios de cultivo y además pueden ser lentes resultados. metabolizados por los explantes. • La esterilización con calor húmedo con va- Últimamente han aparecido soluciones bio- por bajo presión (en autoclave o en una «olla a cidas que matan bacterias y hongos, previenen presión»). Es el procedimiento más empleado la germinación de esporas y a altas concen- para la esterilización de los medios de cultivo traciones pueden eliminar contaminaciones (salvo, como se indicó más arriba, para aque- de microorganismos endófitos. Uno de estos llos que posean componentes termolábiles). compuestos es el PPM ( Preaservative En este caso, lo más común es usar una pre- Mixture). Otro ejemplo es el denominado G-1, sión de 1.46 kg.cm-2 durante 20 minutos, con un compuesto derivado de los furfurales de la lo que prácticamente se destruyen todas las caña de azúcar. Este compuesto, químicamen- formas de vida. Es importante que en todos te: 1-(5-bromofur-2-il)-2- bromo-2-nitroeteno los puntos del autoclave se alcance dicha tem- fue desarrollado en la Universidad Central de peratura, para lo cual hay disponibles cintas las Villas (Cuba) y tiene efecto bactericida y detectoras colorimétricas. fungicida de amplio espectro. En los casos en que se utilicen plántulas cre- 5) Cultivar los explantes en una cámara de cidas in vitro como plantas donantes de explan- transferencia con aire estéril («gabinete de flu- tes, es necesario desinfectar las semillas para jo laminar»), localizada en un ambiente limpio su cultivo y germinación y luego es aconsejable y no expuesta a corrientes de aire. De no dis- desinfectar también las plántulas resultantes. poner este equipamiento, se pueden sustituir En algunos materiales vegetales se utiliza con cuartos esterilizados previamente con luz la preincubación de los explantes mediante lo ultravioleta (nunca exponerse a la luz UV en cual éstos son desinfectados suavemente y forma directa). La mesada de trabajo y las pa- precultivados durante 24 horas en un medio redes del gabinete deben ser desinfectadas conteniendo sacarosa, y finalmente son desin- previamente con etanol al 70%. De la misma fectados nuevamente y cultivados. manera deben ser desinfectados exteriormen- 4) Emplear medios e instrumentos de cultivo te todos los recipientes (conteniendo medios esterilizados, es decir, liberados completamen- de cultivo, agua, etc.) que ingresen en el área te de cualquier microorganismo vivo o espo- del aire estéril. ras. Para la esterilización, en la mayoría de los Los operarios constituyen frecuentemente casos se hace uso del calor en sus diversas una importante fuente primaria de contamina- formas: llama directa, calor húmedo (en forma ción, porque es recomendable que, antes de de vapor abierto o bajo presión), calor seco comenzar a trabajar laven sus manos y ante- (aire caliente). Se pueden usar hornos a mi- brazos con abundante agua y jabón y se des-

20 Biotecnología y Mejoramiento Vegetal II infecten con etanol al 70 %. La utilización de Tabla 1: Composición de tres medios básicos guardapolvos, guantes y máscaras protectoras usados en el cultivo in vitro de tejidos. de la boca y de la nariz, así como los gorros Compuestos Medio básico1 protectores de los cabellos, ayudan a reducir MS N6 B5 sensiblemente los niveles de contaminación. Los instrumentos de trabajo (pinzas, pipetas, NH4NO3 1.650 ------tijeras, agujas, cápsulas de Petri) deben ser KNO 3 1.900 2.830 2.500 KH 2PO4 170 400 ----- esterilizados antes de su uso. Muchos de es- CaCl2.2H2O 440 166 150 tos instrumentos pueden ser colocados en eta- (NH4)2SO4 ----- 463 134 nol al 95% y, antes de ser usados, se deben MgSO4.7H 2O 370 185 250 NaH 2PO4.4H2O ------150 flamear cuidadosamente en la llama de un me- KI 0,83 0,80 0,75 chero. También es necesario flamear la boca MnSO4.H2O ------10,00 de los recipientes que contienen los medios de H3BO3 6,20 1,60 3,00 MnSO4.4H2O 22,30 4,40 ----- cultivo antes y después de cultivar el explante. ZnSO4.7H2O 8,60 1,50 2,00 6) Incubar los cultivos en cámaras o cuar- Na2MoO4.2H2O 0,25 ----- 0,25 tos de cultivo, cerrados, libres de corrientes CuSO4.5H2O 0,025 ----- 0,025 FeSO4.7H2O 27,80 27,85 27,80 de aire y bien higienizados. En lo posible se Na2EDTA 37,30 37,25 37,30 debe restringir la circulación de personas, y los CoCl2.6H2O 0,025 ----- 0,025 Glicina 2,00 2,00 ----- recipientes con cultivos contaminados deben Tiamina -HCl 0,10 1,00 10,00 ser rápidamente eliminados de este sector. Es Piridoxina-HCl 0,50 0,50 1,00 conveniente que antes del lavado, estos culti- Ácido Nicotínico 0,50 0,50 1,00 vos sean esterilizados. Mioinositol 100,00 ----- 100,00 Sacarosa 30.000,00 50.000,00 20.000,00 4 Medios de cultivo PH 5,7 5,8 5,5

-1 . Un medio de cultivo puede ser definido 1) Composición en mg·L - 1 como una formulación de sales inorgánicas y MS = Medio de Murashige y Skoog (Physiol.Plant. 15: 473 - 97. 1962) compuestos orgánicos requeridos para la nu- N6 = Medio de Chu,C.C.,Wang,C:C., Sun,C.S., Hsu, C.,Yin,K,C., y Chu, C. (Sci.Sinica 18: 6 59- 668. 1975) trición y manipulación de los cultivos. Existen B5 = Medio de Gamborg, O.L.,Miller,R.A. y Ojima, K. (Exp.Cell numerosas formulaciones, cada una de las Res. 50: 151 - 158. 1968) cuales comprende entre 6 y 40 compuestos. Para dar una idea de la cantidad de formu- laciones disponibles, George y col., luego de • Otros compuestos. revisar más de 3.000 trabajos científicos des- criben en dos tomos (casi 1.000 páginas en to- Fuente de carbono: Prácticamente todos los tal) más de 2.000 medios de cultivo. También cultivos son heterótrofos (comparativamente dos empresas multinacionales ofrecen para la unos pocos son autótrofos) y por ende necesi- venta más de 60 medios cada una, listos para tan del suministro de una fuente de carbono. su utilización especialmente en la micropropa- La sacarosa, en concentraciones de 2 al 5%, gación comercial de plantas. En la Tabla 1 se es el azúcar más utilizado. En algunos medios presentan tres medios que son muy usados en se la reemplaza por glucosa. En casos particu- la actualidad. lares se cita el empleo de maltosa o galacto- Básicamente, los medios de cultivo se com- sa. También myo-inositol (100 mg/L) suele ser ponen de compuestos que suministran: incorporado a los medios resultando un mejor • Una fuente de carbono crecimiento de los cultivos. • Nutrientes minerales Nutrientes minerales: Los medios de cultivo • ·Sustancias vitamínicas deben suministrar los mismos macro y micro- • Sustancias reguladoras del crecimiento nutrientes que son esenciales para el creci- • Agente gelificante (en el caso de medios miento de las plantas enteras. En general se semisólidos) destacan las concentraciones relativamente

Biotecnología y Mejoramiento Vegetal II 21 altas de nitrógeno y potasio. El nitrógeno es agua de coco (5 a 15%), jugo de tomate y puré suministrado en forma de amonio y/o nitrato. de banana. También en ocasiones es necesa- También se pueden utilizar urea, glutamina y ria la incorporación de agentes antioxidantes caseína hidrolizada. Es fundamental que el hie- (L-cisteína, ácido ascórbico, polivinilpirrolido- rro sea incorporado juntamente con un agente na) para prevenir el ennegrecimiento tisular quelante (Na2EDTA), lo que lo hace disponible causado por la oxidación de polifenoles pre- es un amplio rango de pH. sentes en los explantes. Este ennegrecimiento puede causar la muerte de los mismos. Sustancias vitamínicas: De todas las que La preparación de los medios de cultivo pue- comúnmente se incorporan a los medios, pa- de llevarse a cabo de diferentes maneras, en reciera que la tiamina es la única realmente «lecturas recomendadas» se citan manuales imprescindible para el buen crecimiento de los de laboratorio donde se describen detallada- cultivos. mente este punto.

Sustancias reguladoras del crecimiento: En 5. Condiciones ambientales para la la mayoría de los casos los medios utilizados incubación. para el establecimiento de los cultivos con- tienen auxinas (ANA, 2,4-D, AIA, AIB, NOA, La incubación de los cultivos se debe llevar Dicamba, Picloram) y/o citocininas (BA, KIN, a cabo en condiciones controladas. Por lo me- ZEA, 2iP, Thidiazurón). Las giberelinas (es- nos en lo que se refiere a temperatura, calidad pecialmente GA3) son requeridas en algunas e intensidad de luz, fotoperíodo, humedad at- ocasiones para el cultivo de meristemas o para mosférica e higiene. Estas condiciones se lo- la elongación de brotes. El ABA, es usado en gran con el empleo de cámaras climatizadas algunos casos. o cuartos especialmente preparados con aire acondicionado (frío-calor) y una buena y uni- Agente gelificante (en el caso de medios se- forme circulación de aire en el interior y dota- misólidos): El agar (entre 0,6 y 1%) es el com- dos de un buen sistema de alarma para cortar puesto más utilizado. También pueden em- la iluminación en caso de no funcionar el aire plearse «Agargel» (0,40-0,60%), «Transfergel» acondicionado. En general, los cultivos son in- (2,0-2,60%), «Phytagel» (0,25- 0,40%), agaro- cubados a temperatura constante de 25-28 ºC, sa (0,80-0.90%) y «Gelrite» (0,10-0,20%). con ciclo de luz/oscuridad de 16/8horas. La luz es generalmente provista por lámparas fluo- Otros compuestos: Muchas sustancias, de rescentes del tipo «luz día» con una irradiancia variada composición química, suelen ser adi- de entre 50 y 200μmol m-2s-1. La humedad at- cionadas a los medios básicos. Además de la mosférica debe ser elevada (80- 90%). glicina, otros aminoácidos se pueden agregar a los medios. Es el caso de L-tirosina, aspara- 6 Aclimatación de las plantas regenera- gina y cisteína, aunque hay que tener presente das in vitro. que en dosis altas pueden inhibir el crecimien- to de los cultivos. El carbón activado (0,1 a Durante el período de incubación, los cultivos 5%) suele ser incorporado al medio, dado que son expuestos a condiciones ambientales disí- es probable que absorba metabolitos tóxicos miles al ambiente externo. La atmósfera interna para los cultivos. se caracteriza por presentar una considerable variación diurna en la concentración de CO2, En algunos medios se incorporan ácidos humedad relativa elevada, temperatura cons- orgánicos como el málico, el cítrico, el pirúvi- tante e intensidad lumínica baja. A su vez, el co y el succínico y es frecuente el empleo de medio de cultivo compuesto por concentracio- L-glutamina y de caseína hidrolizada. Aún hoy nes elevadas de azúcares (en aquellos siste- se siguen utilizando ciertos componentes de mas heterótrofos y semiautótrofos de micropro- composición química no bien definida como el pagación), sales y reguladores del crecimiento,

22 Biotecnología y Mejoramiento Vegetal II sumado a la ausencia de microorganismos, del substrato, para mantener la temperatura generan anormalidades morfológicas, anató- por encima de los 18-20 ºC. micas y fisiológicas que las plantas deberán Sin lugar a dudas, la opción más económica corregir cuando son transferidas al ambiente es el empleo de la luz natural, disminuyendo su externo. Este período de adaptación al nuevo irradiancia (20-50%) mediante el agregado de hábitat es llamado fase o etapa de aclimata- mallas de sombreado («saram»). No obstante, ción. La estrategia a implementarse durante el en aquellas latitudes donde el nivel medio de mencionado ciclo deberá contemplar el control luz natural es bajo y los días son cortos du- minucioso de los parámetros ambientales (hu- rante una parte considerable del año, la luz ar- medad, temperatura y luz) de tal manera que tificial puede ser aplicada como complemento permita disminuir la deshidratación y, al mismo de la luz natural. Las lámparas tubulares fluo- tiempo, estimular la fotosíntesis con el objeto de rescentes del tipo «luz día» son empleadas generar un rápido crecimiento de los plantines. en horticultura para prolongar el fotoperíodo. El retraso en el desarrollo de la cutícula y la Asimismo, las lámparas tubulares de sodio alta escasa funcionalidad del aparato estomático presión presentan una distribución espectral que presentan las hojas de la mayoría de las de la energía adecuada para estimular fotosín- especies cultivadas in vitro, determinan una tesis y se emplean para tal fin en una amplia alta tasa de transpiración que puede ocasionar variedad de cultivos. la muerte por deshidratación. El control de este Otro aspecto importante a tener en cuenta proceso fisiológico es de vital importancia du- lo constituye la elección del substrato, siendo rante la aclimatación, teniendo en cuenta que la el adecuado aquel que permita el normal creci- disminución de la transpiración será gradual y miento y desarrollo de las raíces. Se puede em- dependerá de la rehabilitación de los estomas, plear: arena, perlita, turba, vermiculita, o mez- así como también del desarrollo de la cutícu- clas de ellos, teniendo la precaución de rea- la. El equipamiento necesario estará sujeto a la lizar una esterilización previa. Es conveniente especie, pudiendo utilizarse desde túneles de el agregado de fertilizantes, sea a través del polietileno para plantas que posean un elevado substrato (fertilizantes de liberación controla- control de la transpiración (por ej. Malus pumila da) o bien mediante el sistema de riego (fer- o Agave tequilana) o bien, a través del empleo tilizantes solubles); empleándose proporcio- de cámaras climatizadas (Fig.1) equipadas con nes ricas en fósforo (N-P-K: 9-45-15) y potasio sensores que permiten un descenso paulatino (N-P-K: 4-25-35) que favorecerán el desarrollo de la humedad relativa. En algunos casos pue- radicular y la rustificación de las plantas. de resultar necesaria la aplicación exógena de En todo momento deberá realizarse un rigu- ABA (hormona involucrada en el control del cie- roso control fitosanitario empleándose antibióti- rre de los estomas) o bien, el empleo de sus- cos, fungicidas e insecticidas de uso universal. tancias antitranspirantes que forman una capa En la Figura 1, se detalla un modelo de cá- semipermeable en la superficie de la hoja. En mara de aclimatación diseñada por los autores este último caso deberán tomarse algunas pre- y empleada por el Laboratorio de Cultivo de cauciones debido a que pueden observarse re- Tejidos del Instituto de Botánica del Nordeste. acciones de fitotoxicidad. Básicamente, está compuesta por una fase Resulta imprescindible evitar la exposición a aérea construida en aluminio y policarbonato temperaturas extremas tanto en la fase aérea alveolar (9) y un recipiente o batea (11) que como en el substrato. Mediante el empleo de contiene gránulos de arcilla expandida a fin de extractores y/o acondicionadores de aire com- facilitar el drenaje. Mediante el agregado de binados con un sistema de niebla, es posible arena u otro substrato adecuado, esta cámara establecer la temperatura de la fase gaseosa puede ser utilizada tanto para el enraizamiento entre los 25 y 30 ºC durante la estación estival, ex vitro de los brotes obtenidos en la etapa de mientras que en la época invernal es necesa- multiplicación, así como también, para el en- rio, a veces, el empleo de mantas térmicas o raizamiento convencional (a «raíz desnuda») serpentinas, sea de agua o aire caliente a nivel de estacas de tallos u hojas.

Biotecnología y Mejoramiento Vegetal II 23 La humedad relativa de la fase aérea es con- Debido a la latitud geográfica en que se en- trolada por un sensor (6) ubicado por encima cuentra, la cámara está equipada con un acon- de la tubería de riego (4). El sistema humidifi- dicionador de aire (3000 frigorías) para evitar cador está compuesto por picos tipo «fog» y situaciones de estrés térmico en época estival. es alimentado por una bomba de bajo caudal A su vez, y dado que la mayoría de las espe- y alta presión (13). Con el propósito de evitar cies estudiadas son originarias de climas tro- el goteo que pudiese ocasionar el agua rema- picales y subtropicales, el sistema cuenta con nente en las cañerías, el sistema consta de mantas térmicas que son colocadas por deba- una válvula solenoide de descarga y desagüe jo de los tubetes, manteniendo la temperatura (7). La fase gaseosa es renovada en forma in- del substrato durante el invierno. En este últi- termitente mediante el empleo de extractores ubicados en ambos extremos de la cámara (3) mo caso se agrega un material aislante entre la los que, conjuntamente, introducen o extraen leca (10) y la malla de hierro (16) de tal manera aire, generando un movimiento masal. de dirigir el calor hacia la fase aérea.

24 Biotecnología y Mejoramiento Vegetal II 7. Agradecimientos.

Los autores agradecen al Ing. Pablo A. Luna por la planificación digital de la cámara de acli- matación. A la Secretaría General de Ciencia y Técnica (UNNE) y al Establecimiento La Ca- chuera por el aporte financiero recibido para construir la misma.

8. Lecturas Recomendadas

GEORGE, E.F.; D.J.M. PUTTOCK y H.J. GEOR- GE. 1987. Plant Culture Media . Vol. 1 (Formu- lations and Uses). Exegetics Limited. England. 567 pág. GEORGE, E.F.; D.J.M. PUTTOCK y H.J. GEORGE. 1988. Plant Culture Media . Vol. 2 (Commentary and analysis). Exegetics Limited. England. 420 pág. HURTADO, D.V. y MERINO, M.E. 1991. Cultivo de Tejidos Vegetales. Ed.Trillas. México. 232 pág. PÉREZ PONCE, J.N. 1998. Propagación y Mejora Genética de Plantas por Biotecnología. Instituto de Biología de Plantas.Santa Clara. Cuba. 390 pág. POSPOSILOVA, J.; I. TICHA, P. KADLECEK, D. HAISEL, S. PLZAKOVA. 1999. Acclimatization of micropropagated to ex vitro conditions. Biologia Plantarum 42: 481-497. ROCA, W.M. y L.A. MROGINSKI. 1993 (segunda edición). Cultivo de tejidos en la Agricultura: Fundamentos y aplicaciones. CIAT. Cali, Colom- bia, 970 pág. TORRES, A.C.; L.A. CALDAS y J.A. BUSO. 1998. Cultura de Tecidos e Transformacao Genética de Plantas. (Vol.1) Embrapa. Brasil.509 pág. TORRES, A.C.; L.A. CALDAS, y J.A. BUSO. 1999 Cultura de Tecidos e Transformacao Genética de Plantas. (Vol.2) Embrapa. Brasil.355 pág.

Biotecnología y Mejoramiento Vegetal II 25 I - CAPÍTULO 2 2.- Tipos de morfogénesis. Definiciones

Morfogénesis En condiciones de cultivo in vitro, las células somáticas pueden regenerar embriones (Fig Silvia Radice 1) o brotes, raíces y/o flores (Fig 2) como res- puesta a un determinado estímulo. La regene- 1.- Introducción ración es un proceso que comprende diferen- tes fases que se suceden de manera similar La embriogénesis somática y la organogénesis para los tres tipos de morfogénesis citadas. De son dos procesos morfogénicos muy frecuen- Klerk y colaboradores, en 1997, denominaron tes en el cultivo in vitro de especies vegetales. a estas diferentes fases como adquisición de La embriogénesis somática es el proceso por la competencia; fase de inducción y fase de el cual se obtiene una estructura similar a un realización. embrión cigótico sin que medie la fertilización En la primera fase, las células no respon- de las gametas, mientras que por organogé- den al estímulo organogénico pero adquieren nesis pueden obtenerse tallos, raíces o flores. esa competencia durante una fase de desdi- Estos órganos son inducidos a partir de una ferenciación. En la segunda fase o fase de in- célula o de un grupo de células que, según las ducción, las células son receptivas al estímulo condiciones de cultivo, tienen la propiedad de morfogénico y hay una relación directa con el mantenerse en activa división. tipo, concentración y combinación de regula- Esta totipotencialidad celular fue enunciada dores del crecimiento agregados al medio de por Haberlandt en 1902, quien propuso la teo- cultivo y el órgano a desarrollar. En la fase de ría de que todas las células vegetales tienen realización, la célula sufre las sucesivas divi- la capacidad de regenerar plantas completas. siones para formar el órgano determinado. Haberlandt no llegó a demostrar su hipótesis A partir de la siembra in vitro de diferentes ex- debido a que no pudo lograr la división celu- plantes relativamente grandes y en condicio- lar. Los medios de cultivo que empleaba no nes de cultivo adecuadas, puede inducirse la incluían reguladores del crecimiento debido a formación de nuevos órganos de manera direc- que esos compuestos eran aún desconocidos. ta, sin la formación de callo. Si la formación es Los avances en el cultivo de tejidos vegetales de brotes, raíces o flores se denominaorgano - fueron muy lentos en sus inicios. En 1934, Whi- génesis directa. Si en cambio se induce la for- te pudo mantener, en forma ilimitada, el creci- mación de embriones somáticos, este proceso miento de raíces en medios líquidos a partir de se denominará embriogénesis directa (Figs. 1 y ápices de tomate. Al mismo tiempo se identi- 3). Si por el contrario, a partir de la siembra de ficó el ácido indol acético (AIA), que posibilitó un explante in vitro se observa la proliferación el mantenimiento indefinido de callos de za- de células en forma desordenada y sin ninguna nahoria y tabaco in vitro. Posteriormente se función predeterminada, se iniciará la produc- descubrió el efecto de la leche de coco como ción de callos o suspensiones celulares (Figs. estimulante de la formación de callo sobre el 2 A y 3). La diferenciación de órganos a partir cultivo de embriones de Datura stramonium. de callos, denominada morfogénesis indirecta, En 1948 Skoog y Tsui, trabajando con cultivos estará condicionada a la previa formación de de callo de tabaco, demostraron la existencia los meristemoides. Morfogénesis directa o in- de una regulación química en la parte aérea y directa fueron términos propuestos por Hicks en la raíz. Trabajos posteriores en callos de la en1980. misma especie, con el agregado de cinetina, la primera citocinina descubierta, permitieron 3.- Histología de la morfogénesis demostrar que la diferenciación de brotes, raí- ces o de ambos, era regulada por el balance de Después de 48 horas de realizada la siembra auxinas/citocininas. del explante en el medio de cultivo adecuado,

26 Biotecnología y Mejoramiento Vegetal II Figura 1: A-F embriogénesis somática obtenida por cultivo in vitro. A-C-E, embriogénesis somática en di- ferentes fases de crecimiento observada en Codiaeum variegatum (L) Blume cultivado en MS + 1 mg l-1 de BAP. B-D-F, embriogénesis somática obtenida en diversos cultivares de Prunus sp a partir de embriones zigóticos inmaduros cultivados en MS + 0,1 mg l-1 de ANA + 1 mg l-1 de Kin con una previa inducción en MS + 2 mg l-1 de 2,4-D. Las reglillas representan 5 mm.

a partir de una célula epidérmica o del mesófilo renciación de los nuevos órganos. Este tipo de foliar, como ocurre en las coníferas, se suce- meristema puede iniciarse en forma directa, a den una serie de divisiones mitóticas. Así se partir de células diferenciadas pertenecientes a pueden observar, a través del estudio histológi- un explante cultivado in vitro, o indirectamente, co, pequeñas masas de células que contienen a partir de una célula o grupo de células dife- citoplasma denso y grandes nucleolos. Este renciadas que promueven la proliferación celu- conjunto de células, agrupadas a modo de es- lar (Fig 4 A). Su evolución determinará el cre- feras, fueron denominadas meristemoides por cimiento de un órgano, por ejemplo una yema Torrey en 1966, y son responsables de la dife- adventicia (Fig 4 B).

Biotecnología y Mejoramiento Vegetal II 27 Figura 2: A-E Organogénesis somática obtenida por cultivo in vitro. A, callo organogénico obtenido en Abelia sp. (André) Rehder cultivada en MS + 1 mg l-1 de picloran. B, Inicio de brotes (flechas) en hojas crecidas in vitro de “Crimson Gold” (Prunus persica L.) cultivadas en MS + 0,1 mg l-1 de ANA + 1 mg l-1 de Kin. C, Brotes de Gerbera jamesonii Bolus obtenidos a partir del cultivo de capítulos florales en MS 0,05 -1 -1 -1 mg l de IBA + 0.75 mg l de BAP + 0,1 mg l de GA3. D, brotes florecidos in vitro de Abelia sp. (André) Rehder cultivados en MS + 1 mg l-1 de BAP. E, raíces (flechas) crecidas de callo deAbelia sp. (André) Re- hder cultivadas en inducidas en MS + 1 mg l-1 de 2iP, previamente inducidas con 1 mg l-1 de picloran. Las reglillas representan 5 mm

Las células embriogénicas son similares a las po de células embriogénicas, el desarrollo de células meristemáticas debido a que no son las mismas no está sincronizado. Estas células demasiado voluminosas, tienen gran cantidad son capaces de dividirse o de transformarse de ribosomas, citoplasma denso, un nucleolo en embriones según las condiciones del medio agrandado y pequeños granos de almidón. Es- de cultivo. Aquellas células que no desarrollan tas células, que en general se agrupan, pueden proembriones comienzan el proceso de dife- variar en tamaño y número. Dentro de un gru- renciación, es decir se vacuolizan, disminuye

28 Biotecnología y Mejoramiento Vegetal II el volumen de núcleo y nucleolo y desaparecen noso, sufre divisiones polarizadas formando un los gránulos de almidón. embrión globular. Previo a esta polarización se Las experiencias demuestran que las células deposita almidón, luego se forma la epidermis embriogénicas se desarrollan sólo cuando se y adquiere simetría bilateral. Sucesivamente se modifican las condiciones de cultivo. En gene- observa el crecimiento de uno o más cotiledo- ral, cuando se reducen las cantidades de auxi- nes, el desarrollo de los tejidos provasculares, na y citocinina o se elimina la auxina. la iniciación de los ápices radicales y de tallo y Las células embriogénicas desarrollan como una progresiva acumulación de almidón, lípidos embriones cuando las condiciones experimen- y proteínas. tales permiten que estas expresen su poten- En el caso de un origen multicelular de los em- cial. Pueden ocurrir dos condiciones ontogé- briones somáticos pueden observarse diversos nicas diferentes, es decir que el origen de los patrones. Los embriones somáticos se forman embriones sea unicelular o pluricelular. a partir de grupos de células epidérmicas y En el caso de iniciarse a partir de una célula, la subepidérmicas (Fig 4 C). Este tipo de ontoge- misma se aísla de las demás por una importan- nia de origen multicelular se llama comúnmente te modificación en su pared celular, en particu- budding o embriogénesis adventicia. Estas cé- lar por la gelificación de la laminilla media. Esta lulas pequeñas tienen una alta relación núcleo/ célula, rodeada por un polisacárido mucilagi- citoplasma, citoplasma denso y un nucleolo vo- luminoso que se tiñe fuerte- mente. Se diferencian de las células embriogénicas por la falta de sustancias de reser- va, por su delgada pared ce- lular y su frecuente división celular. Estas estructuras se denominan proembriones globulares (Fig 1 A, B). En una etapa posterior desarro- llan una epidermis, un tejido provascular, acumulan mate- rial de reserva y se polarizan. Estas estructuras globulares desarrollan cotiledones y se transforman en embriones somáticos que presentan ápices caulinar y radicular. Para una misma especie puede ocurrir uno u otro tipo de inicio según las condicio- nes de cultivo. El desarrollo de un embrión somático de origen unicelular es compa- rable a la de un embrión ci- gótico. En dicotiledóneas, la etapa globular es seguida Fig. 3: Esquema de los diferentes procesos morfogénicos obtenidos por una etapa corazón que a partir de la siembra in vitro de diferentes explantes. Las líneas con- se corresponde con la adqui- tinuas expresan organogénesis o embriogénesis directa mientras que sición de la simetría bilateral: las líneas quebradas indican que la morfogénesis se obtiene por vía desarrollo de la epidermis, indirecta.

Biotecnología y Mejoramiento Vegetal II 29 Figura 4: A-E Cortes histológicos de diferentes explantes cultivados in vitro. A, meristemoides (flechas) observados en cultivo de Silybum marianum L. en MS + 1 mg l-1 de AIA + 5 mg l-1 de BAP 10 x. B, yemas adventicias (flechas) en ápices deFragaria x ananassa Duch. cultivados en Boxus + 0,1 mg l-1 de IBA + 0.5 -1 -1 mg l de BAP + 0,1 mg l de GA3 4 x. C, grupo de células embriogénicas (flechas) enCodiaeum variegatum (L) Blume cultivados en 1 mg l-1 de tidiazurón. 20 x. D, embriones somáticos en Codiaeum variegatum (L) Blume cultivados en 1 mg l-1 de tidiazurón 10 x. E, embriogénesis secundaria en Codiaeum variegatum (L) Blume cultivados en 1 mg l-1 de tidiazurón 10 x.

de los estratos procambiales y de manera su- la raíz y al procambium en respuesta a la elon- cesiva el desarrollo del ápice radical. El ápice gación axial del embrión somático debido al de tallo se desarrolla más tarde, durante la eta- transporte de auxinas (Fig 1 C). pa cotiledonar. En los embriones somáticos de Los embriones de origen multicelular obtenidos algunas especies hay una etapa intermedia en- por budding muestran la misma ontogenia que tre la globular y corazón llamada oblonga, que los cigóticos, como así también la producción corresponde a la individualización del ápice de de sustancias de reserva.

30 Biotecnología y Mejoramiento Vegetal II Sin el seguimiento histológico detallado, la for- nos. Por esta causa, no es posible generalizar mación del embrión somático sólo puede ser metodologías o protocolos de trabajo debido a confirmada por la germinación (Fig 1 F). Sin que los medios de cultivo, así como las condi- embargo, debido al bajo porcentaje de embrio- ciones de cultivo seleccionados, deben ser es- nes que llegan a esta etapa, esta tarea es casi pecíficos para cada situación en particular. Un imprescindible para una correcta evaluación de ejemplo de ello es el protocolo empleado por las respuestas encontradas con los diversos Stamp and Meredith en diferentes cultivares de medios de cultivo empleados. Vitis vinifera. En cuatro de ellos fue posible la Comparados con los embriones cigóticos de la obtención de embriones somáticos a partir de misma especie, los embriones somáticos fre- embriones cigóticos, pero estos resultados no cuentemente desarrollan de manera anormal se repitieron con el cultivar "Pinot Noir". o son inmaduros. La anomalía más frecuente- mente encontrada es la formación doble o tri- 4.2.- Varios son los compuestos químicos que ple del sistema vascular, causada por la pobre influyen en los patrones morfogénicos in vitro polarización del transporte de auxinas. También dentro de los cuales podemos considerar: se puede encontrar un contenido excesivamen- 4.2.1.- la composición salina del medio de culti- te alto, reducido o ausente de las reservas de vo. La composición salina más empleada para almidón y/o proteicas, que el meristema apical o inducir la formación de callo, la organogénesis radical no estén desarrollados o que la embrio- directa o indirecta en la mayoría de las espe- génesis sea repetitiva o secundaria (Fig 4 E). cies vegetales, es la de Murashige & Skoog La falta del meristema apical o una escasa (1962) (MS). Sin embargo, existen otras formu- deposición de sustancias lipoproteicas en los laciones diseñadas para inducir determinados embriones somáticos de algunas especies no patrones morfogénicos. Existe además una es- debe ser tomada como una anormalía. Esto trecha relación entre la composición hormonal puede ser un síntoma de inmadurez debido del explante y la concentración de reguladores a la rápida formación de los mismos. En este del crecimiento agregada al medio de cultivo. caso una etapa intermedia que permita la ma- 4.2.2.- reguladores del crecimiento. Estos duración de las estructuras formadas permitirá compuestos pueden promover la morfogénesis incrementar el porcentaje de embriones somá- aún cuando la concentración salina no sea la ticos capaces de germinar. adecuada. En condiciones óptimas de cultivo pueden aumentar significativamente la dife- 4.- Factores que afectan los procesos renciación de órganos. Para la inducción de morfogénicos embriones somáticos en muchas especies ve- getales es necesario el agregado de auxinas, Los cuatro principales factores que condicio- como ocurre en Tilia spp. Sin embargo para nan la obtención y el crecimiento de nuevos otras, como es el caso del crotón (Codiaeum órganos in vitro son: variegatum), es suficiente con el agregado de thidiazurón. El genotipo y el tipo y concentra- 4.1.- el genotipo ción de reguladores del crecimiento empleados 4.2.- las condiciones químicas seleccionadas están estrechamente relacionados. para realizar el cultivo. 4.2.3.- antibióticos. En procesos de transfor- 4.3.- las condiciones físicas seleccionadas mación con Agrobacterium tumefaciens es para realizar el cultivo. muy común el agregado de antibióticos del tipo 4.4.- el explante. cefotaxime; kanamicina y carbenicilina para la eliminación de la bacteria. En explantes de 4.1.- El genotipo es un factor determinante en hoja de diferentes cultivares de Malus domes- todos los procesos morfogénicos, desde la ca- tica se encontró que 250 mg L–1 de cefotaxime pacidad del explante para su establecimiento en aumentan significativamente la regeneración condiciones in vitro a la proliferación de callo, o de brotes mientras que 500 mg L–1 de carbe- la diferenciación y crecimiento de nuevos órga- nicilina promueven la formación de callo y la

Biotecnología y Mejoramiento Vegetal II 31 kanamicina inhibe los procesos morfogénicos. dicionada por el tipo y tamaño del envase selec- 4.2.4.- carbón activado. En general se usa para cionado para el cultivo, así como también por el adsorber compuestos tóxicos de la micro atmós- sistema de cobertura del mismo. Las tapas usa- fera gaseosa o el exceso de reguladores del cre- das en cultivo in vitro varían desde el tapón de cimiento presentes en el medio de cultivo pero algodón; papel de aluminio; película de resinite E.K. Pettersson y su equipo de colaboradores de transparente o tapas rígidas de polipropileno. El la Swedish University of Agriculture, demostraron intercambio gaseoso es diferente para cada tipo que puede promover la embriogénesis somática de tapa, en consecuencia la atmósfera interna debido a la incorporación de ciertos compuestos también sufrirá variaciones. al medio de cultivo por difusión. En condiciones in vivo la atmósfera contiene 78 4.2.5.- agar. Otro aspecto importante a tener en % de nitrógeno; 21 % de oxígeno y 0,035 % de cuenta es la consistencia del medio de cultivo. dióxido de carbono. En cultivos in vitro se han Puede emplearse como semi-sólido o líquido. El registrado además, etileno y otros compuestos agente gelificante más utilizado en el cultivo in hidrocarbonados. vitro es el agar, extraído de diversas algas ma- El nivel de oxígeno disponible para el explante rinas. Las diferentes calidades existentes en el condiciona el crecimiento y los procesos morfo- mercado modifican la expresión morfogénica génicos. En general se necesita una buena airea- debido a que pueden contener sustancias inhi- ción para obtener cualquier tipo de proceso mor- bitorias o promotoras del crecimiento. Tal es el fogénico. En alfalfa se puede obtener un buen caso del cultivo de hojas de Actinidia chilensis incremento de material a partir de suspensiones (en medio de MS con el agregado de 0,1 mg/L de celulares embriogénicas cuando la solución se AIA + 1 mg/L de BAP) cuya respuesta morfogéni- satura con 70% de oxígeno. Por el contrario, una ca varió según el tipo de agar utilizado. Cuando tensión de oxígeno del 5 % estimula la produc- el gelificante empleado fue Chubut-agar, de pro- ción de plantas a partir de anteras de tabaco. ducción nacional, se observó una gran diferen- La concentración de dióxido de carbono (CO2) en ciación de yemas adventicias, mientras que con la atmósfera gaseosa in vitro varía según la res- el agregado de agar SIGMA R sólo se indujo la piración y la actividad fotosintética de las plantas. proliferación de callo. En condiciones de oscuridad, el CO2 incrementa En caso de seleccionar medios de cultivo líqui- mientras que en condiciones de luz, disminuye. dos, la respuesta morfogénica observada varía En trabajos realizados con Ficus lyrata se han de manera considerable. El cultivo líquido es im- encontrado concentraciones variables, entre 0,5 prescindible cuando se busca promover la mor- % y 8,5 %, según el tipo de sello o tapa emplea- fogénesis indirecta a través de suspensiones ce- dos. Concentraciones superiores al 1 %, que son lulares. Para ello es necesario cultivar los callos generalmente tóxicas en condiciones in vivo, pro- en medio líquido con agitación para permitir que bablemente no fueron limitantes para la actividad las células se disgreguen y puedan diferenciar fotosintética. raíces, brotes o embriones somáticos en forma La presencia de etileno en condiciones in vitro aislada. promueve diversas respuestas. Su acumulación La elección de un medio de cultivo líquido o tiene efectos inhibitorios sobre el cultivo de cé- sólido depende, además, de la especie con la lulas, callos y anteras, La cantidad de etileno que se trabaja. En Cymbidium, por ejemplo, se producida in vitro varía con la especie, el tipo de ha observado que el empleo de medio líquido explante, la concentración de citocininas en el promueve una mayor diferenciación de proto- medio de cultivo, el tipo de agar utilizado y con la cormos respecto del mismo gelificado. A su vez, luz. Una forma de incorporar etileno al envase de este proceso puede mantenerse durante varios cultivo es a través de la esterilización del material subcultivos, mientras que en medio de cultivo ge- de disección realizada con el material embebido lificado se observó que los protocormos tienden en alcohol y flameado con mechero Bunsen. En a formar tallos. muchos casos el etileno actúa como promotor de 4.2.6.- atmósfera gaseosa. Es un factor determi- la morfogénesis pero luego es inhibitorio del cre- nante en los procesos morfogénicos y esta con- cimiento de los órganos diferenciados

32 Biotecnología y Mejoramiento Vegetal II 4.3.- Entre las condiciones físicas podemos men- cultivadas en un mismo medio de cultivo, según cionar los efectos de la temperatura, la humedad la porción de la lámina utilizada (Pedroso y Pais, relativa y la luz. 1993). Estos investigadores cultivaron estas ho- 4.3.1.- La temperatura de incubación de los cul- jas in vitro durante seis semanas previa inmersión tivos es un factor importante a tener en cuenta. del explante en una solución de IBA (1 mg l–1) du- Si bien en condiciones naturales las plantas ex- rante 20 minutos (Fig 5). perimentan diferencias térmicas durante el día y la noche, las temperaturas in vitro se mantienen casi estables. Es importante señalar que cuanto más se asemejen las condiciones in vitro a las óptimas de crecimiento de la especie estudiada, mayor será la respuesta obtenida. En cultivos de hojas de Streptocarpus x hybridus sometidos a diferentes temperaturas se observó que la rege- neración mayor de brotes se producía a 12 ºC mientras que por encima de los 30 ºC, práctica- mente no se observó diferenciación. 4.3.2.- La humedad relativa (HR), como medida de la cantidad de vapor de agua contenida en la atmósfera gaseosa, es otro de los parámetros físicos a tener en cuenta. La HR dependerá del Figura. 5: Esquema de las diferentes respuestas sello o cobertura del envase empleado. Si este morfogénicas obtenidas después de seis semanas cierre es hermético, la humedad interior será del de cultivo in vitro de hojas de Camellia japonica L. 100 %. Si en cambio existe la posibilidad de un según la porción de la lámina. 1, callo organogéni- co. 2 embriogénesis somática directa. 3, regenera- intercambio gaseoso la humedad interna pue- ción directa de raíces. 4, callo organogénico. de descender a niveles cercanos al 50 %. Este importante descenso de la HR puede promover una pérdida veloz de agua del medio de cultivo variando la concentración de sus compuestos Lecturas recomendadas hasta llegar a niveles tóxicos (Debergh, comuni- cación personal). Buddendorf-Joosten J.M.C. and Woltering E.J. 4.3.3.- La luz suministrada a los cultivos debe 1994. Components of the gaseous environment ser evaluada en cuanto a la calidad, intensidad and their effects on plant growth and develop- y período de suministro. La respuesta morfogé- ment in vitro. Plant Growth Regulation 15: 1-16. nica de un explante puede variar según si se le De Klerk G.J., Arnholdt-Schmitt B., Lieberei R. and proporciona luz o no. Para estimular la formación Neumann K.H. 1997. Regeneration of roots, shoots and embryos: physiological, biochemical de callo, es común que se prefiera la oscuridad. and molecular aspects. Biologia Plantarum 39 El suministro de luz favorece la diferenciación de (1): 53-66. órganos. George E. 1993. Plant propagation by tissue culture Part 1 The technology. Butler and Tanner Ltd 4.4.- Tal como ya se señaló anteriormente, los (ed). Gran Bretaña. 1361pp. proceso morfogénicos dependen del genotipo, Hicks G.S. 1980. Patterns of organ development in pero a esto debe sumarse el efecto del explante plant tissue culture and the problem of organ de- seleccionado. El tratamiento de la planta madre, termination. Bot. Rev. 46: 1-23. las condiciones físicas y fisiológicas en las que Williams E.G. and Maheswaran G. 1986. Somatic ésta se encuentre y el sector del cual se tome embryogenic factors influencing coordinated be- havior of cells as an embryogenic group. Ann. el explante determinarán a su vez la respuesta Bot. 57: 443-597. morfogénica en condiciones in vitro. Un ejemplo muy interesante es la diferente respuesta morfo- génica observada en hojas de Camellia japonica

Biotecnología y Mejoramiento Vegetal II 33 I - CAPÍTULO 3 mosómico). Esta caracterización se realiza en metafase mitótica debido a que, en esta fase, los cromosomas han alcanzado su máxi- La citogenética molecular e inmu- mo grado de condensación y sus límites están nocitogenética en el estudio de perfectamente definidos. Para este análisis ge- los genomas vegetales neralmente se emplean tejidos meristemáticos porque presentan un alto índice mitótico (i.e. Guillermo Seijo; Graciela I. Lavia; la razón entre el número de células en división Germán Robledo; Aveliano Fernández; y el número total de células observadas). Los Viviana G. Solís Neffa órganos (ápices radicales o caulinares, óvulos, etc.) son pre-tratados con diversas sustancias 1 Introducción que inhiben la formación del huso mitótico (col- chicina, 8-hidroxiquinoleína, paclosol, etc.) a La comprensión de la organización de los los efectos de acumular metafases, dispersar genomas lograda a través del análisis citoge- los cromosomas en el citoplasma y producir nético ha tenido un gran impacto en la evalua- una mayor condensación de los mismos. Los ción y utilización de la biodiversidad, así como materiales se fijan y luego se tiñen con colo- en el mejoramiento genético y la ingeniería ge- rantes nucleares (fucsina básica, orceína, car- nética, en particular, desde el desarrollo de las mín, giemsa, etc.). Finalmente, se confeccio- técnicas de citogenética molecular. El empleo nan los preparados por macerado y aplastado sondas de ADN y de anticuerpos conjugados (“squash”) del material sobre un portaobjetos. con fluorocromos en un número creciente de Con estos métodos de tinción, los cromoso- especies vegetales ha permitido, entre otros lo- mas metafásicos observados con un micros- gros, la localización de secuencias específicas, copio óptico aparecen uniformemente teñidos, la identificación de cromosomas particulares, el excepto en el centrómero (constricción pri- estudio del origen y la estructura de los geno- maria) y en algunas constricciones menores mas de híbridos y poliploides, la comparación (secundarias). de regiones genómicas homólogas, el estudio Mediante la observación microscópica se del comportamiento cromosómico y el análisis determina el número cromosómico somáti- de la expresión génica. Por ello, las técnicas de co (2n) y, a través del análisis de microfotogra- hibridación in situ (ISH) e inmunocitogenética fías o dibujos de metafases con cromosomas constituyen actualmente herramientas indis- bien definidos y separados (Fig. 1A), se esta- pensables para la comprensión de la organiza- blecen los cariotipos. Para ello, se analiza la ción y la expresión del genoma de las plantas. morfología de los cromosomas determinando En este capítulo se describen, en primera la posición del centrómero y la longitud de instancia, algunos de los criterios empleados los brazos corto (bc) y largo (bl), así como tradicionalmente para la caracterización cario- la longitud total (lt) de cada cromosoma. A típica y, posteriormente, se presentan los prin- partir de estas medidas, se calcula el índice cipios y las aplicaciones de diferentes técnicas centromérico [IC = (bc / lt) × 100], según el de hibridación in situ de ácidos nucleicos y de cual los cromosomas se clasifican en cuatro ti- inmunodetección de modificaciones epigenéti- pos morfológicos: metacéntricos (m, IC = 50 - cas de nucleótidos e histonas. 37,5), submetacéntricos (sm, IC = 37,5 - 25), subtelocéntricos (st, IC = 25-12,5), acrocén- 2 Citogenética clásica tricos (t, IC = 12,5 - 0) y telocéntricos (T, IC = 0). Otro aspecto a considerar para caracte- La caracterización cromosómica de espe- rizar morfológicamente a los cromosomas es cies o variedades de plantas se inicia con la la presencia y la posición de las constricciones descripción del cariotipo a través del análisis secundarias, así como la presencia y el tipo del número, el tamaño y la forma de los cro- de satélites. En general, las primeras corres- mosomas que presentan (complemento cro- ponden a regiones organizadoras de los nu-

34 Biotecnología y Mejoramiento Vegetal II cleolos (NORs) y los últimos a las porciones tricos) y, dentro de cada tipo, según su tamaño cromosómicas distales delimitadas por la cons- (de mayor a menor) ubicando los centrómeros tricción secundaria y el telómero de los brazos alineados a una misma altura y los brazos cor- que los portan. Los cromosomas que presen- tos hacia arriba. En las plantas diploides (Fig. tan satélites se denominan cromosomas SAT 1C y E) y alopoliploides, el cariotipo se com- (Fig. 1A, E y F). pone de pares de cromosomas homólogos; Para la confección del cariotipo los cromo- mientras que en las autopoliploides (Fig. 1D y somas del complemento se ordenan según su F) se compone de grupos de tres o más cro- morfología (de metacéntricos a submetacéntri- mosomas de acuerdo con el nivel de ploidía. cos, subtelocéntricos, acrocéntricos y telocén- El orden que ocupa en el cariotipo cada par o

FIGURA 1. A-D: Metafases mitóticas teñidas con coloración de Feulgen. A: Lathyrus macropus, 2n = 2x = 14, las flechas señalan los satélites de los cromosomas SAT.B : argentinensis [citada en Fernández y Daviña (1991) como Fortunatia biflora], 2n = 2x = 30, con un cariotipo asimétrico. C y D: Turnera sidoides subsp. pinnatifida, C: citotipo diploide, 2n = 2x = 14 y D: citotipo tetraploide, 2n = 4x = 28. E-F: Idiogramas de los citotipos diploide y tetraploide de Turnera sidoides subsp. pinnatifia ilustrados en C y D, respectiva- mente. En gris se representan los satélites de los cromosomas SAT. La barra representa 10 micras en A y B, 5 micras en C y D y 2,5 micras en E y F.

Biotecnología y Mejoramiento Vegetal II 35 grupo de cromosomas se indica mediante un (Fig. 2A). Además, pueden utilizarse diversos número y, mediante una letra, el tipo cromosó- fluorocromos que tienen la capacidad de inter- mico al que pertenece de acuerdo a su morfo- calarse preferentemente en regiones del ADN logía. La representación gráfica del cariotipo se con una composición de bases particular. Por denomina idiograma (Fig. 1E y F). La compo- ejemplo, las regiones ricas en adenina y timina sición de un complemento cromosómico tam- son reveladas con DAPI (4',6-diamidino-2-feni- bién se puede expresar mediante una fórmula lindol diclorhidrato) o quinacrina, mientras que cariotípica, en la que se indica el número de las ricas en guanina y citosina lo son con CMA3 cada tipo morfológico de cromosomas que pre- (cromomicina A3). Las bandas pueden ser de senta el material analizado (ej. 16 m + 10 sm tamaño e intensidad diferentes y presentar una + 2 st + 2 t). Entre los parámetros cuantitativos distribución particular sobre los cromosomas más utilizados para caracterizar los cariotipos de un complemento generando un patrón de se encuentra el grado de asimetría que pre- bandeo característico (Fig. 2B). Estas técnicas sentan los mismos. Para ello, se emplean ca- de bandeo cromosómico han permitido, en tegorías o índices de asimetría cromosómi- muchos casos, la identificación inequívoca de ca que consideran las diferencias de tamaño cromosomas homólogos, la caracterización de entre los cromosomas del cariotipo (asimetría genomas así como el seguimiento de cromo- intercromosómica), y las diferencias morfoló- somas o bloques cromosómicos en híbridos y gicas de los cromosomas derivadas de la pro- líneas de introgresión. porción entre sus brazos (asimetría intracro- La diferenciación lineal de los cromosomas mosómica). Un cariotipo simétrico es aquel por técnicas de bandeo no siempre es eviden- cuyos cromosomas son aproximadamente del te en todos los grupos de plantas y, aún en mismo tamaño y en su mayoría metacéntricos, aquellas especies que presentan buenos pa- mientras que uno asimétrico es aquel que trones de bandas, a menudo no se cuenta con presenta cromosomas de diferentes tamaños un número significativo de marcadores como y predominantemente submetacéntricos, acro- para integrar los mapas de ligamiento con los céntricos o telocéntricos (Fig. 1B). La informa- mapas físicos. La posibilidad de posicionar se- ción obtenida a partir del análisis de los cario- cuencias particulares sobre los cromosomas y, tipos permite identificar cromosomas, clasificar de esta forma, generar un gran número de mar- los cariotipos, realizar análisis comparativos cadores cromosómicos ha sido posible gracias entre grupos de especies más o menos rela- al desarrollo de las técnicas de hibridación in cionadas e inferir sus tendencias evolutivas. situ, cuyo uso se ha generalizado a partir del Asimismo, permite detectar las anomalías nu- desarrollo de sistemas de marcado y de detec- méricas y estructurales en los complementos ción de sondas no radiactivas. cromosómicos de células o individuos. En numerosos grupos de plantas, la identi- 3 Hibridación in situ fluorescente (FISH) ficación de los diferentes pares de homólogos del cariotipo puede resultar engorrosa debido Esta técnica se basa en reacciones de re- a que presentan cromosomas con morfología conocimiento y asociación de bases entre un muy similar. En estos casos, la aplicación de segmento del ADN cromosómico (secuen- determinados tratamientos en combinación cia blanco) y una secuencia complementaria con diferentes tipos de tinción, puede revelar marcada (sonda). La misma se aplica a pre- regiones cromosómicas con condensación o paraciones de células somáticas o germinales, composición cromatínica diferencial (bandas), previamente incubadas con enzimas (celulasa, generando marcadores cromosómicos adicio- pectinasa y citohelicasa) que remueven las nales. Así, el tratamiento de los cromosomas paredes celulares. Las preparaciones son tra- con un álcali y la posterior tinción con Giemsa tadas con ARNasa A para evitar hibridaciones revela regiones de heterocromatina consti- inespecíficas de la sonda con ARNs y, poste- tutiva, mientras que la impregnación argénti- riormente, son permeabilizadas mediante la ca (bandeo Ag-NOR) revela las NORs activas incubación con proteasas. Las sondas pueden

36 Biotecnología y Mejoramiento Vegetal II ser marcadas con nucleótidos unidos a hapte- Desde el desarrollo inicial de la técnica de nos (digoxigenina, biotina, etc.) o a fluorocro- FISH, se han mejorado sustancialmente tanto mos (Cy3, Cy5, etc.) por la reacción en cadena la sensibilidad (i.e. el tamaño mínimo de una de la polimerasa (PCR), por una transferasa secuencia que puede ser detectada bajo el mi- terminal o por medio de la actividad exonu- croscopio) como el poder de resolución es- cleotídica y de la subsiguiente polimerización pacial (i.e. la distancia física mínima a la que realizadas por la ADN pol I a partir de escisio- dos secuencias pueden ser identificadas como nes simples causadas por una ADNasa (nick independientes). Bajo condiciones óptimas de translation). La sonda marcada, componiendo hibridación y de detección, la sensibilidad de una mezcla de hibridación que contiene forma- esta técnica depende de la accesibilidad de mida y ADN bloqueante (entre otros compo- la sonda a la región complementaria sobre el nentes) es colocada sobre las preparaciones ADN. La misma, a su vez, está determinada cromosómicas, para luego realizar una desna- por el grado de condensación de la cromati- turalización conjunta del ADN de los cromoso- na. El éxito de FISH se debe a las indudables mas y de la sonda, a temperaturas que varían ventajas que ofrece frente a las técnicas clási- entre 70 ºC y 90 ºC durante unos 10 minutos. cas para identificar homologías y, sobre todo, a Posteriormente, los preparados son incubados la posibilidad de contar con una amplia batería a 37 ºC durante al menos 1 hora (normalmente de sondas disponibles de acuerdo con la na- toda la noche) a fin de inducir la hibridación. turaleza de la secuencia blanco que se quiera En este paso, la sonda y la secuencia cromo- detectar. sómica complementaria al blanco compiten en- En general, se pueden utilizar sondas de tre sí, pero debido a la alta concentración de ADN de copia única, moderadamente repe- la primera y a su menor tamaño, bajo condi- titivo o altamente repetitivo. Las secuencias ciones óptimas, la sonda hibrida en todos los repetitivas pueden ser conservadas o varia- sitios complementarios a lo largo de los cro- bles y estar dispuestas en tándem (i.e. una co- mosomas. En el caso de las sondas marcadas pia está seguida de otra en arreglos de decenas con haptenos, la detección de los sitios de hi- a miles de copias formando un locus definido) bridación se realiza mediante una o dos rondas o dispersas (i.e. las repeticiones pueden estar de anticuerpos conjugados con fluorocromos. dispuestas a lo largo de una región cromosómi- Los preparados se analizan con microscopios ca, de algunos cromosomas o de todo el com- de epifluorecencia utilizando filtros específicos plemento). Entre las secuencias repetitivas, las para cada fluorocromo, registrando la presen- sondas de los genes ribosomales (ADNr) 45S cia, el tamaño y el número de señales fluo- y 5S son las empleadas con mayor frecuencia rescentes por complemento. Normalmente, para la generación de marcadores cromosómi- se obtiene una microfotografía monocromática cos por FISH. Esto es debido a que son se- por cada sonda utilizada y una del complemen- cuencias altamente conservadas y a que pre- to cromosómico teñido con DAPI o ioduro de sentan una disposición en tándem que facilita la propidio. Estas microfotografías son super- detección de los loci. Los mismos pueden estar puestas e integradas en una sola imagen. El presentes en más de un sitio por complemen- posicionamiento relativo de las señales con to cromosómico, proporcionando marcadores respecto al centrómero, los telómeros u otros útiles para la identificación de cromosomas y marcadores cromosómicos permite mapear para realizar comparaciones cariotípicas (Fig. con precisión cada sonda sobre el complemen- 2C). Otra de las sondas de secuencias conser- to cromosómico y representarlas en un idiogra- vadas y repetidas en tándem que se emplean ma. A diferencia de la citogenética clásica, la habitualmente en experimentos de FISH son identificación de cromosomas o de segmentos las teloméricas (Fig. 2D). Las mismas son cromosómicos particulares usando sondas de utilizadas tanto para establecer con precisión FISH es independiente de la morfología cromo- los límites cromosómicos como para revelar in- sómica y, por lo tanto, es posible reconocerlos versiones que comprenden los segmentos cro- en diferentes estados del ciclo celular. mosómicos distales y la ocurrencia de fusiones

Biotecnología y Mejoramiento Vegetal II 37 cromosómicas. Las sondas de secuencias no mosómicos; mientras que las de secuencias conservadas repetidas en tándem son muy repetidas dispersas lo son para definir regio- útiles para el desarrollo de marcadores especí- nes cromosómicas o genomios, en particular, ficos de cromosomas y de complementos cro- para identificar los genomas parentales en los

FIGURA 2. A: Bandeo Ag-NOR en una metafase de Arachis hypogaea donde se identifican las regiones organizadoras del nucleolo en marrón oscuro (flechas). B: bandeo con quinacrina que distingue las regio- nes heterocromáticas ricas en AT (en amarillo intenso) de las regiones eucromaticas (amarillo pálido) en los cromosomas prometafásicos de Oziroe argentinensis. C: FISH doble en una metafase de A. batizocoi en donde se localizan los genes ribosomales 5S (en verde) y 45S (en rojo), la contratinción realizada con DAPI diferencia bandas heterocromáticas centroméricas ricas en AT (en blanco) de las porciones cromo- sómicas eucromáticas (en azul). D: FISH que revela las regiones teloméricas (verde) de A. hypogaea. E: FISH que revela la distribución preferencial de un retroelemento en el genoma A de A. hypogaea. F: GISH doble sobre una metafase de A. hypogaea utilizando como sondas ADN genómico de A. ipaensis (rojo) y de A. duranensis (verde) que demuestra la constitución alopoliploide del cultígeno y las especies diploides progenitoras más probables. G y H: ARN-FISH en antera y ovario de Paspalum notatum utilizando como sonda un ARN marcado de expresión diferencial y tejido-específica en plantas apomícticas pero no sexua- les. La intensidad del color violeta indica cantidades relativas del ARN analizado presente en los diferentes tejidos de plantas apomícticas. La barra representa 5 micras en A, C-F, 10 micras en B, 200 micras en G y 100 micras en H.

38 Biotecnología y Mejoramiento Vegetal II híbridos interespecíficos y en los alopoliploi- genómico total y no por un fragmento de ADN des (Fig. 2E). Ambos tipos de secuencias re- de secuencia conocida. El ADN utilizado para petidas pueden mostrar diferencias notorias en construir estas sondas es extraído mediante los motivos que las componen, así como en su protocolos estándares y luego es marcado por abundancia y distribución, aún entre especies nick translation o por amplificaciones al azar estrechamente emparentadas. El análisis del usando cebadores cortos (random priming). conjunto de las secuencias repetitivas consti- El éxito de GISH depende del grado de dife- tuye una herramienta excelente, en sí misma o renciación que presenten los genomios que se como complemento de otras técnicas, para la pretende analizar. Por lo general, las secuen- identificación de cromosomas y genomios, el cias codificantes de los genomas de dos es- estudio de la arquitectura nuclear y los análisis pecies más o menos relacionadas no varían filogenéticos. También nos permiten realizar substancialmente entre sí, por lo tanto, la hi- estudios detallados de aberraciones cromosó- bridación diferencial de las sondas en GISH micas estructurales y numéricas, hacer infe- está determinada principalmente por el grado rencias sobre los mecanismos involucrados en de divergencia del componente repetitivo de la evolución cromosómica y realizar el segui- los genomas en cuestión. En la medida en que miento de cromosomas o regiones particulares los dos genomas presenten más secuencias en las sucesivas generaciones de los progra- en común, mayor será la dificultad para distin- mas de mejoramiento. Las sondas de secuen- guirlos. Una estrategia para mejorar la capaci- cias únicas hibridan con el ADN cromosómico dad discriminante de esta técnica consiste en correspondiente a un locus específico. A dife- realizar un GISH simple utilizando ADN de un rencia de las secuencias repetidas que pueden genoma marcado (sonda) junto con una deter- ser localizadas fácilmente por FISH, la detec- minada proporción de ADN sin marcar del ge- ción de las secuencias únicas es más laboriosa noma que no se va a detectar (sonda fría). En debido a que, por lo general, las regiones codi- cambio, cuando la diferencia entre las secuen- ficantes de los genes presentan longitudes me- cias de los genomas considerados es alta se nores que las detectables por FISH convencio- puede utilizar GISH doble o triple, colocando nal (10 kb). El empleo de grandes bloques de sobre el preparado mezclas equimolares de las ADN genómico clonado en vectores, como los sondas marcadas diferencialmente para cada cromosomas artificiales de bacteriasBACs ( ), uno de los genomas que se quiere distinguir en en combinación con FISH (BAC-FISH), cons- una metafase. Las regiones cromosómicas que tituye un método efectivo para el mapeo físico hibridan con una sola sonda se visualizan con de secuencias únicas de ADN. Sin embargo, el el color original del fluorocromo, mientras que ADN repetitivo presente en las regiones no co- las que presentan complementariedad con dos dificantes de los insertos muchas veces genera o más sondas presentan colores intermedios. patrones de señales dispersas o inespecíficas Entre las diferentes aplicaciones de GISH, (background). A pesar de esta dificultad, hasta se destaca el estudio de la composición ge- el momento, BAC-FISH constituye una de las nómica de los alopoliploides y de los híbri- mejores técnicas para correlacionar los mapas dos naturales o artificiales. En estos casos, genéticos con los físicos, ya que se pueden de- la técnica se basa en la hibridación del ADN sarrollar sondas específicas para cada cromo- genómico marcado de los probables ancestros soma o locus en particular. o progenitores sobre las preparaciones cromo- sómicas del material en estudio. La hibridación 4 Hibridación in situ genómica (GISH) diferencial de las sondas con sólo un subgrupo de cromosomas en una metafase constituye Esta técnica se utiliza para identificar los di- una clara evidencia de que el material estudia- ferentes genomios presentes en un organismo do está compuesto por diferentes genomios. híbrido o alopoliploide. Aunque aplica todos los Mediante el empleo de GISH se han deter- principios de FISH, difiere de ésta porque las minado los progenitores probables de algunas sondas que utiliza están constituidas por ADN especies alopoliploides cultivadas como el ta-

Biotecnología y Mejoramiento Vegetal II 39 baco, la avena, el trigo y el maní (Fig. 2F). Otra 5 Mapeo por amplificación directa de se- de las ventajas de analizar los híbridos y los cuencias de interés por PCR in situ (PRINS) alopoliploides con GISH doble o múltiple, con- siste en la capacidad que ofrece esta técnica La técnica de PRINS (“primed in situ”) es para detectar translocaciones intergenó- considerada como una alternativa a ISH para micas, las que pueden pasar inadvertidas la detección de ciertos tipos de secuencias con los métodos convencionales de aná- de ácidos nucleicos. Esta técnica involucra la lisis genómico. Aplicado a células meióti- extensión de cebadores diseñados para las cas, GISH proporciona un método preciso secuencias blanco por medio de la Taq poli- para el análisis de los apareamientos cro- merasa. Durante la extensión, se incorporan mosómicos que ocurren en los genomas nucleótidos marcados con fluorocromos o híbridos. El estudio de la capacidad de los haptenos a fin de permitir la localización física cromosomas de aparearse en meiosis es el de las secuencias en forma directa o indirecta procedimiento utilizado tradicionalmente mediante protocolos adicionales de detección. para establecer las relaciones genómicas Comparada con FISH convencional, PRINS entre diferentes especies. Sin embargo, ofrece algunas ventajas tales como: 1) el em- en muchas configuraciones metafásicas pleo de cebadores diseñados a partir de un mí- resulta difícil distinguir los apareamientos nimo de información de la secuencia blanco, 2) ocurridos entre cromosomas homólogos dichos cebadores pueden hibridar con secuen- de aquellos ocurridos entre cromosomas cias de ADN más fácil y rápidamente que las homeólogos (i.e. parcialmente homólogos). sondas (de mayor tamaño) usadas en FISH, Mediante GISH es posible “pintar” los cro- aún en cromatina compacta, 3) no requiere el mosomas y, de este modo, determinar el marcado de sondas y 4) los cebadores pueden origen genómico de los cromosomas apa- ser extendidos aún dentro de las secuencias reados y no apareados, tanto en profase adyacentes (a diferencia de FISH que depende como en metafase de la meiosis I. La técnica de una secuencia específica), reforzando la in- de GISH también constituye una herramienta tensidad de la señal para una secuencia corta. irreemplazable para el desarrollo de progra- Mediante PRINS se han localizado secuencias mas de mejoramiento vegetal que involucran repetitivas en tándem (secuencias teloméricas, hibridaciones interespecíficas o intergenéricas elementos móviles y ADNr) en cromosomas de ya que permite: 1) confirmar el origen híbrido leguminosas (Vicia faba y Pisum sativum) y de de la progenie, 2) determinar el origen de los gramíneas (Hordeum vulgare, Avena sativa y cromosomas en las distintas generaciones, Lolium multiflorum). Todos los loci encontrados en particular, cuando los híbridos F muestran 1 fueron coincidentes con los hallados por FISH. inestabilidad cromosómica tal como la elimi- Los resultados demuestran que la técnica de nación cromosómica uniparental, 3) identificar PRINS es apropiada para la localización rá- bivalentes interparentales en la meiosis de los pida de repeticiones en tándem sobre cromo- híbridos F sexuales y 4) comprobar si los cro- 1 somas vegetales cuando la distancia entre los mosomas recombinantes son transmitidos a las siguientes generaciones. Esta técnica también cebadores es pequeña (1 kb) y los blancos son ha sido utilizada para detectar regiones croma- largos (100 – 500 kb). Sin embargo, no se ob- tínicas introgresantes, especialmente aquellas tienen buenas señales cuando las secuencias que portan caracteres agronómicos de interés. repetidas están muy separadas entre sí, como Un ejemplo de ello es el análisis de una línea ocurre con el gen de la vicilina. Este gen está élite de cebada introgresada con Hordeum bul- repetido muchas veces en el genoma de Vicia bosum resistente a roya. Mediante una combi- faba, pero cada copia está separada por una nación de GISH y FISH se pudo determinar la distancia mayor de 12 kb. En estos casos, el localización de los fragmentos cromosómicos empleo de FISH resulta más adecuado dado de H. bulbosum introgresados en el comple- que se obtienen mejores señales. Por otra par- mento cromosómico de cebada que le confe- te, PRINS no ha presentado ventajas con res- rían dicha resistencia. pecto a FISH convencional para la detección

40 Biotecnología y Mejoramiento Vegetal II de secuencias simples en la mayoría de los características hacen que los cromosomas pa- casos, aún utilizando PRINS cíclico que invo- quiténicos constituyan el material de elección lucra de 5 a 10 ciclos de amplificación. Una de para los estudios de FISH de alta resolución, las mayores desventajas de PRINS es el alto en particular, para identificar secuencias blan- grado de aparición de señales inespecíficas, co de alrededor de 10 kb y resolver dos loci probablemente debido a la incorporación de separados por menos de 100 kb. nucleótidos marcados en los extremos 3´OH Por otra parte, la técnica de FISH sobre libres que resultan de roturas espontáneas de cromosomas mitóticos extendidos utiliza los cromosomas durante el procesamiento del cromosomas metafásicos seleccionados por material. Estas incorporaciones indeseables citometría de flujo a partir de meristemas ra- pueden disminuirse mediante el tratamiento dicales sincronizados. El estiramiento de los con ligasa o incorporando 2´, 3´ - didesoxinu- cromosomas se realiza mediante una digestión cleótidos (ddNTP) antes de PRINS. moderada con proteinasa K, antes de la fija- En síntesis, esta técnica es útil para la de- ción con etanol-ácido acético (3:1). Mediante tección rápida de repeticiones en tándem gran- este procedimiento, se pueden obtener cromo- des, pero no constituye una alternativa a FISH somas con una longitud de 10 a 100 veces ma- para la detección de genes de copia simple o yor que la original. Esto permite aumentar la re- para el pintado de los cromosomas en plantas solución de los arreglos de secuencias génicas mediante el uso de un cóctel de cebadores y repetidas sobre los cromosomas, sin perder cromosoma-específicos. la información sobre la orientación relativa con respecto al centrómero y los telómeros. Esta 6 FISH de alta resolución técnica posee una resolución similar a la que utiliza cromosomas paquiténicos y es muy útil Bajo este concepto se agrupan una serie de en aquellas especies en las que la obtención técnicas que, utilizando los mismos principios de buenos preparados meióticos es dificultosa de FISH convencional, permiten hacer hibri- o en aquellas que poseen cromosomas paqui- daciones sobre cromosomas profásicos o aún ténicos difíciles de resolver. sobre núcleos interfásicos. Estas estrategias - esta técni- permiten aumentar tanto la resolución como la FISH en núcleos interfásicos: ca se aplica a núcleos en cortes de tejidos así sensibilidad de la detección. como a núcleos aislados, y permite incremen- tar tanto la sensibilidad como la resolución de - FISH sobre cromosomas poco conden- FISH. sados: consiste en el análisis de cromosomas Para el análisis de los núcleos en tejidos, meióticos en paquitene o de cromosomas mi- los órganos de la planta se fijan con formalde- tóticos extendidos. hído o glutaraldehído (este último en baja pro- La técnica de cromosomas paquiténicos porción ya que puede inducir autofluorescen- se aplica a células madres del polen fijadas en cia), luego se cortan con micrótomo y los cortes etanol : ácido acético (3:1) y tratadas con una se montan directamente sobre un portaobjetos. mezcla de enzimas (celulasa, pectiolasa y cito- Debido a que la sonda necesita penetrar en el helicasa) que digieren la calosa de las paredes tejido para alcanzar el interior del núcleo, se celulares. En general, los cromosomas paqui- realizan diversos pre-tratamientos tendientes ténicos vegetales son de 7 a 40 veces más a incrementar la permeabilidad de los tejidos largos que aquellos de metafases mitóticas, y, además, se emplean como sondas frag- están compuestos por cuatro hebras de ADN mentos marcados cuyo tamaño no supera los (iguales en los homocigotos), son más acce- 100-500 pb. El análisis de las hibridaciones se sibles a las sondas (debido a que tienen una realiza con un microscopio confocal, debido a estructura cromatínica menos condensada) y que este tipo de microscopio permite visuali- presentan marcadores cromosómicos particu- zar las estructuras mediante la reconstrucción lares (bloques heterocromáticos y knobs) que tridimensional de las secciones ópticas de la permiten individualizarlos con facilidad. Estas muestra.

Biotecnología y Mejoramiento Vegetal II 41 Para el análisis de núcleos aislados, los rondas de amplificación con anticuerpos para tejidos se disgregan en un buffer de estabiliza- obtener una buena intensidad de las señales. ción apropiado y la fracción de interés se ob- La principal ventaja de fiber-FISH frente a FISH tiene por centrifugación y tamizado en mallas en núcleos interfásicos es que se logra una con diferentes diámetros de poro. Los núcleos mayor sensibilidad (200 pb) y una resolución aislados se colocan directamente sobre un por- a nivel genómico de 1 kb. Esta técnica es de taobjetos y se secan al aire y deshidratan en gran utilidad para analizar clones solapantes, serie alcohólica. Este procedimiento, que tam- detectar rearreglos cromosómicos pequeños, bién puede ser aplicado a suspensiones celu- determinar distancias físicas entre genes y su lares, no presenta mayores problemas de per- orientación, medir tamaños de loci y acelerar meabilidad para las sondas. Las regiones de el clonado posicional. Sin embargo, su utilidad hibridación de las sondas sobre las secuencias para el mapeo de secuencias es limitada de- de copia simple se observan como señales in- bido a que sólo permite establecer posiciones dividuales dentro del núcleo (dos señales en relativas, perdiendo la orientación real de las los núcleos diploides), cada una de ellas co- sondas con respecto al centrómero y a los teló- rrespondiente a cada uno de los cromosomas meros. Una variante de esta técnica es el em- homólogos. pleo de cromatina estirada, un procedimiento Mediante estas técnicas también se ha es- que involucra la extensión de las fibras croma- tudiado la organización y la disposición de los tínicas sin remover las proteínas, la que resulta centrómeros, de los telómeros y de los cro- muy útil para examinar las interacciones ADN- mosomas en núcleos interfásicos de diferen- proteínas. tes órganos y tejidos de trigo, arroz, tabaco y Arabidopsis thaliana. En particular, las mismas 7 Mapas cromosómicos resultan muy útiles para el análisis de los cam- bios que se producen durante el ciclo celular Estos mapas constituyen una herramienta en las diferentes estructuras cromosómicas fundamental para integrar los mapas físicos dependientes de secuencias. También se em- (basados en el ordenamiento de secuencias y plean para el mapeo de secuencias separadas el armado de contiguos) y los mapas genéti- por distancias menores a 500-1000 kb, ya que cos (derivados de los análisis de ligamiento). en los cromosomas metafásicos las señales de Los mapas cromosómicos permiten posicionar las sondas separadas por estas distancias se genes y/o marcadores ligados a éstos, con superponen. respecto a marcadores estructurales propios de los cromosomas (por ejemplo, centrómeros, - FISH en fibras de ADN extendidas (fiber- telómeros, bandas heterocromáticas y cons- FISH): se basa en la hibridación de las sondas tricciones secundarias) o a otros marcadores sobre fibras extendidas de ADN. Esta técnica cromosómicos desarrollados por FISH. Esta involucra los siguientes pasos: 1) se aíslan los integración facilita el mapeo y el aislamiento de núcleos por medio de mallas de nylon de di- genes particulares por métodos convenciona- ferentes diámetros de poro, 2) se deposita un les y son indispensables para el aislamiento de pequeño volumen de la suspensión de núcleos secuencias por microdisección y microclonado. en uno de los extremos de un portaobjetos tra- Para el clonado posicional de secuencias es tado con poli-L-lisina (este compuesto reduce importante tener una estimación precisa de la al mínimo la aparición de señales inespecíficas razón kb/cM existente en la región del locus y favorece la extensión de las fibras de ADN), de interés. Esto posibilita la conversión de las 3) se agrega un buffer de lisis y se realiza la distancias genéticas establecidas entre los extensión usando un cubreobjetos de manera marcadores y el gen en estudio en distancias similar a como se hace un frotis de sangre, y físicas. En general, se ha observado que la dis- 4) sobre estos extendidos se realizan las hibri- tancia entre loci en los mapas genéticos (y no daciones siguiendo el protocolo convencional el orden) puede diferir mucho de la distancia de FISH. Normalmente, se realizan dos o tres establecida en los mapas físicos. Los estudios

42 Biotecnología y Mejoramiento Vegetal II de los nódulos de recombinación en complejos detectar está poco representado en las mues- sinaptonémicos han revelado que la discrepan- tras, se pueden utilizar protocolos que amplifi- cia entre los mapas físicos y genéticos es el can la señal mediante el precipitado enzimáti- resultado de la distribución no al azar de los co de tiramida sobre los sitios blancos (TSA, eventos de crossing-over a lo largo de los cro- Tyramide Signal Amplification). La aplicación mosomas. En este marco, el desarrollo de los de TSA en los protocolos estándares de ISH, mapas cromosómicos ha cobrado importancia consiste en una detección inicial de la sonda debido a que, dependiendo de las regiones marcada con anticuerpos o estreptavidina con- cromosómicas que se analicen y a la frecuen- jugados con una peroxidasa (por ejemplo la cia de recombinación propia de cada una, los de rábano picante, horseradish peroxidase o mapas genéticos pueden ser mejores o peores HRP). Posteriormente, se agrega al preparado estimadores de las distancias físicas reales. tiramida conjugada con algún hapteno o fluoro- Por tal motivo, en varias especies modelo se cromo, la cual es precipitada masivamente por ha puesto especial énfasis en el desarrollo de la HRP y unida en forma covalente al sitio de marcadores cromosómicos por las técnicas de detección inicial. El sistema resultante es de- ISH (principalmente BAC-FISH, y Fiber FISH) tectado mediante anticuerpos conjugados con para poder integrar los grupos de ligamiento fosfatasas alcalinas (para detecciones cromo- genético con cromosomas, y para relacionar génicas estándares) o directamente con mi- las estimaciones de distancia por recombina- croscopía de epifluorescencia. Debido a que la ción con la distancia física real (Ver capítulo de tiramida adicionada sólo se deposita en las re- Genómica). giones próximas a la enzima, se logra aumen- tar significativamente la sensibilidad sin perder 8 Análisis de la expresión génica en teji- resolución. La principal limitante de ARN-ISH dos por ARN-ISH radica en que, generalmente, se puede anali- zar una sola sonda por cada hibridación. No Los protocolos de ISH de ARN resultan apro- obstante, esta técnica se ha utilizado para piados para describir los patrones temporales y comparar los niveles y sitios de expresión de espaciales de expresión de un determinado gen secuencias en numerosas especies de plan- a nivel celular o subcelular. En los organismos tas. Uno ejemplo de ello, es el análisis espacial multicelulares, ISH constituye un complemento de transcritos expresados diferencialmente en de los análisis de northern blotting, RT-PCR y plantas con reproducción sexual y apomícticas microarrays, en los que la extracción de ARN de Paspalum notatum (Fig 2 G y H). de los tejidos resulta invariablemente en la pér- dida de información espacial. Asimismo, si bien 9 FISH cuantitativo para estimar la expre- los microarrays constituyen una de las técnicas sión génica (QUISH) más poderosas para analizar la expresión de muchos genes simultáneamente, con frecuen- A diferencia de la técnica de ARN-FISH, que cia los resultados que se obtienen deben ser utiliza anticuerpos sobre cortes de tejidos para verificados por métodos independientes tales la detección de la expresión génica, QUISH como ISH. El análisis de la expresión génica se basa en la hibridación de oligonucleótidos por ISH generalmente se efectúa sobre cortes gen-específicos marcados con fluorocromos de tejido, aunque también puede realizarse so- directamente sobre porciones de tejidos u ór- bre órganos enteros (“whole-mount ISH”, ISH- ganos enteros, combinada con el análisis de WISH). La técnica se basa en la utilización de secciones ópticas realizadas con un microsco- una sonda (generalmente cDNA) marcada con pio láser confocal de barrido. De este modo, haptenos que se hibridará directamente sobre se logra mejorar notablemente la calidad de los los cortes de tejido. Las detecciones se reali- resultados debido a que se eliminan los pasos zan con anticuerpos conjugados con fosfata- que generan artefactos e impiden realizar una sas alcalinas o con fluorocromos. cuantificación precisa. La característica clave Para aquellos casos en los que el ARNm a de QUISH es la cuantificación de la expresión

Biotecnología y Mejoramiento Vegetal II 43 génica utilizando como estándar a los genes de giada para realizar estudios de este tipo ya que mantenimiento celular (genes “housekeeping”, permite unir estructuras nucleares con carac- GAPDH y 18S ARNr). El empleo de este es- terísticas bioquímicas, tales como la actividad tándar permite corregir la variación de la razón transcripcional, la replicación del ADN, las mo- citoplasma/vacuola en los diferentes tipos ce- dificaciones de las histonas y la metilación del lulares, los efectos ópticos de los tejidos y las ADN mediante la inmunodetección de distintos señales no específicas. La naturaleza cuantita- blancos celulares con anticuerpos conjugados tiva de esta técnica hace posible el análisis de con fosfatasa alcalina o con fluorocromos. La la expresión génica en órganos, a nivel tisular preparación del material, la fijación, la diges- o celular, independientemente de las diferen- tión de las paredes celulósicas, la permeabi- cias debidas a la edad o a los tipos de tejidos. lización y la incubación con anticuerpos se Este método es mas rápido que los métodos realizan de igual modo que en FISH, aunque tradicionales y puede utilizarse para estudiar la se omiten los pasos de desnaturalización e hi- localización celular de la expresión de uno o bridación. Las técnicas de inmunocitogenética varios genes en un período relativamente corto se emplean para analizar la estructura croma- de tiempo. Asimismo, con QUISH es posible in- tínica y la disposición de las diferentes molécu- vestigar los cambios en los niveles de los trans- las que intervienen en las divisiones celulares. criptos durante la ontogenia o, en respuesta a En particular, estas técnicas son útiles para cambios de las condiciones ambientales en di- estudiar la distribución de las modificaciones ferentes líneas de plantas modelo. histónicas y la metilación del ADN en relación con la estructura cromatínica en cromosomas 10 Identificación de modificaciones y núcleos durante el ciclo celular. Merecen es- cromatínicas por inmunocitogenética pecial mención aquellos análisis relacionados con las modificaciones que indican estructuras La identidad celular está determinada por cromatínicas abiertas, con potencialidad de un programa nuclear establecido por un pa- transcripción, y las que delimitan estructuras trón complejo de interacciones entre el ADN y las proteínas. La organización del ADN en cromatínicas cerradas, con actividad transcrip- la cromatina regula la expresión y el manteni- cional reprimida. El advenimiento de las técni- miento de la información genética (replicación, cas de citogenética molecular y de inmunocito- reparación, recombinación y segregación) en genética ha permitido disectar progresivamen- forma dinámica. Las colas N-terminales de te el núcleo a nivel de microscopía óptica. La las histonas que conforman el núcleo de los detección individual de complejos proteicos y nucleosomas están sujetas a diferentes modi- de secuencias de ARNs y ADN ha revelado la ficaciones pos-traduccionales (acetilación, me- existencia de muchos compartimientos nuclea- tilación, fosforilación, ubiquitinación, etc.) las res. Las variaciones en la arquitectura nuclear que, conjuntamente con la metilación del ADN, reflejan la relación existente entre la organiza- controlan el empaquetamiento de los nucleo- ción nuclear y la regulación génica. El análisis somas en arreglos de orden superior y proveen de dicha arquitectura incluye varios paráme- señales para diversos procesos celulares. tros cuantitativos y cualitativos, tales como el Aunque las histonas y sus modificaciones son tamaño y forma nuclear, el contenido relativo altamente conservadas, la distribución de las y la distribución de heterocromatina, los patro- mismas en los cromosomas puede variar a lo nes generales de modificación cromatínica, la largo de los procesos de diferenciación y del presencia de compartimientos nucleares (nu- ciclo celular, así como dentro y entre grupos cleolos, cromocentros, territorios cromosómi- de eucariotas. Recientemente, se han produci- cos y cuerpos nucleares) y la organización de do grandes avances en el esclarecimiento del los cromosomas en el núcleo (ie. la posición y llamado código de las histonas y del intrincado la orientación de los cromosomas en el núcleo) mecanismo de regulación epigenética. La cito- y las diferencias en la condensación cromatíni- genética se encuentra en una posición privile- ca a nivel local.

44 Biotecnología y Mejoramiento Vegetal II 11 Análisis de la posición de la inserción Fernández A. and Daviña J.R. 1991. Heterochroma- de los transgenes tin and genome size in Fortunatia and Camassia (Hyacinthaceae). Kew Bulletin, 46, 307-316. Diferentes ensayos han demostrado que Fransz P.F., Alonso-Blanco C., Liharska T.B., Pee- ters A.J.M., Zabel P. and Jong J.H. 1996. High- la expresión de los transgenes puede variar resolution physical mapping in Arabidopsis significativamente entre especies diploides thaliana and tomato by fluorescence in situ hy- relacionadas, entre líneas transformadas inde- bridization to extended DNA fibers. The Plant Jo- pendientes, y aún entre generaciones de las urnal, 9, 421-430. líneas trasformadas. Los niveles de expresión Küper H., Ort Seib L., Sivaguru M., Hoekenga O.A. de estas secuencias pueden ser afectados por and Kochian L.V. 2007. A method for cellular lo- diversos factores, entre ellos, la presencia de calization of gene expression via quantitative in numerosas copias de la construcción en uno situ hybridization in plants. The Plant Journal, o varios loci y el contexto genómico en que 50, 159-175. se encuentran las copias. La técnica de FISH Laspina N.V., Vega T., Seijo J.G., González A.M., Martelotto L.G., Stein J., Podio M., Ortiz J.P.A., permite mapear los trangenes en cromosomas Echenique V.C., Quarín C.L. and Pessino S.C. metafásicos, en núcleos interfásicos o en fi- 2008. Gene expression analysis at the onset bras extendidas de ADN y, a su vez, determi- of aposporous apomixis in Paspalum notatum. nar el número de loci en que se encuentran los Plant Molecular Biology, 67, 615-628. mismos. Para el mapeo se utiliza una sonda Lavia G.I., Fernández A. and Seijo J.G. 2008. Cyto- marcada correspondiente al transgen y otras genetic and molecular evidences on the evolu- sondas que permitan identificar los pares cro- tionary relationships among Arachis . In: mosómicos, un genoma o un subgenoma par- Sharma A.K. and Sharma A. (eds.). Plant Ge- ticular (en el caso de híbridos o alopoliploides). nome: Biodiversity and Evolution. Volume 1E: Uno de los ejemplos clásicos, en el cual se Phanerogam-Angiosperm. Science Publishers, Enfield, NH, USA, 2008. pp 101-134. combinaron diferentes técnicas moleculares y Moscone E.A., Matzke M.A. and Matzke A.J.M. citogenéticas para analizar los efectos del con- 1996. The use of combined FISH/GISH in con- texto genómico en la expresión de los transge- junction with DAPI counterstaining to identify nes fue realizado en tabaco. En el mismo se chromosomes containing transgene inserts in empleó FISH para mapear los trangenes sobre amphidiploid tobacco. Chromosoma, 105, 231- los cromosomas y GISH para identificar los ge- 236. nomas del alopoliploide. A partir de estos es- Robledo G., Lavia G.I. and Seijo G. 2009. Species tudios, se ha demostrado que, en general, los relations among wild Arachis species with the A transgenes con expresión estable están locali- genome as revealed by FISH mapping of rDNA zados en las proximidades de las regiones te- loci and heterochromatin detection. Theoretical and Applied Genetics, 118, 1295-1307. loméricas y ricas en genes, mientras que los de Schwarzacher T. and Heslop-Harrison P. 2000. expresión inestable se localizan en las regio- Practical in situ hybridization. BIOS Scientific nes intercalares o paracentroméricas que son Publishers, Oxford, 2000. pp. 203. más pobres en genes. Por otra parte, la combi- Seijo J.G., Lavia G.I., Fernández A., Krapovickas A., nación de FISH con técnicas de inmunocitoge- Ducasse D. and Moscone E.A. 2004. Physical nética permite analizar el contexto epigenético mapping of 5S and 18S-25S rRNA genes evi- de la cromatina circundante a los transgenes dences that Arachis duranensis and A. ipaensis y su relación con la expresión de los mismos. are the wild diploid species involved in the origin of A. hypogaea (Leguminosae). American Jour- nal of Botany, 91, 1294-1303. Lecturas / sitios recomendados Seijo J.G., Lavia G.I., Fernández A., Krapovickas A., Ducasse D., Bertioli D.J. and Moscone E.A. Bennett M.D. 1995. The development and use of ge- 2007. Genomic relationships between the culti- nomic in situ hybridization (GISH) as a new tool vated peanut (Arachis hypogaea - Leguminosae) in plant biosystematics. In: Brandham P.E. and and its close relatives revealed by double GISH. Bennett M.D. (eds.). Kew Chromosome Confe- American Journal of Botany, 94, 1963-1971. rence IV. Royal Botanic Gardens, Kew, 1995. pp Solís Neffa V.G. and Fernández A. Karyotypic stu- 167-183.

Biotecnología y Mejoramiento Vegetal II 45 dies in Turnera sidoides complex (Turneraceae, Leiocarpae). 2002. American Journal of Botany, 89, 551-558. Stein N., Ponelies N., Musket T., McMullen M. and Weber G. 1998. Chromosome micro-dissection and region-specific libraries from pachytene chromosomes of maize (Zea mays L.). The Plant Journal, 13, 281–289. Terkelsen C., Koch J., Kølvraa S., Hindkjær J., Pe- dersena S. and Bolund L. 1993. Repeated pri- med in situ labeling: formation and labeling of specific DNA sequences in chromosomes and nuclei. Cytogenetics and Genome Research, 63, 235-237.

46 Biotecnología y Mejoramiento Vegetal II I.-CAPÍTULO 4 replicación y reparación de ADN así como de la replicación de virus y plásmidos y la síntesis química de secuencias de nucleótidos. De esta Herramientas Básicas de manera, puede decirse que la tecnología del Ingeniería Genética ADN recombinante esta integrada por diversas estrategias metodológicas, muchas de las cua- Ingrid Garbus, Marisa Gómez les son adaptaciones de procesos naturales de y Viviana Echenique la genética microbiana que han sido estudia- dos y se conocen en profundidad. Introducción LA CLONACIÓN MOLECULAR O Hasta principios de los años 70, el ADN CLONACIÓN DE GENES era la molécula de la célula que planteaba más dificultades para su análisis bioquímico. La finalidad de la clonación molecular es la Excesivamente larga y químicamente monóto- obtención de un determinado fragmento de na, la secuencia de nucleótidos del DNA tan ADN, que puede corresponder a un gen, inser- solo podía ser estudiada por caminos indirectos to en un vector capaz de replicarse, pudiéndo- tales como la determinación de la secuencia de se posteriormente amplificar a varios millones proteínas, o del RNA. Actualmente, es posible de copias, por ejemplo para análisis de se- separar regiones determinadas del ADN, ob- cuencia o para obtener grandes cantidades de tener cantidades ilimitadas de esos fragmen- un producto génico. tos y determinar incluso la secuencia de esos El desarrollo de la tecnología del ADN re- nucleótidos. Estos adelantos técnicos forman combinante y la clonación molecular han apor- parte de la tecnología del ADN recombinante, tado sofisticados procedimientos que permiten de cuyo desarrollo han sido pilares fundamen- el aislamiento, purificación y replicación de tales el conocimiento de las enzimas de res- fragmentos específicos de ADN. La clonación tricción, el esclarecimiento de los procesos de de segmentos de ADN, también llamada crea- ción del ADN recombinante requiere esencialmente de las etapas que se enume- ran a continuación (Fig. 1)

1. Obtención del ADN a clonar

Según la estrategia ex- perimental involucrada, el ADN a clonar puede tener diferentes procedencias. Puede tratarse de ADN de origen genómico, de un producto de amplifica- ción por PCR, provenir de la síntesis in vitro, a partir de una retrotranscripción Figura 1. Etapas básicas en la clonación de un fragmento de ADN. En (ADNc) tomando como primer lugar el ADN a clonar y el vector (plásmido) se cortan con la mis- molde el ARNm o de la ma enzima de restricción. Luego se ponen en contacto en presencia de síntesis in vitro de secuen- la enzima ligasa para obtener una molécula de ADN recombinante que cias previamente defini- se introduce en bacterias que multiplicarán el plásmido junto con el frag- das. Cuando el material de mento de interés.

Biotecnología y Mejoramiento Vegetal II 47 partida es el ADN genómico, los fragmentos a copias idénticas. Los organismos hospeda- ser clonados deben ser escindidos mediante el dores utilizados en biología molecular deben empleo de enzimas de restricción. En algunas contener toda la maquinaria genética para la situaciones, particularmente cuando se trata amplificación del ADN recombinante. Puede de la clonación de productos de PCR, los frag- tratarse de organismos procariotas (bacterias) mentos deben ser aislados en función de su o eucariotas (levaduras, células de mamíferos tamaño. Este aislamiento se lleva a cabo a tra- cultivadas). En el caso de la utilización de sis- vés de electroforesis en geles de poliacrilamida temas bacterianos, la introducción se realiza o agarosa. valiéndose de los procesos naturales de la ge- nética microbiana o modificaciones específicas 2. Elección del vector de clonación de los mismos. De estos métodos modificados, el más ampliamente utilizado es el de transfor- Un vector de clonación es una molécula de mación en célula competente (ver vectores de ADN que vehiculizará al fragmento de interés y clonación). Otra forma de introducir el ADN en permitirá su amplificación, resultando de esta la célula hospedadora, de elección para molé- manera indispensable para la creación del culas de ADN de gran tamaño, es el proceso ADN recombinante. Uno de los principales re- de electroporación, que consiste en la creación quisitos para que una molécula de ADN pueda de poros en la membrana celular inducida por actuar como vector, es la capacidad de auto- descargas eléctricas que permiten la introduc- rreplicación que irá acompañada de la replica- ción del ADN. Los plásmidos híbridos, introdu- ción del fragmento inserto. También es nece- cidos a través de alguno de estos procesos, sario que los vectores tengan un tamaño que continuarán replicándose en la célula hospeda- permita su manipulación fuera de la célula. Los dora mientras ésta crezca y se divida, siempre más pequeños se manipulan con mayor facili- que sea mantenida la presión de selección. dad que las moléculas de ADN más grandes, que tienden a ser más frágiles. Los vectores de 5. Identificación y selección de las células clonación más utilizados derivan del genoma que contienen al ADN recombinante viral o de plásmidos bacterianos. Los compo- nentes esenciales de un vector de clonación En el esquema de transferencia del ADN re- son el origen de replicación, un gen marcador combinante al hospedador descripto anterior- responsable de alguna característica fenotípi- mente, se asume que durante la transforma- ca para la selección y al menos un sitio único ción, no todas las bacterias reciben una copia de restricción. del vector híbrido. Es necesario seleccionar aquellas células que han incorporado el vector, 3. Generación del ADN recombinante a través de la utilización de marcadores géni- cos presentes en los vectores de clonación. Los El término ADN recombinante se emplea más comúnmente empleados son los genes de para hacer referencia al material genético a resistencia a antibióticos y el fragmento funcio- clonar unido al vector de clonación. Para su nal de lac Z, el gen de E. coli que codifica para obtención es requisito contar con los dos frag- la enzima β-galactosidasa (β-gal). Estos genes mentos de ADN en forma pura, y ligarlos en- marcadores tienen insertado un sitio múltiple de zimáticamente por acción de la enzima ADN restricción (polylinker), de manera que cuando ligasa, en presencia de ATP. los fragmentos de ADN son clonados en el po- lylinker del gen lacZ, anulan la actividad de la 4. Introducción del ADN recombinante en β-galactosidasa. Esta enzima hidroliza un com- el organismo hospedador puesto químico denominado X-gal, y se libera un colorante azul relativamente insoluble. El Este proceso es realmente el verdadero X-gal se incorpora al medio de cultivo en placa evento de clonación, en el cual el ADN re- de Petri donde desarrollarán las células hospe- combinante es “clonado” para producir varias dadoras del ADN recombinante. Si el ADN clo-

48 Biotecnología y Mejoramiento Vegetal II nado se insertó en el polylinker y desactivó la al lector en las herramientas metodológicas de β-galactosidasa, no se producirá pigmento azul biología molecular más ampliamente utilizadas. y las células formarán colonias que se verán blancas en la placa de Petri. Caso contrario las 1. VECTORES DE CLONACIÓN colonias de las células hospedadoras se verán de color azul. Cuando el marcador es un gen Como hemos mencionado, un vector es una de resistencia a los antibióticos, las células se molécula de ADN a la que se unirá el fragmen- inoculan en medio agarificado que contiene el to de interés resultando en el ADN recombi- antibiótico cuya resistencia confiere el vector, nante y, debido a su capacidad de autorrepli- de manera que sólo sobrevivirán aquellas cé- cación, permitirá la amplificación del fragmento lulas que lo contienen. Luego deberá buscarse insertado. Los vectores de clonación de última específicamente aquellas células que poseen generación son muy prácticos y sencillos de el fragmento de interés. Estos dos marcadores manejar. Incluyen un sitio múltiple de clonación suelen ser utilizados en forma conjunta de ma- o sitio de restricción múltiple (“polylinker”) que nera que solo las colonias portadoras del vec- es un segmento corto de ADN con sitios de res- tor crecerán en medio con antibiótico, y, para- tricción para varias enzimas diferentes, cada lelamente, las colonias que poseen el plásmido uno de ellos único para el vector (Fig. 2). Este recombinante serán de color blanco. sitio suele formar parte del marco abierto de Una vez obtenidas las colonias recombinan- lectura (“ORF”) de un gen responsable de algu- tes los pasos a seguir incluyen la amplificación na característica fenotípica, por lo que resulta de la colonia en medio líquido con antibiótico, sencillo confirmar si tras la restricción se ha ob- purificación del plásmido a partir de la suspen- tenido el plásmido híbrido, ya que la inclusión sión de bacterias y comprobación de la presen- del inserto produce la pérdida de funcionalidad cia del inserto esperado. Para la detección del del gen mediante inactivación por inserción. inserto, pueden utilizarse diversas estrategias. Existen diferentes tipos de vectores de clo- La reacción en cadena de la polimerasa (PCR) nación, entre los que se incluyen: se puede utilizar cuando la secuencia del frag- mento clonado es conocida o para identificar la secuencia de los fragmentos clonados por A) Plásmidos: amplificación con sondas complementarias a Son moléculas de ADN circular, de doble la secuencia terminal del vector. La hibridación cadena, extracromosómicas, presentes en las molecular con una sonda específica marcada bacterias, que poseen propiedades muy útiles puede ser utilizada cuando se conoce la se- como vectores de clonación, a saber: cuencia de interés y se dispone de dicha son- 1. Pequeño tamaño que hace sean fáciles de da. En otros casos, se realiza la selección en aislar y manipular. función del tamaño del inserto, para lo que el 2. Son circulares, lo que hace que el ADN sea plásmido recombinante es digerido median- más estable durante su aislamiento químico. te enzimas de restricción y posteriormente se 3. Su replicación transcurre independiente- realiza una corrida electroforética en gel de mente del ADN nuclear en la célula bacteriana. agarosa. 4. Existen múltiples copias en la célula, de- pendiendo del plásmido y de la especie hos- HERRAMIENTAS Y PROCEDIMIENTOS pedadora puede haber de varias a numerosas IMPLICADOS. copias (por ej. 1000 a 3000 copias de pBR322 por célula). A pesar de que la obtención de ADN recom- 5. La presencia de genes de resistencia a binante pudo ser explicada a través de cinco los antibióticos que actúan como marcadores pasos sencillos, es muy amplio el conjunto de seleccionables facilita la detección y selección herramientas y metodologías experimentales de los clones que los contienen. que están involucradas en su desarrollo. El El tamaño de los insertos que se pueden clo- objetivo de esta parte del capitulo es introducir nar puede ser considerable, sin embargo si son

Biotecnología y Mejoramiento Vegetal II 49 Figura 2. Elementos genéticos que constituyen un vector de clonación. a) Sitio de restricción múltiple que consiste en un corto segmento de ADN con varios sitios de restricción, cada uno de ellos único para el vector. b) representación esquemática del plásmido pBR322 con el origen de replicación (Ori) y los genes marcadores de resistencia a tetraciclina (TETR) y ampicilina (AMPR) que contienen los sitios de restricción de BamHI y PstI, respectivamente; mayores de 10 kb, el plásmido se hace gene- tanto, cuando pBR322 es digerido con BamHI ralmente inestable. y se liga a un ADN, y luego se aíslan los clones Aunque en el ambiente natural los plásmidos transformados, aquellos transformantes que conjugativos generalmente se transfieren por posean resistencia a la tetraciclina y ampicilina contacto célula a célula, los plásmidos vecto- no portan ningún ADN clonado. Aquellas célu- res de clonación generalmente han sido modi- las que continúan siendo resistentes a la ampi- ficados a fin de evitar su transferencia por con- cilina pero sensibles a la tetraciclina, contienen jugación y así lograr su contención biológica. el plásmido con el fragmento del ADN clonado. Sin embargo, en el laboratorio es posible rea- Como la resistencia a la ampicilina y a la te- lizar la transferencia a la célula hospedadora traciclina puede determinarse independiente- por transformación, utilizando choque térmico mente en placas con agar, resulta fácil aislar en presencia de cloruro de calcio o mediante bacterias que contengan los clones deseados electroporación. y eliminar las células que no los contengan. Aunque los primeros plásmidos utilizados existían en forma natural, los vectores de clo- B) Bacteriófagos o fagos: nación actuales constituyen una generación posterior de vectores construidos in vitro, como Fago λ: se caracteriza por ser un fago es- el plásmido pBR322 (Fig. 2). En este plásmi- pecializado en la transducción (transducción do, el sitio de restricción de BamHI está dentro especializada) por lo tanto este fago puede uti- del gen de resistencia a la tetraciclina, y el sitio lizarse también como vector de clonación para para PstI está dentro del gen de resistencia a la ampicilina. Si se inserta un fragmento de un la recombinación in vitro. Es un vector de clo- ADN en uno de estos sitios, la resistencia al an- nación particularmente útil porque: tibiótico conferida por el gen que contiene este 1. Se conoce bien su estructura, genética molecular y funcionamiento sitio se pierde (inactivación por inserción). Por

50 Biotecnología y Mejoramiento Vegetal II Puede insertar mayor cantidad de ADN que coli y la capacidad de empaquetamiento in vitro la mayoría de los plásmidos (entre 10 y 20 kb) del cromosoma de λ y contienen el origen de El ADN puede ser eficientemente empaque- replicación y los genes de resistencia a los anti- tado in vitro dentro de las partículas del fago bióticos de su plásmido parental. Cos proviene Las partículas del fago son mucho más efi- de sitio cohesivo (“cohesive site”) en referen- cientes en la infección de las células hospeda- cia a la terminal de simple cadena de 12 bases doras (transfección) que la transformación. complementaria en el cromosoma de λ madu- El fago λ tiene un mapa genético comple- ro. El sitio cos es reconocido por el sistema jo. El tercio central del cromosoma, que con- de empaquetamiento de ADN de λ, haciendo tiene genes requeridos para la lisogenia pero cortes escalonados que originan los extremos no para el ciclo lítico, puede ser escindido por cohesivos complementarios en el cromosoma restricción y substituido por ADN foráneo (Fig maduro del fago. La principal ventaja de los 3a). El ADN recombinante resultante puede ser cósmidos como vectores es su habilidad para empaquetado en las cabezas del fago in vitro, insertar fragmentos de ADN de 35 a 45 kb. pudiéndolas el fago inyectar en E. coli, que se replica produciendo colonias bacterianas que D) Fásmidos (fagémidos): contienen los fragmentos a clonar. Dado que el fago λ silvestre tiene excesiva Son vectores híbridos entre el fago M 13 y cantidad de sitios de restricción, no es indica- el plásmido pBR323 que contienen los oríge- do como vector de clonación por lo que se han nes de replicación de ambos. Normalmente la construido fagos λ modificados (Charon), en replicación depende del plásmido, pero cuando los cuales los sitios de restricción no deseados una célula que contiene un fásmido se infecta han sido modificados con un fago de tipo salvaje, el origen del fago Fago M13 es un fago filamentoso que con- es responsable de la replicación y se generan tiene ADN monocatenario y se replica sin ma- copias monocatenarias. Este ADN monocate- tar a su hospedador. Sin embargo, para po- nario es empaquetado en viriones y puede ais- der usar M13 para la clonación es necesario larse fácilmente y ser utilizado para secuenciar. disponer de una forma bicatenaria ya que las Habitualmente los fásmidos pueden transportar enzimas de restricción sólo trabajan sobre de forma estable un fragmento de ADN clonado ADN bicatenario. El ADN bicatenario de M13 mayor que un vector típico derivado de M13. puede obtenerse de células infectadas, donde se encuentra en forma replicativa bicatenaria. E) Cromosomas artificiales: La mayor parte del genoma del tipo silvestre contiene información genética esencial para A partir de la creación de proyectos de se- la replicación. Sin embargo existe una peque- cuenciación de genomas completos se gesta ña región, llamada secuencia intergénica, que la necesidad de obtener vectores que alber- puede ser utilizada como sitio de clonación. guen porciones de ADN de mayor tamaño para Es posible clonar ADN de longitudes variables efectuar el análisis genómico y obtener mapas hasta 5kb sin afectar la viabilidad del fago. El físicos de cromosomas. El primer sistema de ADN monocatenario de M13 y de sus vectores clonado de grandes fragmentos de ADN fue derivados, ha sido extremadamente útil para informado en 1987 por Burke y colaborado- secuenciar ADN. res, los cromosomas artificiales de levaduras Tanto en el fago λ como el M13 se ha inser- (YACs), minicromosomas con la capacidad de tado como marcador el gen lacZ. contener insertos de ADN de 200-500 kbp (Fig. 3b). Los YACs son vectores de DNA lineares C) Cósmidos: que contienen los elementos esenciales de los cromosomas de la levadura, como por ejemplo Son híbridos entre plásmidos y el fago λ y el origen de replicación ARS (Autonomously combinan las ventajas de ambos como vecto- Replicating Sequence). Introducidos en la cé- res. Poseen la habilidad del plásmido para re- lula de levadura, los YACs se replican y segre- plicarse autónomamente en las células de E. gan junto con el complemento cromosómico

Biotecnología y Mejoramiento Vegetal II 51 Figura 3. Vectores de clonación. Se muestran los elementos genéticos que constituyen los vectores de clonación. a) Fago lambda. El cromosoma se organiza de acuerdo con las proteínas codificadas por los genes: C&C: cabeza y cola, genes de proteínas de la cápside, de unión cabeza-cola y de estabilización y empaquetamiento de ADN, rec: genes de recombinación, proteínas para la integración y escisión del ADN del fago en el cromosoma de la bacteria hospedadora, reg: genes regulatorios, para el cambio entre los distintos ciclos del fago, rep: región de replicación, con el origen de replicación y los genes O y P, lisis: genes que posibilitan la lisis celular, b) Cromosoma artificial de levadura (YAC). ARS: origen de replicación, CEN: centrómero, TEL: telómeros, URA: gen marcador seleccionable para el desarrollo en medio con ura- cilo. Amp: gen marcador seleccionable en medio con ampicilina. El ADN es clonado en el sitio BamHI. C) Cromosoma artificial de bacterias (BAC). Deriva del factor bacteriano F. Su esqueleto contiene regiones esenciales que le otorgan estabilidad y bajo número de copias en cada bacteria, parA, parB y parC. oriS: origen de replicación unidireccional. CMr: gen marcador seleccionable en medio con cloranfenicol, repE: gen de proteína autoregulatoria esencial para la replicación desde oriS. pBeloBAC11, el vector BAC mas utilizado, tiene tres sitios únicos de clonado, HindIII, BamHI y SphI dentro del gen marcador lacZ.

habitual. El marcador seleccionable suele ser junto con la falta de familiaridad en el manejo un gen de tipo silvestre que le confiere la ca- de levaduras entre biólogos moleculares, limi- pacidad prototrófica a la célula hospedadora. taron el uso de los YACs. Para superar estas El mas comúnmente utilizado es URA3+, que dificultades fueron desarrollados los cromo- confiere a las auxótrofos URA3- la capacidad somas artificiales de bacterias (BACs) consti- de desarrollarse en un medio de cultivo sin ura- tuyen un sistema de clonación que mantiene cilo. Durante la meiosis los YACs se aparean un bajo número de copias en cada bacteria, con cualquier YAC homólogo presente, resul- garantizando una recombinación mínima entre tando en una alta frecuencia de recombina- diferentes fragmentos de ADN y son de sencilla ción entre los fragmentos clonados. Esta alta manipulación. Los BACs se basan en el plás- frecuencia de quimerismo lleva a predicciones mido F de 7kb de E. coli y pueden llevar inser- inexactas en los mapas físicos moleculares y, tos de 300 kb aunque el promedio es de 100

52 Biotecnología y Mejoramiento Vegetal II kb (Fig. 3c). Contienen como elementos esen- la de ADN y ser transformadas se denominan ciales una copia del origen de replicación de E. competentes. Estas células secretan el factor coli, un marcador de selección que suele ser de competencia, que es una pequeña proteína un gen de resistencia a antibióticos y un siste- que induce la síntesis de otras 8 a 10 nuevas ma de recombinación sitio-especifico (cre-lox), proteínas requeridas para la transformación. cuyo rol consiste en forzar la circularización de La transformación es un proceso que ocurre grandes insertos. Los cromosomas artificiales sólo en algunas especies bacterianas. derivados del fago P1 (PACs) permiten la clo- nación de fragmentos de 80-100 Kpb y, al igual Transducción: se refiere a la transferen- que los BACs, presentan bajo grado de qui- cia del ADN de una célula a otra por medio de merismo. El fago P1 se replica primero como un fago, denominación utilizada para los virus plásmido de bajo número de copias y luego cuando se trata de hospedadores bacterianos. como un largo segmento de ADN compuesto Esta transferencia de genes puede ocurrir de por múltiples copias de la secuencia repetida dos maneras: (concatemero), que es empaquetado en la ca- a) transducción generalizada: una frac- beza del fago por un mecanismo similar al del ción del ADN celular, que puede proceder del fago lambda. Las propiedades de los clones cromosoma o del plásmido del hospedador, PAC permiten la iniciación de empaquetamien- durante el ensamblaje del virus pasa a formar to en las etapas de clonación, escisión de las parte del ADN de la partícula vírica madura, re- secuencias de alto número de copias después emplazado el genoma del fago. Una vez que de la infección bacteriana y la inducción de la son liberados, estos fagos anormales pueden replicación inmediatamente antes la amplifica- pegarse a otras células y donar ADN, pero no ción del ADN. Utilizan al igual que los BACs el dan lugar a lisogenia ni a lisis dado que no pue- sistema cre-lox. den replicarse independientemente por carecer de gran parte del ADN fágico. Si los genes del Introducción del vector en la célula donador no sufren recombinación homóloga hospedadora con el cromosoma de la bacteria de la célula receptora se perderán. En el caso de la utilización de sistemas bac- b) transducción especializada (restringi- terianos, la introducción del vector en la célula da): ocurre sólo en algunos virus atempera- hospedadora se realiza valiéndose de los me- dos, es decir, aquellos que se integran en el canismos naturales de la genética microbiana genoma como parte de su ciclo biológico. En dado que en los procariotas existen mecanis- este mecanismo el ADN de una región especí- mos de intercambio genético, que permiten fica del cromosoma del hospedador se integra tanto la transferencia de genes como la recom- directamente en el genoma del fago, reempla- binación del inserto, a través de uno de los si- zando algunos de sus genes. El genoma fági- guientes procesos genéticos: co recombinante puede empaquetarse segui- damente en una cabeza de fago y el resto del Transformación: es un proceso por cual fago puede ensamblarse normalmente. Este el ADN libre del medio ambiente se incorpora fago puede carecer de la capacidad de repli- en una célula receptora, trayendo aparejado car, no obstante puede inyectar su ADN, que un cambio genético. Una cadena de este ADN contiene además algunos genes de la célula libre, llamado donador, es captada y puede receptora a una nueva célula receptora. Pue- transformar genéticamente la célula receptora de también ocurrir recombinación homóloga, por recombinación con una región homóloga sin embargo, como el ADN donador bacteria- del cromosoma. El movimiento de las molécu- no está formando parte del genoma de un fago las de ADN a través de la membrana y den- atemperado se presentan dos posibilidades: tro del citoplasma de la célula receptora es un que el ADN se integre en el cromosoma del proceso activo, que requiere energía. Las cé- hospedador durante la lisogenización, o que el lulas que son capaces de tomar una molécu- ADN se replique en el receptor como parte de

Biotecnología y Mejoramiento Vegetal II 53 una infección lítica. En ambos casos, la partí- (generalmente) seis nucleótidos de la molécula cula vírica transductora es normalmente defec- hospedadora. (Estas secuencias terminales de tiva como virus, ya que los genes víricos han simple cadena se denominan secuencias aco- sido reemplazados. Si bien no todos los fagos plantes). El transposón escindido se circulariza tienen la capacidad de transducir, ni todas las entonces como resultado del apareamiento de bacterias son transducibles, el fenómeno está entre las secuencias acoplantes. Parece pro- lo suficientemente extendido como para asu- bable que sólo se transfiera una simple cadena mir que desempeña un importante papel en las al receptor, y que la cadena complementaria se transferencias genéticas que se producen en sintetice, en el receptor, antes de la inserción. la naturaleza. Las estrategias de introducción de vectores en células hospedadoras utilizadas en las téc- Conjugación: mecanismo de transferencia nicas in vitro del ADN recombinante, han sido genética mediada por un plásmido que requiere desarrolladas en base a modificaciones de es- contacto de célula a célula. Ciertos plásmidos y tos procesos naturales de transferencia de ma- transposones conjugativos confieren a sus cé- terial genético en procariotas. lulas hospedadoras la capacidad de transferir ADN a otras células por conjugación. La conju- 2. ENZIMAS UTILIZADAS EN LA gación requiere una célula donadora, que con- GENERACIÓN DE ADN RECOMBINANTE tiene un tipo particular de plásmido conjugativo, y una célula receptora que carece de él. El pro- El requisito primordial para la clonación ceso de conjugación, presenta características de un gen o segmento de ADN de interés es diferenciales según se trate de bacterias Gram poder contar con dicho fragmento en forma positivas o Gram negativas. En el primer caso, individual, aislado desde su entorno génico. las células receptoras secretan un péptido de Para ello, la tecnología del ADN recombinan- pequeño tamaño que provoca que la célula do- te cuenta con una herramienta indispensa- nadora sintetice un componente adhesivo en la ble, las endonucleasas de restricción. Estas superficie celular. El ADN plasmídico es pos- enzimas reconocen secuencias específicas teriormente transferido desde el donador a la de ADN de 4 a 8 bases de extensión y es- célula receptora adherida. Estos cruzamientos cinden los enlaces fosfodiéster del material pueden tener lugar en medios líquidos. En el genético en dichos sitios, denominados sitios segundo caso, el plásmido codifica, entre otras de restricción. Para actuar como sustrato de proteínas, las subunidades de la proteína del estas enzimas, el ADN debe hallarse como pelo sexual, mediante el cual se realiza el con- doble hebra. tacto. El pelo constituye un puente de conjuga- Son extraídas de organismos procarióti- ción a través del cual pasa el ADN permitiendo cos, donde actúan como un mecanismo de el apareamiento específico. Durante la conju- defensa para degradar material genético gación, pueden resultar movilizados otros ele- extraño que entra en la célula, proveniente principalmente de fagos. Para diferenciar el mentos genéticos, como grandes bloques del ADN propio del extraño, las bacterias tienen cromosoma del hospedador u otros plásmidos. la capacidad de metilar su propio ADN inme- diatamente después de la replicación, ha- Transposición conjugativa: es una con- ciéndolo de este modo irreconocible por las jugación independiente del plásmido, un tipo endonucleasas. de conjugación facilitada por un transposón Las endonucleasas se nombran en relación conjugativo, que pueden encontrarse tanto en a las bacterias de las que fueron aisladas por el cromosoma como en los plásmidos. El con- primera vez, considerando que la primera le- tacto entre las bacterias donadora y receptora tra representa el género de la bacteria, las induce la escisión del transposón en el dona- próximas dos indican la especie, una cuarta dor: en cada extremo del transposón (integra- letra indica la cepa, y un número al final indi- do), se producen un par de cortes alternos de ca el orden en que fue identificada la enzima modo que al escindirse una de las cadenas en en esa cepa. Según este criterio, la enzima cada extremo del transposón porta con ella EcoRI, representa a la primer endonucleasa

54 Biotecnología y Mejoramiento Vegetal II Figura 4. Corte del ADN por enzimas de restricción. Reconocimiento y escisión de secuencias palindró- micas originando: a) extremos cohesivos o b) extremos romos. En este caso puede utilizarse la enzima transferasa terminal para la incorporación de extremos cohesivos. c) reconocimiento y corte de secuencias no palindrómicas. Las flechas indican los sitios de corte mientras que las secuencias reconocidas se se- ñalan en negrita.

aislada en el género Escherichia, especie Las escisiones realizadas por las endo- coli, cepa RV 13. Se utiliza el término isoqui- nucleasas de tipo II, pueden resultar en zómeros para las enzimas que reconocen la extremos romos o cohesivos. En el primer misma secuencia de ADN pero han sido ob- caso, se producen cortes escalonados tenidas de diferentes especies de bacterias. que crean colas cortas de cuatro bases de Pueden diferenciarse tres tipos de enzi- cadena simple en cada extremo del frag- mas de restricción. Las de tipo I y III escin- mento. Estas colas tienden a asociarse den en sitios alejados de la secuencia de re- con una cadena complementaria por apa- conocimiento, requiriendo de ATP para reali- reamiento de bases (Fig. 4a), a secuen- zar el traslado del sitio de reconocimiento al cias complementarias de otro fragmento de acción y tienen actividad de restricción y con colas generadas por la misma enzima. metilación simultáneamente. En cambio, las Cuando se generan extremos romos, el de tipo II cortan en el sitio de reconocimien- ADN es clivado en el centro de la secuen- to, tienen actividad de restricción exclusiva- cia de reconocimiento, en el mismo punto mente y reconocen secuencias palindrómi- en ambas cadenas, no quedando bases cas (secuencias que se leen igual en ambas desapareadas en los extremos por lo que direcciones). Estas últimas son las utiliza- no presentan tendencia a unirse con otros das para el clonado de ADN, aunque tienen fragmentos por complementariedad (Fig. otras aplicaciones como las construcción de 4b). mapas de restricción de un plásmido o bac- Aunque por su especificad y versatilidad teriófago, fragmentación del ADN genómico las endonucleasas de restricción son las para su separación por electroforesis con enzimas las mas renombradas, la tecno- aplicación en técnicas como “Southern Blot” logía del ADN recombinante no sería fac- o fingerprinting o la generación de fragmen- tible sin la participación en el proceso de tos para ser usados como sondas. otras enzimas de roles diversos (Tabla 1).

Biotecnología y Mejoramiento Vegetal II 55 Tabla 1. Algunas enzimas utilizadas en la tecnología del ADN recombinante

3. SEPARACION DE FRAGMENTOS DE ciones (0,5 - 2%) forman un gel semisólido al ADN: ELECTROFORESIS EN GEL enfriarse, constituido por una matriz o trama tri- dimensional de fibras poliméricas, que retarda La electroforesis es una técnica que permite el paso de las moléculas de ácido nucleico a su la separación de moléculas en función de su di- través, en función de su tamaño. Los geles de ferente movilidad en un campo eléctrico, sien- poliacrilamida se forman por la polimerización do el parámetro esencial su diferencia en carga de acrilamida y bis-acrilamida, catalizada por eléctrica. Sin embargo, determinados soportes el agente oxidante persulfato de amonio y la como los geles de agarosa o poliacrilamida, amina terciaria TEMED como agente reductor. ofrecen una resistencia notable al avance de La variación de la concentración de acrilamida las moléculas. Aunque el parámetro que rige posibilita la modificación controlada el tamaño el avance es la relación carga/masa, como en del poro. Estos geles presentan menor rango los ácidos nucleicos la carga eléctrica es pro- de separación que los geles de agarosa, pero porcional a la longitud en nucleótidos, la rela- mayor poder de resolución, pudiendo discrimi- ción carga/masa es la misma para todas las nar fragmentos de ADN con diferencia de ta- moléculas. Como resultado, el efecto de retar- maño de sólo una base. Se usan además para do del gel depende del tamaño molecular por la separación y caracterización de proteínas. lo que la electroforesis separa los fragmentos Para establecer el tamaño de fragmentos de ácido nucleico según su tamaño o longitud. separados se utilizan marcadores moleculares, La agarosa es un polisacárido, cuyas disolu- que consisten en una mezcla de fragmentos de

56 Biotecnología y Mejoramiento Vegetal II ADN de tamaño conocido, a partir de los que se puede inferir el tamaño de la muestra anali- zada. Se establece una curva de calibrado en la que se consigue la linealidad graficando el tamaño en función de la inversa de la movili- dad o el logaritmo del tamaño respecto de la movilidad. Dentro de las aplicaciones más comunes de la electroforesis en gel en biología molecular, podemos mencionar chequeo de la amplifica- ción de fragmentos de PCR, identificación de polimorfismos y la identificación de genes -me diante el establecimiento de sus patrones de restricción.

4. HIBRIDACIÓN. ANÁLISIS MOLECULAR DE ADN, ARN Y PROTEÍNAS

La hibridación es la construcción artificial de un ácido nucleico bicatenario por apareamien- to (emparejamiento) de bases complementa- rias de dos ácidos nucleicos monocatenarios. Para que exista la formación de híbridos esta- bles debe haber un alto grado de complemen- taridad. Se define formalmente como sonda (“probe”) a un fragmento determinado de ARN o ADN marcado química o radioactivamente, utilizado para localizar determinadas secuen- cias de ácidos nucleicos mediante hibridación.

A) Análisis de ADN por hibridaciones Southern Blot Figura 5. Método de hibridación de Southern. a) Es- Los procedimientos utilizados, para separar cisión enzimática o mecánica del ADN; b) inclusión ácidos nucleicos y proteínas se rigen por el del ADN en el gel de agarosa y corrida electroforé- mismo principio, pero involucran algunas dife- tica; c) transferencia de las moléculas de ADN des- rencias de técnicas debidas a las característi- de el gel de agarosa hacia un filtro de nitrocelulosa cas particulares de cada clase de moléculas. por capilaridad, previa desnaturalización del ADN; En 1975, E. M. Southern, publicó un nuevo d) hibridación con la sonda monohebra, seguida de lavados y detección por autorradiografía. procedimiento que permitió a los investiga- dores ubicar los genes y otras secuencias de ADN sobre fragmentos de restricción separa- dos por electroforesis en gel. La principal ca- sus dos cadenas), ya sea antes o durante la racterística de esta técnica es la transferencia transferencia, mediante tratamiento alcalino. de las moléculas de ADN que han sido digeri- Una vez completada la transferencia, el ADN das por endonucleasas de restricción y separa- es inmovilizado sobre la membrana por expo- das por electroforesis en gel a una membrana sición a elevada temperatura o a radiación UV. de nylon o nitrocelulosa. Esta transferencia se Una sonda de ADN conteniendo la secuencia denomina Southern Blot, en honor al científi- de interés es entonces incubada con el ADN co que desarrolló la técnica (Fig. 5). Para rea- inmovilizado. La sonda sólo va a hibridar con lizarla, el ADN es desnaturalizado (abierto en moléculas de ADN que contienen la secuencia

Biotecnología y Mejoramiento Vegetal II 57 de nucleótidos complementaria a su secuencia. agente desnaturalizante de las proteínas. Los El excedente de sonda no hibridada se elimina polipéptidos separados por electroforesis tam- mediante repetidos lavados de la membrana. bién pueden ser transferidos del gel a una mem- Las sondas pueden marcarse por diferentes brana de nitrocelulosa y pueden ser detectados métodos: con elementos radioactivos, o com- utilizando anticuerpos específicos. Esta trans- puestos que producen color o luminiscencia, ferencia de proteínas se denomina Western etc. Luego de la hibridación, la membrana se blotting y se realiza utilizando una corriente somete a diferentes procedimientos para poner eléctrica para trasladar las proteínas desde el en evidencia la sonda, de acuerdo al método gel a la superficie de la membrana. Después con el que haya sido marcada. de la transferencia, la proteína de interés es identificada mediante la unión a un anticuerpo B) Análisis de ARN por transferencia e hi- específico que está conjugado (marcado) ya sea con isótopos radioactivos, que permiten la bridación: Northern Blot De manera similar al tratamiento realizado detección por autoradiografía, o con enzimas con las moléculas de ADN, las moléculas de que producen un producto visible cuando se adiciona el sustrato correspondiente. ARN también pueden ser separadas por elec- troforesis en geles de agarosa, transferidas a membranas y analizadas. La transferencia de 5. AMPLIFICACION DEL ADN: REACCIÓN ARN se denomina Northern blot, en reconoci- EN CADENA DE LA POLIMERASA (PCR) miento al hecho de que el procedimiento es la imagen de espejo de la técnica Southern blot. La PCR constituye una tecnología poderosa Ambos procedimientos son esencialmen- que involucra la síntesis enzimática in vitro de te idénticos. Sin embargo, las moléculas de millones de copias de un segmento específico ARN son muy sensibles a la degradación por de ADN. La reacción se basa en la hibridación enzimas ARNasas. Por lo tanto, se debe tener de un par de oligonucleótidos, diseñados en mucha precaución para evitar la contaminación base a la secuencia de interés y sintetizados de los materiales con estas enzimas. Además, artificialmente, a la secuencia de ADN (Fig 6). la mayoría de las moléculas de ARN contienen Estos oligonucleótidos funcionan como inicia- estructuras secundarias (producidas por apa- dores o cebadores (“primers”) que delimitan la reamiento complementario intracadenas), por secuencia a ser amplificada. La primera etapa lo tanto deben mantenerse desnaturalizadas de la reacción involucra la desnaturalización durante la electroforesis para poder separar- del ADN de doble cadena, por elevación de las en base a su tamaño. La desnaturalización la temperatura a 92-95°C. Posteriormente co- se provoca incorporando formaldehído u otro mienzan los ciclos de PCR, que comprenden: químico desnaturalizante a la solución tampón desnaturalización de la doble cadena, unión (“buffer”) utilizada en la electroforesis. Después por complementariedad del cebador al ADN de la transferencia a la membrana apropiada, de simple hebra y replicación del ADN a par- las moléculas de ARN pueden hibridar con tir del cebador, catalizada por la enzima Taq sondas de ADN o ARN. polimerasa. La temperatura de unión de los cebadores al ADN de cadena simple depende C) Análisis de proteínas por transferencia de la secuencia y tamaño del oligonucleótido, e inmunodetección o Western Blot así como de la estrategia especifica de trabajo, La electroforesis en gel de poliacrilamida es comprendiéndose en términos generales entre una herramienta muy importante para la sepa- los 35-60°C. La fase de síntesis de ADN com- ración y caracterización de proteínas. Debido a plementario se lleva a cabo a la temperatura que muchas de las proteínas están compues- óptima para que la Taq polimerasa realice la tas por dos o más subunidades, las cadenas replicación a partir de cada extremo 3´ de los polipeptídicas individuales son separadas por cebadores. Se trata de una ADN polimerasa electroforesis en presencia del detergente do- termo-resistente aislada de Thermus aqua- decil sulfato de sodio (SDS), que actúa como ticus, bacteria que vive en fuentes termales.

58 Biotecnología y Mejoramiento Vegetal II Figura 6. Reacción en cadena de la polimerasa (PCR). a) Representación de una reacción de PCR de tres ciclos. En cada ciclo se suceden tres etapas: i- desnaturalización por calor del ADN (94°C) para separar las hebras, ii- unión por complementariedad de los cebadores a las monohebras (en este ejemplo 55°C), iii- reacción de polimerización de por la enzima TAQ polimerasa, dando la hebra complementaria al molde de ADN (72°C); b) Comportamiento de una fragmento de ADN blanco de los cebadores, a través de los mencionados ciclos de PCR. En cada ciclo, se incrementa la cantidad de ADN blanco, siguiendo la relacion 2n, donde n es el número de ciclos. En el ejemplo, con tres ciclos de PCR, se obtienen 23 copias. c) Verifi- cación de un producto de PCR sobre un gel de agarosa. En la calle de la izquierda se muestra el marcador de peso molecular. En la primera calle, se observan dos fragmentos de 700 y 650 pares de bases (bp), respectivamente, sugiriendo que el cebador ha encontrado complementariedad en más de un sitio en el genoma. Las calles 2 y 3 presentan banda única de 700 y 550 bp aaproximadamente en cada caso.

Este ciclo es repetido por algunas decenas de Después de apenas 20 ciclos se logra más veces y, como el producto de cada polimeri- de un millón de veces la cantidad inicial de la zación sirve como molde para el siguiente, en secuencia de interés. Esta escala de amplifi- cada ciclo se duplica la cantidad de producto cación permite, por lo tanto, iniciar el proceso sintetizado. Es necesario tener en cuenta que, con cantidades mínimas de ADN (del orden de además de la enzima, los cebadores y el ADN pico o nanogramos) y terminar la reacción con de interés, para que se produzca la amplifica- grandes cantidades de una secuencia de inte- ción es necesaria la presencia de un medio rés. La versatilidad de esta reacción es enorme tamponado y desoxinucleótidos (dNTPs) y clo- y la combinación de la PCR y la secuenciación ruro de magnesio que actúa como cofactor de constituye una poderosa herramienta para el la enzima. El resultado de la reacción es un análisis de genes. fragmento de ADN de doble cadena cuyos ex- Como hemos mencionado, la técnica de tremos corresponden a los extremos 5´ de los PCR es de suma utilidad para amplificar ADN cebadores y su tamaño a la distancia entre los a partir de fragmentos clonados en distintos mismos. A pesar de que se forman moléculas vectores, donde los cebadores son comple- más largas a partir del molde original en cada mentarios a los sitios del vector que flanquean ciclo, se acumulan solo a una tasa lineal y no el fragmento inserto. La versatilidad de la PCR contribuyen significativamente a la masa final incluye la amplificación a partir de ADN de ma- de secuencia blanco. terial embebido en parafina por varios años,

Biotecnología y Mejoramiento Vegetal II 59 de material momificado, de restos fósiles, etc. sigla (RT- PCR). De lo expuesto es obvio, la ne- Dentro de los usos mas frecuentes, podemos cesidad de ser específicos en las denominacio- mencionar la detección de enfermedades gené- nes, sobre todo cuando se combinan ambas téc- ticas, determinación del sexo en embriones hu- nicas: “Real Time de RT – PCR” manos, clonación de genes, mutagénesis in vitro y mapeo y secuenciación de genomas. B) PCR cuantitativa (qPCR) o PCR en tiem- po real (RT-PCR). A) RT-PCR Una variante de la PCR convencional que se Se trata de una reacción de PCR, secundaria basa en la detección y cuantificación simultánea a la transcripción reversa del ARNm, catalizada de la fluorescencia emitida por los productos de por la enzima transcriptasa reversa (RT). Esta PCR que se acumulan durante el proceso de enzima es capaz de sintetizar ADN utilizando amplificación. La PCR cuantitativa ofrece la po- ARN como molde y forma parte de la batería sibilidad de detectar, en tiempo real, el nivel de enzimática de los retrovirus, virus de ARN que amplificación de una secuencia de interés, con requieren la síntesis de ADN para ser integrados el objeto de estimar la cantidad de esa secuen- en el genoma del hospedador. El esquema ge- cia presente en la muestra original. En la PCR a neral de la RT-PCR consiste en un primer paso tiempo real, los procesos de amplificación y de- de síntesis de ADN complementario (ADNc) de tección se producen en el mismo vial cerrado, sin cadena simple tomando como molde el ARN. En necesidad de ninguna acción posterior. Además, esta etapa, llamada síntesis de la primera hebra mediante detección por fluorescencia se puede (first strand synthesis) se utilizan cebadores que medir durante la amplificación la cantidad de pueden ser específicos para el gen de interés, ADN sintetizado en cada momento, ya que la hexámeros de secuencia al azar u oligodT, se- emisión de fluorescencia producida en la reac- gún se busque sintetizar sólo el ADNc específico ción es proporcional a la cantidad de ADN forma- o los ADNc correspondientes a todos los ARNs do. Esto permite conocer y registrar en todo mo- del tejido en cuestión. Por lo tanto, mientras que mento la cinética de la reacción de amplificación. el uso de primers específicos aumenta la espe- Los termocicladores para llevar a cabo la PCR cificidad, los otros dos tipos de cebadores maxi- a tiempo real incorporan un lector de fluorescen- mizan el número de moléculas de ARNm que cia y están diseñados para poder medir, en cual- pueden ser analizadas en una muestra peque- quier momento, la fluorescencia emitida en cada ña de ARN. El uso de hexámeros al azar, puede uno de los viales donde se realice la amplifica- ocasionar distorsiones por exceso en el número ción. Los sistemas de detección por fluorescen- de copias de un determinado ARNm, compara- cia empleados en la PCR a tiempo real pueden do con los cebadores específicos. La segunda ser de dos tipos: agentes intercalantes y sondas etapa consiste en subsecuentes ciclos de PCR específicas marcadas. Los agentes intercalantes con los cebadores específicos para la secuen- son fluorocromos cuya emisión de fluorescencia cia de interés, lo que permite obtener cantida- aumenta notablemente cuando se unen a ADN des apropiadas del ADN para diversas mani- de doble hélice. El más empleado en PCR a pulaciones genéticas. Esta estrategia conjunta tiempo real es el SYBR Green I. El incremento de retrotranscripción y PCR puede ser utilizada de ADN en cada ciclo se refleja en un aumen- para el estudio de ARNm a nivel de una célula to proporcional de la fluorescencia emitida. Este individual. Los principales alcances de esta téc- sistema de detección es de fácil implementación nica incluyen la determinación de la presencia o y mas económico que el uso de sondas especí- ausencia de un transcripto, estimación del nivel ficas. Sin embargo, presenta baja especificidad. de expresión y para el clonado de ADNc sin la El riesgo de amplificaciones inespecíficas pue- construcción de una genoteca. de disminuirse iniciando la reacción de PCR a La técnica de PCR por transcriptasa reversa temperaturas elevadas (hot-start PCR). Pueden es denominada como “RT-PCR”, la cual desafor- utilizarse polimerasas recombinantes que funcio- tunadamente, puede ser confundida con la PCR nan después de ser activadas por temperatura de Tiempo Real, ya que ambas tienen la misma o polimerasas unidas a anticuerpos que mantie-

60 Biotecnología y Mejoramiento Vegetal II nen bloqueado el centro activo de la enzima has- lidad en la eficiencia de amplificación es menos ta que son desnaturalizados por calor. Además, importante. la mayoría de los equipos de RT-PCR tienen la posibilidad de determinar el Tm de los fragmen- C) Variantes de la qPCR tos amplificados, que depende de su longitud y PCR múltiple: es una variante de la PCR de la composición de sus bases, resultando ca- cuantitativa en la que se amplifican simultánea- racterístico de cada fragmento. Las sondas de mente dos o más secuencias blanco en una secuencia específica, están marcadas con dos única reacción. Este análisis en simultáneo de tipos de fluorocromos, un donador y un aceptor. varias secuencias optimiza el aprovechamiento Las más utilizadas son las sondas de hidrólisis, de la muestra cuando se trata de materiales de denominadas también sondas TaqMan que con- disponibilidad limitada y ofrece la posibilidad de tienen un fluorocromo de extinción de fluores- realizar controles internos, por ejemplo, la expre- cencia (Q, quencher) unido en el extremo 3´ y sión de un gen constitutivo en ensayos de expre- otro reportero (R) en el extremo 5´. Cuando se sión. La PCR múltiple suele ser más complicada produce la extensión de la cadena de la sonda que la simple adición de varios cebadores a la por acción de la Taq polimerasa, como resultado PCR cuantitativa simple. Se requiere extremar del clivaje del extintor por su actividad de exo- los cuidados en cuanto al diseño específico de nucleasa es emitida la fluorescencia. La fluores- cebadores, sugiriéndose que tengan igual tem- cencia detectada durante cada ciclo de la PCR peratura de fusión (meeting point, Tm), un conte- será proporcional a la cantidad de ADN que se nido de GC del 45-60% y que carezcan de homo- está amplificando. logía entre sí. La alta eficiencia de los cebadores La confiabilidad de los resultados obtenidos en la PCR individual, no asegura el éxito en la mediante esta técnica requiere de la realización PCR múltiple, pero aumenta considerablemente en paralelo una curva patrón en las mismas con- las posibilidades de obtenerlo. La combinación diciones para conocer la cantidad total de ADN de flouróforos a utilizar en los diferentes cebado- que se está amplificando. res también debe elegirse de manera cuidadosa, Ente las principales aplicaciones de PCR en para que no exista superposición entre los es- tiempo real, podemos mencionar: pectros absorción y emisión entre ellos. Amplificación y detección de ADN o ARN Análisis de curvas de disociación. Se basa específico en una muestra.Los blancos de de- en la aplicación de un gradiente de temperatu- tección pueden estar asociados a la presencia ras creciente después de la PCR para monitori- de agentes patógenos, resultando una herra- zar la cinética de disociación de los fragmentos mienta de extrema utilidad para fines de diag- amplificados, pudiéndose establecer su Tm para nóstico clínico. En el caso del ARNm, debe ser comprobar su especificidad. También permite el previamente retrotranscripto a cDNA, mediante análisis de mutaciones puntuales, usando una una transcriptasa reversa que posee actividad sonda complementaria con el ADN de tipo salva- endo H, es decir, remueve el ARNm permitiendo je, que abarque la posición del polimorfismo. El que se forme la segunda hebra de ADN. Tam- híbrido formado entre sonda y ADN de tipo salva- bién puede aplicarse al estudio de las variantes je tendrá una estabilidad mayor que el formado de “splicing” (corte y empalme de intrones) del entre la sonda y el ADN mutado, puesto que en ARNm. este caso la complementariedad no es absoluta, Cuantificación del ADN o ARN diana en la reflejándose en una Tm superior. Adicionalmen- muestra. Se puede cuantificar la concentración te, permite establecer además, de forma relati- inicial de ADN (o ARN) diana en la muestra de va, la cantidad de ADN de tipo salvaje y la de manera muy sencilla, a través de la construcción tipo mutado cuando ambos están presentes en de una curva de calibrado. El control de la am- la misma muestra. plificación como medida de la concentración en En la Sección IX, Capítulo 4, se detalla más la muestra se obtiene en las fases iniciales de este punto y se aplica esta técnica para la de- la reacción, en las que la concentración de los tección de organismos genéticamente modifi- reactivos no es limitante y el efecto de la variabi- cados (OGMs).

Biotecnología y Mejoramiento Vegetal II 61 6. GENOTECAS nitrógeno liquido para impedir cambios cuali o cuantitativos de la expresión. La susceptibili- Una genoteca (“gene library”) es una colec- dad del ARN al clivaje por ARNasas, requiere ción de fragmentos de ADN clonados que re- de cuidados especiales en el material del labo- presentan en su conjunto el ADN total de un ratorio a ser empleado en el aislamiento. A par- organismo de interés o bien el ADNc, que re- tir del ARN total es posible separar el ARNm, presenta el conjunto de genes que se están tomando ventaja de la característica cola de expresando en un órgano o tejido determinado poliadeninas que posee en el extremo 3´, me- o bajo una situación particular o momento de diante cromatografía de afinidad, utilizando crecimiento o desarrollo. En el primer caso ha- columnas de celulosa que tienen ligados oligo- blamos de una genoteca genómica, donde se nucleótidos compuestos solo por desoxitimina encuentran todas las secuencias que se expre- -oligo(dT). Al pasar el ARN por la columna, el san y no se expresan en el organismo mientras ARNm queda unido por complementariedad que en el segundo se trata de una genoteca de al oligo(dT), a través de la cola de poliA. Una ADNc, donde se encuentran solo las secuen- vez separado del ARN total, el ARNm es eluído cias expresadas. de la columna utilizando una solución tampón Estas genotecas consisten en una colección adecuada. bacterias, conteniendo cada una un vector con Estas colas de poliA también son utilizadas el ADN inserto, dispuestas en pocillos. Las ge- en el próximo paso de clonado, donde fun- notecas carecen de un catálogo a través del cionan como sitio de unión de los cebadores cual se pueda saber cuál es el clon que con- oligo(dT), para la reacción catalizada por la tiene una secuencia de interés, por lo que es enzima transcriptasa reversa. El producto de necesario realizar un relevamiento de las colo- la reacción es un híbrido ARN-ADN. La princi- nias bacterianas. Para ello se utiliza una sonda pal limitación de esta técnica radica en que en de ADN complementaria a la secuencia o gen los casos en los que el ADNc es muy largo, al buscados, que puede ser conocida o deducirse comenzar en el extremo 3´, muchas veces no a partir de la secuencia de aminoácidos de la llega la retrotranscripción al extremo 5´. Para proteína purificada. subsanar esta dificultad, se utilizan primers al Una de las principales dificultades en el clo- azar de 6 a 10 nucleótidos de longitud y es- nado de ADN genómico es que algunas se- tán confeccionados de manera de representar cuencias están representadas una sola vez en muchas secuencias diferentes, por lo que la el genoma y es difícil hallarlas. Para superar reacción comienza a partir de muchos sitios esta limitación de la metodología, puede clo- diferentes, no solo del extremo 3´. Cualquiera narse directamente el ADNc, ya que el número de estas estrategias conduce a la obtención de de copias del ARNm en el tejido correspondien- un híbrido ARN-ADN, a partir del cual median- te a un gen que se esta expresando es más te PCR, se obtiene ADN de doble cadena que elevado. El problema se plantea cuando no se puede clonarse en el vector apropiado. sabe en qué circunstancias o en qué tejido se Para obtener la segunda cadena, se desarro- expresa un gen en particular. Actualmente es lló inicialmente un método que tomaba ventaja posible clonar un ADNc a partir de mensajeros de una “vuelta” o “giro” que da la hebra recién poco abundantes en la célula, con concentra- sintetizada, como un efecto de cambio de rum- ciones de 1 a 2 moléculas por célula. bo de la transcriptasa reversa al llegar al final de la cadena de ARN. Este artefacto provee un A) Genotecas de ADNc cebador adecuado para la síntesis de la segun- El primer paso en la construcción de una ge- da cadena de ADN y puede eliminarse, una vez noteca de ADNc consiste en el aislamiento del obtenida la segunda cadena, con una nucleasa ARN a partir del tejido o condición experimental S1, perdiéndose parte de la secuencia corres- planteada. Los cambios en la expresión génica pondiente al extremo 5’ del mensajero. asociados a la exposición a estímulos diversos, Existe una segunda técnica, que presenta hacen necesaria la preservación del material dos ventajas sobre la anterior. Una es que ge-

62 Biotecnología y Mejoramiento Vegetal II nera moléculas de ADNc más largas y la se- do del fago . Para ello se utiliza la transferasa gunda es que contiene prácticamente toda la terminal, que adiciona colas de poliA o poliT, secuencia correspondiente al extremo 5´. Se o se agregan adaptadores, que son sitios ar- basa en la utilización de la enzima RNasaH, tificiales de reconocimiento de alguna enzima que reconoce moléculas híbridas ARN-ADN y de restricción que se unen a los extremos de digiere la cadena de ARN dejando trozos pe- la secuencia. Se trata de oligonucleótidos ar- queños que permanecen unidos a la primera tificiales (8-12 bp) que se unen al fragmento cadena del ADNc y sirven como primers para utilizando una ligasa de ADN y son cortados la ADN polimerasa I, que usa el ADNc original con la enzima de restricción apropiada (Fig. como molde para sintetizar la hebra comple- 7). Ambos procedimientos sirven para generar mentaria de ADN. Solo queda un pequeño seg- extremos cohesivos a fin de unir el fragmento mento de ARN en el extremo 5´. La segunda al vector, que posee extremos cohesivos corta- cadena de ADN tiene algunos sectores no uni- dos por la misma enzima. dos que son sellados por una ligasa de ADN. Si se utilizan como vectores los plásmidos, Estas moléculas de ADNc de doble cadena se introducen en las células huésped (bacte- están listas ahora para ser insertadas en un rias) por transformación, Si se eligen los fa- vector, que puede ser un plásmido o un deriva- gos, son empaquetados in vitro para formar

Figura 7. Clonado de ADNc de doble cadena en un fago. El ADN del fago contiene dos sitios de restricción EcoRI. El ADN de la región central no esencial del fago se reemplaza por ADN foráneo, uniendo los frag- mentos del fago con el ADN a clonar a través de la enzima ADN ligasa. Es necesario previamente adicionar al ADNc adaptadores que llevan sitios EcoRI, para generar extremos cohesivos para acoplarse con el ADN del fago. Se genera así una serie de moléculas recombinantes dispuestas en tandem, flanquedas por sitios cos. Este ADN recombinante se empaqueta formando partículas infecciosas del fago, que se utilizarán para infectar un césped de bacterias. Esto se visualizará como placas o calvas. Cada placa surge de una molécula recombinante individual, que se propaga ahora como un fago. Para la localización del gen de interés en la genoteca, es necesario hacer una copia de la placa en membrana de nylon, que luego será hibridada con una sonda para el gen marcada apropiadamente. Si la marcación es radiactiva, por ejemplo, será revelada por autoradiografía y el clon se identifica por comparación entre la marca de la membrana de nylon y la placa de bacterias.

Biotecnología y Mejoramiento Vegetal II 63 partículas víricas, que introducirán su ADN en Por ello, estas sondas oligonucleotídicas están el hospedador apropiado por infección de un constituídas por una mezcla de todas las com- césped de bacterias crecido sobre la superficie binaciones posibles. Una de ellas correspon- de una placa de agar (Fig. 7). Si bien los vecto- derá a la secuencia correcta del gen buscado. res plasmídicos son más fáciles de manipular, El problema de esta estrategia es el elevado las genotecas construídas en los fagos poseen número de falsos positivos que pueden dar las fragmentos de mayor tamaño. secuencias adicionales. Una variante consiste Como resultado del cultivo en placa (plaqueo) en usar un menor número de oligonucleótidos de la genoteca, se obtienen cientos de miles a o uno solo pero de mayor longitud (35-75 nu- un millón colonias bacterianas o de placas de cleótidos), eligiendo una región de la proteína fagos (zonas claras o de lisis resultado de la que contenga el menor número posible de co- producción de particulas víricas), dependiendo dones degenerados, utilizando el conocimiento del vector utilizado, cada una conteniendo un de los codones más probables para la especie fragmento clonado, distribuidas sobre la placa en estudio. de agar. A fin de realizar la búsqueda de un gen Existen otras técnicas para localizar genes particular (“screening”), la genoteca es replica- en las genotecas de ADNc, como hibridación da en membranas de nylon o nitrocelulosa, de diferencial, si se trata de genes expresados en manera tal que el patrón de placas en la caja diferentes tejidos o la utilización de sondas de original se vea exactamente reproducido en la regiones conservadas en familias de proteínas membrana de nylon o filtro (Fig. 7). La búsque- para encontrar genes relacionados o bien la da se lleva a cabo por hibridación con una son- utilización de vectores de expresión. da de ácido nucleico, lo cual requiere un cono- cimiento previo de la secuencia de interés. B) Genotecas Genómicas Elección de la sonda: En algunos casos, Un genoteca genómica puede obtenerse de donde parte del gen ha sido clonado, este se cualquier tejido ya que todas las células de un utiliza para buscar las partes faltantes. Si se organismo tienen la misma constitución genéti- usa un sonda donde la homología es completa ca. Se encuentran en ella, no solo las secuen- el “screening” puede realizarse en condiciones cias expresadas sino también las correspon- de alta rigurosidad (es decir, con lavados más dientes secuencias regulatorias. Pueden utili- fuertes, que tienden a despegar lo que se ha zarse fagos como vectores, pero sucede que unido inespecíficamente). Si la sonda no es muchos de los genomas eucariotas son muy completamente homóloga el “screening” de- grandes, el de mamíferos por ejemplo contie- berá realizarse a menores temperaturas y uti- ne 3x109 pb de ADN. Si el promedio típico de lizando concentraciones salinas más elevadas inserto es de 15.000 pb, se necesitarán unos en los lavados. Si no se tiene conocimiento 200.000 fagos para contener el genoma com- previo de la secuencia puede construirse una pleto. Para asegurar que todas las secuencias sonda a partir de la secuencia de aminoácidos estén representadas al menos una vez, los de la proteína. Cuando se utiliza esta estrate- cálculos estadísticos dicen que deberán ana- gia, el tamaño mínimo de la sonda debe ser lizarse aproximadamente de 1 a 2 millones de de 15 a 16 nucleótidos (que permite encontrar fagos. secuencias únicas en genotecas de ADNc eu- Por este motivo, especialmente cuando se carióticos. Generalmente se utilizan sondas de trata de genomas muy grandes, como es el 17 a 20 nucleótidos (correspondientes a 6 ami- caso del genoma humano o de varias especies noácidos contiguos). Otra consideración a te- vegetales y animales, se utilizan las genotecas ner en cuenta cuando se construye la sonda es de YACs o BACs. que existe más de un codón o triplete para defi- nir la mayoría de los aminoácidos (es lo que se Genotecas genómicas en cromosomas conoce como la “degeneración” del código ge- artificiales nético) por lo que un aminoácido puede estar La capacidad de clonar fragmentos de más especificado por hasta 6 codones diferentes. de 100 kb es crucial para la genómica estruc-

64 Biotecnología y Mejoramiento Vegetal II tural, funcional y comparativa de organismos Separación de grandes trozos de ADN: complejos. Las primeras genotecas genómicas electroforesis de campo pulsáti. Las técni- fueron construidas utilizando como vectores los cas estándar de separación de ADN en geles YACs, aunque por sus limitaciones se prefiere de agarosa no son adecuadas para moléculas actualmente el uso BACs y PACs como vecto- mayores de 10 kb. Esta limitación ha sido sub- res. Cuando se trata de genomas de plantas, sanada con la electroforesis de campo pulsátil, pueden utilizarse como vectores los cromoso- en la que el campo eléctrico en el gel de aga- mas artificiales de bacterias binarios (BIBACs), rosa cambia periódicamente de orientación. De que presentan la ventaja adicional de pueden esta manera pueden separarse moléculas tan usarse directamente para transformar plantas grandes como los cromosomas de levaduras utilizando Agrobacterium tumefaciens. (200 a 3000 kb) (ver VII.-1). La separación de Para preparar una genoteca genómica el las moléculas de este tamaño depende de su ADN es escindido con enzimas de restricción relativa facilidad o dificultad para reorientarse o mecánicamente al azar, si se desea evitar la en respuesta a direcciones cambiantes de un presencia de fragmentos demasiado largos o campo eléctrico. Esta técnica puede utilizarse cortos. Un paso crítico en el proceso es el ais- para hacer mapas físicos a gran escala. lamiento de moléculas intactas de ADN de ele- Preparación de una genoteca de BACs. vado peso molecular, esencialmente ADN cro- Como todo proceso de clonación, consiste en mosómico. Para ello las células se embeben la preparación del vector, aislamiento y diges- en bloques de agarosa de baja temperatura tión del ADN, selección de los fragmentos por de gelificación y se tratan con enzimas y otros tamaño, transformación de las bacterias y en- reactivos para separar el ADN de las proteínas samblado de la genoteca. celulares y del RNAs. La función del bloque de El vector debe estar purificado, digerido y agarosa es proteger a las grandes moléculas, defosforilado (cuando se corta con una sola que, embebidas en esta matriz, se someten enzima, se eliminan los fosfatos terminales, a la digestión con enzimas de restricción que para evitar la recircularización). La digestión realicen cortes poco frecuentes (“rare cutters”). del ADN es crítica para obtener fragmentos La preparación de ADN de alta calidad en plan- adecuados para clonar. Los fragmentos son tas es más complicada que la correspondiente seleccionados por electroforesis de campo pul- para el caso de animales debido a la presencia sátil y se separan de la matriz de agarosa por de la pared celular, que dificulta el embebido digestión de la misma con agarasa o gelasa, o en bloques de azarosa. Para superar esta difi- por elusión del ADN desde el gel. Esto permite cultad se trabaja directamente con los núcleos construir genotecas con fragmentos de tama- aislados. Si se desea separar estos fragmen- ños similares, de aproximadamente 150 kb. tos por electroforesis, los bloques de agarosa Estas genotecas de grandes insertos son conteniendo el DNA digerido pueden ser direc- consideradas recursos de largo plazo para in- tamente embebidos en la matriz del gel que se vestigación genómica y deben ser mantenidas correrá. continuamente, especialmente cuando son uti- La cantidad de clones BACs que constitu- yen una genoteca, se relaciona con el tama- lizadas para proyectos de secuenciación y ma- ño del genoma, el tamaño promedio de los peo a gran escala. En general, cuando se va insertos y la cobertura genómica esperada. a construir una genoteca debe elegirse cuida- Considerando el tamaño de inserto promedio dosamente el genotipo de la especie utilizada de los clones BACs, para cubrir cinco veces el como fuente de ADN, el tipo de inserto, etc., genoma, una genoteca de BACs de la especie dado que la misma puede utilizarse para varia- modelo Arabidopsis thaliana, cuyo genoma es dos propósitos. pequeño, requerirá la obtención de 7.000 clo- En la Fig. 8 se esquematiza la búsqueda de nes BACs, mientras que una de trigo candeal, un gen en una genoteca de BACs. Más de- cuyo genoma es dos ordenes de magnitud ma- talles acerca del ensamblado de los distintos yor, tendrá que estar compuesta por 500.000 fragmentos clonados puede encontrarse en el clones. capítulo correspondiente a genómica.

Biotecnología y Mejoramiento Vegetal II 65 Figura 8. Búsqueda de un gen específico en una genoteca de BACs mediante PCR. Las 180 placas de cultivo, de 96 pocillos cada una, contienen un genoma vegetal completo. Estas placas se replican, agru- padas de a 4, en filtros o membranas. Se realiza luego una reacción de PCR con el cebador específico al ADN obtenido de un tubo que contiene los clones correspondientes a tres filtros, representando 12 placas, que fueron previamente agrupados. Como control positivo se utiliza el ADN vegetal total, también amplifi- cado por PCR. La reacción se analiza sobre un gel de agarosa. Un resultado positivo indica la presencia del gen en el ADN genómico del vegetal y también en uno de los tubos, conteniendo el ADN de 12 placas de 96 pocillos, en la figura, corresponde al tubo 1, que contiene los clones de las placas 1, 2 y 3. Se rea- liza en mismo procedimiento con tubos que contienen los clones de cada placa. Cuando se chequean los conjuntos individuales se encuentra que el clon positivo pertenece al filtro 3. El producto de PCR se hibrida luego con este filtro y esto nos dará la posición exacta en la placa de 96 pocillos donde se encuentra el gen de interés.

C) Genotecas de cromosomas específi- dora reconoce el patrón fluorescente típico de cos o de segmentos de cromosomas cada cromosoma. Algunos cromosomas son Cuando se busca un gen que se sabe está muy similares por lo que no pueden ser sepa- ubicado en un cromosoma específico simplifica rados. Se necesita un millón de cromosomas mucho el trabajo hacer una genoteca de ese para hacer una genoteca. Equipos automáti- cromosoma solamente. Se trata de una técnica cos pueden hacer este trabajo en unas pocas que permite separar cromosomas metafásicos horas. teñidos con el colorante fluorescente Hoechst También puede microdisectarse un cromo- 33258 para regiones ricas en AT y cromomicina soma, tomando un segmento del mismo que A, para regiones ricas en GC. Los cromosomas tenga la región de interés. En principio se uti- teñidos fluorescerán cuando se expongan a luz lizó esta técnica para cromosomas grandes, UV (de longitudes de onda de 361 y 363 nm fácilmente distinguibles por microscopía de (Hoechst 33258) o 458 nm (cromomicina A). contraste de fase. Actualmente, la combinación Las cantidades y proporciones de colorantes con PCR posibilita la aplicación de la técnica a varían para cada cromosoma y una computa- cualquier cromosoma. Estos son teñidos con

66 Biotecnología y Mejoramiento Vegetal II Giemsa-tripsina y las bandas deseadas son crilamida donde, mediante autorradiografía, se cortadas con agujas de vidrio ultrafinas y clo- determina el patrón de bandas, que refleja la se- nadas. Cebadores posicionados en el vector cuencia del ADN (Fig 9). Actualmente se utilizan permiten amplificar secuencias desconocidas. digitalizadores de imágenes para la lectura de la El ADN amplificado se clona en un vector apro- autorradiografía. piado y la localización cromosómica de cada Messing desarrolló una serie de vectores de clon se determina utilizando hibridación in situ clonado basados en el fago filamentoso M13, (ver III.5) muy útiles para el secuenciado enzimático, con los que se utiliza un cebador universal que se 7. SECUENCIACIÓN DEL ADN CLONADO posiciona en un lugar adyacente al sitio de po- liclonado del vector. La ventaja es que solo una Una vez que se ha obtenido el clon con el frag- de las cadenas del vector es empaquetada en mento de interés, el paso siguiente es secuen- las cabezas del fago. Este ADN de simple cade- ciarlo. La determinación de la secuencia puede na es ideal para utilizar con el método de Sanger. realizarse por el método químico de Maxam y Actualmente se utilizan fásmidos. La adición de Gilbert o por el método enzimático de Sanger. El un “fago ayudante” (“helper phage”) a las células primero consiste en la utilización de compuestos que lo contienen, hace que el ADN del mismo, que destruyen selectivamente una o dos de las de simple cadena, sea replicado, empaquetado bases que constituyen el ADN, partiendo de mo- y extruído de la célula. Al ser de menor tamaño léculas de ADN marcadas radiactivamente en un (aprox. 3000 bp) que M13 permite la inserción extremo. La destrucción no debe ser total, sino de fragmentos de ADN más largos. que en promedio cada molécula de ADN indivi- Los proyectos de secuenciación genómica han requerido métodos de secuenciado más veloces dual, debe ser clivada una vez. En función del y económicos. Para ello se ha desarrollado una compuesto químico utilizado y de las condiciones técnica llamada Multiplex, que permite manejar de reacción, se obtienen fragmentos de ADN hi- mayor cantidad de muestras en menor tiempo. drolisados a la altura de las bases G, A+G, T+C o Se utilizan 20 vectores plasmídicos que permi- C. Se generan fragmentos de distinto tamaño en ten construir 20 genotecas diferentes a partir del función de la distancia de la base destruida al ex- mismo ADN. Cada vector lleva dos secuencias tremo marcado del fragmento a secuenciar. Los únicas que flanquean al sitio de clonado, que productos de las 4 reacciones se corren en un pueden ser usadas como etiquetas (“tags”) para gel de poliacrilamida que es revelado por auto- el ADN clonado y estarán presentes sobre cada rradiografía y la secuencia del fragmento queda fragmento a ser secuenciado. Se toma un clon determinada por el patrón de bandas. de cada una de las genotecas plaqueadas (20 El método de Sanger, se basa en la interrup- colonias) y se mezclan. Se hace crecer el culti- ción controlada de la replicación enzimática del vo, se aísla el ADN y se secuencian los plásmi- ADN, añadiendo a la reacción de síntesis junto dos utilizando el método Maxam y Gilbert. Los con los cuatro desoxinucleótidos, un 2´,3´- di- productos de 12 conjuntos de reacciones de se- desoxinucleótido (ddNTP) marcado. Los ddN- cuenciación se corren en un gel y se transfieren TPs pueden ser incorporados al ADN por la ADN a una membrana de nylon. El filtro se hibrida se- polimerasa pero interrumpe la síntesis de la ca- cuencialmente (es decir, se despega una sonda dena por carecer del OH en posición 3´, nece- para luego hibridar con las siguiente y así su- sario para la formación del enlace con la base cesivamente), utilizando como sonda la etiqueta siguiente. Se preparan cuatro reacciones con de cada uno de los 20 vectores. En cada caso el ADN molde, el cebador, los cuatro dNTPs, y se van leyendo las secuencias correspondien- en cada una de ellas diferencialmente un ddN- tes a cada uno de los distintos vectores. De esta TPS. Con la proporción ddNTP:dNTP adecua- manera, una sola reacción produce datos de 20 da, se generan fragmentos de distinta longitud, clones a la vez. dependiendo de la distancia de la última base Actualmente existen equipos robotizados incorporada al extremo marcado del ADN. Estos que pueden llevar a cabo dos de las reaccio- fragmentos son separados en un gel de polia- nes más limitantes en el proceso de secuen-

Biotecnología y Mejoramiento Vegetal II 67 Figura 9. Esquema de la secuenciación de ADN por el método de didesoxinucleótidos, de manera a) ma- nual, usando marcación radiactiva ó b) automática, utilizando ddNTPs que emiten color. Se representa a la hebra de ADN a secuenciar con el cebador unido por complementariedad. La reacción de síntesis del ADN complementario por la enzima ADN polimerasa (PCR) se desarrolla: a) en cuatro tubos individuales, cada uno con los cuatro desoxinucleótidos (dNTPs) y un didesoxinuleótido particular (ddNTP). En general, el dNTP marcado radiactivamente es dATP; ó b) en un único tubo, con cada ddNTP unido a un marcador fluorescente diferente. Luego, realiza la corrida electroforética en gel de poliacrilamida y la secuencia es leída desde la banda más corta (extremo 5’) hacia el de mayor longitud (extremo 3’) de manera: a) manual ó b) digital, luego de la excitación con láser y emisión de fluorescencia, obteniéndose un cromatograma.

ciado: la detección de las bandas de ADN y la completada los productos de las 4 reacciones traducción de un patrón de bandas en uno de se mezclan y se corren en una sola calle de un secuencia. Estos equipos utilizan nucleótidos gel, en un secuenciador automático. A medida marcados con fluorocromos. Se utilizan 4 co- que los fragmentos pasan a través del láser, lorantes diferentes, que al ser exitados por lá- sus marcas fluorescentes se excitan y emiten ser emiten luz de diferente longitud de onda. luz que se detecta mediante un fotomultiplica- Los colorantes pueden utilizarse para marcar dor. Después de ser procesada por una com- el primer universal de secuenciación de M13 putadora, la secuencia es mostrada como una o cada uno de los 4 terminadores de cadena serie de picos o cromatograma, donde cada didesoxi. En este caso, cada mezcla de reac- uno de los 4 colores representa a un nucleótido ción con un terminador diferente se marca con diferente (rojo: timina, verde: adenina, negro: un colorante diferente. Cuando la reacción es guanina y azul: citosina) (Fig. 9).

68 Biotecnología y Mejoramiento Vegetal II Lecturas Recomendadas

Madigan M. T., Martinko J. M. and Parker J. 1999 Brock, Biología de los Microorganismos. Octa- va edición revisada. Prentice Hall Iberia. Madrid, España. Singleton P. 2004. Bacterias en Biología, Biotecno- logía y Medicina. 5ta Edición. Acribia. Sambrook J., Fmitsch E. F. and Maniatis T. 1989. Molecular cloning: a laboratory manual, second edition, Cold Spring Harbor Laboratory Press, Cold spring Harbor. Southern E. M. 1975 Detection of specific sequen- ces among DNA fragments separated by gel electrophoresis. J. Mol. Biol., 98, 503-517 Fütterer J., Gisel A., Iglesias V., Kloti A., Kost B., Mittelsten Scheid O., Neuhaus G., Neuhaus-Url G., Schrott M., Shillito R., Spangenberg G. and Wang Z. Y. 1995. Standard Molecular Techni- ques for the Analysis of Transgenic Plants. En Gene Transfer to Plants. Potrykus Y, Spangen- berg G (eds.) Springer Lab Manual. Watson J. D., Baker T. A., Bell S. P., Gann A., Levi- ne M. and Losick Y. R. 2006. Biología Molecular del Gen. 5ª Edición, Ed. Médica Panamericana. Madrid.

Biotecnología y Mejoramiento Vegetal II 69 I. CAPÍTULO 5. identificación visual tales como forma de hoja, pubescencia, color de fruto, etc. En todos los casos debe tratarse de caracteres de herencia Marcadores Moleculares monogénica y predecible según las leyes de Mendel. Muchos de ellos se convierten en im- María Carolina Martínez, Marcelo Helguera, portantes descriptores a la hora de inscribir nue- Alicia Carrera. vas variedades. Por ejemplo, alrededor de 50 caracteres de plántula, tallo, hoja, espiga, espi- 5.1. Introducción guilla y cariopse se utilizan para inscribir e iden- Desde sus comienzos, el objetivo del mejo- tificar variedades de trigo en la Secretaría de ramiento vegetal ha sido seleccionar genoti- Agricultura, Ganadería, Pesca y Alimentación pos superiores a partir de la identificación de de la Argentina. Este tipo de marcadores contri- fenotipos superiores. El grado de éxito en este buyó significativamente al desarrollo teórico del proceso depende de: i) el número de genes in- concepto de ligamiento genético y a la cons- volucrados en el control genético del carácter trucción de los primeros mapas genéticos de (herencia monogénica o poligénica) y las rela- plantas (como por ejemplo, en tomate y maíz). ciones interalélicas (dominancia o aditividad), ii) En el mejoramiento de girasol, los primeros la influencia del ambiente, que se mide normal- híbridos se obtuvieron utilizando “color de hi- mente a través del parámetro heredabilidad. El proceso de caracterización y/o selección se pocótile” como marcador ligado al gen ms de vuelve más eficiente a través del uso de mar- androesterilidad; de este modo las plantas ver- cadores genéticos, definidos como caracteres des que eran androestériles se utilizaban como que presentan polimorfismo o variabilidad ex- líneas maternas y las plantas con antocianas perimentalmente detectable en individuos de que eran fértiles se eliminaban del lote de pro- una población segregante y un tipo de herencia ducción al comienzo de su desarrollo. predecible según las leyes de Mendel. Esta va- Las principales limitaciones de los marcado- riación puede considerarse a diferentes niveles res morfológicos son: i) se encuentran disponi- biológicos, desde cambios fenotípicos hereda- bles en un número restringido de especies ve- bles significativos (marcador morfológico) hasta getales, utilizadas como sistemas modelo para la variación de un solo nucleótido de ADN (mar- estudios genéticos, tales como el maíz, el to- cador molecular). El marcador ideal debería ser mate y la arveja, ii) bajo nivel de polimorfismo, altamente polimórfico (dentro y entre especies), iii) pueden producir alteraciones fenotípicas de herencia mendeliana no epistática, insensi- que dificultan el desarrollo de la planta (albinis- ble a los efectos ambientales, codominante (ca- mo), iv) generalmente de herencia dominante paz de diferenciar individuos heterocigotas de y en algunos casos poligénica y, v) muchos de homocigotas), de rápida identificación y simple ellos se expresan en estadio de planta adulta, análisis, y de detección en los estadios tempra- lo cual prolonga los tiempos de evaluación en nos del desarrollo de la planta. los programas de mejoramiento. En la actualidad existe una gran variedad Un enorme espectro de especies vegetales de marcadores genéticos y a lo largo de este carece de información a este nivel. No obstan- capítulo desarrollaremos aquellos más frecuen- te, los marcadores morfológicos permanecen temente utilizados en plantas. Para una mejor como caracteres útiles en la identificación de comprensión se propone clasificar los marca- materiales dado que representan un conjunto dores en las siguientes categorías: i) marcado- de genes que pueden ser evaluados con méto- res morfológicos, ii) marcadores bioquímicos, dos sencillos y a bajo costo. iii) marcadores moleculares, iv) marcadores funcionales o de expresión, vi) marcadores ba- 5.3 Marcadores Bioquímicos sados en SNPs. Son polimorfismos presentes en ciertas pro- teínas detectados a través de técnicas bioquí- 5.2 Marcadores Morfológicos micas. El desarrollo de los marcadores bioquí- Son características fenotípicas de sencilla micos produjo una revolución en los estudios

70 Biotecnología y Mejoramiento Vegetal II genéticos en plantas, que hasta el momento dificadas por los distintos alelos o loci (Figura habían contado con un limitado número de mar- 1). Finalmente, iv) Compartimentalización cadores morfológicos. La técnica permitía incluir subcelular: se encuentran formas enzimáticas potencialmente a todas las especies de plantas. localizadas en citoplasma, cloroplasto o mito- En esta parte del capítulo nos referiremos a las condria, codificadas todas por genes nucleares Isoenzimas y a las Proteínas de reserva. pero con diferentes velocidades de migración.

5.3.1 Isoenzimas Las isoenzimas se definen como diferentes formas moleculares de una enzima, que po- seen una actividad catalítica común, es decir actúan sobre el mismo sustrato. Ciertos cam- bios en el ADN que codifica estas enzimas (mutaciones) pueden resultar en cambios en la composición de aminoácidos, originando pro- teínas con la misma actividad biológica pero con diferente carga neta y por lo tanto con dife- Figura 1. Locus isoenzimático Pgd-3 de girasol en rentes velocidades de migración en un campo el que se destacan las variantes alélicas a y b. P1 eléctrico. Estas diferencias determinan patro- (calles 1 a 3 de izquierda a derecha) y P2 (calles 7 nes característicos de migración electroforética a 9) son individuos homocigotas y F1 (calles 4 a 6) de las formas iso-enzimáticas. Varios factores son individuos heterocigotas. definen el patrón de bandas o zimograma: i) Número de genes que las codifican: la -pre sencia de varios genes codificando para una Las isoenzimas se extraen por homogenei- misma enzima ha sido atribuida a procesos de zación del tejido (semilla, raíz, hoja) en condi- duplicación génica y subsecuente divergen- ciones no desnaturalizantes (que preservan la cia a través de mutaciones diferentes en cada actividad catalítica de la enzima) y se analizan caso; ii) Estados alélicos: el proceso más sim- mediante electroforesis en un soporte sólido, ple de generación de nuevas formas enzimá- generalmente almidón. El gel puede ser cortado ticas es la mutación de un gen estructural, las en capas horizontales y cada una se destina a variantes alélicas se denominan aloenzimas. una solución de revelado específica que consta Estos marcadores muestran codominancia de un sustrato, un colorante y cofactores, di- (en un individuo diploide ambos alelos de un sueltos en un buffer apropiado. La reacción que locus son expresados y visualizados). A modo ocurre entre las enzimas presentes en el gel y de ejemplo, la enzima alcohol dehidrogenasa el correspondiente sustrato generan productos (ADH), puede comprender varios loci y alelos coloreados que conforman el patrón de bandas. con denominación Adh-1a, Adh-1b, Adh-2a, Las metodologías empleadas en la extracción y Adh-2b, Adh-2c, etc.; iii) Estructura cuaterna- electroforesis son relativamente sencillas y rá- ria de los productos proteicos: la enzima fun- pidas y el equipamiento es de bajo costo. cional puede estar compuesta por un número Las isoenzimas han tenido un rol prominente variable de sub-unidades. En las formas más en estudios de poblaciones vegetales para de- simples o monoméricas los individuos homoci- terminar variabilidad y estructura genética, sis- gotas presentan una banda y los heterocigotas temática y biología evolutiva así como en des- simplemente la suma de ambas. Cuando la es- cripción de germoplasma e identificación de tructura cuaternaria se vuelve más compleja, variedades. Su aplicación en la construcción encontramos enzimas activas compuestas por de mapas se ha visto limitada por el número dímeros, tetrámeros, etc. En este caso el indivi- de marcadores isoenzimáticos disponibles (en duo heterocigota presenta bandas adicionales general menor a 50), y por su reducido poli- no presentes en los homocigotas, que se ge- morfismo (2-4 alelos). Por otro lado, las formas neran por la combinación de sub-unidades co- enzimáticas extraídas de hoja o raíz (no así las

Biotecnología y Mejoramiento Vegetal II 71 de semilla) presentan variaciones en relación a nados conformando familias. Varios estudios las condiciones ambientales de crecimiento y demuestran que durante la evolución de estos a la edad del tejido, lo cual afecta la reproduci- genes se han detectado duplicaciones, trans- bilidad de los zimogramas. No obstante, estos locaciones, inserciones de elementos móviles, loci representan importantes marcas de refe- entre otros rearreglos cromosómicos, que se- rencia para relacionar mapas obtenidos a partir rían los responsables de generar un alto ni- de distintos marcadores de ADN. vel de polimorfismo proteico entre y dentro de especies. 5.3.2 Proteínas de reserva Por ejemplo, en el caso del trigo, las principa- Las proteínas de reserva son un grupo hete- les proteínas de reserva del grano se denomi- rogéneo de proteínas presentes en la semilla nan gluteninas y gliadinas. Estas proteínas son de la planta que tienen por función proveer de capaces de polimerizar durante el amasado de energía al embrión en los primeros estadios de la harina formando una red denominada gluten crecimiento. Estas proteínas han sido extensa- mente estudiadas en cereales y oleaginosas y de importancia fundamental en la elaboración se relacionan directamente con la calidad del del pan. Desde un punto de vista genético, las grano. gluteninas se hayan codificadas en los lociGlu- Las proteínas de reserva se extraen me- 1 y Glu-3 y las gliadinas en Gli-1 y Gli-2 pu- diante procedimientos sencillos a partir de las diendo tener cada uno de estos loci 1, 2 o más semillas y se separan mediante electrofore- genes; mutaciones en estos genes generan sis en geles de poliacrilamida en condiciones nuevas variantes alélicas. Numerosos estudios desnaturalizantes (con detergentes). No se electroforéticos han revelado alto grado de po- requiere detectar actividad enzimática, las pro- limorfismo en el número y la movilidad electro- teínas se visualizan directamente por tinción forética de estas proteínas y muchos de estos con Azul de Coomassie, evidenciándose los polimorfismos son utilizados como marcadores polimorfismos como diferencias en la movilidad genéticos para mejorar la calidad panadera del electroforética. trigo, principalmente en el caso de las glute- En la mayoría de los cereales, estas proteí- ninas (Figura 2). Las gliadinas muestran pa- nas están codificadas por varios genes relacio- trones electroforéticos más complejos que las

Figura 2. Gluteninas de cultivares de trigo separadas mediante electroforesis en geles de poliacrilamida al 12% en condiciones desnaturalizantes (SDS-PAGE). A: fracción correspondiente a las gluteninas de alto peso molecular, codificadas por el locusGlu-1 . B: fracción correspondiente principalmente a las gluteninas de bajo peso molecular codificadas por el locus Glu-3. Fotografía gentileza de L. Vanzetti

72 Biotecnología y Mejoramiento Vegetal II gluteninas y han sido utilizadas en la descrip- 5.4.1 Marcadores basados en la hibridación ción de germoplasma e identificación de varie- del ADN dades. Como en el caso de las isoenzimas, la aplicación de proteínas de reserva en la cons- 5.4.1.1 RFLP (Restriction Fragment Length trucción de mapas genéticos es limitada por el Polymorphism) o polimorfismo en la longitud número de marcadores genéticos disponibles, de fragmentos de restricción (Botstein et al., sin embargo estos loci representan importantes 1980) marcas de referencia, por ejemplo, para los cro- Son los marcadores moleculares más anti- mosomas 1 y 6 de trigo, donde están presentes guos y aún son usados para algunas aplica- los principales genes de gluteninas y gliadinas. ciones importantes como mapeo comparativo y Para más información sobre estructura, pro- estudios de sintenia entre especies (ver Parte piedades y rol de las proteínas de reserva en III, Capítulo 2 "Aplicaciones de los Marcadores grano se recomienda la lectura de la revisión de Moleculares"). Branlard et al. (2001). Este marcador se basa en la comparación de La principal ventaja de los marcadores bio- perfiles de bandas generados a partir del ADN químicos es su fácil implementación en el labo- de distintos individuos por digestión con enzi- ratorio ya que involucran metodologías senci- mas de restricción. Los fragmentos obtenidos llas, rápidas y de bajo costo. Como desventajas se separan por su tamaño mediante electrofore- se pueden citar: baja cobertura del genoma, di- sis y se transfieren a una membrana donde son ficultades en la interpretación de los resultados desnaturalizados y luego hibridados con una (principalmente para las Isoenzimas) y, en el sonda. Esta sonda es un fragmento de ADN de caso de las proteínas de reserva, dado que mu- cadena simple (de secuencia conocida o no) chos de los genes codificantes suelen estar es- que está marcado radioactivamente. La sonda trechamente ligados (familias multigénicas), no se unirá a aquellos fragmentos de restricción se puede asumir independencia entre los loci. con secuencia complementaria a la misma (ver enzimas de restricción y método de Southern 5.4 Marcadores moleculares Blot en Parte I, Capítulo 4 “Herramientas bási- Un marcador molecular es simplemente un cas de Ingenieria Genetica”). segmento de ADN con una ubicación especí- Para la visualización, la membrana se ex- fica en un cromosoma (punto de referencia) pone a una placa radiográfica. En cuanto a cuya herencia puede seguirse en individuos de la sonda empleada esta puede ser genómica una población. La secuencia puede pertenecer (con alta proporción de ADN no codificante, no a regiones codificantes (genes) o sin función perteneciente a ningún gen) o de ADNc (cuan- conocida. do proviene de un transcripto). También puede Con el advenimiento de las técnicas moder- obtenerse a partir de ADN de organelas (mi- nas de biología molecular (para más detalle, tocondrias o cloroplastos). Pueden emplearse ver Parte I, Capítulo 4 “Herramientas básicas sondas aisladas de especies relacionadas (por de Ingeniería Genética”), surgieron diversos ejemplo, sondas aisladas de tomate pueden métodos de detección de polimorfismo genético emplearse en papa y viceversa). directamente a nivel de ADN. En la actualidad, La variabilidad genética presente en el mar- se puede obtener un número prácticamente ili- cador molecular proviene de diferencias en la mitado de marcadores en cualquier organismo secuencia del ADN genómico debidas a mu- vivo que permiten analizar la totalidad de la in- taciones puntuales en los sitios de restricción, formación genética (genoma) de un organismo. a duplicaciones, deleciones, inserciones, etc., Para describir los distintos tipos de marca- que modifican la distancia entre pares desi- dores moleculares, se seguirá una clasificación tios de restricción generando fragmentos po- arbitraria en base a las metodologías que em- limórficos (de diferentes tamaños) (Figura 3). plean para su detección. Todas estas técnicas Un locus RFLP está definido por la combina- parten, como primer paso, de extraer ADN ge- ción de una enzima de restricción y una son- nómico de la planta bajo estudio. da. Individuos homocigotas poseen el mismo

Biotecnología y Mejoramiento Vegetal II 73 Los VNTR, también conocidos como minisaté- lites, son repeticiones de secuencias de 9 a 100 pares de bases. El número de repeticiones es va- riable pero en general es menor a 1000. Existen dos formas de detectar los VNTR: por hibrida- ción o por técnicas de PCR. En el primer caso, el ADN genómico es digerido con enzimas de restricción que reconocen sitios adyacentes a la región repetida. Los fragmentos se separan por electroforesis, se inmovilizan en una membrana y se detectan mediante sondas. La longitud de los fragmentos de restricción producidos en dife- rentes individuos varía de acuerdo al número de repeticiones del minisatélite. La diferencia bási- ca entre RFLP y VNTR reside en el tipo de son- da utilizada. En la técnica de VNTR las sondas están constituidas por secuencias homólogas a las secuencias repetidas de los minisatélites, por lo tanto todos los loci hipervariables del genoma son detectados simultáneamente, mientras que en RFLP, las sondas son homólogas a secuen- cias únicas del genoma, detectando así uno o pocos loci cada vez. De esta manera, en el au- torradiograma, al contrario del patrón simple de bandas obtenido por RFLP, para minisatélites se obtiene un perfil complejo de bandas múlti- Análisis de RFLP empleando como sonda Figura 3. ples. Los VNTR tienen la ventaja que además el marcador RGA(584). Calles impares: S. pennellii. Calles pares: S. lycopersicum. 1 y 2: ADN genómico de explorar el polimorfismo en la longitud de los digerido con EcoRV, 3 y 4: HindIII, 5 y 6: EcoRI, 7 y fragmentos de restricción en cada locus hiper- 8: BamHI. Fotografía de M. C. Martínez.y 6: EcoRI, variable, utilizan también el polimorfismo en el 7 y 8: BamHI. Fotografía de M. C. Martínez.” número y distribución de estos loci a lo largo del genoma, posibilitando así la visualización si- patrón de restricción en ambos cromosomas ho- multánea de diversas regiones del mismo. Las mólogos y por lo tanto producen una sola banda. limitaciones para esta técnica, son las mismas Ejemplos de nomenclatura utilizada para loci RFLP descriptas oportunamente para RFLP. son XNpb136 de arroz o Xpsr912-2A de trigo, que Los minisatélites también pueden ser detec- hacen referencia al laboratorio de origen y a las tados mediante la amplificación por PCR de los sondas utilizadas. segmentos conteniendo diferente número de re- Las ventajas de los RFLPs radican en que son peticiones, utilizando iniciadores o "primers" que altamente reproducibles, codominantes y multialé- flanqueen los VNTR y luego su visualización licos. Por otro lado, cuentan con las desventajas mediante electroforesis y tinción con bromuro de de ser muy laboriosos, difíciles de automatizar, se etidio. Esta opción se ha vuelto más frecuente necesita disponer de las sondas para la especie con el aumento de información de secuencias en en estudio y requieren de infraestructura adecuada bases de datos que permiten el diseño de ini- para mantener las sondas y trabajar con radiactivo, ciadores flanqueantes a determinados minisaté- lo que los hace relativamente costosos. lites. Sin embargo estos marcadores han sido poco utilizados en plantas. 5.4.1.2 VNTR (Variable Number of Tandem Repeats) o repeticiones en tandem de número 5.4.2 Marcadores basados en la amplificación variable arbitraria o semi arbitraria del ADN

74 Biotecnología y Mejoramiento Vegetal II 5.4.2.1 RAPDs (Random Amplified tre distintos individuos consiste en la presencia Polymorphic DNAs) o ADN polimórfico ampli- o ausencia de fragmentos de ADN amplificado ficado aleatoriamente (Williams et al. 1990, debido a mutaciones en el sitio de reconoci- Welsh y McClelland 1990) miento del iniciador, deleciones, inserciones. La metodología de RAPD fue desarrollada Este marcador no permite diferenciar indivi- de forma independiente por dos grupos de duos heterozigotas, por lo que es un marca- Estados Unidos. Un grupo la denominó RAPD y dor dominante. Los marcadores RAPD están el otro AP-PCR (Arbitrarily Primed-Polymerase basados en una técnica sencilla, de bajo costo Chain Reaction o reacción en cadena de la po- de implementación, automatizable y no radio- limerasa con iniciadores arbitrarios). activa. A diferencia de los marcadores basados La técnica de RAPD es una variante de PCR en PCR convencional no se requiere informa- que utiliza un solo oligonucleótido de 10 bp ción nucleotídica previa para su desarrollo, se que hibrida al azar con el ADN en estudio. Para dispone de un número ilimitado de marcado- que se genere un fragmento RAPD es nece- res y el nivel de loci polimórficos es alto. La sario que el oligonucleótido iniciador hibride principal desventaja de esta técnica es su baja en las dos cadenas del ADN en orientaciones reproducibilidad entre laboratorios, en el senti- opuestas suficientemente cercanas (menos de do de que pequeñas modificaciones en la téc- 3000 bp) como para permitir la amplificación. nica como por ejemplo, concentración de ADN La secuencia del oligonucleótido es aleatoria inicial, modelo de termociclador, origen de la al igual que los sitios de hibridación en el ADN, enzima ADN Polimerasa termoestable, etc., por lo tanto la secuencia amplificada es desco- pueden alterar el patrón de fragmentos de ADN nocida. El iniciador puede hibridar en distintos generados por RAPD de una muestra. sitios del ADN sin necesidad de complementa- Relacionados con los RAPDs encontramos riedad exacta de bases, dado que la PCR se a los marcadores DAF (DNA Amplification hace con temperaturas de unión del iniciador Fingerprinting) (Caetano Anollés et al. 1991) bajas, generando varios fragmentos que son y AP-PCR (Arbitrary Primed PCR) (Welsh y resueltos mediante electroforesis y posterior McClelland 1990). DAF y AP-PCR son técni- tinción (Figura 4). Cada banda del patrón de cas similares a RAPD. DAF involucra el uso amplificación es considerada un locus RAPD, de iniciadores arbitrarios de 5 pares de bases definido por la secuencia del iniciador y el peso de longitud. Esto incrementa la probabilidad de molecular. El polimorfismo que se observa en- apareamiento con el ADN molde respecto al

Figura 4. Análisis de RAPD utilizando ADN genómico de trigo candeal definidos por electroforesis vertical en ge- les de agarosa. 1: cultivar Kofa, 2: línea experimental UC1113, 3 a 14: individuos RILs (líneas endocriadas recom- binantes F8) generados del cruzamiento Kofa x UC1113, M: estandar de peso molecular de ADN (100 bp ladder, Invitrogen). Las flechas blancas indican los fragmentos polimórficos. Fotografía gentileza de Mercedes Nisi.

Biotecnología y Mejoramiento Vegetal II 75 RAPD y, por lo tanto, resulta en un perfil más va empleando un nucleótido arbitrario (amplifi- complejo de bandas. La visualización se lleva cación +1 o preamplificación) y luego, este pro- a cabo por medio de geles de poliacrilamida ducto de amplificación obtenido es empleado teñidos con plata. AP-PCR utiliza iniciadores como molde en una nueva amplificación em- ligeramente más largos que la técnica anterior pleando iniciadores que poseen 2 nucleótidos (aprox. 20 pares de bases). Los productos de selectivos adicionales al anterior (amplificación amplificación son marcados radiactivamente y +3 o amplificación final); iv) el análisis de los también pueden ser resueltos por electrofore- fragmentos así amplificados se realiza me- sis en geles de poliacrilamida. Las ventajas y diante electroforesis en geles de poliacrilami- limitaciones de estas técnicas son similares a da desnaturalizantes. Si uno de los iniciadores las descriptas para los RAPD. empleados está marcado radiactivamente, se visualizará mediante autorradiografía, si uno de 5.4.2.2 AFLPs (Amplified Fragment Length los iniciadores está marcado con un compues- Polymorphism) o polimorfismos en la longitud to fluorescente, puede ser resuelto empleando de fragmentos amplificados (Vos et al. 1995) un secuenciador automático. Alternativamente, Los marcadores AFLP constituyen una he- se puede visualizar mediante tinción con nitra- rramienta poderosa de análisis del genoma to de plata (Figura. 5). dado que poseen un alto poder de detección La base genética del polimorfismo de AFLP de la variabilidad genética. El ensayo de AFLP es la ausencia o presencia de fragmentos am- combina la especificidad, resolución y poder plificados de un tamaño determinado dado por de muestreo de la digestión con enzimas de mutaciones puntuales, inversiones, insercio- restricción con la velocidad y practicidad de la nes y deleciones que llevan a la pérdida o ga- detección de polimorfismos mediante PCR, sin nancia de un sitio de restricción o la alteración necesidad de disponer de información previa de la secuencia reconocida o amplificada por del genoma a estudiar. Desde su desarrollo y los iniciadores. Al igual que en los RAPDs, no divulgación esta técnica se utiliza ampliamente es posible distinguir individuos heterocigotas en el análisis de plantas. por lo que se trata de un marcador dominante. Consiste esencialmente en cuatro etapas: i) Una banda AFLP se interpreta como un locus, el ADN genómico es cortado con dos enzimas definido por las dos enzimas de restricción, de restricción. Generalmente una es de corte una combinación de primers que incluyen las raro (ej. EcoRI), que reconoce de 6 a 8 pares bases selectivas (Ej. EcoRI-ATC/MseI-AAG) y de bases y otra es de corte frecuente (ej. MseI) un peso molecular. que reconoce 4 pares de bases; ii) fragmen- Su implementación en laboratorio requie- tos de ADN doble cadena de 20 a 30 pares de re de una infraestructura considerable, son bases llamados adaptadores se ligan en forma relativamente laboriosos para su obtención específica a los extremos de los fragmentos y el costo es medio a alto. Estos marcadores obtenidos en el paso anterior, generando así el presentan un alto poder de detección de la molde para la amplificación posterior del ADN; variabilidad genética, ya que se explora simul- iii) se amplifican selectivamente fragmentos táneamente el polimorfismo de ausencia/pre- por PCR. En esta etapa, se utilizan iniciadores sencia de sitios de restricción (como los RFLP) de aproximadamente 20 nucleótidos que con- y la ocurrencia o no de amplificación a partir tienen una secuencia específica complementa- de secuencias arbitrarias (como los RAPDs). ria a la secuencia de los adaptadores y ade- Es un marcador mucho más robusto que los más, 1 a 3 nucleótidos selectivos adicionales RAPDs, ya que en la amplificación se utilizan de secuencia arbitraria en su extremo 3´. Dado oligonucleótidos más largos, que aumentan que sólo una subpoblación de los fragmentos significativamente la especificidad de la- reac originales es amplificada, se obtiene un patrón ción sin perder las ventajas de la amplificación de bandas que permite un registro adecuado. de secuencias al azar (no requiere información La amplificación descripta en iii) se realiza en previa de secuencia de ADN). Asimismo, se dos etapas: una primera amplificación selecti- pueden emplear distintas enzimas de restric-

76 Biotecnología y Mejoramiento Vegetal II 5.4.3. Marcadores moleculares basados en la amplificación sitio-específica del ADN En contraste con los marcadores basados en la amplificación de secuencias arbitrarias, los marcadores incluidos en la presente categoría requieren del diseño de iniciadores específicos para la amplificación de un locus en particular.

5.4.3.1 Microsatélites (Litt y Luty 1989) Los microsatélites son regiones hipervaria- bles del genoma que contienen arreglos de se- cuencias simples en tandem de mono, di, tri, tetra o pentanucleótidos que se repiten entre 10 y 100 veces. Los marcadores microsatéli- tes, también denominados Simple Sequence Length Polymorphism (SSLP), Simple Sequence Repeat Polymorphism (SSRP), Simple Sequence Repeats (SSR) o Sequence- Tagged Microsatellite Sites (STMS) se encuen- tran distribuidos por todo el genoma de la ma- yoría de las especies eucariotas. Los microsatélites se detectan mediante su amplificación por PCR usando iniciadores es- pecíficos de 20 a 30 pb de longitud que hibri- dan en la región que flanquea al tandem de repeticiones (microsatélite). Estos marcadores se resuelven por electroforesis en geles de po- liacrilamida en condiciones desnaturalizantes, Figura 5. Análisis de AFLP utilizando ADN de trigo mediante tinción con plata o por autoradiogra- candeal definidos por electroforesis en geles de se- fía (en el caso de usar un iniciador marcado cuenciación. En la figura se evaluaron 5 combina- radioactivamente). Si se dispone de un se- ciones de diferentes iniciadores para las enzimas cuenciador automático, se pueden resolver por de restricción Pst I y Mse I sobre el cultivar Kofa tamaño en este equipo mediante el empleo de (K) y la línea experimental UC1113 (D). Las flechas un iniciador marcado con un fluoróforo, posibi- indican presencia de fragmentos polimórficos. Foto- litando un análisis automatizado. grafía gentileza de A. Picca. La base genética del polimorfismo detecta- do en microsatélites se basa en la variabilidad del número de repeticiones en tandem y, con- secuentemente, en el tamaño del microsatéli- ción e iniciadores selectivos, resultando en una te amplificado en individuos de una especie. ilimitada posibilidad de generar polimorfismos. Estas diferencias son originadas durante la re- Otra ventaja de los AFLPs es el número de plicación del ADN debido a fallas en la acción fragmentos (marcadores) obtenidos por reac- de la ADN polimerasa durante el copiado de ción y resueltos por electroforesis (oscila entre una región repetida donde incorpora o elimina 30 - 50 contra los 4 – 10 de RAPDs). repeticiones. Otro mecanismo responsable de Una variante de esta técnica es la llama- la variación es el entrecruzamiento desigual da cDNA-AFLP que, en vez de ADN genómi- entre cromosomas homólogos. En este caso co, parte de ARN mensajero que es copiado se generan alelos con diferencias mayores en a ADNc. Esta metodología es empleada en el número de repeticiones. análisis de expresión diferencial de genes, es- El desarrollo de marcadores microsatélites tudios del transcriptoma y genómica funcional. requiere del conocimiento de las secuencias

Biotecnología y Mejoramiento Vegetal II 77 flanqueantes adecuadas para el diseño de las dos secuencias inversamente orientadas los iniciadores específicos. Los primeros SSR de este microsatélite específico hibridará el se desarrollaron a través de un proceso ex- iniciador y amplificará el fragmento de ADN lo- perimental complejo que implicó la obtención calizado entre ellas. Conceptualmente, sería de genotecas enriquecidas en microsatélites, similar a RAPD empleando un iniciador con la secuenciación, diseño de iniciadores aptos secuencia repetida del microsatélite. para amplificar microsatélites por PCR - yse ISSR (Inter-SSR amplification): se basan en lección de loci con patrones de herencia sim- la amplificación por PCR empleando iniciado- ple. Actualmente, las secuencias flanqueantes res que contienen en su secuencia repeticiones pueden obtenerse a partir de las secuencias de di o trinucleótidos junto con 4 bases nucleo- depositadas en las bases de datos (búsqueda tídicas determinadas en uno de sus extremos. in silico). El uso de programas informáticos es- Esto permite la amplificación parcial de todas pecializados en la búsqueda de microsatélites las regiones (potencialmente) amplificadas por ha revelado que existen secuencias con estas el marcador MP-PCR, descripto anteriormente, características formando parte de secuencias aumentando la reproducibilidad, que es una de que se expresan (genes), denominándose SSR las limitaciones del uso de los MP-PCR. Al te- génicos o EST-SSRs. Aunque tendrían un nivel ner en el iniciador esas 4 bases extras, a este de polimorfismo menor, serían más fácilmente tipo de marcador se lo conoce también como transferibles entre especies relacionadas. microsatélite anclado (AMP-PCR, Anchored Un locus SSR está definido por las secuen- Microsatellite-Primed PCR). cias de los iniciadores flanqueantes al micro- SAMPLE (Selective Amplification of satélite. Por el alto polimorfismo que suelen Microsatellite Polymorphic Loci) o amplificación presentar por locus (multialelismo) se los con- selectiva de loci microsatélites polimórficos. En sidera los marcadores ideales para el mejora- esta metodología se amplifican loci microsatéli- miento en especies autógamas como el trigo. tes a partir de un iniciador arbitrario empleando Estos marcadores son codominantes (ambos dos técnicas: microsatélites y AFLP. Se reali- alelos de un individuo heterocigota pueden ser zan todas las etapas de AFLP, es decir, diges- visualizados), genoma-específicos y altamente tión con dos enzimas de restricción, ligación de polimórficos en comparación con los RFLPs y adaptadores, preamplificación y amplificación RAPDs. Su implementación en un laboratorio selectiva del ADN. Sólo que en la amplificación requiere de mayor infraestructura y presupues- selectiva final, se emplea el iniciador de AFLP to que los RAPDs, siendo semejantes en este con sus tres nucleótidos selectivos en combi- aspecto a los AFLPs. nación con un iniciador SAMPLE. Este inicia- dor, posee en su secuencia bases complemen- 5.4.3.2 Otros marcadores basados en los tarias a un microsatélite. La banda polimórfica microsatélites resultante de la amplificación del ADN con el Una de las limitaciones para la utilización de marcador SAMPLE puede ser convertida en un los marcadores microsatélites es la necesidad marcador microsatélite convencional, a partir de conocer las regiones que flanquean a las del clonado y secuenciación de la misma. repeticiones para poder desarrollar los inicia- dores específicos. Así, se desarrollaron mar- 5.4.3.3. STS (Sequence-Tagged Sites) o cadores moleculares buscando explorar las sitios marcados por secuencias (Olson et al. repeticiones microsatélites sin necesidad de 1989) secuenciar el ADN. Entre esta clase de marca- STS es un término general dado a un locus dores podemos encontrar: en particular definido por las secuencias de sus MP-PCR (Microsatellite-Primed PCR): en el iniciadores específicos. Un STS puede ser ge- desarrollo de este marcador molecular, se uti- nerado para cualquier sitio del genoma siem- liza un iniciador que contiene las repeticiones pre y cuando ese sitio (locus) pueda ser clona- de un microsatélite específico para amplificar do y secuenciado. Un STS debe satisfacer dos el ADN. En las regiones del ADN que poseen condiciones: se debe conocer su secuencia,

78 Biotecnología y Mejoramiento Vegetal II que permite diseñar iniciadores específicos variedades de una misma especie (trigo, soja, que permitirán su amplificación por PCR, y te- etc), lo que disminuye las posibilidades de en- ner una localización única en el cromosoma o contrar mutaciones útiles para desarrollar estos genoma estudiado. Estos marcadores son su- marcadores. De todos modos, existen antece- mamente usados en mapeo físico detallado de dentes exitosos de desarrollo de marcadores genomas grandes para ensamblar, por ejem- de PCR alelo-específicos en trigo para carac- plo, clones de BAC entre sí. teres de interés agronómico como pueden ser Alternativamente, para una utilización más alelos de gluteninas, genes de resistencia a eficiente de marcadores moleculares en pro- patógenos, genes vinculados a adaptación, etc. gramas de mejoramiento existe la posibilidad Una segunda variante de los STS son de convertir marcadores complejos y costosos los marcadores CAPS (Cleavage Amplified o inestables como RFLPs, AFLPs y RAPDs, en Polymorphic Sequence) o "secuencia poli- marcadores PCR alelo-específicos, que son mórfica amplificada y clivada”, (Konieczny y económicos, robustos y de sencilla implemen- Ausubel 1993). En esta técnica, también cono- tación en cualquier laboratorio de biología mo- cida como PCR-RFLP, un fragmento de ADN lecular (los marcadores PCR alelo-específicos es amplificado por PCR, luego digerido con también serían STS en el sentido de que se tra- enzimas de restricción y resuelto por electrofo- ta de una secuencia de ADN corta que identifi- resis en agarosa o poliacrilamida. Este método ca un locus específico del genoma y puede ser aprovecha la capacidad que posee la técnica amplificada por PCR). La estrategia consiste en de PCR de amplificar segmentos específicos aislar el fragmento de ADN polimórfico del gel, se clona, se secuencia y se diseñan iniciadores de ADN con la capacidad que poseen las en- específicos de alrededor de 20 pb, para amplifi- zimas de restricción de cortar el ADN en se- car por PCR dicho fragmento. Cuando se parte cuencias blanco de la enzima de restricción. La de un fragmento RAPD, el marcador derivado base genética del polimorfismo detectado por mediante este proceso ha sido descripto como el marcador CAPS es la presencia/ausencia de SCAR (Sequence Characterized Amplified sitios de restricción en la secuencia amplifica- Region, Paran y Michelmore 1993). da por PCR. Este marcador permite identificar El problema que enfrentan estas estrategias individuos heterocigotas, por lo que se compor- suele ser el bajo nivel de polimorfismo entre ta como marcador codominante (Figura 6).

Figura 6. Marcador CAPS para seleccionar gen Lr37 de resistencia a roya de la hoja en trigo. En todas las muestras los fragmentos de PCR amplificados con los iniciadores URIC-LN2 fueron digeridos con la enzima Dpn II y sometidos a electroforesis en geles de agarosa 2%. La flecha negra (285bp) indica el fragmento de ADN asociado al gen Lr37 y las flechas grises (166 bp y 109 bp) indican fragmentos de ADN asociados a la ausencia del gen Lr37. Las calles 1, 2 y 3 son líneas nulisómicas de trigo para los cromo- somas 2A, 2B y 2D; las calles 4 a 9 corresponden a individuos de una población F2 segregante para Lr37 (calles 4 y 5 individuos portadores del gen Lr37 en forma homocigota; calles 6, 7 individuos sin el gen Lr37; calles 8 y 9, individuos portadores del gen Lr37 en forma heterozigota). M: estandar de peso molecular de ADN. Fotografía de M. Helguera.

Biotecnología y Mejoramiento Vegetal II 79 Los marcadores STS y sus variantes SCAR y 5.5.1 Marcadores COS (Conserved CAPS, tienen la ventaja de requerir un ensayo Orthologue Set) metodológico sencillo y altamente reproducible Los marcadores COS representan genes por los que son fácilmente transferibles a otros funcionales conservados en un amplio rango laboratorios, permitiendo que sean muy usados de plantas dicotiledóneas. Inicialmente, estos en selección asistida por marcadores. Asimismo, marcadores fueron desarrollados a partir de según las características de su diseño, pueden la comparación de la secuencia genómica de ser codominantes y ser analizados en simultáneo Arabidopsis con la base de datos de ESTs de varios loci STS en un mismo gel. tomate. Se postula que estos marcadores po- Actualmente, dada la disponibilidad de se- drán ser aplicados en el mapeo comparativo cuencias en base de datos es posible también entre genomas emparentados y, por lo tanto, diseñar marcadores STS directamente a partir de serán útiles para estudios taxonómicos y en la secuencias de interés (secuencias genómicas, deducción de las relaciones filogenéticas. secuencias ESTs, etc) evitándose de este modo el trabajo previo de secuenciación del STS. 5.5.2 Marcadores GTMs (Gene Targeted Markers) 5.5 Marcadores Funcionales o de Los GTMs se basan en polimorfismos dentro de genes, independientemente de si se cono- Expresión cen o no sus funciones. Estos marcadores se pueden desarrollar a partir de secuencias dis- En la actualidad, las tecnologías de marca- ponibles en las bases de datos (cDNA/EST/se- dores moleculares en plantas superiores han cuencias genómicas que representan genes) o sufrido un cambio. Así, la mayoría de los mar- a partir de genotecas de ADN genómico enri- cadores descriptos anteriormente derivan del quecidas para secuencias de genes. Un ejem- ADN genómico, y por lo tanto pueden perte- plo de GTMs son los Análogos a Genes de necer a regiones transcriptas y no transcriptas Resistencia (Resistance Gene Analogs, RGAs) del genoma. Estos marcadores basados en que son marcadores basados en secuencias ADN derivado de cualquier región del geno- derivadas de genes de resistencia a patóge- ma, han sido descriptos como marcadores de nos. Las secuencias RGAs son útiles para la ADN al azar (RDMs: Random DNA Markers). identificación de nuevos genes de resistencia a Sin embargo, durante los últimos años se ha patógenos en plantas. observado una fuerte tendencia hacia el desa- rrollo de marcadores moleculares derivados de 5.5.3 Marcadores Funcionales propiamente la región transcripta del genoma (genes). Esto dichos (FM: Functional Markers) ha sido posible gracias a la disponibilidad de El desarrollo reciente de varios proyectos de un gran número de secuencias de clones de genómica estructural y funcional en especies ADNc (ARNm transcripto a ADN empleando cultivadas, ha generado un enorme caudal de transcriptasa reversa, también conocidos como información a nivel de secuencias y esto ha po- Expressed Sequence Tags o ESTs), en bases sibilitado el desarrollo de un nuevo tipo de mar- de datos públicas (TIGR, NCBI; EBI, etc., ver cadores denominados marcadores funcionales Parte I, Capítulo 12, ”Análisis informático de (FM). Estos marcadores derivan de motivos secuencias moleculares”). polimórficos (mutaciones) dentro de los genes, Los tipos de marcadores desarrollados a y estos polimorfismos afectan directamente la partir de la región expresada del genoma son expresión fenotípica del carácter asociado al numerosos, complejos y variados. Sólo se des- gen (Andersen y Lübberstedt 2003). Los FM cribirán en detalle aquellos marcadores más reciben también el nombre de marcadores relevantes y que no fueron enunciados ante- diagnósticos, marcadores de genes blanco o riormente, recomendándose la lectura de la re- marcadores perfectos (perfect markers). visión de Gupta y Rustgi (2004) para informa- El desarrollo de FM requiere de secuencias ción adicional. alélicas de genes caracterizados funcional-

80 Biotecnología y Mejoramiento Vegetal II mente, a partir de los cuales puedan identifi- i) la aplicación confiable de marcadores en po- carse motivos polimórficos funcionalmente res- blaciones sin necesidad de mapeo previo; ii) el ponsables de afectar el fenotipo de la planta. uso de marcadores en poblaciones segregantes El primer paso en el desarrollo de FM es dis- sin el riesgo de perder información debido a la poner de la secuencia de un gen con una fun- recombinación; iii) una mejor representación de ción asignada. En Arabidopsis, menos del 10% la variación genética en poblaciones naturales o de sus aproximadamente 25.000 genes han de mejoramiento. sido caracterizados funcionalmente. En otras En general, los FM son útiles para: i) la fija- especies, el número de secuencias caracteri- ción más eficiente de alelos en cualquier pobla- zadas funcionalmente es sustancialmente me- ción segregante; ii) el análisis de alelos tanto en nor. Sin embargo, considerando la identidad de poblaciones naturales como de mejoramiento; secuencias es posible asignar funciones putati- iii) la combinación de alelos de FM que afectan vas (probables) a un 30-50% de las secuencias idénticos o diferentes caracteres en mejora- expresadas (ESTs) en otras especies. Esta es- miento de plantas; iv) la construcción de haplo- trategia de considerar genes candidatos y las tipos de FM ligados. relaciones sinténicas (similitud) entre genomas En la actualidad se encuentran disponibles de plantas ha sido explotada exitosamente para varios genes con potencial para el desarrollo identificar genes agronómicamente importantes. de FM sobre caracteres de importancia agro- El segundo paso en el desarrollo de FM es la nómica, por ejemplo, altura de planta en cerea- búsqueda de secuencias polimórficas o alelos les; tiempo de floración en maíz, requerimien- del gen en cuestión. Para ello se deben anali- tos de vernalización en Brassica y trigo, tama- zar las secuencias del gen en más de un geno- ño de fruto en tomate, calidad de alimento en tipo por especie. Las estrategias de desarrollo arroz; resistencia a enfermedades y respuesta de marcadores funcionales varían desde la de- a stress en varias especies, etc. Sin embargo, tección de polimorfismos de un solo nucleótido aún en especies modelo, sólo el 10% de los (SNPs), el descubrimiento en regiones génicas genes han sido caracterizados funcionalmente de secuencias tipo microsatelites (SSRs), la mientras que para especies no modelo, este identificación de sitios de restricción que dife- número es probablemente menor al 5%. rencien alelos (CAPS), la detección de inser- Los FM derivan de estudios de asociación ciones y/o deleciones (InDels), las variaciones realizados en grandes colecciones de genoti- a nivel de secuencias que se pueden revelar pos o de la comparación de líneas isogénicas, empleando la metodología de conformación de las cuales tienen un costo alto para su desarro- ADN simple cadena en electroforesis parcial- llo, limitando el estudio inicial a uno o unos po- mente desnaturalizantes (SSCP), etc. cos fondos genéticos. Luego estos FM deben Posteriormente, se debe probar la existen- ser evaluados en otros fondos genéticos, con cia de variación fenotípica asociada al alelo en lo cual, para todo esto es necesario desarro- cuestión. Esto puede realizarse indirectamen- llar un marco experimental, estadístico y bio- te, por estudios de asociación en poblaciones informático para la acumulación de datos y las segregantes, o directamente, mediante la com- evaluaciones a lo largo de diferentes estudios. paración de genotipos isogénicos generados Teniendo en cuenta estos factores y el la- por mutagénesis específica en la secuencia del borioso desarrollo de los FM, la generación de gen mediante TILLING, Targeting-Induced Local FM debería concentrarse en genes que confie- Lesions In Genomes (McCallum et al., 2003 ran una variación fenotípica sustancial. Así, la Parte II; Capítulo 4 “Mutagénesis, TILLING y selección de “genes claves” para caracteres de EcoTILLING”), etc. interés agronómico será crucial y el paso limi- En varias aplicaciones, la gran ventaja que tante para el desarrollo de FM útiles. presentan los FM es su ligamiento completo con motivos (mutaciones) funcionales. En con- 5.5.4 Arreglos de ADN para estudios de ex- traste con los marcadores tradicionales (distri- presión de genes buidos al azar en el genoma), los FM permiten: Los arreglos de ADN (arrays) permiten, en-

Biotecnología y Mejoramiento Vegetal II 81 tre otras cosas, analizar sistemáticamente el Además de la contribución para el entendi- patrón de expresión génica de un organismo miento de la expresión génica a gran escala, se en escala genómica. De este modo, es posible vislumbra la posibilidad de emplear la técnica examinar la expresión simultánea de cientos a de arreglos de ADN en mejoramiento asistido miles de genes en varios estadios del desarro- por marcadores, fingerprinting, selección de ac- llo, en respuesta a diferentes condiciones am- cesiones de germoplasma, desarrollo de plan- bientales y en tejidos específicos. tas tolerantes a diferentes tipos de estrés, etc. Los arreglos de ADN son soportes sólidos, Asimismo, la identificación de genes expresa- comúnmente vidrio o nylon, en los cuales es- dos diferencialmente, en especial aquellos cuya tán fijadas de forma ordenada gran cantidad de expresión no es abundante o están involucra- secuencias de ADN de interés (marcadores) . dos en cascadas de transducción de señales, Estas secuencias pueden ser genes comple- ampliará enormemente los horizontes una vez tos o parciales. El empleo de estos arreglos que esos genes puedan ser empleados como como herramienta para el estudio de expresión marcadores para selección asistida (Galbraith, de genes a escala genómica sigue típicamen- 2006). te los siguientes pasos: i) la construcción del arreglo de ADN; ii) la preparación de sondas 5.6 Marcadores SNPs (Single Nucleotide (a partir de ARNm de las distintas situaciones Polymorphisms) a comparar); iii) la hibridización del arreglo; iv) la detección de la señal y análisis de los datos Si bien, son una clase particular de marcado- por herramientas computacionales apropiadas. res moleculares que podrían ser incluidos dentro Existen diferentes sistemas de arreglos de del punto 5.4, se los decidió tratar aparte dado ADN, dependiendo de la fuente de ADN de que los SNPs pueden derivar tanto de secuen- interés, naturaleza del soporte sólido y el sis- cias genómicas codificantes (que se expresan) tema de detección de la hibridización. El sis- como no codificantes. tema más simple es el que requiere menos Recientemente, de la mano de los proyectos inversión, comúnmente se lo llama macroarre- de secuenciación de genomas enteros de plan- glo (macroarray) y emplea una membrana tas, una nueva clase de marcadores moleculares de nylon como soporte en combinación con denominados SNPs (polimorfismo de un nucleó- sondas radiactivas. El sistema más sofistica- tido), está siendo utilizada en distintos estudios do utiliza láminas de vidrio y sondas fluores- genéticos. Estos marcadores se basan en la de- centes y se lo llama microarreglo (microarray). tección de polimorfismos resultantes de la alte- Asimismo, en los macroarreglos se depositan ración de una única base en una secuencia de centenas de secuencias de ADN mientras que ADN. En la figura 7 se muestran secuencias de en los microarreglos la densidad de secuencias ADN ejemplificando algunas variaciones de pun- es al menos un orden de magnitud mayor. Es to, las cuales se definen como SNPs. Algunos importante destacar la existencia de distintos autores consideran SNPs sólo cuando ocurre términos empleados para describir estos arre- una sustitución de base, otros consideran tam- glos, de modo que glass array, chips de ADN y bién la inserción/deleción de una base (InDel). biochips son denominaciones usadas para los Los SNPs pasaron a tener mayor importan- microarreglos sobre placas de vidrio, en cuanto cia a partir de la secuenciación del genoma que nylon array y high density membranes son humano, al descubrirse que el 90% de polimor- para los macroarreglos sobre nylon. fismo encontrado en el genoma eran SNPs. En el área vegetal, la utilización de arreglos Recientemente en el área vegetal, la secuen- de ADN para el análisis de la expresión génica ciación a gran escala de genomas completos y aumentó significativamente de la mano de los de secuencias expresadas (ESTs), ha permitido proyectos de secuenciación completa del ge- evidenciar la presencia de SNPs en especies noma de Arabidopsis thaliana y Oryza sativa como Arabidopsis thaliana, melón, soja, girasol, (arroz) (para mas detalles ver Rensink y Buell, arroz, maíz, cebada, trigo, y caña de azúcar en- 2005). tre otras.

82 Biotecnología y Mejoramiento Vegetal II Figura 7. Ocurrencia de SNPs por la comparación de secuencias de ADN de dos individuos diferentes de girasol (variedades PAC2 y RHA266). De izquierda a derecha, obsérvese el primer SNP en la posición 17 de la primera secuencia (A-G) y el segundo SNP (inserción/deleción TGTATA) a partir de la posición 31 de la segunda secuencia. Gentileza C.Fusari.

Los marcadores genéticos SNP poseen na- potencial para el procesamiento de los datos turaleza bialélica y son muy abundantes en el generados, los equipamientos necesarios y la genoma, siendo la frecuencia de SNPs de 1 dificultad de los ensayos. cada 100-300 pb para los genomas de plantas. Inicialmente, los abordajes para la detección Los SNPs pueden localizarse en regiones codi- de SNPs consistían en amplificar y secuenciar ficantes, regulatorias y no codificantes. Cuando fragmentos genómicos equivalentes de regio- están presentes en regiones codificantes, nes génicas específicas del ADN de varios in- muestran 100% de asociación con el carácter dividuos y comparar sus secuencias buscando de interés, por lo que son muy útiles en MAS SNPs. La adopción de esa estrategia involucra (marker assisted selection o selección asistida el diseño de iniciadores para amplificar seg- por marcadores) y en el aislamiento de genes. mentos de ADN de entre 400 a 700 pb, deri- Debido a su frecuencia de distribución, los vados frecuentemente de genes de interés o SNPs surgen como importantes marcadores provenientes de ESTs. Para la amplificación para la obtención de mapas genéticos de alta se emplean ADNs de varios individuos, prefe- resolución. Estudios llevados a cabo utilizando rencialmente representativos de la diversidad Arabidopsis como organismo modelo, han de- de la población de interés. Estos productos mostrado que estos marcadores posibilitan la de amplificación resultantes se secuencian obtención de mapas de una resolución cerca de directamente y las secuencias resultantes se 100 veces superior a la obtenida con los marca- alinean, empleando programas bioinformáticos dores convencionales. apropiados para la identificación de polimorfis- Los SNPs son estables desde el punto de mos (SNPs). vista evolutivo, lo que facilita su empleo en es- Actualmente, la secuenciación a gran esca- tudios de poblaciones. Otra característica im- la del genoma de varios organismos permite la portante es que la genotipificación de los SNPs identificación de SNPs mediante la compara- no está basada en la medida del tamaño de los ción de millares de secuencias depositadas en alelos como ocurre con los otros marcadores las bases de datos, incluyendo clones genómi- moleculares, y la distinción de los alelos puede cos y, principalmente, secuencias de ADNc y/o ser automatizada. Por lo tanto, los SNPs, por ESTs. tener una tasa de mutación relativamente baja, Independientemente del método utilizado ser mucho más frecuentes en el genoma y ser para identificar los SNPs es indiscutible la con- detectables en forma automatizada, surgen tribución de la bioinformática en dicho proceso. como importantes marcadores genotípicos. Por otra parte, la necesidad de la validación En tiempos recientes se han desarrollado experimental de los datos es indispensable. varias metodologías para detectar SNPs que Actualmente, están disponibles distintos mé- utilizan diferentes estrategias para comparar todos de validación y genotipado (detección), regiones específicas del ADN obtenidas de va- uno de ellos son los chips de ADN o microarre- rios individuos. La elección de uno de los mé- glos de ADN. Como se dijo anteriormente, es- todos dependerá de muchos factores: costos, tos chips consisten en arreglos de oligonucleó-

Biotecnología y Mejoramiento Vegetal II 83 tidos de secuencia conocida depositados sobre cleótidos, se están empleando en la actualidad un soporte sólido. Para el caso de la detección para identificar Single Feature Polymorphisms de SNPs, los oligonucleótidos difieren entre sí (SFPs, Polimorfismos de Característica Única) en sitios específicos en nucleótidos individua- como una alternativa atractiva para detectar les (en el sitio del SNP). La técnica es apro- SNPs y otro tipo de mutaciones entre genoti- piada para analizar varios SNPs en paralelo pos. Los SFPs son detectados sobre arreglos a partir de cada muestra (en forma multiplex). de alta densidad de oligonucleótidos (chips) En una columna del arreglo cuatro oligonucleó- y representan polimorfismos de secuencia de tidos diferirán solamente en el sitio del SNP ADN entre dos genotipos dentro de un oligonu- (tendrá cada uno, una de las cuatro bases en cleótido individual, el cual se detecta por dife- la posición del SNP). Cuando este arreglo es rencia en la afinidad de hibridación. El término hibridado con productos de PCR o fragmentos “característica (feature)” refiere a la señal de de ADN genómico obtenidos por nebulización hibridación dada por una sonda (oligonucleóti- (romper el ADN en fragmentos de un tamaño do) en el arreglo (Zhu y Salmeron, 2007). determinado y al azar), estos se unirán solo El descubrimiento de los SNPs, asociado a a los oligonucleótidos perfectamente comple- la posibilidad de utilizarlos como marcadores, mentarios y los productos no perfectamente permite a los investigadores explorar nuevas complementarios (con mismatch) serán lava- hipótesis. Se considera que muchos de estos dos. La unión perfecta de cada caso podrá ser SNPs están localizados en el interior de se- tomada por un sistema de detección. Así, en cuencias génicas, esto puede significar una un único microarreglo (chip) es posible analizar importante reducción en el tiempo y costos miles de SNPs, correspondientes a distintos para el descubrimiento de genes de interés, loci en simultáneo. comparado con los marcadores actualmente Otros métodos de análisis de SNPs incluyen: disponibles. Asimismo, el desarrollo constante cromatografía liquida de alta resolución desna- de tecnologías para su aplicación permitirá au- turalizante (DHPLC), espectrometría de masa, tomatizar el mapeo de alta densidad y, conse- ensayos con extensión de iniciadores, PCR cuentemente, reducir los costos de su empleo en tiempo real, minisecuenciación, secuen- en estudios moleculares a gran escala. ciación de una única base, digestión por enzi- mas de restricción (RFLP), CAPS, entre otros. 5.7 Lecturas recomendadas Puede encontrarse una revisión detallada de estos métodos en Kwok (2001), Tsuchihashi y Andersen J.P & Lübberstedt T. 2003. Functional Dracopoli (2002). markers in plants. Trends Pl. Sc. 8: 554-560. En cuanto a las aplicaciones y perspectivas Botstein D., White R.L., Skolnick M. & Davis R. W. de los marcadores SNPs cabe destacar que Construction of a genetic linkage map in man han sido fundamentales para el análisis de using restriction fragment length polymorphisms. genes y el descubrimiento de la base genéti- Am. J. Hum. Genet. 32: 314-331. 1980. ca molecular de importantes características Branlard G., Dardevet M., Saccomano R., Lagout- agronómico-industriales. Como por ejemplo en te F. & Gourdon J. 2001. Genetic diversity of arroz, el descubrimiento de SNPs involucrados wheat storage proteins and bread wheat quality. en la calidad de cocción, procesamiento y aro- Euphytica 119: 59-67. ma del grano (Larkin y Park, 2003). Caetano-Anollés, G., Bassam, B.J. & Gresshoff, La comparación directa de SNPs también P.M. 1991. DNA amplification fingerprinting using ha sido empleada en estudios de genética de very short arbitrary oligonucleotide primers. Bio/ poblaciones y filogenia, identificación de va- Technology 9: 553-557. riedades, construcción de mapas genéticos y Galbraith D.W. 2006. DNA Microarray Analysis in físicos, análisis funcionales, análisis de asocia- Higher Plants. OMICS: A Journal of Integrative ción en mejoramiento genético vegetal etc. Biology. 10(4): 455-473. El uso de métodos masivos de análisis, Gupta P.K. & Rustgi S. 2004. Molecular markers como los arreglos de alta densidad de oligonu- from the transcribed/expressed region of the ge-

84 Biotecnología y Mejoramiento Vegetal II nome in higher plants. Funct. Integr. Genomics Steinmetz L.M. 2000. Combining genome sequen- 4:139-162. ces and new technologies for dissecting the ge- Konieczny A., & F. Ausubel. 1993. A procedure for netics of complex genotypes. Trends Pl. Sc. 5(9): mapping Arabidopsis mutations using co-domi- 397-401. Tsuchihashi Z. & Dracopoli N.C. 2002. Progress in nant ecotype-specific PCR based markers. Plant high throughput SNP genotyping methods. Phar- J. 4:403–410. macogenomics 2: 103-110. Kwok P-Y. 2001. Methods for genotyping Single Nu- Vos P., Hogers M., Bleeker M., Rijans M., Van de cleotide Polymorphisms. Annu. Rev. Genomics Lee T., Hornes M., Frijters A., Pot J., Peleman Hum. Genet. 2: 235-258. J., Kuiper M. & Zabeau M. 1995. AFLP: A new Larkin P.D. & Park W.D. 2003. Association of waxy technique for DNA fingerprinting. Nucleic Acids gene single nucleotide polymorphsim with starch Res. 23:4407-4414. characteristics in rice (Oryza sativa L.). Mol Welsh J. & McClelland M. 1990. Fingerprinting ge- Breed 12:335-339. nomes using PCR with arbitrary primers. Nucleic Litt M. & Luty J.A. 1989. A hypervariable microsate- Acids Res. 18:7213-7218. Williams J.G., Kubelik A.R., Livak K.J., Rafalski L.A. llite revealed by in vitro amplification of a dinu- & Tingey S.D. 1990. DNA polymorphism ampli- cleotide repeat within the cardiac muscle actin fied by arbitrary primers are useful as genetic gene. Am. J. Hum. Genet. 44:398-401. 1989. markers. Nucleic Acids Res. 18:6531-6535. McCallum C.M., Comai L., Greene E.A. & Henikoffet Zhu T. & Salmeron J. 2007. High-definition genome S. 2003. Targeting induced local lesions in ge- profiling for genetic marker discovery. Trends Pl. nomes (TILLING) for plant functional genomics. Sc. 12(5): 196-202. Plant Physiol. 123:439-442. Olson M., Hood L., Cantor C. & Dotstein D. 1989. A common language for physical mapping of the human genome. Science 245:1434-1435. Paran I. & Michelmore R.W. 1993. Development of reliable PCR based markers linked to downy mildew resistance genes in lettuce. Theor. Appl. Genet. 85:985-993. Rensink W.A. & Buell C.R. 2005. Microarray ex- pression profiling resources for plant genomics. Trends Pl. Sc. 10(12): 603-609.

Biotecnología y Mejoramiento Vegetal II 85 I CAPITULO 6 llo de mapas genéticos altamente saturados permite el clonado posicional de genes.

Construcción de mapas de 2. Introducción a la construcción de ma- ligamiento genético, localización pas genéticos en vegetales de genes y regiones Para comprender mejor las bases teóricas cromosómicas asociadas a y metodológicas empleadas en el mapeo ge- caracteres de interés en plantas nético es necesario recordar algunos concep- tos básicos de genética Mendeliana. Gregor Gerardo D L Cervigni, Mendel realizó sus experimentos en Pisum sativum (arveja cultivada) efectuando cruza- Juan Pablo A Ortiz, Sergio E Feingold mientos controlados entre individuos que se diferenciaban en determinadas características 1. Introducción La posibilidad de construir mapas de liga- (como por ejemplo el color de la flor, tipo de miento genético en especies vegetales o ani- tegumento de las semillas y largo de los tallos), males es una de las contribuciones de mayor y estudió la forma en que estos caracteres se impacto de las técnicas de marcadores mole- transmitían a la descendencia. A partir de datos culares en las ciencias biológicas. Los marca- experimentales formuló una hipótesis simple dores moleculares utilizados pueden corres- para explicarlos y posteriormente diseñó expe- ponder a regiones intergénicas no codificantes rimentos para contrastarla. Sus trabajos permi- o a segmentos génicos, en cuyo caso son de- tieron inferir la existencia de “factores” heredi- nominados funcionales y constituyen marca- tarios y sus mecanismos de transmisión antes dores “ideales” a los efectos de selección de de conocer la existencia del ADN como mate- genotipos. Un mapa genético establece de ma- rial de transmisión genético. En base a sus da- nera probabilística el arreglo lineal de un grupo tos experimentales Mendel formuló su prime- marcadores (o genes) sobre el genoma de una ra ley, o ley de la segregación. Ella establece especie. Si bien el concepto data de principios que los miembros de un par génico (alelos) se de siglo XX, a partir de los trabajos de Morgan segregan (se separan) uno de otro durante la y Bridges con mutantes de Drosophila, recién formación de las gametas. Como consecuen- a partir del advenimiento de los marcadores cia, la mitad de las mismas portan un alelo y moleculares fue técnicamente posible construir la otra mitad el otro. La progenie es luego for- mapas genéticos saturados en la mayoría de mada por la combinación al azar de las game- las especies vegetales de interés agronómico. tas de ambos progenitores. La segunda ley de Usando este tipo de mapas es posible iden- Mendel, o ley de la segregación independiente, tificar la posición y el efecto de genes sobre indica que la segregación de los alelos de un caracteres de importancia mediante asocia- gen es independiente de la segregación de los ciones estadísticas entre los valores fenotípi- alelos de otro gen. Estas dos leyes fueron los cos y las variantes alélicas de los marcadores. puntos de partida sobre los cuales se elaboró La disponibilidad de mapas genéticos permite toda la teoría de herencia que hoy conocemos. también la selección indirecta de genotipos de- Incluso aún en el presente, los análisis de las seables, comúnmente denominada MAS (del frecuencias en que aparecen los caracteres inglés Marker Assisted Selection), mediante el en las progenies de cruzamientos controlados seguimiento de marcadores localizados en re- son una parte fundamental de los análisis ge- giones genómicas determinadas. La utilización néticos. Los caracteres genéticos pueden estar de marcadores comunes permite comparar la controlados por uno o pocos genes, o poseer estructura del genoma de diferentes especies un control complejo que involucra muchos ge- (comparative mapping) e identificar rearreglos nes, denominados loci de caracteres cuantitati- cromosómicos a pequeña y gran escala (micro vos o QTLs (del inglés Quantitative Traits Loci), y macro sintenia) para estudios de filogenia y a menudo afectados por el ambiente. La dis- evolución molecular. Por otro lado, el desarro- ponibilidad de un gran número de marcadores

86 Biotecnología y Mejoramiento Vegetal II (loci) polimórficos, no afectados por el medio mitan la construcción del mapa genético. En ambiente, neutros, sin efectos deletéreos y ausencia de polimorfismos genéticos los aná- cuya herencia pude determinarse con relativa lisis de segregación y ligamiento son imprac- facilidad, simplificó enormemente los análisis ticables. En general los cruzamientos entre genéticos en especies vegetales y animales. especies alógamas presentan mayor grado de La construcción de un mapa de ligamiento ge- polimorfismo que entre autógamas. La falta de nético es esencialmente una representación polimorfismos es común en poblaciones deri- gráfica lineal del orden más probable de mar- vadas de cruzamientos entre progenitores de cadores moleculares o genes a partir de los va- base genética estrecha, como los realizados lores de recombinación observados entre ellos. entre distintos cultivares de la misma especie Cada arreglo lineal es denominado “grupo de o entre individuos de especies silvestres deri- ligamiento”. En teoría un mapa saturado debe vados de la misma población natural. En teoría contener el mismo número de grupos de liga- es posible desarrollar varios tipos de poblacio- miento que número básico de cromosomas. nes segregantes y la decisión de cual utilizar En este Capítulo se desarrollarán los con- depende de la resolución que se desee alcan- ceptos básicos del mapeo genético en vegeta- zar con el mapa y la posibilidad y/o facilidad les y algunas de sus aplicaciones. De ninguna de desarrollarla. En la Figura 1 se muestra un manera se pretende abordar el tema en toda esquema del desarrollo de 5 poblaciones bási- su extensión debido a que la misma supera cas de mapeo. Las poblaciones de tipo retro- largamente los objetivos de este libro. Aquellos cruza (backcross o BC1) y F2 son generalmente lectores que deseen ampliar y profundizar los adecuadas y fáciles de generar en la mayoría temas que aquí se desarrollan pueden consul- de las especies cultivadas como: trigo, maíz tar los textos que se citan en la lista de referen- y soja. Las poblaciones F2 proveen mayor in- cias bibliográficas al final del Capítulo. formación genética que las retrocruzas para el Los pasos fundamentales a seguir en la mismo número de individuos debido a que pue- construcción de un mapa genético de una de- den evaluarse dos cromosomas recombinan- terminada especie o el mapeo específico de un tes por planta. En especies autoincompatibles gen (locus) de interés pueden resumirse en: 1) y altamente heterocigotas las poblaciones F1 selección de progenitores y desarrollo de una también son segregantes y pueden emplear- población segregante (población de mapeo), 2) se para mapeo. Estos 3 tipos de familias son generación de un número suficiente de marca- efímeras, es decir, que cada individuo segre- dores y registro de los mismos en cada uno de los individuos de la población (genotipado), 3) determinación de las frecuencias de recombi- nación entre marcadores y determinación de grupos de ligamiento y 4) determinación del or- den de los marcadores y conversión de la fre- cuencia de recombinación (r) en unidades de mapeo o centiMorgan (cM).

2.1. Poblaciones de mapeo El primer paso en todo proyecto de mapeo es el desarrollo de una población segregan- te para una o más características de interés. La selección de los progenitores es un punto importante debido a que no sólo deben ser contrastante para la característica en estudio, sino que además deben presentar diferencias a nivel de secuencias del ADN y así obtener suficientes marcadores polimórficos que per- Figura 1.

Biotecnología y Mejoramiento Vegetal II 87 gará las combinaciones génicas que porta en de la F1. La desventaja de este método es que la siguiente generación. Si no es posible man- es necesario disponer de un protocolo eficiente tenerlas clonalmente como por ejemplo a partir para la regeneración de plantas in vitro a partir de órganos vegetativos o por cultivo in vitro, la del cultivo de anteras y la posterior duplicación información obtenida en ellas debe ser transfe- cromosómica. rida a una nueva población utilizando algunos Una vez establecido el tipo de población a de los marcadores que fueron previamente lo- utilizar, el número de individuos es también un calizados (mapeados) de manera de conservar punto importante debido a que la resolución del puntos de referencia entre ambas. mapa y el ordenamiento de los marcadores en En el caso de requerirse múltiples ensa- los grupos de ligamiento dependen de éste. En yos, (repeticiones intra experimento, ensayos general, poblaciones de 60 a 100 individuos en distintas localidades o en varios años), son adecuadas para trabajos de tipo acadé- es necesario desarrollar poblaciones de ma- mico, como la localización de un determinado peo inmortales como las Líneas Endocriadas locus en el genoma o el mapeo de un carác- Recombinantes (RILs por Recombinant Inbred ter cualitativo. Sin embargo, para proyectos de Lines) o poblaciones de Haploides Duplicados mapeo de QTLs o la construcción de mapas de (DHs). Ambas poblaciones se componen de un alta resolución son necesarias poblaciones de conjunto de líneas homocigotas que pueden 500 a 1000 individuos. ser replicadas por semillas varias veces y por varios ciclos de cultivo. Estas características 2.2. Registro de marcadores moleculares las hacen especialmente adecuadas para ma- y clasificación de la población pear QTLs. Las RILs son generadas a partir de Los marcadores moleculares útiles para ma- una población F2 por descendencia de semilla peo deben existir en 2 o más formas alélicas única de un número determinado de individuos distinguibles, de manera que los genotipos de durante cinco o más generaciones. Finalmente, cada individuo puedan ser claramente identifi- cada línea representará los diferentes bloques cados. Los mismo pueden ser de tipo dominan- de ligamiento presentes en un individuo F2 de te (presencia o ausencia de una banda como la población original, pero en estado homoci- en RAPD y AFLP) por lo cual no es posible gota. Una vez estabilizadas, las RILs pueden distinguir entre el genotipo homocigota (AA) ser mantenidas y multiplicadas por semillas del heterocigota (Aa) o co-dominantes (todos año tras año. Una de las desventajas de este los alelos pueden identificarse, por ej., usan- método es que algunas regiones del geno- do SSR y RFLP), donde los 3 genotipos de un ma pueden seguir en el estado heterocigota mismo locus dialélico pueden ser discriminados a pesar de las múltiples autofecundaciones. (AA, Aa y aa). Como criterio general una vez Por otro lado, no es posible desarrollarlas en que se dispone de entre 100-200 marcadores especies autoincompatibles. Las poblaciones en una determinada población es posible identi- DH se generan a partir del cultivo de tejidos de ficar grupos de ligamiento, regiones genómicas anteras de individuos F1. En algunas especies específicas y mapear genes o QTLs. Asimismo, es posible regenerar plantas enteras a partir prácticamente cualquier nuevo marcador que de microgametofitos haploides (grano de polen se agregue pude integrarse a los preexistentes. en el estado uninucleado). Si la planta dado- El genotipo de cada individuo de la población, ra es una F1, sus granos de polen portarán las para cada uno de los marcadores debe ser de- gametas derivadas de la meiosis con diferen- terminado (genotipado). En general se toman tes combinaciones alélicas. Posteriormente, como marcadores informativos aquellos que por tratamientos de duplicación cromosómica muestran relaciones de segregación, por pre- con colchicina, las plantas haploides obtenidas sencia/ausencia, que se ajusten a las frecuen- pueden diploidizarse llevando todos los loci al cias esperadas considerando el tipo de pobla- estado homocigota. Como resultado se obtiene ción y marcador molecular utilizado (por ej.: 1 una serie de líneas que representan las com- Aa: 1 aa en una retrocruza o 3 A_: 1aa en una 2 binaciones génicas presentes en las gametas F2), por medio de la prueba del ji-cuadrado (Χ ).

88 Biotecnología y Mejoramiento Vegetal II 2.3. Estimación de las frecuencias de para que el número de plantas recombinantes recombinación y detección de grupos de sea igual al de no recombinantes, se dice que ligamiento los mismos segregan independientemente. Por otro lado, si el número de plantas recombinan- 2.3.1. Concepto de ligamiento tes es menor al esperado (50%) se considera Dos loci que se encuentran muy cercanos que ambos loci están ligados genéticamente. en el mismo cromosoma no segregan indepen- De esta manera, determinando la frecuencia dientemente durante la meiosis. Esta relación de aparición de individuos con combinaciones se denomina ligamiento genético y explica la alélicas recombinantes es posible realizar una aparición de una proporción mayor de indivi- medida relativa de la distancia entre ellos. 2.3.2 duos portando combinaciones alélicas paren- tales que lo esperado según la Segunda Ley Detección del ligamiento de Mendel. Los genes ligados pueden ser se- El primer paso en el estudio del ligamiento parados por un intercambio físico de partes de entre 2 loci (por ej., A y B) consiste en deter- cromosomas (cromátidas hermanas) durante minar si los mismos segregan individualmen- la meiosis por el proceso de entrecruzamiento te de acuerdo al modelo esperado (1:1, 3:1, o “crossing-over” (CO), el cual genera game- 1:2:1, etc.), y posteriormente, si lo hacen en tas recombinantes, distintas de las parentales forma independientemente o no. En ambos (Figura 2). casos la prueba estadística adecuada es el Χ2

Figura 2.

Existe una relación entre la distancia física considerando un nivel de significancia prede- a la que se encuentran 2 loci y la probabilidad terminado (p ≥ 0,05 o 0,01), aunque también de que se produzca un CO entre ellos. Cuanto es posible utilizar el LOD score (ver punto 2.4). más alejados estén uno del otro mayor será Si la probabilidad asociada al Χ2 obtenido para la probabilidad de que ocurra un entrecruza- cada locus en forma individual es superior a la miento y se generen gametas recombinantes. predeterminada, se considera que ambos mar- Consecuentemente, si dos loci están lo sufi- cadores segregan de acuerdo a lo esperado. cientemente separados en el cromosoma como En el segundo paso, el número de progenies

Biotecnología y Mejoramiento Vegetal II 89 observadas en cada clase genotípica se con- 1 producto de cada 100 meiosis es del tipo re- trasta con los valores esperados para una se- combinante. Un ejemplo de los pasos a seguir gregación independiente (Tabla 1). en la estimación del ligamiento entre dos ge- nes se muestra en la Figura 3.

Tabla 1: Segregaciones esperadas para 2 loci inde- pendientes en distintas poblaciones de mapeo.

BC­1: población de retrocruzamiento; F2: población tipo F2 derivada del cruzamiento entre 2 progenitores heteroci- gotas; RIL: población de líneas endocriadas recombinan- tes (RILs por Recombinant Inbred Lines) y DH: población de haploides duplicados.

La hipótesis nula (Ho) es que ambos loci se- gregan independientemente y la hipótesis al- ternativa (HA) es que ambos loci están ligados. Si los desvíos obtenidos entre los valores ob- servados y esperados tienen una probabilidad de ocurrencia menores que 1/20 o 1/100 (p < 0,05-0,01), se considera que los loci A y B no segregan independientemente y por lo tanto se acepta HA que indica la existencia de ligamien- to entre ellos (ver ejemplo Figura 3).

2.3.3. Estimación de la frecuencia de recombinación Una vez verificada la existencia de ligamien- to entre 2 loci es posible estimar la frecuencia Figura 3. de recombinación (r) entre ellos. En el caso más simple de una retrocruza, todas las clases fenotípicas (o genotípicas) pueden ser identi- ficadas (Figura 3). El valor de r expresado en En este caso la frecuencia de recombinación porcentaje se calcula: entre A y B es de 5,55 %. Como la frecuen- cia de recombinación es una proporción, su variancia (derivada de la distribución binomial) está dada por la expresión: R (1-R)/N, donde R es la frecuencia de recombinación y N es el número total de los individuos de la población. Una estimación de r = 0,01 (1 %) es definida Por lo tanto, un valor de r = 5,55 % (como el como una unidad de mapeo (u.m), y corres- de nuestro ejemplo), posee el siguiente error ponde a la distancia entre dos loci en la cual estándar:

90 Biotecnología y Mejoramiento Vegetal II B nunca hubiéramos detectado estos dobles entrecruzamientos. Extendiendo este razona- miento, en realidad tampoco sabemos si entre A-B hubo entrecruzamientos dobles y, por lo De esta manera es posible establecer el gra- tanto, haber subestimado la proporción de re- do de ligamiento entre 2 loci. Sin embargo, en combinantes entre ellos. Cuanto más grande es algunos tipos de poblaciones como las F , no 2 la distancia entre 2 marcadores, más inexacta todas las clases genotípicas pueden ser iden- será la medida de la distancia. Asimismo, otro tificadas fácilmente, especialmente cuando se hecho que debe considerarse es el fenómeno trabaja con marcadores co-dominantes. Esto de interferencia (I). La interferencia se relacio- es debido a que no es posible diferenciar si los na con la imposibilidad física de que adyacente dobles heterocigotas derivan de 1 o 2 game- a un punto de entrecruzamiento se produzca tas recombinantes. Para estos casos se han otro en la misma meiosis debido a un impedi- desarrollado procedimientos alternativos para mento físico entre ellos (se "interfieren"). Estas estimar las distancias genéticas. El método características hacen que las frecuencias de de máxima probabilidad (maximum likelihood recombinación no sean magnitudes aditivas method) es el más utilizado. Debido a que se para grandes segmentos cromosómicos. Para trata de un método estadístico de estimación solucionar esto, los valores de r se convierten de probabilidades las fórmulas empleadas en unidades de mapeo (centMorgan – cM) me- en los cálculos son generalmente complejas. diante la aplicación de las funciones de mapeo. Allard (1956) desarrolló el método de los sco- Las ecuaciones para convertir r en cM derivan res para derivar las fórmulas, estimar las dis- de funciones de distribución y son fundamen- tancias genéticas y calcular las desviaciones talmente dos, la función de Haldane (1919) y la estándares para varios tipos de poblaciones. de Kosambi (1944). La diferencia básica entre Afortunadamente en el presente se dispone de ellas es el supuesto que asumen con respec- programas de computación que utilizan estas to a la interferencia en la ocurrencia de dobles fórmulas y permiten trabajar con grandes ar- CO. La función de Haldane considera interfe- chivos de datos derivados de poblaciones de rencia nula (I=0) mientras que la función de un gran número de individuos. Entre los más Kosambi estima el valor de I. Estos valores ge- populares se encuentran el Mapmaker (Lander neralmente se encuentran entre 0 y 1 (interfe- 1987) y el JoinMap (Stam et al. 1993). rencia completa). El valor real de interferencia se ubicará entonces en algún lugar en medio 2.3.4. Ordenamiento de los marca- de ambos valores. Los valores de cM estima- dores y conversión de frecuencias a dos con ambas funciones son equivalentes unidades de mapeo cuando se consideran valores de r de hasta 10 Cuando se estudia el ligamiento simultáneo %, para valores mayores la transformación de entre 3 o más marcadores (por ej. A, B y C), Kosambi es más exacta. se puede establecer un orden en base a las distancias relativas entre ellos (mapeo de 3 puntos). Suponiendo que el orden sea ABC, la 2.4. Programas de mapeo La utilización de programas de mapeo distancia estimada en la prueba de 2 puntos como el Mapmaker 3.0 (Lander et al. 1987; entre A y C será aproximadamente igual a la suma de la distancia entre A-B + B-C. Sin em- http://www.nslij-genetics.org/soft/mapmaker) bargo, frecuentemente la distancia entre A y C o JoinMap 1.4 - 4.0 (Stamp 1993; http://www. (medida como prueba de dos puntos) suele ser kyazma.nl), permiten el análisis simultáneo de menor a la de A-B + B-C. Esto se debe a la muchos marcadores en poblaciones de gran presencia de entrecruzamientos dobles entre número de individuos, mediante la utilización A y C cuyo resultado final es la formación de de métodos de estimación de parámetros gametos parentales AC y ac que se computan como el de máxima probabilidad o mínimos como "no recombinantes", cuando en realidad cuadrados. Estos programas poseen diferen- sí lo son. Si no hubiéramos mapeado el gen tes procedimientos, o rutinas, que permiten la

Biotecnología y Mejoramiento Vegetal II 91 estimación de r entre pares de marcadores, 3. Mapeo de QTL la identificación de los grupos de ligamiento y Muchas de las características de importan- la determinación del orden de los marcadores cia agronómica presentan una distribución dentro de cada grupo. El programa Mapmaker continua de valores, esto es, dentro de una utiliza el test estadístico LOD score para eva- población determinada no existe una clara dis- luar el valor de r estimado y la posición más tinción en clases fenotípicas. La base genética probable de un marcador en el grupo de liga- de estas características fue esclarecida poco miento. El LOD score (logaritmo de los odds) después del redescubrimiento de las leyes de es el logaritmo en base 10 del cociente entre la Mendel, cuando Yule en 1902 propuso que probabilidad de obtener los datos observados esa variación era la consecuencia de la acción en caso de que los loci considerados estuvieran aditiva de muchos genes. Entre éstos se sue- ligados, sobre la probabilidad de obtener los da- le identificar a genes de efectos pronunciados, tos en ausencia de ligamiento. Un LOD = 3 para denominados genes mayores y genes con pe- un par de marcadores indica que es mil veces queños efectos que fueron inicialmente deno- más probable que los loci estén ligados respec- minados poligenes. Sin embargo, la distinción to a que no lo estén. El programa Mapmaker entre poligenes y genes mayores (también lla- también utiliza LOD score para comparar dife- mados oligogenes) no resultó satisfactoria ya rentes órdenes posibles entre varios genes. Al que el efecto de un gene depende del entorno orden más probable le asigna un 0 y a los res- genético, el ambiente y del alelo presente en el locus del gen. Geldermann (1975) propuso tantes le asigna valores negativos. Por su par- denominar a estos loci controladores de carac- te, el programa JoinMap (Stam, 1993) permite terísticas cuantitativas como QTLs (del inglés trabajar con distintos tipos de poblaciones e in- Quanitative Traits Loci). Esta nomenclatura re- clusive con distintos tipos de segregación den- sultó más adecuada ya que no asocia al gen tro de la misma población. Este programa fue con la magnitud de su efecto. especialmente diseñado para estimar datos de Si bien la genética cuantitativa ha propues- ligamiento genético en poblaciones derivadas to y utilizados modelos biométricos con gran de especies altamente heterocigotas y/o donde éxito a lo largo de la historia del mejoramiento no es posible obtener líneas puras. Otra de sus de plantas y animales, estos modelos se ba- principales ventajes es que permite “combinar” san en la estimación de los efectos génicos y mapas derivados de distintas poblaciones (o no tanto en el número de genes involucrados. datos bibliográficos) si disponen marcadores en Utilizando marcadores moleculares ligados a común (Stam 1993). Debido a que las unidades los QTLs, es posible estimar el genotipo, los de mapeo genético están basadas en frecuen- efectos genéticos y tener una aproximación cia de recombinación su significado en cuanto menos sesgada del número de o genes/QTLs a distancia física (número de nucleótidos) entre determinantes del carácter. Es indispensable dos loci varía según la especie considerada, el que el lector no considere la metodología de cromosoma y la localización dentro del mismo. marcadores moleculares sustituta de de los Es conocido que existen regiones de alta fre- modelos genéticos-estadísticos utilizados por cuencia de recombinación localizadas sobre los la genética cuantitativa, por el contrario, ellos brazos cromosomales (comúnmente llamados son la base de los estudios de mapeo de ge- hotspots) y regiones donde la recombinación nes/QTL utilizando marcadores moleculares. está fuertemente restringida como por ejemplo cerca de los centrómeros o telómeros. Aunque Una de las técnicas de identificación de se corre el riesgo de cometer un error grosero QTLs es la denominada asociación con mar- puede considerarse que en promedio 1 cM equi- cas simples o marcadores individuales. En este vale aproximadamente a 1 Mpb (un millón de caso, la utilización de un mapa genético no es pares de bases) en humanos y entre 500 y 750 necesaria, aunque un mapa genético ayuda a kpb (mil pares de bases) en plantas superiores la interpretación de los resultados. Las posibi- (como el arroz y tomate, respectivamente). lidad de identificar un QTL usando marcadores

92 Biotecnología y Mejoramiento Vegetal II moleculares depende de la distancia genética Efecto aditivo existente entre el marcador y el QTL, y de la m - m magnitud de los efectos genéticos, aditivo (a) y a = MM mm de dominancia (d) (ver más abajo), del propio : 2(1- 2 r) QTL. La estimación de estos efectos es indi- recta pues se realiza con base en el marcador Efecto de dominancia: ligado al QTL. Además, la estimación de estos efectos será más o menos exacta dependien- do de la técnica de mapeo utilizada, siendo la más adecuada aquellas técnicas derivadas del mapeo por intervalo. Consideremos M/m el locus del marcador Razón d/a (grado medio de dominancia): molecular y Q/q el locus del QTL. Para saber d 2m - m + m si M y Q están ligados, son necesarias las si- = Mm MM mm d guientes etapas: a (1- 2r)(m MM - mmm) • obtener una población segregante para ambos loci M y Q(población de mapeo), Si el QTL no estuviera ligado al marcador, • medir la característica fenotípica (Y) con- (r = 0,5) las diferencias entre las tres medias trolada por el QTL (Q), no serán estadísticamente significativas. De la • obtener el fenotipo del marcador (M) en misma forma, si a y d fuesen iguales a cero (au- cada planta de esta población, y registrarlo sencia de efecto), no se detectarían diferencias en una matriz de datos. estadísticas entre las medias. De esta manera, sólo si r < 0,5 es posible detectar asociaciones Considerando el caso de un único locus entre M y Q, dependiendo esta detección del (Q/q), en que el alelo Q aumenta el valor de grado de ligamiento o magnitud de r (pequeños la característica, y haciendo µQQ, µQq y µqq valores de r facilitan la detección) y del efecto las medias de los individuos con genotipos QQ, del alelo Q sobre el carácter. Qq y qq, respectivamente, y µ = (µQQ + µqq)/2 la media entre los genotipos homocigotos, los µ Formalmente tenemos: Ho: µMM=µMm= mm; siguientes efectos genéticos pueden ser obte- ≠ ≠ ≠ HA1: µMM µMm; HAa2: µMM µmm; HA3:µMm µmm. nidos una población F2:

Medias de los genotipos µqq µ µQq µQQ

d Valores genotípicos -a a

a) efecto aditivo (a) y (d) efecto de la domi- La asociación Marcador-QTL se confirma nancia donde: si las diferencias entre las medias fenotípicas mQQ - mqq mQQ + mqq de grupos de marcadores son estadísticamen- a = d = mQq - 2 2 te diferentes de cero (se rechaza de Ho). Las diferencias pueden ser evaluadas por medio

án una generación F2 cuyos genotipos mar- del análisis de la varianza (ANOVA) o prueba cadores MM, Mm y mm estarán presente en la t, eligiendo un nivel de significancia de P ≤ 0,05 frecuencia de 1/4, 1/2 y 1/4, respectivamente. como se ejemplifica en la Tabla 2. En este caso los efectos a, d y d/a son estima- En una población F2, la asociación entre el dos con base en el marcador ligado al QTL, marcador y el QTL puede ser valorada a través como sigue: de la regresión entre los genotipos y su corres-

Biotecnología y Mejoramiento Vegetal II 93 Tabla 2: ANOVA entre los tratamientos MM, Mm y mm obtenidos de una población F2 Observe que:

a = g1 - g2

y d = g2 + g1

por lo que para estimar los efec- tos a y d en una población de retro- FV: fuente de variación, GL: grados de libertad, SC: suma de cuadra- cruzamiento debe retrocruzarse la dos, CM: cuadrados medios, F: valor del estadístico F (CM Tratamiento/ F con cada uno de los progenito- CM Residuo) y P: probabilidad de rechazar una H verdadera. Cuando 1 o res. Un problema adicional es que P < 0,05 indica asociación entre el marcador (M) y el QTL (Q).v a y d pueden anularse. Si existiera dominancia completa de Q sobre q pondiente fenotipo. En este caso, es necesario (d = a), g1 = 0 y si existiera dominancia comple- codificar los tres genotipos (MM, Mm y mm) ta de q sobre Q (d = -a), g2 = 0. como 1, 0 y -1 para el modelo aditivo, y 0, 1 y 0 para el modelo dominante. El análisis de ANOVA y la regresión son téc- nicas que permiten la identificación de mar- El modelo de regresión adoptado es: cadores ligados a QTLs, pero poseen ciertas limitaciones: β β β ε 1) no indican si hay uno o más QTLs asocia- Yi = 0 + 1X1j + 2X2j + j. dos al marcador, donde: 2) no estiman la posición del QTL y 3) el efecto del QTL puede ser subestimado Yi= valor de la característica; X1j= código del marcador para efecto aditivo (MM = 1, Mm = 0, debido a que es confundido con la frecuencia de recombinación. mm = -1); X2j= código del marcador para efec- β to dominante (MM = 1, Mm = 0, mm = -1); 0 = intercepto de la regresión (media de la ca- 3.2. Mapeo por intervalos β El mapeo por intervalo (interval mapping) fue racterística); 1 = inclinación de la recta para el β propuesto originalmente por Lander y Botstein modelo aditivo; 2 = inclinación de la recta para ε (1989) y es la base de todos los métodos de el modelo dominante y j = error aleatorio para j-ésimo individuo. mapeo de QTL utilizados actualmente. Para conceptualizar esta metodología podemos Una vez evaluado y confirmado el modelo considerar el cruzamiento entre dos progenito- completo (modelo aditivo + dominante), debe res homocigotos cuya F1 posee la constitución analizarse la importancia relativa de cada uno genética que se ejemplifica en la Figura 4. de los modelos, por ejemplo mediante la me- A diferencia del mapeo por marcas simples, todología de regresión múltiple de eliminación en el mapeo por intervalo es indispensable por paso (stepwise). poseer un mapa genético ya que la unidad de En poblaciones de retrocruzamiento, sólo el análisis es el intervalo genético y no un marca- genotipo heterocigoto (Qq) y uno de los homo- dor individual. De manera resumida el mapeo cigotos (QQ o qq) están presentes por lo que por intervalo utiliza la siguiente estrategia: 1) el efecto aditivo y dominante quedan confun- como la distancia entre cada par de marcado- res es conocida, el método estima los paráme- didos, en este apartado denominados g1 y g2, respectivamente, y estimados como sigue: tros del modelo a incrementos de distancias genéticas predefinidos, 2) los parámetros del modelo pueden ser estimados mediante la fun- ción de verosimilitud o regresión, 3) la hipótesis H0: ausencia de QTL/ HA: QTL en un intervalo Yg2 =m Mm- m mm = ()a+d ()1-2r entre marcadores, son contrastadas a través

94 Biotecnología y Mejoramiento Vegetal II entre los marcadores, el genotipo de QTL más probable dentro del intervalo sería QQ. Así, la única variable indicadora que asume valor es x* y ese valor es 1 (p = 1), pues no exis- ten desvíos debido a la dominancia y el alelo Q incrementa el valor del carácter. El intervalo

M1M1M2m2 fue generado por una gameta pa- rental y otra recombinante. Ahora es probable que dentro del intervalo genético el genotipo del QTL sea QQ o Qq con probabilidades 1-p y p, respectivamente. El valor 1-p será máximo cuando estemos cerca del genotipo marcador

M1M1 y mínimo cuando estemos próximos de Figura 4. M2m2. Lo contrario sucederá con el valor de p. Las variables x* y z* asumirán valores 1-p de la razón de dos verosimilitudes, LR (LR por y p, respectivamente, cuyos valores variaran Likelihood Ratio) o LOD score y 4) la presencia conforme nos desplacemos en el intervalo a de un QTL es inferida cuando el máximo valor distancias ra. Con el mismo razonamiento se de LR o de LOD obtenido es mayor a un um- pueden encontrar las probabilidades condicio- bral previamente establecido (punto 3.4). nales de los genotipos QQ, Qq y qq para los

Haley y Knott (1992), presentaron un modelo intervalos M1M1m2m2 y M1m1M2m2. de mapeo por intervalos basados en regresión. Según el modelo de Según Haley y Knott El modelo adoptado para poblaciones F2 es: (1992) una regresión es realizada para cada * * valor de r entre los marcadores M y M . El Yj = µ + ax + dz + εj. a 1 2 2 valor de ra que produzca el mayor valor de R (coeficiente de determinación), LR o de LOD donde: Yj = valor de la característica Y en el individuo j; µ = media de la característica en la indica la localización del QTL. El test de sig- población; a = efecto aditivo del locus que está nificancia de hipótesis, LR, según puede ser siendo estudiado, sobre la característica Y; d = expresado como: efecto de dominancia del locus que está siendo SCR (reducido) * * LR = 2ln estudiado, sobre a característica Y; x y z son SCR las variables indicadoras (utilizadas para esti- (completo) mar los efectos a y d del QTL) y dependen de los genotipos de los marcadores flanqueantes educido) = Suma de cuadrados del residuo del ε modelo reducido: Y = µ + e SCR = Suma del QTL, en el individuo j y j = error aleatorio j j; (completo) para j-ésimo individuo. de cuadrados del residuo del modelo completo: Yj = µ + ax* + dy* + εj ( para F2), Yj = µ + g1x* Expliquemos como se obtienen los valores + εj (para Retrocruzamientos) y Yj = µ + ax* + * * de las variables indicadoras x y z presenta- εj (para RIL y DH). Los valores de LOD se en- dos en la Tabla 3. Para adjudicar estos valores cuentran dividiendo el valor LR por 4,61 (LOD debemos respondernos la pregunta: Dado un = LR / 4,61). intervalo genético de marcadores moleculares, cuyo fenotipos son conocidos, ¿cuál es la pro- 3.3. Mapeo por intervalo compuesto babilidad que dentro del intervalo el genotipo En el mapeo por intervalo, los tests de hi- del QTL sea QQ, Qq o qq?. Consideremos el pótesis no son independientes de otros QTLs ligados al intervalo siendo analizado. Para intervalo genético M1M1M2M2. El genotipo de los marcadores indica que fue generado por QTLs no ligados al intervalo el efecto no es tan el encuentro al azar de las gametas parenta- dramático, pero deben hacerse las siguientes les M1M2. Dado que no existió recombinación consideraciones: 1) la segregación del QTL no

Biotecnología y Mejoramiento Vegetal II 95 Tabla 3: Esperanza de los efectos genotípicos medios para un QTL para todos los po-

sibles genotipos de los marcadores flanqueantes, en una población 2F , cuando no se considera la ocurrencia de recombinaciones dobles en el intervalo.

2 2 2 p=ra/r ; (1-p)= rb/r; c=r /[r +(1-r) ] (Tomado de Schuster & Cruz, 2004).

ligado contribuye a la variación fenotípica; blación F2 pueden ser estimados los efectos

2) interfiere en la estimación del efecto del QTL aditivo y de dominancia, en un RC el efecto g1 y 3) removiendo el efecto de la segregación o g2 y sólo el efecto aditivo en poblaciones de del otro QTL se reduce la varianza residual RILs y DH. Para determinar si el valor de cada del intervalo en consideración, aumentando el efecto estimado es diferente de cero se usan poder de detección y precisión. El mapeo por las estadísticas LR o LOD. En muchos trabajos intervalo compuesto (Jansen 1993, 1994; Zeng de mapeo un valor de LOD superior a 2 – 3 1993, 1994), combina el mapeo por intervalo es utilizado como criterio para declarar la pre- con la regresión múltiple. Esta última, permite sencia de un QTL. Esta forma de determinar el incluir en el mapeo marcadores ubicados por valor umbral o crítico es arbitrario y la mayoría fuera del intervalo como cofactores, incremen- de los autores no lo consideran el más adecua- tando el poder de detección y precisión en la do, pues la probabilidad e detectar al menos un estimativa de la posición del QTL. La pregunta falso positivo (declarar la real la presencia de de cuántos cofactores deben utilizarse no es un QTL inexistente) en alguna región del ge- de fácil respuesta. En principio los dos marca- noma es prácticamente 1 (100 %). Se propuso dores que flanqueen el intervalo deben ser in- disminuir este sesgo determinando un nivel de cluidos, al igual que aquellos que resulten sig- significancia para cada cromosoma. En este nificativos en una regresión múltiple. Definidos caso, el nivel de corte para cada cromosoma los marcadores que se utilizarán como cofac- correspondería al del genoma completo dividi- tores, la metodología de mapeo por intervalo do el número de cromosoma o grupos de liga- compuesto se aplica exactamente igual a la de mientos obtenidos. También es posible definir mapeo por intervalo simple. un nivel de significancia para cada intervalo, di- vidiendo la significancia del cromosoma por el 3.4. Test de hipótesis y nivel de número de intervalos en el grupo de ligamiento significancia (número de marcadores menos uno). La formulación de hipótesis adecuadas y Finalmente, el valor crítico de corte puede utilización de estadísticos apropiados, para la establecerse empíricamente mediante el test evaluación de las mismas, es esencial para de permutaciones que es actualmente el más declarar la presencia de un QTL. En una po- usado. Para realizar este test deben numerar-

96 Biotecnología y Mejoramiento Vegetal II se los individuos de 1 a n. Los valores fenotípi- establecer el número, posición y efecto indivi- cos de las características son tomados al azar dual de cada uno de los loci involucrados. Sin y atribuidos a los individuos conforme vayan embargo, la identificación de QTLs en diversos siendo retirados. El primer valor fenotípico reti- cultivos no ha concluido con la identificación de rado es asignado al individuo 1, el segundo va- los genes responsables del fenotipo, cuya exis- lor fenotípico al individuo 2, así sucesivamente, tencia se presume en el intervalo comprendido se asignan todos los valores fenotípicos a cada entre marcadores flanqueantes de los mismos. uno de los individuos. Los datos permutados Como consecuencia, la función biológica (o el son analizados para detectar la presencia de modo de acción) de los genes responsables de QTL, almacenando el mayor valor de LOD ob- los efectos de los QTLs es aún desconocida en tenido. El proceso se repite de forma completa la mayoría de los casos reportados. Asimismo, N veces, finalmente, los valores de LOD rete- la posibilidad de realizar un “caminado cromo- nidos, son ordenados por orden de magnitud sómico” (cromosome walking) desde el marca- permitiendo estimar el valor critico de cada dor flanqueante al QTL hacia la región física test. El valor crítico de cada intervalo tendrá la donde reside el gen responsable con el fin de magnitud N(1- α), o sea, si se realizaron 1000 aislarlo, depende de la distancia de recom- permutaciones, la significancia de 5% será el binación entre el marcador y el gen, y de la 950 º valor ordenado. Se procede de la mis- relación de esa distancia con la distancia físi- ma forma para obtener el valor de corte para ca real, que puede estar afectada por varios un determinado grupo de ligamiento o para el otros factores, como fuera mencionado antes genoma completo (conjunto de grupos de li- en este capítulo. gamientos) considerando uno u otro en el test La creciente disponibilidad pública de infor- de permutación. Cuanto mayor el número de mación de secuencias de transcriptos de ADN permutaciones, mayor la precisión en el valor mensajero (Expressed Sequence Tags, ESTs), crítico. junto con el grado de homología evidenciado entre especies, ha permitido la generación de 4. Mapas y marcadores funcionales los llamados marcadores génicos o funciona- En la historia del desarrollo de los marcado- les, cuya característica relevante es la de es- res moleculares se ha priorizado la detección tar localizados en regiones codificantes del de polimorfismos en regiones no codificantes genoma. del genoma. Esto ha sido en función de asegu- ticipan en las llamadas mutaciones silencio- rar la neutralidad fenotípica de los marcadores sas. Esto es, cuando el cambio nucleotídico se y posibilidad de maximizar la variación entre produce en la tercera base del codón sin alte- diferentes genotipos. Esta última caracterís- rar el aminoácido para el cual codifica. La iden- tica está sustentada en que las regiones no tificación de SNPs puede inferirse directamen- génicas del genoma no han sufrido presión de te a partir de datos de secuencias públicas, si selección sobre las mutaciones que pudieran estas corresponden a distintos genotipos, o por haber ocurrido en el transcurso de la evolución secuenciación de fragmentos de genes amplifi- y por consiguiente ser más variables. La aso- cados por PCR de individuos diversos. ciación de los marcadores con caracteres de Aunque históricamente se ha asumido que interés, como se ha visto anteriormente, está las secuencias tipo microsatélites son propias determinada por la distancia de recombinación del ADN no codificante, hoy sabemos que las (o física) del marcador con el gen responsa- mismas pueden encontrarse también en regio- ble del fenotipo. De esta manera, los mapas nes génicas. Si bien la frecuencia relativa de genéticos basados en marcadores molecula- estos motivos es baja (< 5 %) la gran abun- res han posibilitado la localización de regiones dancia de secuencias de ESTs en diversos cul- cromosómicas estadísticamente asociadas a tivos, ha ocasionado que varios estudios ha- caracteres de tipo cualitativos (monogénicos) yan usado esta estrategia para el desarrollo de o cuantitativos (poligénicos o QTLs). Como ya marcadores moleculares. La selección de mo- se ha visto, la determinación de QTLs permite tivos de trinucleótidos, aumenta la posibilidad

Biotecnología y Mejoramiento Vegetal II 97 de encontrar SSRs polimórficos en regiones (RGAs) o genes pertenecientes a rutas meta- codificantes, minimizando los posibles cam- bólicas particulares (por ejemplo: síntesis de bios en el marco de lectura ocasionados por carbohidratos), o a integrantes de una familia una variación en el número de repeticiones de génica (por ejemplo: genes de la familia P450). motivos de di, tetra o pentanucleótidos. Estos Los mapas genéticos funcionales posibilitan marcadores, denominados SSRs génicos o establecer una estrategia de genes candidatos EST-SSRs, presentan las mismas ventajas en la identificación de factores responsables de que los SSRs neutros que han sido enunciadas QTLs a nivel molecular, a través de la coinci- en el Capítulo 5. dencia en la localización de QTLs y marcadores Los marcadores CAPs requieren la existen- génicos. Un marcador funcional se convierte en cia de un sitio de restricción polimórfico en la gen candidato cuando está asociado al carác- secuencia génica, y si bien se han reportado ter fenotípico a través de un análisis de marcas casos, los mismos son de baja ocurrencia. simple, o cuando en un mapa su localización La aproximación más sencilla para el desa- coincide con un QTL. En el primer caso, tanto el rrollo de un marcador funcional es a través de marcador como el carácter fenotípico deben es- una amplificación por PCR de un fragmento de tar evaluados en la misma población, mientras un gen y estableciendo la existencia de polimor- que en el segundo caso esto no es necesario, y fismo entre genotipos a través de la resolución es factible comparar la posición de un marcador del producto en geles de SSCP. Los polimorfis- funcional con QTLs de mapas de otras poblacio- mos detectados mediante esta técnica se basa nes de la misma u otra especie. Por ejemplo, se en que hebras simples de ADN con secuencias ha encontrado que el locus del gen Lin5 del cro- distintas, migrarán diferencialmente en un cam- mosoma IX del tomate correspondiente a una po eléctrico, en función de un diferente plega- invertasa vacuolar (responsable de la degra- miento intra-cadena dado por la complementa- dación de sacarosa en glucosa y fructosa) co- riedad de bases. Patrones de bandas distintos localizada con el QTL Brix9-2-5 de rendimiento entre genotipos estarían indicando una varia- de azúcar de fruto, mientras que en papa el gen ción de secuencia en el fragmento amplificado. ortólogo invGE está asociado a variaciones en Sin embargo, no puede asegurarse identidad el nivel de azúcares reductores en tubérculos de de secuencia de dos fragmentos amplificados, una población segregante, y su posición coinci- por no observarse diferencias en los patro- de con el QTL Sug9a, responsable del endulza- nes de electroforesis, ya que la detección de miento por frío en tubérculos de otra población las mismas es un balance entre el número de de papa. Análogamente se ha encontrado que SNPs presentes y el tamaño del fragmento am- marcadores funcionales, basados en análogos plificado. Los polimorfismos presentados por a genes de resistencia (RGAs) se asocian en los marcadores funcionales pueden entender- diferentes especies a resistencias a distintas se como variantes alélicas, que pueden o no enfermedades fúngicas y virales. estar asociados a una variación a nivel protei- Asimismo, en caracteres complejos donde se co, ya sea en estructura o expresión. De todos hayan establecido múltiples QTLs, los marcado- modos, estos marcadores, análogamente a lo res funcionales permiten establecer la interac- enunciado antes en este capítulo, pueden uti- ción entre éstos a la luz de las rutas metabólicas lizarse para generar mapas genéticos, que al involucradas, pudiéndose identificar enzimas estar formados por marcadores funcionales se claves para la manifestación del carácter. Esta denominan mapas funcionales. información genera un marco adecuado para Los mapas funcionales en general están ba- estudios de ingeniería metabólica. sados en mapas pre-existentes de marcadores El mejoramiento genético asistido por marca- neutros con el agregado de marcadores fun- dores moleculares (MAS) encuentra en los mar- cionales. Estos marcadores funcionales pue- cadores funcionales una situación ideal en la den corresponder a genes sin relación entre sí, que la recombinación entre el gen responsable como por ejemplo en mapas de ESTs-SSRs, y el marcador es nula, ya que ambos guardan o incluir análogos de genes de resistencia identidad.

98 Biotecnología y Mejoramiento Vegetal II Al estar diseñados sobre genes, la transfe- recombination frequency. En: The genetic analy- rencia de estos marcadores a través de espe- sis of quantitative traits. (First edition). Chapman cies está beneficiada, dada la mayor conserva- & Hall. London. pp. 120-132 ción de las secuencias codificantes. Asimismo, LANDER, E. S.; GREEN, P.; ABRAHAMSON, J.; la comparación de mapas funcionales aporta BARLOW, A.; DALY, M. J.; LINCOLN, S. E. y NEWBURG, L. 1987. MAPMAKER: an interac- información en estudios de sintenía (conserva- tive computer package for constructing primary ción del tipo y orden de marcadores entre es- genetic linkage maps of experimental and natu- pecies relacionadas), evolución y especiación ral populations. Genomics 1:174–181. entre diferentes organismos. LANDER, E.S. y BOTSTEIN, D. 1989. Mapping Del mismo modo, la utilización de marcadores mendelian factors underlying quantitative traits funcionales en la conservación de los recursos using RFLP linkage maps. Genetics 121: 185- genéticos permite ponderar la diversidad gené- 199. tica existente en base a las variantes alélicas ORTIZ, J. P. A.; PESSINO, S. C.; BATH, V.; HAY- intra e inter-específicas. Concordantemente, WARD, M. D. y QUARÍN, C. L. 2001. A genetic los estudios de genética de asociación (o ma- linkage map of diploid Paspalum notautm. Crop. Science 41: 823-830. peo de asociación), basados en el desequilibrio RUSSELL, P.J. 1996. Mendelian Genetics. En: Ge- de ligamiento entre un marcador y un carácter netics, Chapter 2 (4th Edition). Harper Collins fenotípico en una población de individuos no College Publishers, New York. pp. 17- 46 relacionados (como es el caso de los bancos SAX, K. (1923) The association of size differences de germoplasma) se presenta robustecido por with seed coat pattern and pigmentation in Pha- el uso de marcadores génicos. seolus vulgaris. Genetics 8:552-560 Finalmente, la correlación de los marcadores SCHUSTER, I. y CRUZ, C. D. 2004. ���������������Estatística ge- funcionales con datos fenotípicos o con QTLs nômica aplicada a populações derivadas de cru- sólo sugiere la función putativa de un gen y zamentos controlados. Primera Edición. Viçosa, sus variantes alélicas. Es por esto que la con- Brasil. Ed. UFV. pp 568. STAM, P. 1993. Construction of integrated genetic firmación definitiva de la función génica debe linkage maps by means of a new computer pack- realizarse mediante estrategias más directas age: JoinMap. Plant J. 3:739–744. como ensayos de complementación y/o silen- WEISING, K.; NYBON, H.; WOLFF, K. y KAHL, G. ciamiento génico. 2005. Linkage analysis and genetic maps. En: DNA Fingerprinting in plants. Principles, Me- thods, and Applications (2nd Edition). CRC Press, 5. Bibliografía y lecturas recomendadas: Taylor & Francis Group, Boca Raton, Florida. pp. 277-289 YOUNG, N.D. 1994 Constructing a plant genetic ALLARD, R. W. 1956. Formulas and tables to faci- linkage map with DNA markers. En: DNA-based litate the calculation of recombination values in markers in plants. Advances in cellular and mo- heredity. Hilgardia 24: 235–278. lecular biology of plants. Vol. 1. (PHILLIPS, R. L. FEINGOLD, S. E.; LLOYD, J.; NORERO, N.; BO- y VASIL, I. K. Editors). (1st edition). Kluwer Aca- NIERBALE, M. y LORENZEN, J. 2005. �������Map lo- demic Publishers. Dordrecht, The Netherlands. cation and diversity values for new potato SSRs pp. 39-57 developed from EST databases. Theor. Appl. YULE, G.U. 1902. Mendel´s laws and their probable Genet. 111: 456-466. relation to intra-racial heredity. New Phytol. 1: GELDERMANN, H. 1975. Investigations on inheri- 193-207. tance of quantitative characters in animals by gene markers. I. Methods. Theor. Appl. Genet. 46: 319-330. HALEY, C. S. y KNOTT, S.A. 1992. A simple regres- sion method for mapping quantitative trait loci in line crosses using flanking markers. Heredity 69: 315-324. JANSEN, R. C. 1993. Interval mapping of multiple quantitative trait loci. Genetics 135: 205-211. KEARSEY, M. J. y POONI, H.S. 1996. Estimation of

Biotecnología y Mejoramiento Vegetal II 99 I - CAPÍTULO 7 se encuentran disponibles las secuencias de nucleótidos y aminoácidos de miles de genes y productos génicos codificados por los ge- Genómica nomas de varios organismos complejos. Esta información se utiliza para el estudio de en- Viviana Echenique; Juan P. Selva; Mauro Meier; fermedades humanas complejas y para com- Pablo Roncallo; Gustavo Schrauf prender fenómenos tales como la fisiología celular, el desarrollo, la conducta, la evolución, etc. También aportan información acerca de to- dos los aspectos del crecimiento y desarrollo 1 Introducción vegetal, diferenciación y respuesta a estreses La «genómica» se desarrolló en las ulti- mas dos décadas como consecuencia de los bióticos y abióticos. Gracias al potencial de re- avances realizados en biología molecular e lacionar fenotipos biológica y económicamente Informática, dos áreas de la ciencia que han importantes con los genes responsables de los tenido un desarrollo tecnológico enorme, gene- mismos actualmente es posible identificar ge- rando una revolución en el conocimiento y en nes de interés para ser transferidos a otros or- la comprensión de los procesos biológicos. ganismos por medio de tecnología génica. Por El término fue acuñado en 1986 por Thomas otro lado, el conocimiento de la secuencia de Roderick para referirse a la subdisciplina de la los genes posibilita el desarrollo de marcadores genética que se ocupa del mapeo, secuen- perfectos, basados en la secuencia del mismo ciación y análisis de las funciones de geno- gen, lo cual facilita la selección y la transferen- mas completos y sirvió de nombre para una cia de los mismos a variedades de interés. La revista especializada en la publicación de los conjunción entre tecnología génica, marcado- mencionados temas, “Genomics”. Consiste res moleculares, genómica y bioinformática ha en la caracterización molecular de genomas revolucionado el mejoramiento genético vege- enteros y aporta información acerca de la se- tal, dando origen a lo que se denomina mejo- cuencia y de la función de cada sector del ge- ramiento molecular y se están desarrollando noma en diferentes situaciones de desarrollo nuevos y promisorios cultivares (Fig. 1). y bajo diferentes condiciones ambientales, así La genómica puede dividirse en: como de los mecanismos implicados en la re- gulación de la expresión e interacción génica. - Genómica estructural, que se ocupa de Para ello, las herramientas que se utilizan la caracterización física de los genomas. para el análisis individual de genes o peque- ñas regiones cromosómicas, se aplican al aná- - Genómica funcional, que caracteriza el lisis global de genomas completos, estudian- transcriptoma, que está constituido por el do en conjunto los miles de genes, proteínas conjunto completo de transcriptos producidos y metabolitos que constituyen un organismo, por un organismo, el proteoma o conjunto de así como las complicadas redes de interac- proteínas codificadas por un genoma, y el me- ciones que operan entre ellos. La información taboloma o conjunto total de metabolitos de generada es enorme y es clave para la identi- una célula, consecuencia de la función de los ficación y el aislamiento de genes de interés y ARN y proteínas. permitirá interpretar, en términos moleculares, los procesos biológicos. Para ayudar en este El objetivo de la genómica es la dilucidación proceso han surgido poderosas herramientas completa y exacta de la secuencia de ADN de bioinformáticas que permiten almacenar e in- un genoma haploide representativo de una es- terpretar esta información. pecie. Cuando esta secuencia se conoce, abre Las aplicaciones de la genómica alcanzan a la puerta a numerosas posibilidades. todos los ámbitos de la actividad humana re- Por análisis computacional de la misma y lacionados con la biología, como la salud, la utilizando principios conocidos de genética es alimentación y el medio ambiente. Actualmente posible:

100 Biotecnología y Mejoramiento Vegetal II Figura 1: La conjunción entre tecnología génica, marcadores moleculares, genómica y bioinformática re- volucionaron el mejoramiento vegetal, conduciendo al desarrollo de nuevos cultivares. Los nuevos genes hallados son introducidos en plantas por tecnología génica. Esto a su vez permite establecer la funciona- lidad de los mismos. El conocimiento de la secuencia permite la obtención de mapas, marcadores perfec- tos y realizar selección asistida por marcadores moleculares (MAS), así como el fenotipeado molecular. Gentileza de G. Spangenberg.

• Comparar secuencias similares presen- mente importantes en regiones codificantes y no tes en diferentes entidades biológicas y codificantes del genoma. Catalogar las variacio- comprender la función de las mismas. nes genéticas entre individuos ayudará a identifi- • Realizar predicciones acerca de to- car aquellos cambios que conducen a enfermeda- das las proteínas codificadas por una des genéticas, investigar nuevas terapias y esta- especie. blecer la resistencia o susceptibilidad a diferentes • Establecer las variaciones genéticas factores. Para la comparación de secuencias se entre distintas poblaciones de una mis- utiliza el algoritmo BLAST (basic local alignement ma especie. search tool: herramienta de búsqueda de alinea- ción local básica), para lo cual existen distintos Comparar secuencias de diferentes espe- programas que permiten hallar regiones similares cies y entender procesos evolutivos. entre diferentes genes (Parte I, Cap. 12). En Febrero de 2001, coincidiendo con el cin- Esto ha dado origen a la genómica compa- cuenta aniversario de la publicación del modelo rativa y ha demostrado que existe considerable estructural del DNA por Watson y Crick, la revis- sintenia, es decir, una localización conservada de ta Nature publicó el primer borrador del genoma genes en posiciones equivalentes en especies re- humano, que ha sido secuenciado completa- lacionadas (Fig. 2). También ha sido una excelente mente. También se han secuenciado otros geno- herramienta para identificar motivos de secuencia mas como maíz, colza, soja, trébol, raigrás, etc. altamente conservados y, por lo tanto, funcional- (Tabla 1).

Biotecnología y Mejoramiento Vegetal II 101 Tabla 1. Ejemplos de genomas secuenciados en los últimos años.

Figura 2: Sintenia entre los genomas de varias gramíneas. El genoma de arroz contiene grupos de mar- cadores que se hallan altamente conservados en muchos cereales, por lo cual dichos genomas pueden sintetizarse básicamente como compuestos por «bloques de ligamiento de arroz». En la figura se muestra el alineamiento de los cromosomas y segmentos de cromosomas (identificados con letras mayúsculas) de varias gramíneas con los del arroz (centro). El genoma del maíz tiene dos copias semejantes de cada bloque de genes por lo que está representado por dos anillos del círculo. Las líneas externas punteadas conectan sectores adyacentes de los cromosomas de trigo. Modificado de Gale y Devos (1998).

102 Biotecnología y Mejoramiento Vegetal II También es posible estudiar todos los genomas 2 Genómica estructural bacterianos asociados a genomas más complejos, Como su nombre lo indica, el objetivo de la misma sin necesidad de aislar y de cultivar especies micro- es caracterizar la estructura del genoma. Conocer bianas particulares. Esto se denomina metagenó- la estructura de un genoma individual puede ser de mica (Parte I, Cap. 11). Para este estudio se extrae utilidad para manipular genes y segmentos de ADN todo el ADN de una comunidad microbiana de un en una especie particular. El análisis comparativo ambiente particular (suelo, agua de mar, intestino de diferentes genomas posibilitará deducir reglas humano, etc.), se determina que genes se encuen- generales que gobiernan la estructura de todos los tran presentes, cuales son sus funciones y las dife- genomas. rencias que existen entre distintas comunidades a La genómica estructural procede a través de ni- este nivel. veles incrementales de resolución analítica, comen- Más recientemente ha surgido la denominada zando con la asignación de genes y marcadores a “Genómica Sintética”, que pretende crear formas cromosomas individuales, mapeando estos genes y sintéticas de vida recreando genomas artificiales, marcadores dentro de los cromosomas, finalizando células con vías metabólicas predeterminadas y pro- con la preparación de un mapa físico a través de piedades catalíticas especificas. Involucra el redise- la secuenciación. Es decir, que se procede desde ño y la fabricación de sistemas biológicos. Como un mapeo genético de baja resolución, basado en ejemplo podemos citar el transplante de un genoma el análisis de recombinación meiótica, hacia uno de de una célula bacteriana a otra. alta resolución, basado en marcadores moleculares, A continuación se brinda un panorama global llegando a la realización de un mapa físico, basa- acerca de la forma en que se articulan los proyec- do en la secuencia de fragmentos clonados parcial- tos de genómica, algunos resultados relevantes, las mente solapantes (Fig. 3). aplicaciones en agricultura y el estado de la investi- gación en Sudamérica. Los pasos a seguir son:

Figura 3: Niveles de complejidad de la genómica estructural. La genómica estructural procede desde un mapeo genético de baja resolución, basado en el análisis de recombinación meiótica, a uno de alta reso- lución, basado en marcadores moleculares hasta la realización de un mapa físico, basado en la secuencia de fragmentos clonados solapantes. Modificada de Griffths et al. (2004).

Biotecnología y Mejoramiento Vegetal II 103 - Mapeo cromosómico de baja resolución se establece que banda corresponde a cada (ubicación de genes que producen fenotipos mutan- cromosoma. Luego, un nuevo gen clonado de tes conocidos y algunos marcadores). Las distan- ubicación desconocida se utiliza como sonda cias genéticas se basan en frecuencias de entrecru- para asignarle una posición en un cromosoma zamientos («crossing overs») y son medidas como determinado. porcentaje de recombinación en centimorgans (cM). - Híbridos celulares interespecíficos, - Mapeo genético de alta resolución de cada por ejemplo humano-ratón. Se utiliza exclusi- cromosoma (con marcadores moleculares ubicados vamente en mapeo del genoma humano o de muy próximos entre sí). especies animales. Se establecen bancos de - Mapeo físico, basado en distancias molecula- líneas celulares que contengan todos los cro- res, resultantes de mapas de fragmentos de restric- mosomas del roedor y un cromosoma huma- ción parcialmente superpuestos. La distancia entre no particular. Siempre incluye un cromosoma dos marcadores puede ser medida determinando el humano que lleva un alelo salvaje defectivo tamaño de los fragmentos de restricción que los con- para una función bioquímica determinada en el tienen, siendo el fragmento más pequeño que lleva genoma del ratón. Si sobreviven en un cultivo ambos marcadores una estimación de la distancia deficiente para el factor que no sintetizan es entre ellos. Utilizando combinaciones de sondas y porque llevan el alelo humano equivalente, que enzimas de restricción puede construirse un mapa complementa la función faltante. físico determinando qué fragmentos poseen marca- dores en común. Las distancias físicas se miden en 2.2 Ubicación de los genes a lo largo del kilobases (kb) o megabases (Mb). cromosoma - Anclado del mapa genético en el mapa físico. El próximo nivel de resolución consiste en - Secuenciación de ADN a gran escala, que determinar la posición de un gen o marcador brinda un mapa completo de cada cromosoma. molecular sobre el cromosoma. Este paso es - Anclado del mapa genético y del mapa físi- importante porque los mapas genéticos pue- co en el de secuencia. Las distancias físicas ge- den alinearse con los mapas físicos y utilizarse neralmente no se correlacionan directamente con para validar los mismos. las distancias genéticas porque las frecuencias de - Mapeo por recombinación: en los casos recombinación no son siempre proporcionales a las en que ha sido factible hacerlo (organismos distancias moleculares. Sin embargo, a menudo las experimentales como levaduras, mosca de la dos correlacionan razonablemente bien en regiones fruta, ratón, Arabidopsis, etc.) ha posibilitado la eucromáticas de los cromosomas (aquellas menos construcción de mapas que a lo largo de los condensadas, que se colorean de manera más difu- años aparecen repletos de genes con efectos sa). En humanos, un cM es equivalente, en prome- fenotípicos determinados. Sin embargo, los dio, a aproximadamente 1 Mb de ADN. intervalos recombinacionales entre genes co- nocidos contienen cantidades muy grandes de 2.1 Asignación de loci a crosomas ADN. Estos intervalos o «gaps» no pueden ser específicos. completados utilizando análisis de ligamiento Se utilizan los siguientes métodos: debido a la ausencia de marcadores en esas - Ligamiento a loci conocidos: análisis regiones. Para llenarlos y construir mapas de tradicional basado en cruzamientos, en espe- alta resolución surgieron los marcadores mole- cies en las que es factible hacerlo. culares, entre los que se encuentran los RFLP - Electroforesis de campo pulsátil: se usa y los SSLP (mini y microsatélites) (Parte I, Cap. en el caso de especies que poseen cromoso- 5). Estos marcadores permiten la construcción mas pequeños, separables por esta técnica, de mapas genéticos con una densidad de un como sucede con los de levaduras. Las ban- marcador/centimorgan (cM). Aunque tal resolu- das en el gel corresponderían a cromosomas ción es un logro muy importante, un centimor- individuales y pueden utilizarse para locali- gan representa, en humanos, una megabase, zar nuevos genes por hibridación. Prime- lo que equivale a un millón de pares de bases o ro, utilizando sondas de localización conocida 1000 kb. Para lograr mayor resolución actualmen-

104 Biotecnología y Mejoramiento Vegetal II te existen los SNP, que son marcadores basados representadas en el ARNm. Para obtener esta en el polimorfismo de un solo nucleótido. información debe secuenciarse el genoma com- - Hibridación in situ: cuando se dispone de pleto. Para ello, el ADN genómico total se digiere un gen clonado éste puede ser utilizado como con enzimas de restricción apropiadas o se frag- para hibridar con los cromosomas in situ, para menta mecánicamente en fragmentos de gran lo cual se lo marca radiactivamente o por fluo- tamaño (100-300 kb.), que se clonan en vectores rescencia. Puede, de ese modo, identificarse apropiados, para construir genotecas que con- a los cromosomas portadores de la secuencia, tienen, al menos, una representación completa determinar si son secuencias específicas de un del genoma, que puede estudiarse en detalle y cromosoma y determinar la posición del gen en secuenciarse (Parte I, Cap. 4). A fin de distinguir el mismo. En el caso de fluorescencia, la técnica las regiones codificantes de las no codificantes, se denomina FISH («fluorescence in situ hybri- las secuencias se comparan con las de ESTs y dization»). La localización del fragmento en el ADNc previamente estudiados. cromosoma se visualiza como un punto brillante Para reconstruir la secuencia del genoma ori- (Parte I, Cap. 3). ginal a partir de los fragmentos clonados se utili- - Mapeo físico de los cromosomas: aporta zan las siguientes estrategias: un nivel de resolución mayor. Se trata de identifi- car un conjunto de fragmentos de ADN clonados a) Secuenciación de los clones y superpuestos que, juntos representen un cromo- ensamblado de los fragmentos soma o un genoma completo. Los mapas así ob- El clonado comienza obteniendo un número tenidos se llaman mapas físicos, porque el ADN elevado de fragmentos al azar que se clonan en es el material físico del genoma. un vector apropiado. En la preparación de mapas físicos de genomas se utilizan vectores como los 2.3 Secuenciación a gran escala del genoma cósmidos, YACs, BACs y PACs, que aceptan in- - Generación de bancos de EST (etiquetas sertos de gran tamaño (Parte I, Cap 4). El conte- de secuencias expresadas) nido de estos clones se caracteriza y se ordenan, La complejidad de los genomas eucariotas buscando los puntos de solapamiento o superpo- hace aconsejable, como primera aproximación, sición. Un conjunto de clones solapantes se lla- no abordar el estudio del genoma completo. Es ma contiguo. Para establecer el solapamiento de preferible estudiar sólo una fracción del mismo, clones se secuencian regiones cortas del inserto es decir, aquellos genes que se están expresan- proximas al sitio de clonado utilizando primers do en un momento determinado de la vida del posicionados en el vector. Los intervalos sin se- organismo. Para ello se obtienen poblaciones cuencias (gaps) se completan utilizando el final de ADNc (que reflejan sólo secuencias expresa- de un fragmento clonado para llegar al siguiente das) que se secuencian de forma masiva para (primer walking). A medida que se van caracteri- generar miles de secuencias parciales conocidas zando los clones, los contiguos se alargan y van como ESTs (Parte I, Cap. 8). Estas secuencias convergiendo unos con otros. El proyecto termi- de entre 300-500 pb. suelen ser suficientes para na cuando se tiene un conjunto de contiguos que la identificación de los genes mediante compara- equivale al número de cromosomas de la espe- ción con las secuencias existentes en las bases cie en estudio. En la Figura 4 se resume una es- de datos públicas (ej. Genbank, EMBL), utilizan- trategia de secuenciación jerárquica (hierarchical do para ello programas de análisis informático shotgun sequencing). Esta se usa para geno- (Parte I, Cap.12). Si la información contenida en mas grandes. Para genomas más pequeños se la secuencia parcial no es suficiente, habría que utiliza otra, llamada secuenciación de genomas determinar la estructura del ADNc completo para completos (whole genome shotgun sequencing) estudiar su función por otros métodos. (Fig. 5). Todos los estadios del análisis genómi- - Secuenciación genómica co como la preparación de clones, el aislamiento La aproximación anterior no permite identificar de ADN, la electroforesis y la secuenciación han genes que se expresan a bajo nivel o en situacio- sido bien adaptados a diferentes máquinas o ro- nes fisiológicas no consideradas o regiones no bots, automatizando el trabajo.

Biotecnología y Mejoramiento Vegetal II 105 Figura 4: Estrategia de secuenciado jerárquico («hierarchical shotgun sequencing strategy»). El primer paso consiste en construir una genoteca por fragmentación del ADN e introducción del mismo en vectores que aceptan grandes insertos, en este caso de BACs. Los fragmentos de ADN representados en la misma son organizados en un mapa físico y los clones individuales son seleccionados y secuenciados para lo cual se hace una nueva genoteca de trozos más pequeños («shotgun library»). La secuencia de los clones se ensambla finalmente para reconstruir la secuencia del genoma. Modificada de la publicación del Interna- tional Human Genome Sequencing Consortium, 2001

Figura 5: Montaje de un genoma complejo mediante la secuenciación completa del genoma por tiros de esco- peta («whole genome shotgun sequencing»). En primer lugar, se construyen los contiguos con las secuencias que se superponen. Finalmente se utilizan los extremos apareados para cubrir los intervalos sin secuencia y así orientar y ordenar los contiguos en unidades llamadas andamios (scaffolds) Modificado deGriffths et al. (2004).

106 Biotecnología y Mejoramiento Vegetal II b) Ordenamiento de los clones con una cobertura mayor a 20x de su genoma. Se utilizan varias técnicas para ordenar los En comparación, por el método de Sanger, se clones en contiguos. Entre ellas: logró una cobertura de 3x (12,5Mb). - FISH: para localizar las posiciones aproxi- madas de insertos grandes. 3 Utilización de mapas genómicos para el - Fenotipificación (fingerprinting): se cor- análisis genético ta el clon con enzimas de restricción que ge- Los mapas genéticos y los físicos son un im- neran un grupo de bandas que representan portante punto de partida para varios tipos de un «fingerprint» o «huella digital» del clon. Las análisis genético, incluyendo el aislamiento de bandas generadas por varios clones pueden genes y genómica funcional. alinearse visualmente o por un programa de Por ejemplo: computación para determinar si se superponen - Aislamiento de genes por clonado po- o solapan. sicional: para ubicar un gen cuya secuencia - STS («sequence tag sites» o sitios de se desconoce se puede partir de un marcador secuencia marcada): son secuencias cortas conocido que esté estrechamente ligado al de insertos grandes clonados. Se reúne un mismo. El mismo actúa como punto de partida conjunto de clones al azar y se cortan en frag- para el caminado cromosómico (chromosome mentos más pequeños que se clonan en λ y se walking), donde los fragmentos finales del mar- secuencian pequeñas regiones de cada uno. cador ligado son utilizados como sondas para Para ello se diseñan primers que amplifican seleccionar otros clones de la genoteca. Del una secuencia corta de ADN (STS). segundo grupo de clones (los que solapan con el inicial) se hacen mapas de restricción y los Actualmente existe una tecnología más mo- fragmentos obtenidos son utilizados para rea- derna para el secuenciado de genomas, la pi- lizar una nueva ronda de selección de clones rosecuenciación. Esta técnica utiliza esferas superpuestos. Así el proceso de «caminado» atrapadas en una placa que contiene 1.600.000 se mueve hacia ambos lados a partir del sitio microceldas. Cada esfera (una por microcelda) inicial, que culmina cuando se llega al gen de permite realizar una reacción de secuenciación interés. Existe otra técnica relacionada llamada individual, basada en la síntesis complementa- salto cromosómico, que permite saltar a través ria de un ADN de cadena sencilla, previamente de áreas distantes y potencialmente no clona- multiplicado por PCR y alineado a cada esfe- bles del ADN y genera «marcas», ampliamen- ra. La incorporación de cada nucleótido du- te espaciadas a lo largo de la secuencia, que rante la síntesis de ADN libera una molécula pueden utilizarse como puntos de inicio para de pirofosfato (PPi), que al interactuar con en- múltiples caminatas cromosómicas bidireccio- zimas presentes en el medio (luciferasa, entre nales. Esta técnica consiste en crear fragmen- otras) produce una señal quimioluminiscente tos grandes (entre 80-150 kb) por restricción captada por una cámara de detección de fo- del ADN en la región que se cree contiene al tones, la cual traducida en una computadora gen de interés. Cada fragmento de ADN es como la adición de un nucleótido determinado, luego circularizado, poniendo en contacto los generando una secuencia individual por cada extremos libres. Este procedimiento acerca celda. Esta tecnología, desarrollada por la em- puntos relativamente distantes de la región presa 454 Life Sciences, dio lugar a la creación de genoma en estudio. Se trata de generar en del primer equipo de secuenciación masiva esa unión un sitio que no sea cortado en una (Secuenciador GS 20™) diseñado para se- posterior restricción, de manera que esas dos cuenciar genomas bacterianos, con una capa- regiones que estaban distantes en el genoma cidad para descifrar 20 millones de bases por ahora estén unidas en un fragmento. El círculo corrida (4hrs) en secuencias individuales de se corta con una nueva enzima de restricción ±100 bases. En el proyecto del género Bacillus, y los fragmentos obtenidos, entre los que se que tiene un genoma de aproximadamente 4 encuentran los sitios de unión, se clonan en Mb, con seis corridas se descifraron 129.6 Mb, fagos.

Biotecnología y Mejoramiento Vegetal II 107 Esto es lo que se llama una «genoteca de gunos de estos genes que contribuyen a la va- saltos». Una sonda del sector de comienzo de riación cuantitativa cuyos loci son llamados QTL la región que contiene al gen de interés puede (quantitative trait loci) (Parte I, Cap. 5 y 6). Para utilizarse como punta de partida para comenzar abordar este problema, se buscan dos tipos de a «saltar» por el genoma. Un salto puede, por líneas que muestren fenotipos contrastantes ejemplo, avanzar unos 50 kb hacia el locus de para un carácter cuantitativo y se cruzan para interés. Una vez allí, el otro extremo de la unión generar descendencia homocigota que conten- del fragmento inicial se corta y se usa para ga solo un segmento o un pequeño número de buscar el siguiente punto de salto en la geno- segmentos de una de las líneas. Estos indivi- teca. O sea que a través de las uniones se va duos pueden caracterizarse por su fenotipo y avanzando hacia el punto donde se encuentra puede estimarse la contribución de los segmen- el locus. Cada posición de salto es un punto de tos específicos a la variación observada. Los partida para una caminata cromosómica. Estas SNP (polimorfismos de un nucleótido simple) regiones se van secuenciando. Allí comienza aceleran el mapeo de caracteres complejos. la búsqueda de genes utilizando programas de predicción y se seleccionan las secuencias can- 4 Análisis funcional de los genes didatas. Esta estrategia de saltos se utilizó para Una vez secuenciado el genoma completo clonar el gen de la fibrosis quística, que es una pueden identificarse la mayoría de los genes enfermedad humana que resulta fatal y es cau- de una especie. Restaría entonces determinar sada por mutaciones en un gen de gran tamaño cuál es la función de cada uno de ellos y cómo localizado en el cromosoma 7. interaccionan para definir un fenotipo determi- - Estrategia del gen candidato: la caracte- nado. La genómica funcional intenta resolver rización de una región cromosómica hace que esta cuestión a través del estudio de: aparezcan varios genes de función descono- - El transcriptoma: se refiere al estudio de cida. Si un gen de interés es mapeado en esa los perfiles de expresión de todos los genes región, estas secuencias pasan a ser «candi- presentes en el genoma. Para ello se extraen datas». Para cada una de ellas, o para la más todos los ARNm contenidos en una célula, te- probable, de acuerdo al análisis de secuencia, jido u órgano en un determinado momento de se diseñan experimentos tendientes a determi- desarrollo o situación fisiológica. El método nar en cuales tejidos se expresa, en qué condi- más utilizado es el de micromatrices de ADN, ciones, etc., utilizando Northern blot o RT-PCR. que permite analizar simultáneamente la ex- Si el patrón de expresión encontrado coincide presión de miles de genes, pudiéndose dis- con el patrón esperado es altamente probable poner entre 5000-50.000 genes (ESTs, ADNc, que hayamos encontrado el gen de interés. El oligonucleótidos) sobre un portaobjetos utili- experimento ideal para confirmar esto, sería la zando un sistema robotizado. Sobre este chip transformación de un individuo mutante para de ADN se realizan experimentos de hibrida- esta función con el gen normal. Si se produce ción con muestras marcadas radiactivamente la reversión del fenotipo mutante (complemen- o con fluoróforos apropiados, y los resultados tación), tendremos la prueba irrefutable de que se cuantifican mediante análisis con phospho- estamos frente al gen buscado. rimager o microscopía confocal. De esta mane- - Genes con patrones complejos de he- ra se pueden identificar, de forma simultánea, rencia: no todos los genes muestran patrones los patrones de expresión de miles de genes simples de herencia. Puede suceder que: en un momento del desarrollo o en respuesta - La variación fenotípica sea cuantitativa, a diferentes estímulos ambientales. El análisis como peso o altura. Este tipo de variación se bioinformático de estos datos permite asociar debe a la interacción acumulativa entre alelos + grupos de genes que se expresan de forma co- y – de varios genes y el ambiente. ordinada y proporciona información importante La disponibilidad de miles de marcadores mo- sobre la función de los mismos (Parte I, Cap. 8). leculares como los SSLP, dispuestos a lo largo - El proteoma: comprende el conjunto to- del cromosoma, ha posibilitado el mapeo de al- tal de proteínas expresadas por un genoma

108 Biotecnología y Mejoramiento Vegetal II completo, incluyendo las modificadas des- cia resulta obvia cuando se considera que los pués de la traducción. El estudio del transcrip- genomas poseen miles de millones de pares toma debe ser complementado con el análisis de bases (Parte I, cap. 12). de las proteínas codificadas por los transcrip- tos, puesto que estas macromoléculas están al 5 Modelos final de la ruta de expresión génica. El método El mapeo comparativo ha demostrado que más utilizado para estudiar la abundancia re- la organización de los genes dentro de los lativa de cientos de proteínas es la electrofo- genomas ha permanecido muy conservada resis bidimensional en geles de poliacrilamida a través de la evolución, existiendo estrechas (2DPAGE), que permite separar con gran reso- relaciones de colinearidad entre los geno- lución la mayoría de los polipéptidos celulares mas de casi todas las gramíneas cultivadas, combinando de forma secuencial diferencias entre las solanáceas, entre las brasicaceas en carga y en masa molecular. Utilizando sis- cultivadas y Arabidopsis, entre los pinos, rosá- temas computarizados de análisis de imagen ceas y varias leguminosas. Por ello, teniendo se seleccionan las proteínas cuya abundan- en cuenta la envergadura de un proyecto de cia relativa cambia durante el desarrollo o en secuenciado, los emprendimientos genómicos respuesta a diferentes estímulos ambientales tomaron especies modelo, representativas de (Parte I, Cap.9). un genoma vegetal. El primer modelo vegetal - El metaboloma: comprende el conjunto fue una dicotiledónea, Arabidopsis thaliana. total de metabolitos de una célula. En plan- Le siguió una monocotiledónea, el arroz, cuyo tas, el metabolismo secundario (reacciones genoma es seis veces menor que el del maíz que no son vitales para el individuo y que con- y 37 veces menor que el del trigo. El estudio ducen a la producción de compuestos que a de estas dos especies permitirá arribar a cono- veces ayudan a su supervivencia, como por cimientos clave para el mejoramiento vegetal. ejemplo antraquinonas, alcaloides, digoxina, Arabidopsis thaliana es una dicotiledónea taumatina, vainillina, menta, etc.) produce una que posee uno de los genomas vegetales enorme variedad de compuestos diferentes. más pequeños. Carece de importancia Se han identificado más de 40.000 y se esti- económica pero resulta ser un excelente or- ma que aún quedan por descubrir alrededor de ganismo para la investigación puesto que es 100.000. Los investigadores que trabajan en fácil de transformar y su ciclo de vida tarda sólo este nuevo campo de la química aplicada a la 7 semanas, de semilla a semilla. Alrededor de biología (metabolómica) consideran que sólo 12.000 científicos trabajan coordinadamente de esta forma se podría definir, en términos en esta pequeña planta, conformando el más moleculares, un fenotipo concreto. En meta- avanzado sistema de experimentos en biología bolómica se emplean herramientas analíticas vegetal del mundo. Su secuencia genética es muy sensibles (tales como espectrometría de de libre acceso en el sitio http://www.arabi- masa, cromatografía líquida o gaseosa y re- dopsis.org. En un artículo publicado en Nature sonancia magnética nuclear) para analizar los (2000) se analiza el genoma de Arabidopsis a cambios metabólicos provocados por mutacio- partir de las 115.4 megabases secuenciadas nes génicas o por la expresión de transgenes. (de un total de 125). Su evolución involucró La metabolómica puede ser aplicada al monito- una duplicación completa del genoma, seguida reo de estreses inducidos, para identificar pa- por una subsecuente pérdida y duplicación de sos metabólicos limitantes, para el análisis de genes, lo cual dio origen a un genoma dinámi- mutantes y hasta para realizar la evaluación de co, enriquecido por una transferencia lateral manejos agronómicos, tales como el efecto de de genes de cianobacterias. Contiene 25.498 fertilizantes sobre el metabolismo, etc. (Parte I, genes que codifican para 11.000 familias de Cap. 10). proteínas, con una diversidad funcional similar - La bioinformática intenta dar sentido a la a la encontrada en Drosophila y Caenorhabditis información derivada de las técnicas anterior- elegans. Arabidopsis posee varias familias mente descriptas. La importancia de esta cien- de proteínas nuevas pero carece de otras co-

Biotecnología y Mejoramiento Vegetal II 109 munes, indicando que los grupos proteicos en El nivel de ploidía y el número básico de cro- común han experimentado una expansión y mosomas son muy variables, así como el ta- contracción en estos tres grupos eucariotas. maño del genoma. El genoma de arroz está compuesto por 19 bloques génicos que, reordenados como “blo- 6 Algunas generalizaciones acerca de los ques de Lego”, permiten reconstruir el genoma genomas de las Tritíceas, maíz, Setaria, caña de azúcar Los estudios en especies modelo han per- y sorgo (Fig. 6). Considerados como una uni- mitido arribar a varias generalizaciones. Una dad genética representarían el genoma ances- de ellas es que el número de genes no es tral de las gramíneas, el cual tendría un único la base de la complejidad. La mosca de la par de cromosomas. fruta tiene unos 13.000 genes, Caenorhabitis La familia de las gramíneas es probable- elegans 18.000, Arabidopsis 26.000 y los hu- mente la mejor caracterizada en este aspecto, manos 30.000. Si el número de genes no es contando con una buena cantidad de mapas muy diferente entre estas especies, ¿cuál es la genéticos comparativos que demuestran las base de la mayor complejidad en los humanos? relaciones interespecíficas (Fig. 7). En térmi- La explicación estaría en el proteoma, más nos genéticos, las gramíneas representan una que en el genoma. Las proteínas codificadas familia muy diversa. Se estima que el genoma por los genes pueden agruparse en familias en de las mismas divergió hace alrededor de 65 base a su similitud y muchas de estas familias millones de años desde un antecesor común. proteicas son compartidas por todos los grupos

Figura 6: El genoma de arroz está compuesto por 19 bloques génicos que, reordenados como «bloques de Lego», permiten reconstruir el genoma de las Tritíceas, maíz, Setaria, caña de azúcar y sorgo. Estos bloques, considerados como una unidad genética, representarían el genoma ancestral de las gramíneas, el cual tendría un único par de cromosomas.

110 Biotecnología y Mejoramiento Vegetal II Figura 7: Alineamiento de cromosomas de arroz (3, 6) y maíz (9).

mencionados, aunque el número de miembros estudiado. Esto parece reflejar el hecho de por familia es mayor en humanos. que las plantas deben adaptarse a una amplia Esto es particularmente evidente en aque- variedad de condiciones medioambientales, a llos genes involucrados en el desarrollo. Los diferencia de los animales, que pueden movili- humanos tenemos 30 genes para factores zarse y cambiar de lugar si este no les resulta de crecimiento del fribroblasto, mientras que propicio. Drosophila y Caenorhabitis elegans tienen 2. En humanos, los genes ocupan una cuarta Las nuevas proteínas surgen a través de cor- parte del genoma, y sólo el 1,5% codifica para tes y empalmes alternativos de un mismo ARN proteínas. Las secuencias correspondientes a mensajero (alternative splicing), lo que permi- los exones (secuencias del mensajero que se te aumentar considerablemente la diversidad encuentran representadas en la proteína, las proteica a partir de los mismos mensajes. Las secuencias correspondientes a los intrones no predicciones indican que el 60% de los genes lo están) comprenden un porcentaje bajo del humanos tiene dos o más alternativas de em- genoma, mientras que los intrones compren- palme. En Caenorhabitis el 22%. den el 24%. Los genes no están distribuidos en Un elevado número de factores de trans- forma pareja. Algunos se encuentran agrupa- cripción y modificaciones postraduccionales dos en ciertas regiones del genoma mientras también conducen a una mayor complejidad. que otros se encuentran aislados. En la mosca, En el caso de Arabidopsis, cerca del 9% de el nematodo y Arabidopsis la disposición de los los genes son factores de transcripción (FT). genes es mucho más regular. Si se compara la proporción con los genomas Aproximadamente la mitad del genoma hu- de otras especies, se observa que Arabidopsis mano consiste de secuencias repetitivas, no sólo tiene más genes que algunos anima- siendo la mayoría elementos transponibles les pequeños, sino que la proporción de FT es que se propagan replicándose e insertando más alta que en cualquier clase de organismo una copia de sí mismos en otras regiones del

Biotecnología y Mejoramiento Vegetal II 111 genoma. En la actualidad solo dos tipos de pansión de los genomas. En maíz representan elementos son activos, Alu y LINE1. La mayo- del 50 al 80% del genoma y en trigo el 80% ría de los mismos se encuentran en regiones (Fig. 8). De esta manera los genomas de los ricas en A y T, mientras que los genes se en- cereales pueden considerarse como islas de cuentran en áreas con elevado contenido de G genes que se hallan dispersas en un mar de y C. Fragmentos de estos elementos también secuencias repetitivas. se encontraron en las secuencias regulatorias que controlan la expresión de varios genes, por 7 Genómica y Agricultura lo que se ha sugerido que, de alguna manera, Especialistas en varias disciplinas han llega- podrían afectar positivamente su expresión y do a la conclusión de que el alcance de la ge- evolución. nómica será mayor en lo que se refiere a la eco- Los genomas vegetales también están pla- nomía y la calidad de vida que en el ámbito de gados de secuencias repetitivas (transposones la salud humana. Gracias al aporte de grupos y retrotransposones), que constituyen un por- de investigación de todo el mundo se dispone centaje muy importante del ADN nuclear y han de bases de datos públicas con información contribuido, a lo largo de la evolución, a la ex- genómica de utilidad para los mejoradores. El

Figura 8: a) Elementos repetitivos en un fragmento cromosómico de maíz. b) Diagrama que muestra como los elementos transponibles en gramíneas son responsables del incremento en el tamaño del genoma. El arroz, sorgo, cebada y maíz derivaron de un ancestro común hace aproximadamente 70 millones de años. Desde entonces, los transposones y retrotransposones se han ido acumulando a diferentes niveles en las especies. Los cromosomas son más largos en maíz y cebada, cuyos genomas contienen grandes cantidades de retros con LTR (long terminal repeats). En verde se señalan los elementos transponibles y en naranja los genes. Modificada de Griffths et al. (2000).

112 Biotecnología y Mejoramiento Vegetal II conocimiento de cómo actúan los genes en una utilizando criterios de selección a partir de la especie puede ayudar a los mejoradores a per- información molecular. feccionar su función en otra. Las secuencias de La genómica comparativa, basada en el los genomas de Arabidopsis y de arroz propor- análisis de ESTs de diferentes plantas tole- cionan información relevante acerca de otros rantes a estreses abióticos, ha permitido la cultivos, como el maíz y el trigo. Dado que es- identificación de redes de genes comunes aso- tos tres cereales representan más de la mitad ciados con estreses ambientales, tales como de la producción alimentaria mundial y que el salinidad, sequía, bajas y altas temperaturas. arroz es el alimento básico de más de la mitad El análisis de especies tolerantes a situaciones de la población del planeta, la trascendencia de extremas ha identificado genes involucrados la genómica en la agricultura es indiscutible. en los mecanismos que las hacen tolerantes. La similitud entre las especies de cereales Dichos genes podrán entonces ser transferidos también implica que cuando se trasladan ge- a especies de cultivo. nes de una especie a otra, tenderán a funcionar Como ejemplos pueden citarse Agrostis bien y en la misma forma con una mínima ma- adamsonii y Agrostis robusta, tolerantes a sali- nipulación genética. nidad, Microlaena stipoides, tolerante a alumi- A través de esfuerzos públicos y privados se nio y Deschampsia antarctica, tolerante a bajas trabaja en la identificación de genes asociados temperaturas (la única gramínea que crece en con caracteres como rendimiento, resistencia a la Antártida) (Fig. 9). la sequía, calidad de los alimentos, resistencia También se ha mencionado que los factores a insectos y tolerancia a herbicidas. de transcripción serían las “llaves” para des- De esta manera se ha acelerado significa- bloquear funciones génicas que aprovechen la tivamente el aporte de nuevas variedades al diversidad de la naturaleza para producir mejo- mercado, ya sea por modificación genética o res cultivos. Estos son genes que virtualmente por selección con marcadores moleculares o controlan todo carácter importante, desde el

Figura 9: Categorización funcional de ESTs de Deschampsia antarctica. El objetivo de este proyecto es encontrar genes involucrados en la resistencia a bajas temperaturas para ser transferidos, por tecnología génica, a especies de cultivo. Gentileza de G. Spangenberg.

Biotecnología y Mejoramiento Vegetal II 113 punto de vista agrícola, en las plantas, inclu- ciación de un hongo con la raíz de una planta yendo rendimiento, resistencia a las enferme- superior. Esta asociación no es específica de dades, protección contra las heladas y sequía, especie como el caso de Rhizobium y las legu- producción de químicos, proteínas usadas en minosas. El hongo puede ser de varios géner- farmacéutica, etc. La mayoría de los caracte- os y aporta fósforo a la planta). Recientemente res vegetales a los que interesa aplicar la inge- se logró la identificación, en alfalfa, de un re- niería genética son multigénicos (ej. tolerancia ceptor requerido para el reconocimiento de se- al estrés hídrico) y los genes involucrados se ñales bacterianas de nodulación, los llamados expresan en cascadas de forma tal que genes factores NOD. primarios activan a genes secundarios que a Las plantas medicinales aportan el 25% de su vez activan a genes terciarios. Los factores los compuestos activos utilizados actualmente de transcripción serían los responsables de ha- por la industria farmacéutica. Entre estos com- cer funcionar a los genes primarios, obtenién- puestos se encuentran los citocromos P450, dose largas cascadas de expresión de genes que participan en la biosíntesis de muchos por la manipulación de un solo gen. compuestos anticancerígenos, alcaloides, fitoesteroides, antioxidantes y antimicrobia- Durante los últimos años se ha obtenido una nos. También tienen un rol muy importante en gran colección de FT de plantas, funcional- la detoxificación de xenobióticos (herbicidas y mente caracterizados, no sólo en Arabidopsis, pesticidas). Se han identificado 1052 citocro- sino también en especies como tomate, maíz mos P450 y el objetivo actual es, utilizando y soja. En total hay cerca de 1900 FT en herramientas de metabolómica, determinar su Arabidopsis pero en el contexto de la genómi- función bioquímica precisa. ca funcional el interés recae en unas 60 famil- Otro de los objetivos de la metabolómica es ias que tienen funciones reconocidas. La her- el estudio de la síntesis de las esencias que ramienta primaria que se utiliza para conocer confieren perfume a las flores y el mejoramien- la función de los FT consiste en sobreexpre- to del sabor de algunas plantas utilizadas en sarlos y/o detener la expresión de algunos de alimentación humana, como por ejemplo man- ellos. Se puede, por ejemplo, medir el efecto dioca, donde el objetivo sería la eliminación de de cada FT en la composición de los lípidos en los glucósidos cianogénicos que le confieren las semillas aceiteras y la composición de lípi- sabor amargo. dos en las hojas, la composición de azúcares, La devastación de los bosques es motivo su- de esteroides, etc., estudiar procesos básicos, ficiente para invertir en proyectos de genómica a través de la dilucidación de sus efectos en el tendientes a la identificación de genes involu- desarrollo vegetal y la resistencia a las enfer- crados en perennidad, desarrollo, interacción medades, o tratar de identificar el FT que regu- con herbívoros, respuesta a estrés y síntesis la el consumo de nitrógeno (N). El N es uno de de metabolitos secundarios como lignina y los insumos más costosos para la agricultura, celulosa. Se han generado ESTs de álamo, por lo que identificar los genes que controlan y abedul, abeto, pino y eucaliptos. El álamo se modifican la respuesta al N sería de gran valor. utiliza como sistema modelo para el análisis También existen proyectos genómicos rela- de los genes involucrados en la formación de cionados con leguminosas y con sus simbiontes madera. Otro objetivo en este campo es la fijadores de nitrógeno. Recientemente se han búsqueda de estrategias para inducir floración secuenciado los genomas de las especies de temprana, que es un factor crítico en el mejora- Mesorhizobium y Sinorhizobium y se han pro- miento de forestales. ducido cientos de miles de EST de Medicago La secuenciación de los genes y la diluci- truncatula, Lotus corniculatus y soja. En el dación de las vías que controlan la floración en caso de M. truncatula no sólo se han disectado los cereales, que difiere en varios aspectos con los pasos que controlan las señales entre la los correspondientes en Arabidopsis, ha sido bacteria fijadora y la planta sino también entre otro de los logros de la genómica. También se la planta y otro simbionte, las micorrizas (aso- localizaron y caracterizaron, en trigo y cebada,

114 Biotecnología y Mejoramiento Vegetal II los genes VRN1 y VRN2, que son los genes aunque en algunos casos la correspondencia centrales en la vía de vernalización en trigo, cromosómica fue modificada por duplicacio- cebada y otros cereales invernales. Este cono- nes, inversiones o translocaciones. De esta cimiento es clave en agricultura, ya que per- manera se logró consensuar un mapa unifica- mitiría, potencialmente, controlar la floración do de gramíneas en el que se detallan secuen- en cultivos de gran importancia económica, cias y genes conservados en diferentes geno- como los cereales y los forrajes. mas (Fig. 2). Utilizando estas herramientas fue posible transferir información proveniente de 8 Aportes de la genómica al mejoramien- plantas de genomas pequeños (arroz, sorgo) to de cereales a plantas de genomas más complejos como el El trigo pan (Triticum aestivum L 2n= 6x= 42; trigo. Esto ha facilitado la localización más pre- AABBDD) es uno de los principales cultivos cisa de genes para tolerancia a estrés biótico y alimenticios ya que provee cerca del 55% de abiótico (prebrotado, dormición, vernalización, los carbohidratos consumidos por el hombre. frío y otros) y el desarrollo de marcadores útiles La genética de este cultivo resulta compleja, para el mejoramiento. También ha conducido a es de naturaleza hexaploide, con tres geno- la obtención de mapas consenso específicos mas homeólogos denominados A, B y D que para trigo pan, candeal, maíz y cebada. aportan 7 pares de cromosomas cada uno. Los genes redundantes son una norma, con sets Las nuevas técnicas de genómica funcional, homoalélicos triplicados en la mayoría de ellos. epigenética, mapeo por asociación, “TILLING” El genoma del trigo hexaploide es el de may- y los ARN interferentes (ARNi), entre otras, or tamaño (17000 Mbp trigo, 2800 Mbp maíz, contribuirán a un mayor conocimiento del 800 Mbp sorgo, 450 Mbp arroz). Más del 80% funcionamiento del genoma de este cereal. del mismo está constituido por secuencias de Existen genotecas de BACs/BIBACs para to- ADN altamente repetitivo. El restante 20% está dos los genomas de trigo. Estas representan compuesto por secuencias de bajo número de un importante complemento para saturar los copias o copia única, donde se encuentran la mapas. mayoría de los genes. Si bien las secuencias En los últimos años fueron confeccionado altamente repetitivas varían de especie en es- numerosos mapas genéticos de trigo pan, can- pecie, las secuencias génicas, en general, son deal y cebada a partir de poblaciones de RILs conservadas. Esta característica permite el uso (líneas recombinantes endocriadas) o haploi- de sondas heterólogas (de otros genomas) des duplicados, que resultan útiles en estudios en experimentos de hibridación de tipo RFLP de identificación de QTL asociados a calidad (Parte I, Cap. 5) para identificar secuencias y estreses bióticos (enfermedades) y abióticos conservadas en especies diferentes dentro de (sequía, salinidad). Para ello se utilizaron y una misma familia taxonómica (Devos y Gale, desarrollaron miles de marcadores molecula- 2000). res, incluyendo RFLPs, SSRs, AFLPs, SNPs, En 1989 se publicó el primer mapa genético y marcadores DArT (Diversity array techno- molecular de trigo, correspondiente a los cro- logy), (estos últimos basados en matrices de mosomas homeólogos del grupo 7, observán- diversidad). La información generada posibilitó dose que el orden de los genes y marcadores el desarrollo de marcadores perfectos, a partir se conserva en gran parte de los tres geno- de la secuencia del gen a seleccionar, en lugar mas de trigo hexaploide. Esta fue la primera de marcadores genéticamente ligados. Como prueba de colinearidad en gramíneas y posibil- ejemplo pueden citarse los genes de las enzi- itó el desarrollo de la genética comparativa en mas polifenol oxidasas, lipoxigenasas y fitoeno cereales. sintasa, entre otros. También posibilitó la con- En trabajos posteriores se comprobó que fección de mapas consenso para trigo pan, largos segmentos de los cromosomas de candeal y cebada. maíz, sorgo, arroz, trigo y cebada conservan la El acceso a los principales genes que afectan presencia y el orden de marcadores y genes, la calidad ha abierto nuevas vías para el desa-

Biotecnología y Mejoramiento Vegetal II 115 rrollo comercial de diferentes productos deriva- Toda esta información permite inferir que la dos del trigo. Es posible obtener variedades con biotecnología puede cambiar el escenario de los diferente calidad de almidón, diferente textura cereales en dos áreas principales: (1) protegien- de grano, diferente composición de gluteninas, do al cultivo de estreses bióticos y abióticos y gliadinas y secalinas en función del uso indus- (2) modificando el concepto de producción de trial. El descubrimiento de genes valiosos de «commodities» por el de producción de «spe- otros genomas y la posibilidad de incorporarlos cialities», por ejemplo para derivados de trigo al trigo por transgénesis permitirán resolver pro- con mayor valor agregado, como noodles (clase blemas del cultivo, como pueden ser limitantes de fideo muy utilizado en Asia), galletitas dulces, debido a estreses bióticos y abióticos o desa- crackers (un tipo de galletita que se rompe fácil- rrollar nuevas generaciones de transgénicos en mente), masa congelada, pan de molde, pasta, función de las necesidades del consumidor, con almidones, plásticos biodegradables, etc. mayor contenido de aminoácidos esenciales Se han identificado cinco áreas de investiga- como la lisina, vitaminas, etc. ción a desarrollar en los próximos años para el La complejidad del genoma del trigo ha he- mejoramiento de trigo, que pueden aplicarse a cho aconsejable abordar los estudios genómi- los cereales en general: (i) mapeo genético, (ii) cos a través del transcriptoma. Para ello se han análisis de QTL, (iii) mejoramiento molecular, establecido consorcios internacionales como (iv) mapeo por asociación, y (v) desarrollo de el International Wheat Genome Sequencing software. Consortium (IWGSC) o el International Triticeae Mapping Initiative (ITMI), el cual coordina gru- 9 Genomas trabajadores pos de investigación de distintos países en la La genómica aplicada a dilucidar los meca- construcción de mapas moleculares del geno- nismos por los cuales funcionan los microorga- ma de trigo. Existe colaboración internacio- nismos puede conducir al aislamiento de sus nal para otros cultivos como el arroz, donde el componentes para desarrollar nanoestructuras Internacional Rice Genome Sequencing Project que lleven a cabo funciones complejas. Como (IRGSP) coordina esfuerzos de 10 países y como ejemplos pueden citarse: resultado de esto, en 2002, fueron colocadas en bases de datos públicas secuencias de alta cali- Methanococcus jannaschii: es una bacteria dad que representaban 366 Mbp del genoma de que produce metano, una importante fuente de arroz. En el 2005 se llegó a 371 Mbp, que repre- energía. Contiene enzimas que soportan tem- sentan el 95% del mismo. Las bases de datos peraturas y presiones elevadas por lo que son de EST han crecido exponencialmente en la úl- potencialmente útiles para fines industriales. tima década, de manera que en Septiembre de Deinococcus radiodurans: soporta niveles 2008 había 55 millones de ESTs depositadas en de radiación extremadamente elevados por lo el National Center for Biotechnology Information cual tiene un alto potencial para limpiar dese- dbEST database (http://www.ncbi.nlm.nih.gov/ chos radiactivos. dbEST). Esto incluye cerca de 1.607.934 de Thalassiosira pseudonana: se trata de una ESTs de trigo hexaploide y sus parientes más diatomea marina que es la principal participan- cercanos de la tribu Triticeae, que son Hordeum te en el bombeado biológico de carbono hacia vulgare L.; especies diploides y tetraploides de las profundidades de los océanos, por lo que Triticum, Secale cereale L. y Aegilops speltoides posee un elevado potencial para mitigar los Tausch. Estas ESTs se utilizan para el desarro- cambios climáticos del planeta. llo de marcadores funcionales, la preparación de mapas de transcriptos y la construcción de 10 Proyectos de Genómica en Sudamérica matrices de ADNc. Actualmente el estudio de En Sudamérica se han desarrollado y se ARN interferentes, TILLING y la “genética de ex- encuentran en ejecución algunos proyectos presión” lideran el mapeo de eQTL (Quantitative genómicos. Frente al estado del desarrollo de Traits Loci de expresión) y han sido utilizados estas áreas en el mundo, existen en la región para identificar funciones de genes individuales. serias carencias, tanto de recursos humanos

116 Biotecnología y Mejoramiento Vegetal II entrenados como de infraestructura y equi- formas tecnológicas en genómica forestal con pamiento. En Brasil se estableció una red de el objeto de mejorar la posición competitiva del cooperación que secuenció completamente el sector forestal chileno. genoma de Xylella fastidiosa, bacteria que ata- En el marco del Programa Cooperativo para ca a los cítricos causando importantes pérdidas el Desarrollo Tecnológico Agroalimentario y económicas. También incursionó en el estudio Agroindustrial del Cono Sur (PROCISUR), de genómica funcional de células cancerosas los Institutos Nacionales de Investigación y de secuenciación del genoma de caña de Agropecuaria de Argentina, Bolivia, Brasil, azúcar, Saccharum oficinalis. En Argentina se Chile, Paraguay y Uruguay han conformado ha trabajado en la secuenciación de Brucella una plataforma regional para enfrentar los de- abortus, agente causal de la brucelosis bovina. safíos que impone la secuenciación del geno- Investigadores argentinos participan tam- ma de la papa. Esta iniciativa es desarrollada a bién en proyectos de genómica en coopera- nivel mundial por el Consorcio Internacional de ciones internacionales, como el consorcio in- Secuenciación del Genoma de la Papa, que li- volucrado en la secuenciación del genoma de dera la Universidad de Wageningen de Holanda Trypanosoma cruzzi, el proyecto que llevó a la y en la que están comprometidos China, clonación y caracterización de los genes de ver- Estados Unidos, Holanda, India, Inglaterra, nalización en trigo o el proyecto de búsqueda Irlanda, Nueva Zelanda, Polonia, Rusia y los de genes de tolerancia a frío en Deschampsia sudamericanos Chile, Perú, Argentina y Brasil. antarctica. En Chile se ha completado recien- Estos últimos, en conjunto, secuenciarán el temente la secuenciación de Piscirickettsia sal- cromosoma 3 del genoma de la papa y en total monis, patógeno intracelular de salmones que se deberán secuenciar los 12 cromosomas de causa importantes pérdidas en esta industria. la especie. También se trabaja activamente en especies En varios países se han secuenciado hortícolas, principalmente frutales. fragmentos de genomas de virus y viroides Otros ejemplos son el desarrollo de marca- (Argentina, Chile, Uruguay). En Argentina se dores microsatélites (Parte I, Cap. 5) de di- esta realizando la caracterización biológica versas especies, como girasol (colaboración y molecular del virus del mal de Río Cuarto de INTA-Argentina con empresas semilleras (MRCV) con el fin de estimar la diversidad ge- locales), vides (INIA-Chile como parte de un nética de las poblaciones del virus, detectar la consorcio internacional), alpacas y otros camé- existencia de razas y limitar la propagación de lidos sudamericanos (INIA-Chile), pasto llorón esta enfermedad de importancia para el maíz. (CERZOS, UNR, INTA Castelar), entre otros. El En el año 2003 la Agencia Nacional de girasol es una especie de importancia económi- Promoción Científica y Tecnológica de ca en la Argentina y es el eje de varios proyec- Argentina (ANPCyT) lanzó una convocatoria tos genómicos. Algunos de los objetivos son la para Proyectos de Área de Vacancia (PAV), caracterización de la diversidad funcional del donde la genómica era una de las prioridades. girasol y la identificación de SNPs asociados a En respuesta a esta convocatoria se formó una caracteres agronómicos de importancia como Red de laboratorios dedicados al análisis ge- la resistencia a estreses bióticos y abióticos. nómico funcional y comparativo en especies Por otro lado, el desarrollo de marcadores mi- de interés agropecuario, forestal o ambiental crosatélites, ESTs y el mapeo genético de las (PAV137). Los objetivos fueron generar una in- mismas es utilizado para asistir al mejoramien- fraestructura operativa y comunicacional ade- to y realizar identificación varietal. cuada y formar recursos humanos necesarios En Chile se ha desarrollado un programa de para apoyar el desarrollo de iniciativas e inves- genómica funcional coordinado por diversos tigaciones en áreas de genómica funcional y ministerios, destinado a enfrentar problemas bioinformática críticas para la biología agrope- de postcosecha y enfermedades en plantas de cuaria, forestal y ambiental. La red pudo capa- interés agrícola. Otro proyecto de genómica, citar recursos humanos orientados a la bús- en este mismo país, apunta a desarrollar plata- queda, prospección y/o análisis funcional de

Biotecnología y Mejoramiento Vegetal II 117 genes con interés básico o aplicado. Se abor- susceptibilidad y resistencia a estreses bióti- daron cinco áreas de desarrollo e integración: cos, a través de estudios de genómica funcio- a) transcriptómica, b) proteómica, interactómi- nal, utilizando ESTs y unigenes y micromatri- ca y metabolómica, c) genómica comparativa, ces de ADNc. d) genómica evolutiva para la caracterización Los objetivos para programas de genómica de la diversidad genética y e) ecogenómica sudamericanos deberían enfocarse hacia el (aplicada a la evaluación de impacto ambien- aumento de la productividad y la mejora de la tal) y epidemiología molecular. En los dos pri- calidad de los productos, desarrollando capaci- meros subproyectos se encararon trabajos de dades para identificar genes del germoplasma prospección y caracterización funcional de re- regional, de manera de disminuir la dependen- giones genómicas de interés en plantas supe- cia de variedades y genes desarrollados y ais- riores y bacterias zoonóticas mediante el aná- lados por países del primer mundo y buscar so- lisis de perfiles de transcripción, interacción de luciones para problemas propios de la región, proteínas y perfiles metabólicos (girasol, citrus, que difícilmente pueden ser enfrentados por soja, solanáceas, Mycobacterium y otros). En programas de mejoramiento genético ajenos a el c) se caracterizaron molecularmente regio- la misma. nes genómicas involucradas en características reproductivas (apomixis) de especies forra- 11 Lecturas / sitios recomendados jeras, de resistencia a estreses en especies cultivadas, así como de características pro- Cenci A., Chantret N., Xy K., Gu Y., Anderson O.D., ductivas en girasol y caprinos. El área d) sirvió Fahima T., Distelfeld A. Y Dubcovsky J. 2003. para evaluar la diversidad genética de recursos Construction and characterization of a half mil- biológicos naturales o cultivados, en particular lion clones Bacterial Artificial Chromosome en especies leguminosas y en forestales. La (BAC) library of durum wheat. Theor Appl Genet 107: 931-939. e) permitió estudiar la dinámica poblacional de Cervigni G., Paniego N., Díaz M., Selva J.P., Zap- variantes alélicas en ecosistemas (impacto del pacosta D., Zanazzi D., Landerreche I., Felitti cultivo de maíces transgénicos en potenciales S., Pessino S., Spangenberg G. And Echenique genes de resistencia en insectos plaga, cuanti- V. 2008. Expressed sequence tag analysis and ficación de diversidad genética de especies en development of gene associated markers in a peligro de extinción en ecosistemas naturales near-isogenic plant system of Eragrostis curvula. explotados por el hombre) y encarar la epide- Plant Molecular Biology. 67: 1-10. miología molecular de la fiebre aftosa y de la Devos K.M Y Gale M.D. 2000. Genome relationship: peste porcina clásica. the grass model in current research. Plant Cell Este proyecto acaba de finalizar (septiembre 12: 637-646 Echenique V., Stamova B., Wolters P., Lazo G., de 2008) y, si bien aún no se ha realizado la Carollo V. Y Dubcovsky J. 2002. Frequencies of evaluación final del mismo, varios de los ob- Ty1-copia and Ty3-gypsy retroelements within jetivos fueron cumplidos exitosamente, ya que the Triticeae EST databases. Theor. Appl. Genet. se formaron varios doctores en el área en dis- 104: 840-844. tintas Universidades del país, entrenados para Gale M. Y Devos K. 1998. Plant������������������������ comparative genet- trabajar en equipos multidisciplinarios, además ics after 10 years. Science, 282: 656-658. de lograr avances en el conocimiento en las Gibson D.G., Benders G.A., Andrews-Pfannkoch mencionadas áreas. C., Denisova E.A., Baden-Tillson H., Zaveri J., El INIA (Uruguay) cuenta con proyectos de Stockwell T.B., Brownley A., Thomas D.W., Al- desarrollo y validación de herramientas bioin- gire M.A., Merryman C., Young L., Noskov V.N., Glass J.I., Venter J.C., Hutchison Iii C.A. Y Smith formáticas para integrar información genómica H.O. 2008. Complete chemical synthesis, as- en programas de fitomejoramiento y selección sembly, and cloning of a Mycoplasma genitalium de germoplasma. Dentro de los proyectos de genome. Science, 319: 1215-1220. genómica de arroz, el EMBRAPA (Brasil), rea- Glass J.I., Assad-Garcia N., Alperovich N., Yooseph liza el estudio de genes y sus productos, in- S., Lewis M.R., Maruf M., Hutchison Iii C.A., Smi- volucrados en los mecanismos moleculares de th H.O. Y Venter J.C. 2005. Essential genes of

118 Biotecnología y Mejoramiento Vegetal II a minimal bacterium. Proc. Nat. Acad. Sci. 103: 425-430. Goff S.A., Ricke D., Lan T.H., Presting G., Wang R., Dunn M., Glazebrook J., Sessions A., Oeller P., Varma H. et al. 2002. A draft sequence of the rice genome (Oryza sativa L. ssp. japonica). Sci- ence, 296: 92-100. Griffiths A., Miller J., Suzuki D., Lewontin R.Y Gelbart W. 2004. An�������������������������������� introduction to genetic anal- ysis. Octava Edición. W.H. Freeman, N.York. 860 pp. Gupta P.K., Mir R.R., Mohan A. And Kumar J. 2008. Wheat genomics: Present status and future prospects. International Journal of Plant Genomics. Article ID 896451, 36 pages. doi:10.1155/2008/896451 Kumar A. Y Bennetzen J.L. 1999. �����������������Plant retrotrans- poson. Annu Rev Genet 33: 479-532. Lacadena J.R. 2000. Seréis como dioses. Crítica (Madrid), 874: 12-16. Lartigue C., Glass J.I., Alperovich N., Pieper R., Par- mar P.P., Hutchison Iii C.A., Smith H.O. Y Venter J.C. 2007. Genome transplantation in bacteria: changing one species to another. Science 317: 632-638. Moore G. 2000. Cereal chromosome structure, evo- lution and pairing. Ann. Rev. Plant Mol. Biol. 51: 195-222 Sanmiguel P., Ramakrishna W., Bennetzen J.L., Busso C. Y Dubcovsky J. 2002. Transposable elements, genes and recombination in a 215 kb. contig from wheat chromosome 5A. Functional and Integrative Genomics. 2: 70-80. Wade C.M., Kulbokas E.J. Iii., Kirby A.W., Zody M.C., Mullikin J.C., Lander E.S., Lindblad-Toh K. Y Daly M.J. 2002. The mosaic structure of vari- ation in the laboratory mouse genome. Nature, 420: 574-578. Warren R.L., Varabei D., Platt D., Huang X., Messi- na D., Yang S., Kronstad J.W., Krzywinski M., Warren W.C., Wallis J.W., Hillier L.W., Chinwalla A.T., Schein, J.E. Siddiqui A.S., Marra M.A., Wil- son R.K., Y Jones S.J.M.. 2006. Physical map- assisted whole-genome shotgun sequence as- semblies. Genome Res. 16: 768-775. Yu J., Hu S., Wang J., Wong G.K., Li S., Liu B., Deng Y., Dai L., Zhou Y., Zhang X. Et Al. 2002. A draft sequence of the rice genome (Oryza sativa L. ssp. indica). Science, 296: 79-92. The Arabidopsis Genome Initiative: Analysis of the genome sequence of the Arabi- dopsis thaliana. Nature 2000. 408: 796-815.

Biotecnología y Mejoramiento Vegetal II 119 120 Biotecnología y Mejoramiento Vegetal II I CAPÍTULO 8 tos de posición (originados en el mapeo gené- tico) con los datos de expresión (originados en el análisis del transcriptoma) posibilita la selec- Transcriptómica ción de candidatos responsables de disparar un determinado carácter de interés. Silvina Felitti y Silvina Pessino Este capítulo tiene como objetivo presentar en forma abreviada una serie de metodologías que son utilizadas habitualmente para el análi- El análisis de los niveles de representación sis del transcriptoma de plantas. Debido al muy de ARN mensajeros proporciona información rápido cambio y perfeccionamiento en las téc- importante sobre la actividad de un gen, evi- nicas empleadas para abordar el estudio de la denciando si está siendo copiado para poste- representación de mensajeros tanto a nivel de riormente dirigir la síntesis de la proteína a la mesada como bioinformático, algunas de las cual codifica. En los últimos años los proce- metodologías mencionadas aquí ya han sido dimientos para la detección de los niveles de reemplazadas y se usan actualmente en forma ARN mensajeros han progresado velozmente poco frecuente. Sin embargo hemos decidido desde el análisis de genes únicos específicos incluirlas, dada su gran importancia histórica (como el Northern, slot, y dot blotting, la RT- en relación al cambio de abordaje conceptual PCR semicuantitativa y cuantitativa y los en- que va desde el análisis de la actividad de ge- sayos de protección de nucleasas) hacia otros nes únicos al estudio integral de la expresión enfocados en la identificación de múltiples transcriptos que difieren en su representación génica. Comenzaremos describiendo las técni- entre las diversas muestras experimentales cas en orden cronológico de desarrollo. (como la hibridización substractiva, el display diferencial, el ADNc-AFLPs, la secuenciación Hibridización substractiva de etiquetas expresadas o ESTs, el análisis se- Los métodos de hibridización substractiva rial de la expresión de genes o SAGE y la hi- fueron creados a principios de los años 80 con bridización de microarreglos). La organización el propósito de construir bibliotecas de ADNc posterior de las secuencias dentro de grupos para obtener sondas de genes expresados funcionales basada en los datos de homología diferencialmente. Fueron los primeros que se proporciona un marco básico para conducir utilizaron de manera amplia con el propósito nuevos estudios dirigidos a definir el rol bioló- de identificar genes regulados positiva o nega- gico de cada producto génico. Por otra parte, la tivamente en una escala global. Sus ventajas aplicación de técnicas de PCR en tiempo real y incluyen la habilidad de aislar genes de función de hibridización in situ de tejidos permiten una relacionada sin tener conocimientos previos validación más precisa de los datos de expre- de su secuencia o identidad y el uso de téc- sión diferencial obtenidos por métodos ante- nicas comunes de biología molecular que no riormente citados. requieren equipos especializados de detección La capacidad tecnológica creciente permi- y análisis. El procedimiento general consiste te ahora capturar sectores de tejidos o inclu- en la hibridización de un ADNc proveniente so células aisladas y analizar su contenido de de una muestra prueba (tester) con un exceso ARNm, lo que provee información específica de ARNm proveniente de una muestra control sobre la representación del transcriptoma para (driver). Los transcriptos expresados en ambas tipos celulares únicos. La asociación de los da- muestras (tester y driver) forman moléculas de tos provenientes de la secuenciación genómica ARNm/ADNc híbridas, mientras que las se- con aquellos originados en la transcriptómica y cuencia de ADNc que están presentes única- la proteómica facilita la predicción de la exis- mente en la muestra tester permanecen como tencia de fragmentos codificantes en sectores hebras simples. Las moléculas de hebras sim- acotados del genoma, y da información sobre ples y dobles se separan usando cromatogra- la posible función de los candidatos en tejidos fía en hidroxilapatita. Los ADNcs expresados particulares. Además, la asociación de los da- diferencialmente pueden entonces ser recu-

Biotecnología y Mejoramiento Vegetal II 121 perados y clonados o usados directamente el display diferencial esto se logra utilizando como sondas para analizar una biblioteca. Dos como cebador de la transcripción reversa a un limitaciones importantes del protocolo original poliT anclado con una o más bases adicionales son: i) el requerimiento de grandes cantidades al extremo 3´ del ARN mensajero (por ejemplo de ARNm y ii) una tendencia a una menor efi- (T)12AC). Estos oligonucleótidos se fijan al ARN ciencia en la identificación de transcriptos poco mensajero a través de la unión de las bases abundantes. adicionales, impidiendo que el poliT “resbale” La hibridización substractiva es aplicable sobre distintas zonas del poli A. El único grupo sólo a comparaciones de pares de muestras y de ARNms que es transcripto en forma reversa debe ser realizada por duplicado con el tester y es el integrado por las moléculas que llevan las el driver invertidos para detectar tanto aumen- bases complementarias a las bases adiciona- tos como disminuciones en los niveles de ex- les del poliT en el extremo del mensajero adya- presión. Además no genera una medida cuanti- cente al poliA. En contraste, la RAP-PCR utiliza tativa y aunque es eficiente en la identificación oligonucleótidos de secuencia arbitraria para la de genes que están completamente ausentes transcripción reversa. Estos cebadores tienen en el driver no revela fácilmente a aquellos que normalmente 10 bases de largo y se unen a están presentes en ambas muestras en distinta sus secuencias complementarias permitiendo proporción. Se realizaron modificaciones para formar una hebra de ADNc desde este sitio. mejorar el protocolo original que incluyen la En este caso el subgrupo de ARNms que su- producción de ADNc con marcas de biotina o fre transcripción reversa estará integrado por oligo(dT)30-látex de manera de refinar la - se aquellas moléculas que presenten la secuen- paración de las moléculas de cadena simple cia complementaria a la del cebador orientada y doble. También se incorporó la amplificación en el sentido adecuado. de ADNcs selectos por PCR para disminuir la Luego de haberse realizado la síntesis de la cantidad inicial de ARNm requerido y aumen- primer hebra del ADNc, se amplifican segmen- tar la eficiencia de clonado de los transcriptos tos de los transcriptos usando pares múltiples seleccionados. También se ha utilizado un pro- de cebadores de PCR. Tanto para el display tocolo ingenioso conocido como hibridización diferencial como para el RAP-PCR, el cebador substractiva de supresión (SSH) que fue dise- superior es un oligonucleótido arbitrario de 10 ñado para favorecer la detección de transcrip- pares de bases. El cebador inferior es el mis- tos raros expresados diferencialmente. Este mo oligonucleótido poliT anclado (para el caso incluye una normalización en la representación del display diferencial) o el decámero arbitrario de los transcriptos diferenciales basada en la (para el caso de RAP-PCR) que se usaron alter- inhibición de la amplificación de aquellos que nativamente para hacer la transcripción rever- son más abundantes, eliminando también la sa. Se ha estimado que los productos de PCR necesidad de separar moléculas de cadena de 240 combinaciones particulares de pares de doble y simple (ver Figura 1). cebadores de display diferencial (por ejemplo todas las combinaciones de 20 oligonucleó- Display diferencial y RAP-PCR tidos arbitrarios y 12 oligonucleótidos ancla- Las técnicas conocidas en general como dos) representan estadísticamente a todos los “huellas digitales de ARN” (ARN fingerprinting) ARNm originalmente presentes en la muestra. incluyen al display diferencial (DD) y la PCR Los productos de PCR pueden ser marcados de ARN cebada arbitrariamente (RAP-PCR). por incorporación de un nucleótido radiactivo Ambos métodos están basados en una am- o de una molécula que pueda ser detectada a plificación por PCR de subgrupos al azar de través de su interacción con un anticuerpo con- transcriptos a partir de dos o más muestras. jugado a un sistema de detección (por ejemplo La primera etapa de ambos procedimientos es digoxigenina). También puede usarse un ce- común y consiste en generar ADNcs haciendo bador unido a un fluoróforo u optarse por no una transcripción reversa de una fracción de marcar los fragmentos amplificados y usar lue- las moléculas de ARNm de una muestra. En go una tinción con nitrato de plata para revelar

122 Biotecnología y Mejoramiento Vegetal II Figura 1.

los geles. La visualización de los productos de la otra, o aquellos que están presentes con di- PCR se logra luego de la electroforesis en ge- ferentes intensidades relativas en los distintos les de poliacrilamida seguida de la apropiada tratamientos experimentales, representan po- generación y detección de imágenes, que son tenciales transcriptos de ARNm de expresión evaluadas comparando la intensidad relativa diferencial. Típicamente, las bandas son eva- de las bandas producidas a partir de diferentes luadas sólo si amplifican en forma consistente muestras experimentales. Los fragmentos que en reacciones de PCR duplicadas para cada están presentes en una muestra y ausentes en muestra (ver la Figura 2).

Biotecnología y Mejoramiento Vegetal II 123 Figura 2.

La fase final del display diferencial consiste casos debe realizarse un alineamiento de las en la identificación de la secuencia del trans- imágenes de los fragmentos de amplificación cripto representado por el producto de PCR y con el gel de poliacrilamida seco. En los casos la confirmación de que éste realmente se ex- en que se utiliza tinción con nitrato de plata no presa en forma contrastante. Estas etapas se es necesario realizar este paso, por lo cual la logran localizando físicamente y escindiendo la recuperación de la banda es mucho más efi- sección del gel de poliacrilamida que contiene ciente. Los productos de PCR son purificados al producto de interés. En la mayoría de los del gel y reamplificados. Para ello el fragmento

124 Biotecnología y Mejoramiento Vegetal II de poliacrilamida se procesa en fragmentos pe- de la secuencia. Sin embargo, es probable que queños con un bísturí que se transfieren a una distintos alelos o incluso diferentes miembros solución tampón adecuada para la elución de de una familia génica hibridicen en conjunto en los fragmentos. Luego de una centrifugación, el experimento de Northern, o que los diseños el sobrenadante se purifica con fenol/clorofor- de cebadores para real time PCR no permitan mo y el ADN se precipita con etanol, se diluye diferenciarlos. También puede ocurrir que en en agua y se reamplifica por PCR. los experimentos de DD se detecte una he- Se han utilizado varias estrategias para bra antisentido sobreexpresada en una de las confirmar la expresión diferencial de los trans- muestras. Si la hebra sentido está expresada criptos, que incluyen el uso de los fragmentos en la otra, los experimentos de real time no como sondas de Northern, la siembra de los permitirán la detección de la expresión diferen- fragmentos en membranas para someterlos a cial. Estos son sólo algunos de los muchos ca- análisis de Northern inverso y el clonado y se- sos posibles en los cuales el northern y la PCR cuenciación de los productos para diseñar ce- en tiempo real no reproducirán los datos de badores específicos que permitan realizar PCR DD, pero no precisamente porque el DD haya semicuantitativas, así como también la hibridi- generado un falso positivo, sino simplemente zación in situ de tejidos. porque estas técnicas están basadas en prin- Dos ventajas importantes de los métodos cipios de detección diferentes. Muchos de los de fingerprinting de ARN con respecto a los de supuestos “falsos positivos” detectados por DD hibridización substractiva son la capacidad de en el pasado (cuando no se tenía conciencia comparar muestras experimentales múltiples sobre la frecuencia de la expresión antisenti- en forma simultánea y la de identificar genes do) pueden englobarse seguramente en estas que están regulados tanto positiva como ne- categorías. gativamente en una muestra respecto de las Otro problema es que estas técnicas deben otras. Sin embargo, los métodos de fingerprin- aplicarse en general a muestras provenien- ting de ARN comparten con el SSH la limitación tes del mismo individuo sometido a distintas de que no son cuantitativos. condiciones o sobre individuos genéticamen- Uno de los problemas que suelen atribuirse te idénticos (por ejemplo isolíneas). Cuando a display diferencial es la amplificación de fal- se comparan los perfiles de ARNm de indivi- sos positivos o sea fragmentos de genes que duos diferentes genéticamente, pueden apare- parecen estar diferencialmente expresados cer falsos positivos que son resultado de una pero son luego cosiderados artefactos de PCR amplificación diferencial debida a una varia- porque no pueden validarse por Northern blot ción en la secuencia de los transcriptos más o PCR en tiempo real. Es necesario dar una que a diferencias en su representación. Ese mirada más detallada a este punto. Es cierto problema puede ser evitado utilizando estra- que es imprescindible realizar las amplificacio- tegias de análisis de segregantes en grupo nes de DD PCR por duplicado o triplicado para (BSA) aplicadas al estudio de perfiles de ARN. asegurarse que la amplificación es reproduci- Finalmente, la investigación de todos los ge- ble y no se trata de una banda espuria. Pero nes que potencialmente se expresan en forma una vez superado este punto de la reproduci- diferencial requiere el uso de equipamiento de bilidad de la amplificación, hay que considerar última generación y una inversión extensiva de que no siempre las diferencias detectadas con tiempo y trabajo para detectar y confirmar la esta técnica pueden ser validadas por Northern expresión diferencial de cada uno de los genes o por PCR en tiempo real. Por ejemplo, cuando individuales. existe expresión alélica diferencial entre mues- tras, o cuando diferentes miembros de una Polimorfismos en el largo de los fragmen- misma familia génica son expresados diferen- tos de ADNc amplificados (ADNc-AFLP) cialmente, es posible que se detecten polimor- La tecnología de AFLP, generalmente utili- fismos en los geles de DD, como consecuencia zada para producir huellas genéticas de DNA de que los primers se unan a sitios variables genómico, puede ser aplicada también a pre-

Biotecnología y Mejoramiento Vegetal II 125 paraciones de ADNc de doble hebra para ob- de adaptadores de cadena doble a los extre- tener un perfil del transcriptoma. Los patrones mos de los fragmentos de restricción, iv) ampli- obtenidos por esta técnica son una herramien- ficación de un subgrupo de los fragmentos de ta confiable y eficiente para la identificación de restricción usando dos cebadores complemen- ARNms expresados diferencialmente. La téc- tarios al adaptador que llevan bases selectivas nica de ADNc-AFLP detecta fragmentos de adicionales en el extremo 3´ v) electroforesis restricción de DNA por medio de amplificación de los fragmentos de restricción amplificados por PCR. Comprende las siguientes etapas: i) generación de ADNc, ii) restricción del ADNc en geles de poliacrilamida, vi) visualización de con dos endonucleasas específicas, preferible- las huellas digitales genéticas mediante el uso mente una que reconoce sitios de 6 bases y de autoradiografías, fosfoimágenes y otros mé- otra que reconoce sitios de 4 bases, iii) ligación todos (ver Figura 3).

Figura 3.

126 Biotecnología y Mejoramiento Vegetal II Las mayores ventaja del uso de la tecno- normalizadas para ecualizar la abundancia logía de ADNc-AFLP son: i) no se requiere de clones que corresponden a los diferentes información previa de secuencia; ii) se puede transcriptos. Los EST secuenciados a partir estudiar una fracción muy grande de todos los de estas últimas pueden ser comparados para genes expresados, iii) es una técnica muy sen- identificar transcriptos que se expresan en una sible que permite la detección de transcriptos biblioteca y están completamente ausentes en de baja abundancia, iv) los fragmentos son ex- otra, pero si se pretende obtener datos cuanti- traídos fácilmente de los geles y las secuen- tativos exactos que describan abundancia re- cias correspondientes pueden determinarse lativa se debe recurrir indefectiblemente a bi- sin necesidad de clonados previos. bliotecas de ADNcs no normalizadas. También existen productos comerciales que permiten la Etiquetas de secuencia expresadas construccion de bibliotecas donde los transcrip- (Expressed sequence tags, ESTs) tos han sido amplificados pero manteniendo la La secuenciación exhaustiva de ESTs proporción relativa de unos respecto a otros, (Expressed Sequence Tags) es considerado lo que facilita la comparación cuantitativa entre principalmente un método para la caracteriza- muestras. ción de la expresión génica, a pesar de que la Las ESTs requieren de varias etapas de pro- generación de ESTs resulta también importan- cesamiento, ensamblado en grupos (contigs) te para deducir la presencia de genes no pre- y anotación para que se pueda extraer infor- dichos en ausencia de datos genómicos. Las mación biológica a partir de las mismas. Para ESTs son obtenidas a gran escala por secuen- esto, resulta muy importante el almacenamien- ciación de una sola hebra de clones de ADNc to, la organización y la anotación de estas se- (aproximadamente 500 pb) provenientes de cuencias utilizando distintas herramientas in- bibliotecas que representan distintos tejidos o formáticas (revisadas por Nagaraj et al., 2007). condiciones experimentales. Las ESTs repre- sentan descripciones parciales de las regiones Análisis serial de la expresión de genes que se transcriben de un genoma. Una canti- (SAGE) dad creciente de centros de investigación han El análisis serial de la expresión de genes construído y secuenciado bibliotecas de ADNc (SAGE) consiste esencialmente en una versión en los últimos años. Esta tendencia se ve refle- acelerada de la secuenciación de ESTs. Está jada en el número de ESTs depositadas en la basada en el concepto de que una etiqueta base de datos del NCBI (ESTdb), el que al 6 de corta de unas pocas bases es suficiente para Junio de 2008 es de 2994249 provenientes de identificar inequívocamente a un transcripto, 261 especies de plantas. siempre y cuando esté ubicada en una posición En teoría, la abundancia de una EST es di- definida dentro de la secuencia del mensajero. rectamente proporcional a la representación en Una etiqueta SAGE consiste típicamente en número de copias de un transcripto en un teji- 9-14 bases de secuencia ubicadas por debajo do determinado. El proceso de generación de del último sitio de reconocimiento de una en- ESTs es relativamente lento y costoso, lo que donucleasa específica en el transcripto blanco. hace difícil que se logre la saturación de una Múltiples etiquetas SAGE se ligan juntas en un biblioteca. Teóricamente, si se secuencia el nú- vector de clonado de manera que una reacción mero suficiente de ESTs, este método permite de secuenciación de 300 a 500 pb genera las analizar incluso aquellos genes que presentan secuencias de 20 a 30 etiquetas al mismo tiem- niveles de expresión bajos, pero si el número po (ver Figura 4). Como cada etiqueta SAGE de secuencias obtenidas es limitado conviene representa un único transcripto de ARNm, es recurrir a técnicas de amplificación comple- posible obtener una visión general de todos mentarias (ADNc-AFLP o DD) para detectar los genes expresados en la muestra original. transcriptos poco abundantes. Las diferencias en la expresión de genes en- Las secuencias ESTs a menudo se generan tre muestras experimentales pueden entonces a partir de bibliotecas de ADNc que han sido ser identificadas comparando la abundancia

Biotecnología y Mejoramiento Vegetal II 127 Figura 4.

relativa de etiquetas SAGE específicas en dife- ca su abundancia en la muestra en estudio. A rentes bibliotecas. Los genes o las secuencias diferencia de los microarreglos, la técnica de ESTs representados por las etiquetas SAGE SAGE permite detectar transcriptos de los cua- son localizados en las bases de datos detec- les no se conoce su secuencia previamente a tando aquellos transcriptos que tengan la eti- la realización del experimento, es decir es una queta SAGE en la posición adecuada. técnica conocida como “abierta” (pueden reco- Esta técnica se utiliza para identificar y cuan- nocerse genes nuevos). tificar transcriptos. Fue descripta por primera A partir de un experimento de SAGE se pue- vez por Velculescu y colaboradores en 1995 den obtener unos 50.000 a 100.000 fragmen- (ver bibliografía recomendada). Brevemente, tos, los que representan de 20.000 a 40.000 se utiliza una enzima de restricción tipo II (en- genes únicos. Estos fragmentos brindan infor- zima de etiquetado) que libera fragmentos de mación cualitativa de los transcriptos detecta- entre 9 y 14 pb a partir de los ADNc previa- dos, mientras que el número de copias de cada mente digeridos con otra enzima de restricción uno de ellos brinda información cuantitativa y (la más comúnmente utilizada es NlaIII). Estos refleja la abundancia de los transcriptos en la fragmentos son luego ligados entre si para muestra. Generalmente se observa que algu- formar un concatémero que es clonado y se- nos de los fragmentos detectados por SAGE cuenciado. Los fragmentos detectados en una presentan más de 100 copias, otros entre 2 y muestra representan a los transcriptos que los 100 copias y la mayoría de ellos (70-80%) se originaron y su frecuencia de detección indi- encuentran en copia única. En la mayoría de

128 Biotecnología y Mejoramiento Vegetal II los casos se observa que entre el 50-70% de del transcripto tales como las resultantes de los fragmentos presentan similitud con genes splicing alternativo o SNPs presentes en la eti- o transcriptos de función conocida, mientras queta pueden resultar en distintos fragmentos que entre 30-50% no son similares a ninguna que en realidad se correspondan con un mis- secuencia conocida. Es esperable que estos mo gen), experimentales (artefactos introduci- porcentajes que son usuales actualmente se dos en las secuencias como consecuencia de modifiquen en el futuro a medida que aumente la técnica utilizada) y por redundancia de trans- el número de genes caracterizados y la canti- criptos. Las bases de datos de referencia se dad de etiquetas promedio secuenciadas por construyen con secuencias que son altamente proyecto. redundantes. Las mismas son agrupadas en Se ha observado una especificidad relativa- función de la homología de secuencias, lo que mente alta de un fragmento de entre 9 y 14 pb puede originar que se encuentren transcriptos para su asociación con transcriptos conocidos que corresponden a un mismo gen en grupos en el caso de genomas relativamente simples. distintos (como en el caso de que hubiera spli- Sin embargo, la especificidad disminuye cuan- cing alternativo) o que se agrupen transcriptos do se estudian genomas más complejos. Se correspondientes a genes distintos porque pre- han hecho intentos para mejorar la especifi- sentan un alto grado de homología de secuen- cidad aumentando el largo de los fragmentos. cia. Es importante mencionar que las bases de LongSAGE aumenta el largo de los fragmentos datos de referencia pueden ser incompletas, a 21 pb y SuperSAGE a 26 pb, utilizando dife- debido a que comúnmente se incluyen en las rentes enzimas de etiquetado. Esta estrategia mismas secuencias de alta calidad y anotadas mejoró la especificidad de un dado fragmento para aumentar la especificidad. Sin embargo, para representar a un transcripto único (aun- esta estrategia disminuye en gran medida el que no completamente) y también la probabi- número de transcriptos representados en la lidad de que dicho fragmento se localice una base de datos. Esto origina que muchos de única vez en el genoma. Sin embargo, el hecho los fragmentos obtenidos por SAGE sean cla- de trabajar con fragmentos más largos aumen- sificados como desconocidos incluso cuando ta los costos de secuenciación de la técnica. sus transcriptos correspondientes hayan sido Por estos motivos, el usuario debe considerar previamente identificados. Además, un mismo cuidadosamente cuál es la longitud de los frag- fragmento puede presentar homología con más mentos a utilizar para cada caso particular. de un gen, lo que presenta un desafío adicional Los fragmentos obtenidos mediante SAGE para la clasificación de los mismos. Por todos no se pueden utilizar directamente en bús- estos motivos, es necesario verificar la asigna- quedas de homología con secuencias conteni- ción de un fragmento mediante otras técnicas. das en bases de datos debido a que son muy Entre las más utilizadas se pueden mencionar cortos. Para poder asignar un gen a un dado el RACE (Rapid Amplification of ADNc Ends) fragmento es necesario contar con una base y GLGI (Generation of Long ADNc from SAGE de datos de referencia construida previamen- tags for Gene Identification). te. Esta base de datos contiene información de Los fragmentos obtenidos por SAGE pueden fragmentos obtenidas in silico a partir de se- organizarse en tres grupos: de alta, intermedia cuencias conocidas de transcriptos o de genes y baja abundancia. Sin embargo, no se ha ana- de la especie en estudio. Si un fragmento aisla- lizado exhaustivamente aún si el número de do experimentalmente presenta homología con copias de un fragmento obtenido por SAGE una secuencia presente en la base de datos refleja exactamente en todos los casos la can- SAGE de referencia, entonces se considera tidad de ARNmensajero real contenida en la que el transcripto que lo originó proviene del muestra. Dado que el SAGE involucra numero- gen que había sido asignado a esa secuencia. sas amplificaciones por PCR, pueden originar- La confiabilidad de la asignación de genes uti- se errores específicos para un dado fragmento. lizando estas bases de datos está influenciada Además se ha observado que las secuencias por factores biológicos (por ejemplo, isoformas obtenidas por esta técnica presentan un ma-

Biotecnología y Mejoramiento Vegetal II 129 yor contenido de G+C, lo que sugiere una pre- dad de la técnica se ve reflejada en su amplia ferencia de amplificación que compromete la variedad de aplicaciones que abarca desde exactitud de la cuantificación. el análisis de expresión génica hasta estu- Dos ventajas importantes del SAGE sobre dios de ADN genómico (como Comparative la hibridización substractiva y el display dife- Genomic Hybridization - CGH- y Chromatin rencial es que los datos obtenidos son cuan- Immunopurification microarrays - conocidos titativos y acumulativos. Si se genera la sufi- como ChIP-chips). Sin embargo, en este ca- ciente cantidad de información de secuencia pítulo sólo describiremos los microarreglos de se obtienen perfiles exactos de la expresión de ADNc y de oligonucleótidos, ya que son los más los transcriptos, que describen la abundancia utilizados para el análisis del transcriptoma. de todos los genes expresados en una célula Los microarreglos de ADN pueden ser crea- o tejido. Existe una base de datos pública de dos de dos maneras: fijando las moléculas de expresión génica que ha sido creada para el ácidos nucleicos sobre una superficie sólida o almacenamiento y análisis de secuencias de por síntesis in situ de oligonucleótidos. En el SAGE cuyo poder continuará creciendo a me- primer caso las moléculas de ADN pueden ser dida que se contribuya con más información. ADNcs amplificados por PCR, oligonucleótidos Otra característica de los datos de SAGE es o fragmentos de ADN genómicos clonados en que pueden complementar otros de ESTs ge- BACs (Bacterial Artificial Chromosomes). nerados a partir de bibliotecas de ADNc nor- La utilización de clones de ADNc amplifica- malizadas o substraídas. Los ESTs brindan in- dos por PCR como sondas es el método de formación de secuencia mientras que el SAGE elección cuando se interrogan muestras de or- provee datos cuantitativos describiendo la ganismos cuyo genoma no está secuenciado. abundancia de los transcriptos. Finalmente, a Estos microarreglos son generalmente fabrica- pesar de que el SAGE requiere capacidad de dos utilizando robots. Los mismos contienen secuenciación de última generación, la canti- un cabezal de puntas que es sumergido en dad de datos que aporta puede ser 20 veces soluciones de sondas de ADN disueltas en el mayor que el que posibilita la misma cantidad buffer correspondiente y que luego son depo- de secuenciación EST. sitadas sobre un sustrato de vidrio modificado químicamente. Las puntas se cargan de sonda Hibridización de microarreglos por capilaridad y la tensión superficial entre el Los microarreglos han revolucionado la bio- buffer y el vidrio actúa para descargar las son- logía molecular. Esta técnica utiliza cientos a das. Las perturbaciones en la estructura de las miles de sondas altamente organizadas sobre descargas son frecuentes y son una fuente sig- una superficie sólida para interrogar de mane- nificativa de variación de la señal. Si bien exis- ra simultánea a todas las moléculas de ARN ten otras alternativas, la utilización de robots (definidas como blancos) contenidas en una es la más popular debido a su disponibilidad, muestra biológica. Las muestras a ser analiza- alta flexibilidad y bajos costos. Los sustratos das se marcan fluorescentemente o radiactiva- inertes sobre los cuales se depositan las son- mente y se aplican al microarreglo. Los ácidos das son variados. Los portaobjetos de vidrio nucleicos marcados hibridan con las moléculas cubiertos con poli-L-lisina fueron gradualmente de ADN complementarias que se encuentran reemplazados por sustratos con aminosilano inmovilizadas en el microarreglo. La fuerza de comerciales debido a su mayor consistencia la señal fluorescente o radiactiva capturada por en cuanto a la morfología de las descargas. las sondas de ADN en el arreglo es detectada y Para este tipo de químicas, las sondas son digitalizada para su cuantificación. inicialmente unidas por atracción electrostáti- Los microarreglos fueron originalmente dise- ca y luego fijadas por ligación cruzada (cross- ñados para identificar diferencias de expresión linking) al sustrato mediante radiación UV o génica en dos muestras distintas basadas en calor. Posteriormente se introdujeron sustratos las cantidades relativas de blancos unidos a reactivos y sondas modificadas que permiten una sonda determinada en el arreglo. La utili- una mayor discriminación de secuencia debido

130 Biotecnología y Mejoramiento Vegetal II Figura 5. a que hay un único punto de unión y una mayor Originalmente, las sondas de ADN eran di- retención de la sonda al sustrato. También se sueltas en soluciones con alto contenido de han desarrollado otros sustratos para producir sales. Luego se introdujo la utilización de de- señales más intensas y que demanden me- tergentes para mejorar la morfología de las nores cantidades de sondas. Para lograrlo se descargas. Sin embargo, algunos investigado- aumentó la cantidad de grupos reactivos sobre res informaron que la presencia de detergen- la superficie. Esto se puede lograr cubriendo tes resulta en un mayor arrastre de la sonda los portaobjetos con dendrímeros, mezclas de y una mayor variabilidad entre una deposición epoxisilano y aminosilano o con polímeros que y la siguiente. La utilización de soluciones de se auto-absorben. descarga conteniendo agentes higroscópicos

Biotecnología y Mejoramiento Vegetal II 131 permitió mejorar la estructura de los puntos y dos al desarrollo de nuevas tecnologías, van a aumentar las intensidades de señal obtenidas. permitir reducir los niveles de variabilidad sis- La desventaja de la utilización de aditivos hi- temáticos resultantes de la fabricación de los groscópicos es que producen aumentos en el microarreglos. área ocupada por la sonda, sin embargo, este La mayoría de los laboratorios ensayan la efecto se puede reducir disminuyendo la velo- calidad de sus microarreglos antes de reali- cidad del robot o aplicando micro-vibraciones zar los experimentos de hibridación con las de las puntas. Disminuir la temperatura de la muestras biológicas de interés. Generalmente cámara del robot donde se generan los mi- se controla la bondad de la impresión y se de- croarreglos y utilizar soluciones hidrofóbicas tectan errores tales como puntos que no están contribuye también a reducir el tamaño prome- bien formados, aquellos de tamaños mayores dio de las descargas. La variedad de solucio- a los deseados o faltantes. Los puntos pueden nes de descarga que existe sugiere que no ser visualizados utilizando tinturas fluorescen- hay un tipo de solución que resulte ideal para tes de unión a ADN. También se pueden em- todas las aplicaciones y que la elección de la plear métodos más precisos como son la hi- misma depende en gran medida del tipo de mi- bridación con mezclas de oligonucleótidos al croarreglo que se quiere construir. Las puntas azar de 9-mer marcados fluorescentemente o de los cabezales que se utilizan son normal- con oligonucleótidos marcados que hibridizan mente de acero inoxidable o de titanio y contie- con secuencias marcadoras cortas que están nen un capilar generado mediante descargas presentes en todas las sondas de ADN del eléctricas o la utilización de un láser. Se ob- microarreglo. Para controlar la calidad de la serva una variación sistemática en la extensión producción de microarreglos es recomendable de la descarga, porque ésta es una función del desarrollar, documentar y emplear protocolos formato de la punta, y existe variabilidad du- estándar (Standard Operating Procedures- rante la fabricación de las mismas. Se han de- SOPs). Se pueden encontrar ejemplos de los sarrollado nuevas tecnologías para solucionar mismos en la página http://www.flychip.org.uk. este problema como por ejemplo la generación Esta práctica no solamente aumenta la con- de puntas de cerámica más uniformes. sistencia entre experimentos dentro de un la- La evaporación durante el proceso de impre- boratorio, sino que facilita la transferencia de sión de los microarreglos es la principal causa información entre laboratorios. de variabilidad. La evaporación reduce el vo- El segundo método posible para la construc- lumen de solvente en las microplacas de 384 ción de microarreglos es la síntesis de oligo- pocillos y dentro del reservorio capilar de las nucleótidos in situ, inicialmente desarrollada puntas, lo que produce un aumento de concen- por Affymetrix (Affymetrix, Santa Clara, EEUU). tración de las sondas y altera las caracterís- Este método usa una conjunción de fotolitogra- ticas de la solución de descarga. Como con- fía y de química combinatoria que resulta en secuencia de esto, las propiedades del punto la síntesis de chips de ADN de alta densidad. sembrado y la distribución de la sonda de ADN También NimbleGen (NimbleGen, Madison, dentro del área del mismo se modifican. Este EEUU), Xeotron (Xeotron, Houston, EEUU) y problema se puede solucionar en parte regu- Febit (Febit, Mannheim, Alemania) han desa- lando las condiciones de humedad y tempera- rrollado otros procesos para lograr la síntesis tura dentro de la cámara del robot donde se de oligonucleótidos in situ. Todos estos pro- realiza la impresión de los microarreglos. Dado cesos se basan en la utilización de radiación que existen numerosas interacciones entre UV. En cambio Combimatrix (Combimatrix, los distintos componentes del proceso, no es Mukilteo, EEUU) usa electroquímica localiza- sencillo predecir en forma exacta cómo va a da. En el caso de Affymetrix se logra la síntesis resultar la combinación entre una solución de in situ mediante fotoactivación y desprotección siembra y un sustrato determinados. Sin em- de ácidos nucleicos. Se utilizan fotomáscaras bargo, se están realizando constantemente es- para dirigir la radiación UV a sectores espe- tudios para examinar este proceso que, suma- cíficos del microarreglo, de modo de lograr

132 Biotecnología y Mejoramiento Vegetal II la síntesis en forma selectiva. En el caso de secuencia. Por lo tanto, los estudios de expre- NimbleGen, Xeotron y Febit, todos ellos usan sión usando arreglos de tipo “tejado” permiten métodos que no requieren la utilización de fo- obtener una visión mucho más completa del tomáscaras. En este caso, la radiación UV es transcriptoma y de su relación con el genoma. dirigida mediante miles de espejos regulables La necesidad de descripciones precisas de y el ADN es sintetizado utilizando nucleótidos experimentos de microarreglos para permitir el modificados con fosfoamidita. En el caso de almacenamiento de los datos experimentales CombiMatrix, numerosos microelectrodos son y su análisis posterior ha originado la creación utilizados para sintetizar distintas moléculas de del “Minimum Information About a Microarray ADN en paralelo. La reacción química para la Experiment (MIAME) Standard” (MIAME síntesis de oligonucleótidos ocurre en el área Standard). Al igual que con las secuencias de que rodea a cada microelectrodo a la que se ADN o con las estructuras de proteínas, es suele denominar “vaso virtual” (virtual flask). cada vez más común el requerimiento de en- Una estrategia para estudiar la expresión gé- viar los resultados a bases de datos de este nica de todo un genoma es la detección de la tipo antes de su publicación. Estos estándares actividad transcripcional completa de los cro- son necesarios para permitir que la información mosomas usando “arreglos solapados o en te- esté públicamente disponible en un formato jado” (tiling arrays). En este caso, en lugar de único, y también para uniformar la nomenclatu- utilizar sondas específicas para cada gen, el ra empleada lo que hace posible la integración genoma completo incluyendo regiones intergé- y comparación de resultados obtenidos de dis- nicas está representado en el arreglo. Además tintas fuentes. MIAME administra descripcio- de detectar transcriptos estos chips permiten nes técnicas detalladas (plataforma utilizada, realizar hibridaciones comparativas de geno- métodos de marcación e hibridación, medición de datos y diseño del arreglo), pero no provee mas para detectar deleciones y polimorfismos, información relevante específica del organismo estudiar los perfiles de metilación y analizar en estudio que es necesaria para comprender muestras de inmunoprecipitación de cromati- el experimento planteado. Por este motivo, se na. Affymetrix desarrolló los primeros arreglos diseñó la base MIAME/Plant, la que incluye de- de este tipo para Arabidopsis. Los estudios talles biológicos para describir experimentos realizados utilizando arreglos de tipo “tejado” de microarreglos realizados en plantas. permiten la identificación de numerosos sitios El análisis de los datos originados en un mi- transcripcionalmente activos que no habían croarreglo resulta mucho más laborioso que su sido detectados mediante algoritmos predicti- generación. En el mismo se consideran la hipó- vos y/o en colecciones de ADNc. Muchos de tesis de trabajo y los objetivos experimentales estos nuevos transcriptos son expresados a para lograr identificar a los genes candidatos partir de la hebra complementaria y en antisen- en las condiciones de estudio. El análisis puede tido con respecto a transcriptos anotados pre- dividirse en dos fases: 1) el procesamiento de viamente. O sea, mientras que en determina- datos y 2) la identificación de genes de interés dos tejidos y/o condiciones se expresa la hebra y la interpretación biológica de los resultados. sentido, en otros se transcribe la antisentido. El procesamiento de los datos incluye la de- Sumado a esto, también se demostró que las terminación del nivel de ruido, la cuantificación regiones centroméricas presentan actividad de las señales fluorescentes, el examen de la transcripcional en ambos sentidos resultando calidad de los datos, la eliminación de los erro- esta observación sorprendente, ya que hasta res técnicos y la normalización de los datos. La hace muy poco tiempo atrás se suponía que identificación de los genes candidatos incluye en estas regiones no había transcripción ac- la reducción del volumen de la información a tiva. Esta metodología permite asimismo el un nivel manejable y más fácil de visualizar, el estudio del metiloma, de las regiones de ADN reconocimiento de patrones de expresión es- regulatorias, del procesamiento alternativo de pecíficos y la interpretación del significado bio- ARN y del descubrimiento de polimorfismos de lógico de los mismos.

Biotecnología y Mejoramiento Vegetal II 133 Conclusiones sión. Las colecciones de ESTs presentan alta Los métodos descriptos en este capítulo son especificidad para los transcriptos en estudio tecnologías eficaces que expanden los estu- pero baja sensibilidad para aquellos de esca- dios de expresión desde los genes únicos has- sa abundancia. La técnica de SAGE disminuye ta el nivel del transcriptoma completo. Ninguno el largo secuenciado por transcripto lo que au- de estos procedimientos per se es óptimo para menta la velocidad de relevamiento, pero esta todas las aplicaciones y la mejor estrategia simplicidad resulta en una alta sensibilidad para situaciones específicas puede ser crear pero a costa de una menor especificidad. Una combinaciones de varios de ellos. El continuo comparación de las características de cada refinamiento de las técnicas de transcriptómica técnica se presenta en la Tabla 1. y de la bioinformática relacionada proporciona- La combinación de la información genera- rá a los investigadores nuevas herramientas da por la transcriptómica (nivel y localización para estudiar la expresión de la información he- espacio/temporal de la expresión génica) y la reditaria y lograr un mejor entendimiento sobre de los proyectos de secuenciación de geno- el control genético de los procesos fisiológicos. mas (secuencias completas de los genes y sus Cada plataforma empleada actualmente para promotores) permite realizar asociaciones de estudiar el transcriptoma tiene sus ventajas y expresión y homología estructural que en mu- desventajas. Por ejemplo, los microarreglos chos casos facilitan la inferencia de la posible son una técnica de alto rendimiento pero sólo función de los genes identificados. Por supues- se pueden aplicar a transcriptos de secuencia to esto constituye una instancia inicial en la conocida. Los métodos de ADNc- AFLP y DD definición de la función de cada gen. Para de- son abiertos, es decir permiten detectar ge- terminar su rol preciso deben hacerse estudios nes noveles y son especialmente útiles cuan- particulares en general dirigidos a bloquear o do se trabaja fuera de los modelos, pero son aumentar su expresión por ingeniería genética cualitativos o semicuantitativos y requieren de y a modificar estructuralmente la molécula de un complemento de PCR en tiempo real para manera de alterar la actividad de los diferentes validar y cuantificar las diferencias de expre- dominios de la proteína que codifica.

Tabla 1: Comparación de los principales métodos de relevamiento del transcriptoma.

134 Biotecnología y Mejoramiento Vegetal II Para maximizar el potencial de la transcrip- transcripts induced by phytohem-aglutinin and tómica es necesario un cambio de paradigma phorbol 12-myristate 13-acetate. Anal. Biochem. respecto a la interpretación de los resultados 240:90–97. obtenidos en este tipo de experimentos. Este Liang, P., A. B. Pardee. 1992. Differential display cambio de paradigma implica comprender que of eukaryotic messenger ARN by means of the polymerase chain reaction. Science (Wash DC) los datos de expresión no están libres de erro- 257:967–971. res y aceptar que la variabilidad biológica es- Meyers B.C., Galbraith, D.W., Nelson T. and Agraw- pacio-temporal es una parte inherente y cuan- al, V. 2004. Methods for transcriptional profiling tificable de este tipo de experimentos. A pesar in plants. Be fruitful and replicate. Plant Physiol., de que los continuos cambios en la expresión 135, 637-652. de genes en tiempo y espacio colocan al inves- MIAME Standard: http://www.mged.org/Work- tigador en un escenario de arenas movedizas, groups/MIAME/miame.html es mucha y muy relevante la información que Moody D. E. 2001. Genomics techniques: an over- puede obtenerse de este tipo de estudios. Esta view of methods for the study of gene expres- transición en la interpretación de los resultados sion. J. Anim. Sci. 79 (E. Suppl.): E128-E135. Nagaraj S.H., Gasser R.B. and Ranganathan S. será más fácil si se delinea claramente la dife- 2007. A hitchhiker’s guide to expressed se- rencia entre proponer una función biológica a quence tag (EST) analysis. Brief Bioinform., 8, partir de simples datos de expresión y postu- 6-21. lar una hipótesis que debe luego validarse en NimbleGen: http://www.nimblegen.com base a datos experimentales concretos. Okubo, K., N. Hori, R. Matoba, T. Niyama, A. Fu- kushima, Y. Kojima, K. Matsubara. 1992. Large Biblografía Recomendada scale ADNc sequencing for analysis of quantita- tive and qualitative aspects of gene expression. Adams, M. D., J. M. Kelley, J. D. Gocayne, M. Dub- Nat. Genet. 2:173–179. nick, M. H. Poly-meropoulos, H. Xiao, C. R. Me- Rensink W.A. and Buell C.R. 2005. Microarray ex- rril, A. Wu, B. Olde, R. F. Moreno. 1991. Comple- pression profiling resources for plant genomics. mentary DNA sequencing: expressed se-quence Trends in Plant Science, 10, 603-609. tags and human genome project. Science (Wash Sargent T. D., I. B. Dawid. 1983. Differential Gene DC) 252:1651–1666. expression in the gastrula of Xenopus laevis. Affymetrix: http://www.affymetrix.com Science (Wash DC) 222: 135-139. Combimatrix: http://www.combimatrix.com Schena M., D. Shalon, R. W. Davis, P. O. Brown. Davis, M. M., D. I. Cohen, E. A. Nielsen, M. Stein- 1995. Quantitative monitoring of gene expres- metz, W. E. Paul, L. Hood. 1984. Cell-type-spe- sion patterns with a complementary DNA micro- cific ADNc probes and the murine 1 region: the array. Science (Wash DC) 270:467–470. localization and orientation of Ad. Proc. Natl. Velculescu, V. E., L. Zhang, B. Vogelstein, K. W. Acad. Sci. USA 81:2194–2198. Kinzler. 1995. Serial analysis of gene expres- Diatchenko, L., Y.-F. C. Lau, A. P. Campbell, A. sion. Science (Wash DC)270:484–487. Chenchik, F. Moqa-dam, B. Huang, S. Lukyanov, Venkatasubbarao S. 2004. Microarrays – status and K. Pukyanov, N. Gurskaya, E. D. Sverdlov, P. D. prospects. Trends in Biotechnology, 22, 630-637. Siebert. 1996. Suppression subtractive hybridi- Welsh, J., K. Chada, S. S. Dalal, R. Cheng, D. zation: A method for generating differentially reg- Ralph, M. McClelland. 1992. Arbitrarily primed ulated or tissue-specific ADNc probes and librar- PCR fingerprinting of ARN. Nucl. Acids Res. ies. Proc. Natl. Acad. Sci. USA 93:6025–6030. 20:4965–4970. Febit: http://www.febit.com Xeotron: http://www.xeotron.com Gregory B.D., Yazaki J. and Ecker J.R. 2008. Utiliz- Zimmermann P., Schildknecht B., Craigon D., ing tiling microarrays for whole-genome analysis Garcia-Hernandez M., Gruissem W., May S., in plants. The Plant Journal, 53, 636-644. Mukherjee G., Parkinson H., Rhee S., Wagner Gurskaya, N. G., L. Diatchenko, A. Chenchik, P. U. and Hennig L. 2006. MIAME/Plant – adding D. Siebert, G. L. Khaspekov, K. A. Lukyanov, value to plant microarray experiments. Plant L. L. Vagner, O. D. Ermolaeva, S. A. Lukya- methods, 2:1. nov, E. D. Sverdlov. 1996. Equalizing ADNc subtraction based on selective suppression of polymerase chain reaction: cloning of Jurkat cell

Biotecnología y Mejoramiento Vegetal II 135 I CAPÍTULO 9 Luego de la separación electroforética, se lleva a cabo la tinción de los geles y el aná- Proteómica lisis de las imágenes para visualizar y cuan- tificar cada proteína. Los métodos de tinción Paula Casati y María F. Drincovich utilizados van desde los más convencionales, como la tinción con azul de Coomassie o ni- trato de plata, hasta métodos más sensibles 1. Introducción como la tinción fluorescente. Por otro lado han La proteómica, entendida como el estudio sido desarrollados recientemente varios com- del patrón proteico de una célula u órgano, puestos fluorescentes que permiten múltiples se encuentra ya en su segunda década como tinciones de un mismo gel, técnica que permite campo de estudio. Durante la primera década, la tinción y visualización de diferentes grupos la mayor parte de los estudios se realizaron de proteínas o diferentes subproteomas (por principalmente mediante el uso de geles en dos ejemplo, el fosfoproteoma o el glicoproteoma) dimensiones seguidos de técnicas de tinción de manera secuencial en un mismo gel. La se- convencionales. Si bien estos métodos conti- paración en geles bidimensionales puede dar núan siendo utilizados de manera importante, lugar a un mapa proteico complejo, y algunas durante esta segunda década otros métodos veces la reproducibilidad de estos geles puede más sensibles y que además presentan mayor ser problemática debido a la naturaleza diversa reproducibilidad han comenzado a ser utiliza- de las distintas proteínas, sumado a la tarea de dos. Estas técnicas han sido clasificadas como identificar el mismo punto proteico en distintos “proteómica cualitativa”. Muchos de estos mé- geles. Esto se debe a que cuando se realizan todos están siendo aplicados en experimentos estudios comparativos es necesario analizar de biología vegetal. Por ejemplo, la electrofore- múltiples geles que pueden contener 1000 sis bidimensional DIGE (del inglés, differential puntos proteicos cada uno. Así, a pesar del uso gel electrophoresis) y el marcado isotópico de de programas avanzados para el análisis de proteínas y péptidos, son técnicas utilizadas en geles 2D, se requiere una validación manual fi- la actualidad para el estudio de diversos pro- nal. Existen distintos paquetes de computación teomas. En el presente capítulo se describen para el análisis de las imágenes que permiten primero los métodos utilizados en proteómica asistir con la substracción del ruido de base, en la actualidad, seguido de una descripción la detección de los puntos proteicos, el ajuste de las aplicaciones de estas técnicas en la bio- de las imágenes, la detección e identificación logía de plantas. de puntos entre geles, y la cuantificación me- diante un análisis estadístico. Los geles bidi- 2. Electroforesis en dos dimensiones mensionales son una herramienta para la reso- El procedimiento más utilizado para los es- lución y visualización de isoformas proteicas, tudios de proteómica es la separación elec- productos de degradación y modificaciones troforética por isoelectroenfoque (IEF) de las postraduccionales; además de permitir el cál- proteínas seguido de una segunda separación culo empírico de la masa molecular, punto iso- en gel de poliacrilamida en presencia de SDS eléctrico y niveles de expresión. Las limitacio- (SDS-PAGE). Esta técnica se denomina co- nes de la técnica son la no automatización, la múnmente electroforesis bidimensional (2D), dificultad para resolver proteínas de membrana donde las proteínas se separan en base a su y proteínas muy básicas o ácidas. carga y masa molecular. Los avances recien- Una técnica que aumenta la sensibilidad y tes en la resolución del IEF gracias al uso de disminuye la variabilidad que existe entre dis- geles comerciales en tiras han aumentado la tintos geles es la llamada electroforesis diferen- reproducibilidad y la resolución de los geles 2D cial en gel o DIGE. En esta técnica, las mues- en proteómica. En particular, la disponibilidad tras proteicas se preincuban con compuestos de tiras comerciales de diferentes tamaños y fluorescentes activos que se unen a residuos rangos de pH permiten un análisis detallado de Lys o Cys que pueden ser utilizados para del proteoma.

136 Biotecnología y Mejoramiento Vegetal II cuantificar la abundancia de cada proteína en sus subunidades, que se observan en filas ver- una población. La mayor ventaja de esta téc- ticales de puntos proteicos en los geles 2D. nica es la posibilidad de correr dos muestras Esta técnica complementa a los geles 2D IEF/ distintas en un mismo gel, siempre y cuando SDS-PAGE. las muestras se hayan marcado con marcado- res fluorescentes con distintos espectros de 3. Cuantificación por espectrometría de emisión. Esto disminuye los problemas que se masa (MS) generan durante la identificación de los puntos Luego de la selección de las proteínas y la cuantificación. En teoría, la cantidad máxi- de interés en un gel 2D, éstas pueden ser ma de muestras que se pueden separar en un identificadas por espectrometría de masas. mismo gel se limita al número de compuestos Básicamente, luego de la digestión de las pro- fluorescentes que se encuentren disponibles teínas cortadas del gel con una proteasa (típi- y que no muestren espectros de emisión que camente tripsina), la mezcla compleja de pép- se superpongan, aunque en general se utilizan tidos es analizada. Existen distintos tipos de sólo tres: dos para el marcado de las muestras espectrometría de masas, que utilizan distintos a comparar, y el tercero se utiliza para marcar métodos para la ionización de las muestras. Por un control interno. La imagen de los geles es un lado, la espectrometría de masa por des- generada utilizando un escáner de fluorescen- orción por ionización mediante láser asistida cia capaz de adquirir las imágenes provenien- por una matriz (MALDI-TOF, del inglés matrix- tes de cada uno de los fluorescentes utilizados. assisted laser desorption ionisation (MALDI))- Esta técnica es muy sensible, ya que permite tiempo de vuelo (time-of-flight (TOF)), se utiliza resolver alrededor de 1000 puntos proteicos principalmente para realizar huellas dactilares con solo 50 µg de proteínas sembradas, por lo de péptidos y proteínas. Por otro lado, la es- que el límite de detección es del orden de pico- pectrometría en tandem por electropulverizado a femtomolar de proteína en cada punto. (ESI), usualmente se acopla a una separación Una ventaja de realizar estudios de proteó- previa en un sistema de cromatografía de alta mica mediante separación en geles bidimen- presión (HPLC) y se utiliza para la elucidación sionales es que estos experimentos pueden de la secuencia e identificación de la proteína ser realizados utilizando muestras de cualquier correspondiente (Figura 1). especie vegetal, sin necesidad de que el ge- En estos momentos, existe una actualización noma de la especie en estudio se encuentre constante en los distintos tipos de espectróme- secuenciada. Además, esta técnica es ideal tros de masa que se encuentran disponibles para experimentos en donde se observen po- en el mercado, y la sensibilidad, selectividad cos cambios en los patrones proteicos. y precisión de los equipos son cada vez mayo- Una alternativa a las separaciones 2D por res. Los principios de esta técnica pueden ser IEF/SDS-PAGE es la técnica de separación en resumidos en cuatro funciones del equipo: electroforesis nativa en presencia de azul de 1-Ionización: la molécula de interés sufre un Coomassie (BN-PAGE, del inglés “blue-nati- cambio en la carga neta, formándose un anión ve”). Esta técnica es utilizada para la separa- o un protón. Dependiendo del método de io- ción de proteínas hidrofóbicas y proteínas en nización utilizado, es posible que se generen su estado nativo, ya que éstas no se separan iones fragmentados. En el caso de usos en correctamente en los geles IEF/SDS-PAGE. proteómica, los métodos de ionización utili- Esta técnica se basa en la integración de una zados son MALDI y electrospray/microspray/ carga neta negativa en las proteínas y comple- nanospray. jos proteicos por adición del colorante azul de 2-Separación: las especies iónicas son se- Coomassie, y permite la separación en condi- paradas de acuerdo a su relación masa/carga ciones nativas en la primera dimensión. En la (m/z), segunda dimensión se realiza un SDS-PAGE, 3-Medida de la masa: las masas son asig- donde los complejos proteicos que migraron nadas según las medidas de algún parámetro juntos en la primera dimensión se separan en físico.

Biotecnología y Mejoramiento Vegetal II 137 Figura 1. Técnicas de MS para identificación de proteínas a partir de geles bidimensionales. Los puntos de interés del gel 2D son cortados y colocados en tubos. La proteína del bloque de acrilamida es digerida con una proteasa, y los productos obtenidos son analizados por distintas técnicas para su identi- ficación. Adaptado de Nesatyy and Suter (2007).

138 Biotecnología y Mejoramiento Vegetal II 4-Medida de la abundancia: la medida de la sión electrostática que hace que se liberen io- abundancia de cada ion se realiza en base a nes gaseosos que son acelerados en el espec- la altura o área del pico en el espectro, permi- trómetro de masas. Cuando los péptidos entran tiendo una semicuantificación o cuantificación al espectrómetro de masa, algunos iones pep- de cada ion. tídicos son seleccionados y fragmentados por colisión con un gas para producir un número 3.1. MALDI-TOF y huella dactilar de péptidos: de fragmentos iónicos. Las relaciones m/z de En esta técnica, los péptidos generados lue- estos fragmentos son registrados para dar el go de la digestión con tripsina son mezclados espectro de fragmentación de ese péptido. Un a una matriz en solución, que está formada péptido se puede considerar como una cade- por una solución concentrada o saturada de na aminoacídica que se puede fragmentar en un compuesto de bajo peso molecular ácido y cualquier punto; sin embargo la fragmentación que absorbe el UV. En el caso de péptidos, el ocurre preferencialmente entre la unión de N y compuesto más utilizado es el ácido α-ciano- C entre aminoácidos, por lo que la secuencia 4-hidroxicinámico. Aproximadamente 1µL de de un péptido puede determinarse por el patrón la mezcla muestra/matriz es colocada en una de picos que se obtienen del espectro de frag- placa para MALDI y se permite co-cristalizar en mentación. El espectrómetro de masa realiza un único punto. Como la matriz se coloca en el registro de todos los picos de fragmentación, exceso con respecto a la muestra y absorbe y luego de completada la separación y espec- UV, cuando se irradia con un láser de UV esta trometría de masa de todos los péptidos, los energía es absorbida por la matriz y pasada a espectros son enviados a una base de datos la muestra de manera que se ioniza pero no se para la identificación de la proteína en estudio fragmenta. Estos iones son luego acelerados por comparación al patrón de ionización teórico por el espectrómetro de masa: los iones mas de los péptidos de la proteína. livianos viajan más rápido que los pesados, por lo que el tiempo en el que llegan al detector 3.3. Bases de datos para la identificación de puede ser utilizado para determinar la relación proteínas: masa/carga de cada ion, obteniéndose un es- Existen numerosas bases de datos para la pectro que contiene todos los iones acelera- identificación y caracterización de proteínas dos, y se obtiene una lista de las masas de los luego de la espectrometría de masas, búsque- picos que presentan mayor intensidad. La lista da de semejanzas, patrones de fragmentación de picos es enviado a una base de datos que y perfiles, predicción de sitios de modificación compara las masas de los picos de los espec- postraduccional, etc. Entre ellos se encuen- tros con los teóricos de las proteínas digeridas, tran MASCOT, ProteinProspector, ExPASy y produce una lista de las posibles identidades Proteomics. Muchos de estos sitios son acce- utilizando un sistema de puntaje. sibles luego de una suscripción, mientras que otros están disponibles en la web a todos los 3.2. Espectrometría de masas en tandem usuarios interesados. La tabla 1 muestra las por electropulverizado. páginas correspondientes de algunos de los Este proceso analiza los péptidos genera- sitios. dos luego de la digestión con tripsina. En este caso, el espectrómetro de masas esta acopla- 4. Alternativas a los geles bidimensionales do a un equipo de HPLC. Durante la ionización Algunas alternativas al uso de geles en dos por electropulverizado, los péptidos se separan dimensiones son los métodos basados en es- previamente por HPLC (usualmente son utili- pectrometría de masa para comparar la abun- zadas columnas de C18) y luego entran a una dancia de péptidos. Luego de la digestión de fuente de ionización. Un voltaje alto es aplicado las proteínas (sin que se realice ninguna se- a una aguja por donde pasan las muestras que paración previa), la mezcla compleja de pép- llegan como gotas, produciendo una carga en tidos se separa por cromatografía previo al la superficie. En la gota se genera una repul- análisis por MS. La espectrometría de masas

Biotecnología y Mejoramiento Vegetal II 139 Tabla 1. el que la marca es introducida a la proteína o a los péptidos, y cómo son extraídos los datos de cuantificación. A continuación se describen brevemente los distintos tipos de marcado.

4.1. Marcado isotópico in vivo. Este es un método comúnmente utilizado en proteómica comparativa. Para estos expe- rimentos, una de las muestras se crece en una atmósfera de nitrógeno natural, mientras que la muestra a comparar se crece en presencia del isótopo pesado. Esto puede hacerse por la puede ser corrida de manera independiente o introducción de algún aminoácido marcado en bien acoplada a la separación por HPLC. Los cultivos celulares o utilizando 15N como única péptidos producidos por la digestión de las pro- fuente de nitrógeno, típicamente en la forma 15 teínas totales son ionizados para adquirir el es- de K NO3. Como resultado, las masas de los pectro de MS de todos los iones presentes en péptidos de las poblaciones a comparar serán la mezcla. Algunos péptidos son seleccionados diferentes, permitiendo una comparación di- y son fragmentados individualmente para ob- recta de las intensidades de los iones de las tener un segundo espectro MS (MS/MS) que dos mezclas. En principio, las dos muestras a permite obtener la secuencia de aminoácidos comparar pueden ser mezcladas al comienzo del péptido. La señal o integración de los picos del experimento, por lo que se eliminan virtual- de los iones puede ser utilizada como técnica mente todas las potenciales variaciones téc- de cuantificación, ya que en teoría la intensi- nicas. Debido a que la diferencia isotópica de cada péptido es la misma entre los espectros dad de los picos es proporcional a la cantidad de las dos muestras, el estudio del proteoma de proteína de la cual proviene el ion peptídi- completo puede ser problemático debido a la co. Sin embargo, la variabilidad técnica, tanto complejidad de los espectros, por lo que esta a nivel de la cromatografía líquida como a nivel técnica es recomendable para sub-proteomas, de los pasos de ionización, hacen que la com- como por ejemplo el fosfoproteoma. paración de las intensidades no sea confiable. Por ello, se han desarrollado diferentes técni- 4.2. Marcado isotópico in vitro. cas de marcado de las proteínas que permi- Una alternativa es introducir la marca en los ten una directa comparación de los picos en péptidos de manera química durante o luego un mismo espectro MS o MS/MS. La base de de la digestión de las proteínas. Una ventaja de todas estas técnicas es la misma: se introdu- esta técnica es que cualquier muestra protei- cen marcas inertes, estables e isotópicas a los ca puede ser marcada, eliminando la limitación péptidos de manera que los patrones de ioni- que existe al querer introducir la marca en una zación y las propiedades cromatográficas de célula viva. La mayor desventaja es el cuidado los péptidos marcados sean similares a los de que hay que tener para no introducir variacio- las muestras de origen, pero pueden ser dife- nes técnicas durante la obtención de la mues- renciados luego del análisis por un leve corri- tra proteica (en especial si existe algún paso de miento en el espectro de MS. De esta mane- fracción subcelular). ra, las dos muestras a comparar pueden ser corridas de manera simultánea y analizadas 4.2.1. Marcado con 18O durante la digestión a partir de un mismo experimento. Por ello, la con tripsina separación de los péptidos seguida de la cuan- Durante la hidrólisis de las proteínas con tificacion de los iones refleja la abundancia re- tripsina, el oxígeno del agua se incorpora al lativa de cada proteína intacta de la cual deriva C terminal del péptido tríptico. Por lo tanto, si el péptido cuantificado. Los distintos métodos la digestión de una muestra se realiza en pre- 18 de marcado se diferencian en el momento en sencia de H2 O mientras que la de la muestra

140 Biotecnología y Mejoramiento Vegetal II 16 a comparar se realiza en un medio con H2 O, los péptidos de múltiples espectros de LC-MS/ en teoría se generan péptidos que difieren MS. Una vez identificado el mismo péptido en en cuatro unidades de masa en el espectro. distintos espectros, éstos se comparan y se Experimentalmente, sin embargo, la incorpo- genera una relación de expresión luego de un ración es siempre incompleta, generándose análisis estadístico. espectros que se solapan. Por esta razón este método no es tan elegido como otros, aunque 4.4. Cuantificación absoluta utilizando pépti- presenta bajo costo comparado a los que se dos AQUA describen a continuación. Los métodos descriptos anteriormente son capaces de determinar cantidades relativas 4.2.2. Marcado isotópico con sondas por afi- de proteínas o péptidos. Para convertir datos nidad (ICAT). relativos a absolutos se requiere la inclusión Otro método de marcado se basa en la mo- de estándares internos de concentraciones dificación covalente de Cys con compuestos conocidas, que deben estar marcados para químicos biotinilados que sólo difieren en la distinguirse de la proteína nativa. Para ello se inclusión de isótopos pesados y livianos lue- utiliza la técnica de marcado isotópico estable, go de la digestión. El uso de biotina permite el en la que péptidos sintéticos son marcados rápido enriquecimiento de los péptidos marca- con un aminoácido pesado en una o más posi- dos, y debido a que la mayoría de las proteínas ciones (llamado péptido AQUA). Debido a que contienen pocas Cys, sólo algunos péptidos de las propiedades cromatográficas e ionizantes cada proteína son analizados. Por ello, este de los péptidos AQUA son idénticas a las de método permite el análisis de muestras com- los péptidos nativos, al analizar e integrar los plejas. Sin embargo, dado que una de cada cromatogramas de los iones del par isotópico, siete proteínas no contiene residuos de Cys, se obtiene una relación entre el péptido nati- existen limitaciones en el análisis. vo y el sintético de concentración conocida. Estos péptidos pueden ser sintetizados para 4.2.3. Marcas isobáricas para cuantificación múltiples proteínas de interés y usados para relativa y absoluta (iTRAQ). determinar concentraciones absolutas en una Un método alternativo involucra la modifica- muestra. Además, pueden ser utilizados para ción de aminas primarias con marcas isobári- cuantificar modificaciones postraduccionales. cas. Esta técnica es similar a ICAT en cuanto a que cada muestra es marcada con una marca 5. Aplicaciones de la proteómica diferente, pero con los reactivos iTRAQ todos El análisis del proteoma de órganos o teji- los péptidos trípticos son marcados. Además, dos de plantas se ha llevado a cabo para ana- esta técnica permite el análisis de hasta 8 lizar, por ejemplo, la respuesta a hormonas o muestras de manera simultánea si se utilizan moléculas señal, la respuesta a estímulos del distintos reactivos iTRAQ para marcar las dis- ambiente, cambios durante el desarrollo o tam- tintas muestras. bién para analizar los patrones proteicos de lí- neas con diferente base genética. Proteomas 4.3. Cuantificación libre de marca. subcelulares también han sido analizados en A pesar de los problemas de variabilidad des- diversas especies y, más recientemente, se criptos anteriormente en la cuantificación direc- ha utilizado este tipo de estudio para analizar ta de la intensidad de los picos de MS luego de interacción de proteínas o modificaciones pos- la cromatografía líquida, debido a la aparición traduccionales. Además, se han analizado por de espectrómetros de masa de última genera- esta técnica la equivalencia y seguridad de ali- ción y al aumento de la reproducibilidad de las mentos derivados de plantas transgénicas, así separaciones en las cromatografías gaseosas, como el estudio de la presencia de alergenos, esta técnica ha comenzado a ser utilizada nue- entre otros. Así, los campos de aplicación de la vamente. Para ello, varios programas de com- proteómica en plantas ha ido en aumento en putación han sido desarrollados para comparar los últimos años (ver revisiones: Cánovas et al.

Biotecnología y Mejoramiento Vegetal II 141 2004; Rossignol et al. 2006; Jarrín et al. 2007) dores específicos. Cabe destacar que muchas y a continuación se detallarán algunos de los de las proteínas identificadas en los diversos aspectos más estudiados. La Tabla 2 resume compartimentos provienen de anotaciones de las áreas más relevantes en las que se ha apli- genes con función desconocida, por lo cual el cado la proteómica en plantas. conocimiento de la localización de la proteína que codifican permite comenzar a identificar la 5.1. Análisis de proteomas subcelulares de plantas función de dichos genes. El mayor avance en proteomas subcelulares El análisis de proteomas de plastidios, es- se ha llevado a cabo en plastidios, mitocon- pecialmente de cloroplastos, ha brindado in- drias y membranas. Estos estudios no sólo han formación sobre nuevas proteínas localizadas contribuido a la localización de proteínas espe- en membrana externa y en tilacoides. Estos cíficas, sino también que ha brindado informa- estudios, llevados a cabo fundamentalmente ción relevante sobre transporte, metabolismo, en arabidopsis y espinaca, han evidenciado vías de secreción, diferenciación y respuesta a diversos procesos de procesamiento y trans- estrés. A pesar de que la purificación de plas- locación y modificaciones postraduccionales tidios es una técnica fácil y que brinda frac- de proteínas. Gracias al uso de extracciones ciones de alta pureza, el aislamiento de otras con diversos solventes, se han identificados organelas o fracciones subcelulares es técni- nuevas proteínas candidatas a ser transporta- camente más dificultosa. En todos los casos, dores de membrana. La técnica de electrofore- siempre se debe estimar el nivel de contamina- sis nativa en presencia de azul de Coomassie ción de la fracción purificada utilizando marca- (BN-PAGE), seguida por segunda dimensión e

Tabla 2 Aplicaciones de la proteómica en plantas: Especies analizadas, tipos de proteomas estudiados, procesos biológicos y aspectos prácticos donde se ha analizado el proteoma.

142 Biotecnología y Mejoramiento Vegetal II identificación de las proteínas por MS, técnica los últimos años un gran número de trabajos ampliamente utilizada para el estudio de com- se han realizado con el objetivo de identificar plejos mitocondriales, también ha sido utilizada los cambios proteicos que ocurren asociados para el estudio de la composición de los com- al crecimiento y desarrollo, con la finalidad de plejos proteicos de la membrana tilacoidal. identificar las proteínas claves implicadas en El estudio del proteoma mitocondrial se ha dichos procesos. Así, se han descrito los cam- dividido en la identificación de proteínas so- bios en el proteoma asociados al crecimiento o lubles, proteínas periféricas y proteínas inte- desarrollo del grano de polen, semillas, raíces, grales de membrana. En este caso, el uso de haces vasculares, entre otros. BN-PAGE seguido por 2-DE e identificación de Muchos son los estudios que demuestran las proteínas, se ha utilizado para analizar la que los análisis de proteómica pueden generar composición de los diversos complejos respi- información relevante para dilucidar los meca- ratorios, identificándose nuevos componentes nismos moleculares involucrados en procesos y diferencias con complejos respiratorios de de desarrollo. Por ejemplo, estudios llevados otros organismos. a cabo en raíces de maíz han indicado que, El análisis de proteínas de membrana es uno de las proteínas identificadas luego de 5-días de los desafíos más difíciles, debido a proble- de germinación, sólo el 28% permanece en las mas de metodología por la baja abundancia de últimas etapas del desarrollo, identificándose, las proteínas y sus características hidrofóbi- además, proteínas asociadas a la formación de cas, siendo muchas de ellas proteínas trans- raíces laterales. Procesos como la embriogé- membrana. Para el análisis de este tipo de pro- nesis somática también han sido analizados en teínas, se han empleado partición de proteínas diversas especies por proteómica, identificán- en distintas fases de solventes seguido de frac- dose proteínas de membrana, nucleares, así cionamiento teniendo en cuenta las propieda- como proteínas involucradas en metabolismo y des fisicoquímicas de las proteínas. Por ejem- producción de energía, en diversas etapas de plo, el proteoma de la membrana plasmática este proceso. En muchos casos, se han iden- de arabidopsis fue analizado, siendo uno de los primeros que, además, se sometió a aná- tificado proteínas cuyos ARNm no fueron iden- lisis de proteínas fosforiladas, identificándose tificados por estudios de transcriptoma, como más de 300 sitios de fosforilación. El proteoma es el caso del análisis del grano de polen en vacuolar de arabidopsis, tanto de la membra- arabidopsis, entre otros. na como de las proteínas solubles, también ha sido analizado, confirmándose dicha localiza- 5.3. Proteomas en respuesta a estrés ción subcelular para algunas de las proteínas abiótico identificadas por otras técnicas. El estudio de la interacción de las plantas Además, se han llevado a cabo estudios con el ambiente ha sido clásicamente aborda- para identificar proteínas de pared celular y do mediante estudios bioquímicos, genéticos y extracelulares –identificándose la presencia de más recientemente, a nivel de transcriptoma, varias proteasas-, proteínas nucleares –muy mediante PCR en tiempo real (qRT-PCR), mi- difícil debido a su baja cantidad y a sus asocia- croarreglos, entre otros. Sin embargo, la pro- ción con el Retículo Endoplasmático-, y proteo- teómica, desde su aplicación en este tipo de mas mixtos del aparato de Golgi y del Retículo situaciones, ha comenzado a brindar contribu- endoplasmático. ciones relevantes en cuanto a los elementos involucrados tanto en la percepción de la situa- 5.2. Proteomas durante el desarrollo de ción ambiental como en la traducción de dicha órganos señal en la planta. Los tipos de estrés analiza- Uno de los primeros objetivos de la pro- dos mediante proteómica han sido: sequía, es- teómica en plantas fue generar mapas de re- trés salino, alta temperatura, alta luz, radiación ferencia de proteínas solubles de un órgano UV-B, deficiencia nutricional, niveles elevados en un determinado estado de desarrollo. En de CO2, anoxia, metales pesados y herbicidas.

Biotecnología y Mejoramiento Vegetal II 143 Este tipo de aplicación de la proteómica in- quitinasas, proteasa, inhibidores de protea- cluye típicamente análisis de 2-DE/MS para sas), antioxidantes (catalasas, SODs, peroxi- estudiar variaciones proteicas entre especies dasas), chaperonas, HSPs, proteínas LEA. En sensibles y resistentes frente a una determi- el segundo grupo, varias enzimas asociadas nada situación de estrés. Se analizan las dife- a metabolismo como la glucólisis, fotosínte- rencias cuantitativas y cualitativas de proteínas sis, ciclo de Krebs, asimilación del nitrógeno o con la finalidad de correlacionar estos cambios implicadas en metabolismos secundarios han con las diferencias fenotípicas. Se estudian sido encontradas. Es notable que los estudios también plantas mutantes o transgénicas, don- basados en análisis del transcriptoma han ana- de una línea es resistente y otra sensible. Así, lizado en mucha mayor medida el primer grupo las proteínas diferenciales se seleccionan con- que el segundo. Sin embargo, la presencia de trastando los proteomas entre líneas resisten- mayor concentración de proteínas implicadas tes versus susceptibles, o entre líneas crecidas en metabolismo primario en genotipos resis- en condiciones óptimas versus estresadas. tentes versus sensibles podría indicar una ven- taja genética para defenderse frente al ataque. 5.4. Proteomas en respuesta a estrés biótico En los últimos años, muchos estudios se 5.5. Proteómica para el estudio de simbiosis han llevado a cabo para analizar la respues- en plantas ta de los proteomas de diversos órganos fren- La proteómica se ha aplicado también para te al ataque por hongos, virus o bacterias. el estudio de las proteínas involucradas en la Típicamente, extractos crudos de hojas, semi- formación de nódulos en especies legumino- llas, raíces o cultivos celulares se analizan a sas. Mapas de proteínas de raíces de especies distintos tiempos luego del tratamiento y se se- hospedadoras, nódulos, cultivos de bacteroi- paran organelas o subfracciones para el aná- des fueron generados y comparados, con el lisis de los cambios en el proteoma. Además, objetivo de identificar proteínas involucradas se analiza el efecto de elicitores o moléculas en la simbiosis. Además, se analizaron las pro- claves de la señalización (como ácido sali- teínas involucradas en distintas etapas de la cílico, peróxido de hidrógeno u óxido nítrico) nodulación. sobre el proteoma. Por otro lado, se estudian los proteomas de especies tolerantes o resis- 5.6. Modificación postraduccional e interac- tentes versus el de sensibles. Estos estudios, ción de proteínas junto con el estudio del proteoma de diversos Una de las modificaciones postraducciona- compartimentos celulares (apoplasto, tricoma, les de proteínas estudiadas mediante proteó- sap de floema o xilema, entre otros), han evi- mica es la fosforilación. En estos estudios, denciado que varias proteínas relacionadas a se han identificado los cambios cuantitativos la defensa frente al ataque de patógenos están y cualitativos de las proteínas fosforiladas en presentes incluso en ausencia del mismo y que respuesta a diversas señales. Además, se han las mismas proteínas responden a tipos varia- analizado las proteínas modificadas en su esta- dos de estrés. Además, muchas proteínas de- do redox en diferentes sistemas, identificándo- rivadas de genes de función desconocida, han se muchos candidatos putativos de ser blanco sido encontradas en estos estudios. de reducción por tioredoxinas. Recientemente, En general, la mayoría de las proteínas se ha comenzado a analizar el patrón de pro- identificadas en los estudios de proteomas teínas sujetas a ubiquitinación en plantas, me- de genotipos resistentes comparadas con los diante estudios de proteómica. de sensibles, han mostrado dos tipos gene- En cuanto al estudio de interacción de pro- rales de proteínas: proteínas relacionadas a teínas mediante proteómica, los estudios lle- la defensa y enzimas asociadas al metabolis- vados a cabo en plantas son todavía muy po- mo del carbono o nitrógeno y al metabolismo cos comparados con los llevados a cabo en secundario. Dentro del primer grupo, se han otros sistemas, como mamíferos y levaduras. encontrado proteínas PR (como glucanasas, Algunos ejemplos incluyen estudios de com-

144 Biotecnología y Mejoramiento Vegetal II plejos formados por virus de plantas y proteí- Rossignol M., Peltier J-B., Mock H-P., Matros A., nas del huésped, análisis de inmunoprecipita- Maldonado A. M. and Jarrín J. V. 2006. Plant dos de proteínas que interaccionan con fitocro- proteome analysis: A 2004-2006 update. Pro- mos, así como proteínas que interaccionan con teomics, 6, 5529-5548. cobre.

6. Perspectivas Los resultados obtenidos mediante estudios de proteómica en sus distintas aplicaciones han indicado que los estudios de genómica y transcriptoma no son suficientes, dado que la proteómica generalmente evidencia pro- cesos no detectados por los otros estudios mencionados. Esto se debe fundamentalmente a que las proteínas son física y químicamente más diver- sas que los ácidos nucleicos. Además, debido al procesamiento del ARN y a las modificacio- nes postraduccionales, las proteínas de un dado organismo exceden en número la can- tidad de genes. Otro nivel de complejidad se presenta si se tienen en cuenta la interacción de proteína-proteína, lo cual modifica las pro- piedades de las proteínas individuales. De esta manera, el estudio del proteoma, en paralelo con el del transcriptoma, llevado a cabo sobre el mismo sistema, podrá dilucidar los mecanismos de control de expresión de proteínas y evidenciará los procesos biológicos llevados a cabo en una determinada situación.

7. Bibliografía

Cánovas F. M., Dumas-Gaudot E., Recorbet G., Jo- rrin J., Mock H-P and Rossignol M. 2005. Plant Proteome Analysis. Proteomics, 4, 285-298 Chen S., and Harmon A. C. 2006. Advances in plant proteomics. Proteomics, 6, 5504–5516. Jorrín J. V., Maldonado A. M. and Castillejo M. A. 2007. Plant proteome analysis: A 2006 update. Proteomics, 7, 2947-2962 Nesatyy V. J. and Suter M. J-F. 2007. Environmental Science & Technology, 41, 6891-6900. Newton R. P., Brenton, A. G., Smith, C. J. and Dud- ley E. 2004. Plant proteome analysis by mass spectrometry: principles, problems, pitfalls and recent developments. Phytochemistry, 65, 1449- 1485. Thelen J.J. and Peck S.C. 2007. Quantitative Pro- teomics in Plants: Choices in Abundance. Plant Cell, 19, 3339–3346.

Biotecnología y Mejoramiento Vegetal II 145 I CAPÍTULO 10 general, la metabolómica indica la totalidad de los patrones metabólicos de los sistemas bio- Metabolómica lógicos, también conocidos como perfiles me- tabólicos. Como los metabolitos son el produc- to de reacciones enzimáticas, ellos brindarán Fernando Carrari, Telma E. Scarpeci, información importante sobre las propiedades Luciano A. Abriata, Alejandro J. Vila y regulatorias o catalíticas de un producto génico Estela M. Valle. dado. Los metabolitos presentes en un sistema biológico bajo condiciones específicas (esta- Definición de metaboloma díos de desarrollo, condiciones ambientales, Se conoce como metabolismo al conjunto modificaciones genéticas) se pueden analizar de reacciones químicas que ocurren en las cé- mediante el uso de técnicas cromatográficas lulas vivas, tejidos u organismos, mediante el de separación en distintas fases (gaseosa, lí- cual estos participan del intercambio de mate- quida, de alta presión, etc) y de identificación ria y energía con su entorno. El origen de la mediante espectrometría de alta resolución palabra metabolismo procede del griego me- que han comenzado a establecerse reciente- tabolé que significa cambio, transformación. mente en Argentina, como la espectrometría En los sistemas biológicos los metabolismos de masa (MS) gaseosa o líquida y técnicas es- se encuentran interconectados formando re- pectroscópicas como la resonancia magnética des bioquímicas. En los últimos años y en esta nuclear (RMN). A su vez, el acoplamiento de era post-genómica, se ha acuñado el término los sistemas de separación con los de identi- “metaboloma”, para indicar la totalidad de los ficación mencionados más arriba permite la metabolitos que actúan en las redes metabóli- obtención de perfiles metabólicos de muestras cas de un sistema biológico. Es decir, el meta- complejas como por ejemplo, extractos crudos boloma implica la identificación y cuantificación obtenidos de órganos fotosintéticos de plantas. simultáneas de todos los metabolitos del mate- rial investigado. Diseño experimental, técnicas, entrena- El metaboloma está conformado por dos ti- miento. Métodos cromatográficos (fase ga- pos de compuestos: los metabolitos primarios y seosa y líquida). los secundarios. Los metabolitos primarios son El análisis de los metabolitos presentes en compuestos que están involucrados en funcio- muestras complejas (como las que pueden ob- nes básicas de la célula, como la respiración o la tenerse a partir de extractos crudos de plantas) biosíntesis de aminoácidos. Todos los organis- puede realizarse en primer lugar a partir de la mos comparten básicamente los mismos tipos separación de las moléculas que las compo- de metabolitos primarios y en términos gene- nen. Existen diversos métodos de separación rales se puede decir que se trata de moléculas con distintos grados de resolución y sensibili- simples y de bajo peso molecular. En cambio, dad. La cromatografía en fase gaseosa (GC) los metabolitos secundarios son específicos de ha sido extensamente usada justamente por la especie y muchos de ellos están implicados su alta resolución y sensibilidad. Consiste en la en la defensa de la planta contra estrés biótico separación de las moléculas por su capacidad (siendo los terpenos los más abundantes), en móvil en una fase gaseosa impulsada por un procesos de desarrollo específicos de la espe- gas usualmente inerte (por ejemplo Helio -He-) cie (hormonas) y en estrategias de atracción de modo de evitar reacciones con la matriz a de polinizadores (pigmentos de las flores). En analizar. Luego de su obtención y acondicio- las plantas, se estima que el número total de namiento, los extractos son inyectados en una metabolitos supera los 200.000. El análisis del cámara de vaporización a alta presión y tem- metaboloma de un sistema biológico dado es peratura, donde la muestra es volatilizada para conocido como metabolómica. Este término no luego ser transportada a una columna bajo un siempre tiene el mismo significado, ya que la flujo constante de gas. Existen diferentes pro- metabolómica es multifuncional y depende del tocolos en cuanto a las condiciones y tiempos diseño experimental y del objeto de estudio. En

146 Biotecnología y Mejoramiento Vegetal II de corrida y se utilizan columnas diferentes pleja. Si bien se han desarrollado diferentes en función del tipo de muestras y moléculas a métodos de derivatización, esta etapa consti- analizar. Las moléculas se separan de acuerdo tuye la principal desventaja de la cromatogra- a sus propiedades físicas y químicas y al final fía gaseosa dada la diversidad de propiedades de la columna, un detector emite una señal que fisico-químicas de las miles de moléculas que es registrada como una serie de picos los que componen un extracto crudo. La principal di- constituyen el cromatograma. En la figura 1 se ficultad radica en la exacta identificación de observa un cromatograma obtenido luego de los fragmentos obtenidos luego de la ioniza- aproximadamente 40 minutos de corrida de ción de las distintas moléculas (ver siguiente una muestra de extractos de frutos de tomate. sección: “Espectrometría de masas. Principios El ápice de un pico dado representa el momen- básicos”). to de mayor intensidad registrado y se lo co- En este sentido, la aplicación de la cromato- noce como el tiempo de retención (RT) de ese grafía en fase líquida (LC) constituye un com- grupo de moléculas. El RT es una propiedad de plemento importante a la gaseosa y contribu- las moléculas que permite la identificación de ye a expandir el rango de aplicaciones de las las mismas en el cromatograma. técnicas cromatográficas en metabolómica. Si Sin embargo, dada la necesidad de volatili- bien la resolución de ésta es menor que la ga- zar los extractos, es necesario un tratamiento seosa, permite la separación de compuestos previo de los mismos a fin de transformar las de mayor peso molecular y polaridad sin la ne- moléculas en compuestos menos polares y cesidad del paso de derivatización previamen- más volátiles. Este paso, denominado deriva- te mencionado. tización, consiste en la adición de grupos quí- No obstante los avances en el conocimiento micos (tales como sililo -Si(CH3)3- y metoxi) a en cuanto a la separación e identificación de las moléculas que componen la muestra com- compuestos orgánicos, la cromatografía no ha

Figura 1. Cromatograma obtenido luego de aproximadamente 40 minutos de corrida de un extracto crudo de fruto de tomate. Sobre las abscisas se observan los tiempos de retención para grupo de moléculas en una columna en fase gaseosa. Sobre las ordenadas se grafican las intensidades relativas de cada grupo de moléculas separado. Bajo condiciones experimentales definidas estas intensidades son proporcionales a la cantidad de la molécula en análisis presente en una muestra dada.

Biotecnología y Mejoramiento Vegetal II 147 resuelto aún la exacta identificación de molé- produce luego una corriente gaseosa que con- culas individuales presentes en una muestra duce a los iones obtenidos hacia los detectores compleja. El empleo de sistemas de cromato- del espectrómetro. Durante esta corriente los grafía acoplados a espectrometría de masas iones generados son separados de acuerdo resulta de gran utilidad en la identificación de a su masa y carga que al impactar sobre los moléculas que se encuentran en trazas en una detectores generan una señal eléctrica que es muestra compleja con un grado de exactitud de registrada de acuerdo a su intensidad. La ma- hasta 3-4 decimales. nera gráfica de representar estas señales es lo que se conoce como espectro de masas de Espectrometría de masas. Principios una molécula. En la figura 2 se observa un es- básicos. pectro de masas del aminoácido fenilalanina. La espectrometría de masas es un método que permite la identificación de moléculas a Preparación de muestras. Extracción y partir del patrón de fragmentos que se generan derivatización. luego de la ionización de las mismas. A este pa- La obtención de muestras biológicas para el trón se lo denomina espectro de masas y cons- análisis de sus perfiles metabólicos, como cual- tituye la “huella digital” de una molécula dada. quier otra técnica que involucre la identificación Esta es una de las funciones primarias de los y cuantificación de metabolitos, requiere la in- espectrómetros de masas. Existen varias mé- mediata inactivación del metabolismo de modo todos para la ionización de moléculas: ioniza- de evitar efectos de su manipulación sobre el ción química (CI), por impacto de electrones mismo. La inhibición rápida del metabolismo se (EI), bombardeo rápido de átomos (FAB), por logra mediante la disminución brusca de tem- campo eléctrico (FI), por láser (LIMS), desor- peratura (≤ -60°C) por inmersión de las mues- ción asistida por láser (MALDI) e ionización por tras en N2 líquido. A su vez, los procedimientos electrospray (ESI). Este último método es uno posteriores de extracción requieren el uso de de los más utilizados para la generación de los materiales (tales como tubos plásticos o de vi- espectros de masas de moléculas orgánicas el drio) de alta calidad y pureza de modo de pre- cual consiste en un impacto con electrones de venir fuentes de eventuales contaminaciones. alta energía aplicado sobre una corriente de A su vez, dado que una de las aplicaciones moléculas en fase líquida. Esto produce la ne- comunes de estas técnicas es la comparación bulización y fragmentación de las moléculas y del estado metabólico de organismos frente a mediante cambios rápidos de temperatura se perturbaciones ambientales (por ejemplo de

Figura 2. Espectro de masas del aminoácido fenilalanina. Sobre las abscisas se observan las relaciones masa/carga (m/z) de los diferentes fragmentos obtenidos luego de la ionización de la molécula. Sobre las ordenadas se grafican las intensidades relativas de cada fragmento obtenido. Bajo condiciones experi- mentales definidas estas intensidades son proporcionales a la cantidad de la molécula en análisis presente en una muestra dada. Fuente: adaptado de “The Golm Metabolome databases”.

148 Biotecnología y Mejoramiento Vegetal II plantas de cultivo en ambientes extremos) y/o como apolar, a los efectos de este ejemplo, a cambios en la constitución genética de los los pasos siguientes se concentran en la ob- mismos (por ejemplo de plantas transgénicas tención de la fase polar. Mediante un paso de que expresen diferencialmente una proteína extracción con cloroformo-agua, las alícuotas involucrada en señalización por azúcares) una de la fase polar son concentradas y liofilizadas necesidad básica es las consideraciones de para su posterior derivatización. controles tanto de los materiales “per se” como Tal como se mencionó previamente, la de- de las condiciones en las que las muestras son rivatización consiste en la modificación de las extraídas y procesadas. A su vez, la aplicación moléculas a fin de disminuir su polaridad y per- de algoritmos estadísticos a los datos obteni- mitir la volatilización de las mismas. Existen va- dos requiere la determinación del grado de va- rios métodos y reactivos derivatizantes. Entre riación dentro de la población de muestras a los más usados para esta aplicación, el MSTFA ser analizadas. (N-metil-N-trimetilsililtrifluoroacetamida) ha de- A efectos explicativos, en este capítulo nos mostrado ser uno de los más reactivos en re- concentraremos en un ejemplo de muestreo, emplazar los hidrógenos lábiles de un amplio acondicionamiento y extracción de muestras rango de compuestos polares por grupos sililos de hojas de plantas (de tomate, papa, tabaco o y el hidroxicloruro de metoxiamina es usado en Arabidopsis) en condiciones ambientales con- un segundo paso de derivatización a fin de pro- troladas (22-24°C, 250 µmol fotones.m-2.s-1 y teger grupos aldehídos y cetonas de las molé- 16 h de luz/8 h de oscuridad). El momento del culas presentes en la matriz. día para el muestreo debe ser cuidadosamen- Los extractos así preparados son inmedia- te controlado. Como regla general, la mitad tamente inyectados en el cromatógrafo aco- del periodo de luz es el más indicado debido plado al espectrómetro de masas. Tanto las a que numerosos reportes en la literatura dan condiciones de corrida (tiempo, rampa de cuenta de los ritmos diurnos en los cambios en temperaturas, frecuencia de captura de datos, la composición metabólica de plantas. El otro etc) como las especificaciones de flujo de gas punto importante a tener en cuenta es el es- y columnas cromatográficas deben ser -pues tado fenológico de las plantas y los órganos a tas a punto para cada aplicación particular. En muestrear. La posición de las hojas en la planta este sentido, en los últimos años se dispone y el área de las mismas también debe ser te- de programas de computación especialmente nido en cuenta. Además, una vez que las por- diseñados por los fabricantes de espectróme- ciones de hojas fueron cortadas de la planta, tros que controlan toda la operación y posterior se debe registrar la masa exacta de la muestra procesamiento de datos. A su vez, la disponi- y congelarlas inmediatamente. Las muestras bilidad de colecciones de espectros de masas deben mantenerse a la temperatura indicada en bases de datos de acceso público (ver sitios durante todo el proceso de extracción. Para recomendados) permite la rápida evaluación ello es conveniente enfriar todos los instrumen- de los datos adquiridos. tos necesarios para la toma de muestras, tales como tijeras, pinzas, sacabocados, tubos, etc. Resonancia magnética nuclear. Principios Para el ejemplo mencionado, la cantidad de te- básicos jido necesario puede variar entre 100-150 mg La resonancia magnética nuclear es un mé- (peso fresco). La muestra debe ser homoge- todo de análisis espectroscópico no destruc- nizada en N2 líquido, las enzimas inactivadas tivo, que se basa en la absorción de energía mediante el agregado de metanol y al mismo en la zona de radiofrecuencia por parte de los tiempo deben agregarse estándares internos núcleos de algunos átomos, en presencia de (en concentraciones conocidas) no presentes un campo magnético. La MS es la técnica más en la muestra a analizar. La extracción se reali- utilizada en metabolómica. Sin embargo, la za luego calentando la muestra a 70°C con agi- técnica de RMN está ganando terreno en este tación constante. Si bien este protocolo puede sector, como una técnica que brinda informa- aplicarse a la obtención tanto de la fase polar ción complementaria, ya que amplía el rango

Biotecnología y Mejoramiento Vegetal II 149 de metabolitos detectados y provee informa- estos niveles, que es el fenómeno de Resonancia ción estructural detallada de las moléculas (figura 3). presentes. Más aún, la RMN permite identificar La frecuencia de absorción 0 depende del cam- sustancias previamente no halladas en mues- po aplicado (B0), el cual está fijo para cada equipo, tras similares. y la constante giromagnética nuclear (γ) que es ca- La RMN explota una propiedad de los núcleos racterística de cada núcleo (figura 3). Es decir que atómicos, el spin nuclear. El spin nuclear posee cada núcleo tendrá una frecuencia de absorción un momento magnético, es decir que se compor- característica. Es importante tener en cuenta que, ta como un pequeño imán. Normalmente, estos como se trata de una propiedad del núcleo atómi- momentos magnéticos están orientados al azar y co, dado un elemento químico, los distintos isóto- tienen la misma energía (figura 3). Si se aplica un pos del mismo presentarán distintas propiedades campo magnético fijo (B0) con una dada dirección, magnéticas. Algunos isótopos (dependiendo de su estos momentos magnéticos quedarán alineados composición) pueden carecer de spin, y por lo tan- a favor o en contra del campo magnético externo to no serán activos en RMN y este es el caso de (figura 3). Según su orientación con respecto al 12C, 16O y 32S. Por simplicidad, en este capítulo se campo Bo, los núcleos tendrán ahora distinta ener- considerarán sólo los núcleos con spin ½, que son gía. La diferencia de energía (ΔE) entre estos dos los de interés biológico. Dentro de los núcleos de niveles está en el orden de las ondas de radio, es spin ½ se encuentran los núcleos de 1H, 13C, 15N y decir con frecuencias de MHz. Si ahora aplicamos 31P, que pueden ser estudiados por RMN. Cada nú- al sistema orientado la frecuencia correspondien- cleo posee una sensibilidad determinada, que está te a esa ΔE (0), se inducirá una transición entre determinada por su constante giromagnética. El or-

Figura 3. Esquema en donde se muestra los niveles de energía de los núcleos en presencia o ausencia de un campo magnético externo (B0) y las transiciones de los núcleos entre un nivel de energía y otro superior υ al absorber una frecuencia ( 0) correspondiente a la diferencia de energía (∆E).

150 Biotecnología y Mejoramiento Vegetal II den de sensibilidad de estos núcleos es: 1H > 31P > como es el fosfato inorgánico, nucleósidos tri- 13C > 15N. La detección de 1H o 31P, además de su fosfatos, fosfomonoésteres, etc. alta sensibilidad, está favorecida por la alta abun- dancia natural de estos isótopos (99,9% y 100%, Desplazamiento químico respectivamente). En cambio, los isótopos de 13C La frecuencia de absorción de cada núcleo y 15N poseen una abundancia de 1,1% y 0,4%, lo depende de su constante giromagnética γ a un cual dificulta más aún su detección. Este inconve- campo dado. Por ejemplo, a un campo de 9,4 T, niente se puede sortear enriqueciendo la muestra los 1H absorben a 400 MHz, los 13C a 100,6 MHz con el isótopo activo de interés. Cabe destacar que y los 15N a 40 MHz. Sin embargo, no todos los ninguno de estos isótopos es radioactivo, lo que fa- 1H ni todos los 13C absorben a la misma frecuen- cilita la manipulación de las muestras. cia. La frecuencia de absorción de cada protón Todos los elementos con isótopos magnéticos depende de la ubicación del núcleo en las molé- detectables por la técnica RMN pueden ser usados culas, es decir, de su ambiente químico. Las dis- para identificar metabolitos en tejidos de plantas y tintas posiciones de los núcleos en un espectro sus extractos. El 1H es el isótopo magnético más se cuantifican con un parámetro llamadodespla - utilizado debido a su alta sensibilidad intrínseca zamiento químico (, cuyo valor no sólo informa y su abundancia natural. La concentración límite la frecuencia precisa de absorción, sino que nos para poder detectar un metabolito por RMN de 1H permite distinguir el tipo de protón (por ejemplo en un extracto es alrededor de 10 µM. Para una alifático, aromático, amídico, etc.). La intensidad muestra dada, la sensibilidad aumenta con el cam- de una señal de resonancia, o sea el área bajo po magnético del instrumento utilizado. cada pico, es proporcional al número de núcleos Los metabolitos fosforilados pueden ser iden- de ese tipo (figura 4). tificados y cuantificados por RMN utilizando el isótopo magnético 31P. De esta manera se pue- Espectrómetro de RMN den estudiar un número pequeño de moléculas Cada equipo de RMN trabaja a un cam- abundantes y de gran importancia metabólica po magnético fijo. En general es conveniente

Figura 4. Dependencia ubicación del núcleo en las moléculas y su frecuencia de absorción.

Biotecnología y Mejoramiento Vegetal II 151 trabajar con un campo magnético alto porque volumen de extracto utilizado es dependiente esto trae aparejado una mayor sensibilidad y del ensayo pero varía entre 250 y 400 μl. resolución. Cada equipo se suele denominar no por la magnitud del campo (por ejemplo, 16 Utilización de la técnica RMN en Tesla), sino por la frecuencia de absorción del metabolómica 1H a ese campo (para el caso mencionado, 600 1-Identificación y cuantificación de me- MHz). La mayoría de los análisis metabólicos tabolitos en tejidos vegetales: ventajas y se realizan con instrumentos que operan en el desventajas rango de 300 a 900 MHz para 1H. Existen diversas ventajas de la técnica de El campo magnético está generado por RMN para el análisis de perfiles metabólicos. Helio líquido a bajas temperaturas (4 K), que Las mayores ventajas con respecto a otras téc- es superconductor, y se encuentra en un termo nicas son: (1) no se requiere tratamiento pre- que rodea la muestra, que constituye el imán vio de la muestras (pudiéndose utilizar extrac- o magneto. Los pulsos de excitación de radio- tos crudos); (2) es un método no destructivo, frecuencia se generan mediante bobinas que lo cual permite el análisis subsiguiente de la están alrededor del tubo donde se encuentra la muestra con otros métodos; (3) se puede ob- muestra, complementadas con un conjunto de tener información sobre una amplia variedad bobinas que permiten la detección de la señal de metabolitos en un único experimento; (4) no resultante. existen restricciones en cuanto a la volatilidad, polaridad de los compuestos, o la presencia Preparación de las muestras de determinados cromóforos que interfieran; y Se pueden obtener espectros de RMN a (5) la técnica puede ser aplicada con escaso partir de una amplia variedad de materiales: conocimiento previo de la composición de la extractos vegetales (por ejemplo: jugo de to- muestra. mate), suspensiones celulares e inclusive plán- Otra gran ventaja de ésta técnica para el tulas intactas. análisis cualitativo de metabolitos es que no En el caso de realizar RMN de 1H, es con- requiere del conocimiento de ningún paráme- veniente liofilizar las muestras para eliminar el tro equivalente a los coeficientes de extinción agua. Esto se realiza con el fin de reducir la necesarios para cuantificar muestras mediante señal correspondiente al solvente, que (por su técnicas espectrofotométricas. Esto se debe a alta intensidad) dificulta la detección de seña- que la magnitud de la señal de resonancia de les de los metabolitos. Luego se resuspende un isótopo es directamente proporcional al nú- la muestra liofilizada en agua deuterada (D2O). mero de núcleos que contribuyen a dicha se-

La adición de D2O a la muestra hará que no se ñal. Lo anterior implica que, por una parte, no puedan detectar las señales de protones inter- se requieren curvas de calibración para efec- cambiables con el solvente, como los de grupos tuar el análisis cuantitativo, y por otro lado no amida o alcohol. En caso de que sea necesario es necesario conocer el espectro de un com- poder identificar los mismos, deben realizar- puesto puro ya que por lo general basta con se experimentos que permitan la eliminación identificar señales debidas a una porción dada selectiva de la señal del solvente. En caso de de la molécula para obtener la información de- que se deseen extraer algunos componentes seada. La información cuantitativa se obtiene a específicos, también pueden utilizarse solven- partir del área integrada bajo la curva. tes orgánicos, de preferencia deuterados (que se venden comercialmente). Conviene utilizar Ejemplo 1: caracterización de extractos solventes químicamente inertes y volátiles, lo de frutos de tomate que permite eliminar el solvente en caso de La Figura 5A muestra un espectro de RMN que la muestra deba ser analizada por otra téc- de 1H en una muestra de jugo de tomate. En nica. Esto es posible debido a que la técnica la región de campo alto (3,1-0,3 ppm) del es- de RMN es no destructiva. Las muestras se co- pectro de protones contiene la resonancia de locan en tubos de vidrio borosilicato puro y el los grupos alifáticos de los aminoácidos y áci-

152 Biotecnología y Mejoramiento Vegetal II dos orgánicos pertenecientes al metabolismo RMN. A fin de minimizar esto se puede combi- de los ácidos tricarboxílicos. En particular, las nar esta técnica con una de separación croma- señales provenientes de treonina, alanina, glu- tográfica, de manera que el extracto se fraccio- tamato, glutamina, GABA, aspartato, citrato y ne, disminuyendo la complejidad de la mues- malato fueron identificadas claramente. Las re- tra y por ende del espectro de RMN. Esto es sonancias encontradas en la región del espec- análogo a lo que se realiza cuando se acopla tro de campo intermedio (desde 3,2 a 5,3 ppm) la cromatografía gaseosa a un espectrómetro corresponden en su mayoría a sacáridos, de de masa. La segunda opción para incrementar los cuales D-glucosa y D-fructosa son los com- la resolución espectral es adquirir espectros bi- ponentes principales. En la región de campo dimensionales, distribuyendo las señales a lo bajo (5,5-9,4 ppm) del espectro se encuentran largo de dos ejes de frecuencia. Estos méto- las señales correspondientes a aminoácidos dos bidimensionales pueden además utilizarse aromáticos y compuestos fenólicos. Debido a para incrementar la sensibilidad de isótopos la baja intensidad de la señal, las asignaciones menos abundantes como 13C, y establecen co- se realizaron parcialmente. Estos resultados nexiones entre las señales de 1H y 13C lo cual muestran que la técnica RMN puede ser una es útil para la identificación de los metabolitos. herramienta útil para ser usada en la caracteri- zación de tomates. La principal desventaja de la técnica de RMN es su baja sensibilidad. El advenimiento de ins- trumentos de RMN de alto campo, de técnicas especiales de detección y el diseño de crioson- das (de mucha mayor sensibilidad) ha mejora- do este aspecto. De todas formas, rara vez se usa RMN para el análisis de un componente que se encuentra en trazas. Generalmente, el problema de la baja relación señal-a-ruido en los espectros de RMN (que sucede principal- mente con isótopos poco abundantes) puede ser superado haciendo varios espectros de manera automática, y sumándolos. Esto re- dunda en mayor tiempo de adquisición del ex- perimento. Sin embargo, si se tiene en cuenta que cada experimento permite seguir muchos metabolitos a la vez, este aspecto negativo se ve compensado. La técnica de RMN aplicada a heteronúcleos (tales como 13C, 15N o 31P) es útil debido al he- cho de que estos núcleos presentan una gran dispersión en sus señales, dado que el rango de desplazamientos químicos de los mismos es mayor que el de 1H. En el caso particular de 13C o 15N, como ya se mencionó, los núcleos son menos sensibles y abundantes, por lo cual es conveniente realizar una marca isotópica. Generalmente, se utiliza la estrategia de mar- cado isotópico selectivo (no uniforme) para el análisis de flujos metabólicos, más que para Figura 5. Perfil metabólico correspondiente a una realizar perfiles metabólicos. muestra de jugo de tomate (A) espectro de 1H RMN Otra de las desventajas de la técnica es el en una dimensión y (B) en dos dimensiones (COSY) solapamiento de las señales obtenidas en 1H de la zona de azúcares y alifáticos

Biotecnología y Mejoramiento Vegetal II 153 La gran cantidad de información que se pue- de plantas que posean específicamente algu- de extraer de estos espectros bidimensiona- na ruta metabólica alterada. Un ejemplo de les compensa el hecho del mayor tiempo que esto es el análisis de plantas de tabaco que lleva realizarlos. Estos experimentos explotan producen constitutivamente el ácido salicílico, las interacciones entre los distintos isótopos las cuales son más resistentes a infecciones. detectables por RMN en una molécula y re- Los perfiles metabólicos que se obtuvieron por sultan en lo que se denomina correlación ho- RMN mostraron que las plantas transgénicas monuclear, donde los dos ejes de frecuencia tenían alterados los niveles de distintos com- corresponden al mismo núcleo, por lo general puestos como flavonoides, azúcares, aminoá- 1H, o correlación heteronuclear en donde uno cidos, etc. Este ejemplo muestra claramente de los ejes de frecuencia corresponde al 1H y la potencialidad de utilizar la técnica de RMN el otro a 13C, 15N y menos frecuentemente 31P. para estudiar cambios metabólicos. Los experimentos de correlación homonuclear son particularmente útiles para realizar perfiles 2-Mapas de distribución espacial de me- metabólicos, permitiendo que subgrupos de pi- tabolitos en tejidos vegetales cos que se encuentran juntos en el espectro La técnica 1H RMN puede ser utilizada in vivo de una dimensión puedan ser identificados y para obtener información acerca de la distribu- asignados a compuestos particulares. La co- ción espacial de un número limitado de meta- rrelación heteronuclear también es útil cuando bolitos. Este método se utiliza generalmente los extractos derivan de tejidos que han sido para el H2O ya que es la señal más fuerte de- marcados con 13C o 15N. tectada in vivo. Las imágenes brindan informa- Con el objeto de realizar una asignación ción acerca de la anatomía del tejido y el movi- completa de las señales resonantes a com- miento del H2O dentro del mismo. También se puestos específicos presentes en el jugo de puede obtener información acerca de la distri- tomate, se realizaron diversos experimentos bución espacial de ciertos metabolitos menos de RMN bidimensionales. La Figura 5B corres- abundantes que el H2O como ser aminoácidos ponde a un COSY de la zona de azúcares y y carbohidratos. Debido a que es una técnica alifáticos. Usando la información de conectivi- no destructiva y no invasiva, se pueden moni- dad y aprovechando la mayor separación de torear cambios temporales en ciertos metabo- las señales en la dimensión adicional, muchas litos. Es posible a partir de la misma muestra de las señales fueron asignadas sin ambigüe- grabar una serie de espectros in vivo y luego dad. En los casos en donde la asignación fue analizar en el tiempo cómo es la respuesta me- dudosa, se adicionaron los compuestos puros tabólica frente a cambios en el estado fisiológi- al extracto para corroborar así la identidad del co del tejido vegetal. metabolito analizado. Se utilizaron las tablas de desplazamientos químicos existentes en la RMN versus MS literatura como guía para asignar correctamen- La espectrometría de masa acoplada a cro- te las señales. matografía gaseosa (GC-MS) es la técnica más utilizada en metabolómica. Sin embargo, Ejemplo 2: caracterización de plantas la técnica de RMN está siendo utilizada como transgénicas una técnica que brinda información comple- El desarrollo de técnicas para la generación mentaria a la que se obtiene con GC-MS. de plantas transgénicas ha revolucionado el La sensibilidad es tal vez el requisito más im- área de la biología de plantas. Estas plantas portante que debe cumplir una técnica analítica transgénicas pueden tener perturbaciones en para ser utilizada en metabolómica, ya que una las rutas metabólicas debido a la introducción alta sensibilidad favorece el análisis rápido de del transgen en el genoma de la planta. La téc- una fracción mayor del metaboloma. La técnica nica de RMN permite tener un pantallazo ge- 1H RMN , que tiene un límite de detección de neral del estado metabólico de las plantas lo 5 nmoles, es varios órdenes de magnitud me- cual es de suma utilidad para generar líneas nos sensible que la técnica GC-MS, cuyo límite

154 Biotecnología y Mejoramiento Vegetal II de detección es de 10-12 mol. Esta diferencia Resumiendo, una comparación entre RMN se incrementa aún más si se tiene en cuenta y GC-MS muestra que esta última técnica es la técnica de RMN con otros isótopos menos más sensible aunque el procesamiento de las abundantes. muestras es más laborioso y la eficiencia de Se estima que con la técnica de GC-MS se extracción y derivatización no sería homoge- puede identificar menos del 5 % de los metabo- nea para todos los metabolitos. Por otro lado, litos de una célula vegetal si bien todo el meta- la facilidad con la que se generan los espec- boloma es potencialmente detectable. Este ar- tros y se cuantifican los metabolitos y la infor- gumento ignora cualquier diferencia que pudie- mación complementaria (como ser estructural) se existir en la eficiencia de extracción y deri- que suministra hacen de la técnica RMN una vatización de metabolitos cuyas características herramienta de gran utilidad para los estudios son muy diversas. Otro obstáculo que impide metabolómicos. un análisis completo tanto en RMN como en GC-MS es la dificultad de detectar componen- Lectura y sitios recomendados tes minoritarios en presencia de señales más intensas. Fiehn O. Metabolomics – the link between geno- Existen otros factores que influyen en la types and phenotypes. Plant Molecular Biology elección de una técnica o la otra. Uno de ellos 48:155-171 es el procesamiento de las muestras. Como se Köckenberger W. Nuclear magnetic resonance mi- cro-imaging in the investigation of plant cell me- ejemplifico mas arriba, en el caso de GC-MS, tabolism. Journal of Experimental Botany. 2001, es necesario realizar una extracción con sol- 52(356): 641-656. ventes y además derivatizar los compuestos Krishnan P, Kruger NJ y Ratcliffe RG. Metabolite por lo que la preparación de las muestras es fingerprinting and profiling in plants using NMR. más laboriosa y además es más probable que Journal of Experimental Botany. 2005, 56(410): en la muestra no estén representados todos 255-265. los metabolitos que existen en el tejido de par- Lisec J, Schauer N, Kopka J, Willmitzer L y Fernie tida. Este no sería el caso de las muestras que AR. Gas chromatography mass spectrometry– son analizadas por RMN, en donde se pueden based metabolite profiling in plants. Nature pro- obtener espectros a partir de una amplia va- tocol. 2006, 1(1): 387-396. Ratcliffe RG y Hill YS. Probing plant metabolism riedad de materiales sin necesidad de realizar with NMR. Annu Rev Plant Physiol Plant Mol extracciones con solventes. Biol. 2001, 52: 499-526. La técnica de RMN tiene una ventaja para el Silverstein RM y Webster FX. Proton��������������������� magnetic reso- análisis cuantitativo y es el hecho de que los nance spectrometry. En: Spectrometric identifi- espectrómetros modernos son muy estables cation of organics compounds, 1998, 6° edición, en comparación con los GC-MS en donde es Wiley & Sons. necesario realizar calibraciones frecuentes y la Sobolev AP, Segre A, Lamanna R. Proton high-field variabilidad en los tiempos de retención pue- NMR study of tomato juice. Magnetic Resonance den complicar significativamente el análisis in Chemistry, 2003, 41: 237-245. cuantitativo. Ambas técnicas generan usual- Verpoorte R, Choi YH, Kim HK. NMR-based metab- olomics at work in phytochemistry. Phytochem mente múltiples señales lo cual es una ventaja Rev. 2007, 6:3–14. para la identificación de metabolitos, pero a la Weckwerth W. Metabolomics. Methods and Proto- vez representa una desventaja en términos de cols. Methods in Molecular Biology Series 358. complejidad espectral. Sin embargo, en MS, Humana Press 2007. algunas de estas multiplicidades se deben al www.metabolomicssociety.org (Sociedad de Meta- fraccionamiento de la molécula ionizada, com- bolómica). plicando el análisis cuantitativo. En cambio, www.springeronline.com/sgw/cda/frontpa- para el caso de RMN, las señales múltiples ge/0,11855,5-40109-70-34409863-0,00.html (Si- provienen de la misma molécula, lo cual per- tio web de la revista científica Metabolomics, re- mite una verificación cruzada de los datos de vista oficial de la la Sociedad de Metabolómica). www.metabolomics-nrp.org.uk (Norwich Research cuantificación de los metabolitos. Park – Metabolomics and plants).

Biotecnología y Mejoramiento Vegetal II 155 www.metabolomics.bbsrc.ac.uk (Rothamsted: The www.metalign.nl (Software para pretratamiento National Centre for Plant and Microbial Metabo- suavizado, estimación del ruido, corrección de la lomics). línea base, alineamiento, etc de datos de GC y http://csbdb.mpimp-golm.mpg.de/csbdb/gmd/gmd. LC) html (Max Planck Institute of Molecular Plant http://metacyc.org (La base de datos MetaCyc in- Physiology / The Golm Metabolome databases cluye información sobre las rutas metabólicas, consortium). sustratos, reacciones, enzimas, etc de más de www.noble.org (Noble Foundation / Plant Biology / 150 organismos diferentes). The Sumner group). www.infometrix.com (Diversos paquetes informá- ticos para alineamiento de datos cromatográfi- cos y espectroscópicos y análisis multivariados: PCA, SIMCA, etc).

156 Biotecnología y Mejoramiento Vegetal II I CAPÍTULO 11 suelos y agua, mejoramiento de la producción agrícola, producción de biocombustibles, fer- mentar alimentos para el hombre, etc. Metagenómica Alrededor de la década de 1950, los micro- biólogos disfrutaban la percepción de haber lo- 1 2 O. Mario Aguilar y Daniel H. Grasso grado un conocimiento satisfactorio de los mi- croorganismos del suelo. Así, en el año 1931 el Introducción microbiólogo Waksman, quien contribuyó signi- Encaramos este capítulo reconociendo el ficativamente al conocimiento de microorganis- protagonismo de los microorganismos en la mos del suelo productores de antibióticos, con- vida de nuestro planeta, desde su origen más cluía “… disponemos de una buena informa- remoto. Tenemos el caso de nuestra atmós- ción que nos da un panorama claro del mundo fera rica en oxígeno resultante de la activi- microscópico del suelo…”. Sin embargo, otros dad fotosintética de los primeros organismos investigadores con iniciativas aisladas y dis- microbianos, y aún hoy los microorganismos persas, persistían en su afán por demostrar la aportan la mayor capacidad fotosintética del existencia de otras poblaciones microbianas planeta. Cada proceso en la biósfera hace uso ignoradas, recogiendo evidencias experimen- de la casi ilimitada potencialidad de los micro- tales que cuestionaban esa aparente tranqui- organismos para transformar el medio que los lidad científica. En 1985, Staley y Konopka a rodea. El resto de los organismos vivos de- partir de la revisión de los datos relacionados a pendemos en gran parte de ellos gracias a su capacidad de transformar compuestos en nu- la capacidad de cultivo de microorganismos de trientes asimilables, accesibles y requeridos muestras ambientales, concluyen en la llama- para nuestra forma de vida. En este sentido da “gran anomalía del conteo en placa”. Esta mencionemos los siguientes ejemplos: La ca- anomalía es la discrepancia entre los valores pacidad de transformar el nitrógeno molecular de recuento de células obtenidos mediante mi- atmosférico en una forma asimilable por las croscopía y los valores de recuentos en placa. diferentes formas de vida se encuentra restrin- La conclusión latente, de un conocimiento limi- gida a los microorganismos. Miles de millones tado de los microorganismos del suelo, restrin- de microbios benignos que habitan el intestino gida esencialmente a aquellos que los micro- nos ayudan a digerir los alimentos, degradar biólogos habían sido capaces de cultivar in vi- potenciales toxinas y combatir otros microorga- tro en sus laboratorios, ha sido tanto abundante nismos patógenos. También, nos beneficiamos como sólidamente documentada durante la úl- de aquellos microorganismos que son capaces tima década. El concepto de organismo viable de mantener el medio ambiente libre de conta- pero no cultivable se hizo evidente con Vibrio minantes y xenobióticos. cholerae, el cual es viable y virulento cuando se La capacidad de adaptación de los procario- aísla de un medio acuático pero crece en culti- tas, que les permite prosperar y poblar cada vo hasta después de su pasaje por el intestino ambiente, aún aquellos de condiciones extre- humano o de ratón. Este tipo de evidencias co- mas tales como los respiraderos hidroterma- menzaron a redirigir la atención hacia el mundo les del fondo del océano y los drenajes ácidos de los organismos no cultivables, entre las cua- de las minas y efluentes industriales, es con- les destacamos dos descubrimientos que han secuencia de su gran diversidad metabólica tenido una gran relevancia en esta área. En el y fisiológica. Además de su importancia debi- primero de ellos se describió mediante curvas do a su rol esencial en la biósfera, los micro- de reasociación DNA-DNA la diversidad de las organismos han sido objeto del desarrollo de bacterias del suelo, encontrándose que era al numerosas tecnologías que han contribuido a menos 100 veces mayor que la que puede ser mejorar la calidad de vida. Son empleados in- estimada mediante técnicas dependientes de dustrialmente para producir la mayoría de los cultivo. El segundo descubrimiento fue la de- antibióticos y muchas otras drogas de uso clíni- mostración de Helicobacter pylori como agente co, también como agentes de remediación de etiológico de úlceras y cáncer gástrico. Pese a

Biotecnología y Mejoramiento Vegetal II 157 que hace más de un siglo que esta bacteria ha término metagenómica al análisis del genoma sido observada en la mucosa gástrica, hasta de comunidades independientemente de las que no fue cultivada no se aceptó su rol en la tareas de aislamiento y cultivación. El conjunto enfermedad. de métodos desarrollados para acceder al co- La ecología microbiana ha experimenta- nocimiento fisiológico y genético de comunida- do una gran transformación en los últimos 25 des, comprende la extracción directa de ADN años debido a la introducción de la filogené- de muestras ambientales, clonado de fragmen- tica, revolucionando la forma de ver a los mi- tos de ADN en general o resultante de la am- croorganismos. El primer hito fue el trabajo de plificación de secuencias del gen 16S rRNA o Carl Woese quien propuso a los genes rARN genes asociados a funciones tales como meta- como cronómetros evolutivos (Woese, 1987). bolismo nitrogenado, antibiosis, etc. (Figura 1). Posteriormente, Pace y colaboradores utiliza- El avance y los logros ya alcanzadas por la ron el análisis de las secuencias de 5S y 16S metagenómica están asociados al desarrollo rARN para describir la diversidad de los micro- de capacidades técnicas de secuenciación de organismos (cultivables y no cultivables) pre- sentes en muestras ambientales (Pace, 1997). Estos primeros trabajos se realizaron secuen- ciando directamente el ARN o sus respectivas copias de cADN. El desarrollo de la tecnolo- gía de PCR y el diseño de los cebadores que permiten amplificar el gen completo, permitió un acceso mayor a este procedimiento por una comunidad científica más amplia y a una mayor diversidad de nichos ecológicos. La aplicación de la amplificación por PCR de los genes 16S rARN a partir del ADN total de una comunidad, seguido del clonado y secuenciación, ha gene- rado una gran cantidad de datos y ha redefinido la diversidad procariota. Si la muestra ambien- tal contiene varios tipos diferentes de organis- mos, se espera entonces encontrar diferentes secuencias de rARN, cuya diversidad será una medida de la complejidad de la comunidad y en el contexto de un árbol filogenético nos dirá quienes son sus miembros. Se ha empleado para caracterizar el perfil poblacional de diver- sos ambientes naturales. Así, mediante este tipo de análisis se ha demostrado que el suelo es el hábitat de la Tierra más rico en diversidad procariota, aún cuando los métodos basados en el cultivo in vitro no ponen de manifiesto esa alta diversidad. El advenimiento de nuevas tecnologías y procedimientos de análisis de muestras am- bientales, metodologías independientes del cultivo de los microorganismos, con potencia- lidades distintas para revelar componentes de Figura 1. Bibliotecas metagenómicas. Esquema del la comunidad microbiana, impulsó un nuevo proceso de obtención y análisis de bibliotecas cons- enfoque de estudio ampliando los horizontes truidas con ADN extraído directamente de muestras del conocimiento. Se ha denominado con el ambientales.

158 Biotecnología y Mejoramiento Vegetal II ADN con alta eficiencia de generación de datos de humedad, pasando desde una saturación primarios y a la bioinformática que ha desarro- por persistentes lluvias o defectos de drenaje llado herramientas útiles para el procesamien- hasta períodos de aridez. Esto sugiere que la to y análisis de datos. composición de la comunidad microbiana ex- Los microbiólogos encontraron la oportuni- perimenta ajustes periódicos en respuesta a dad para dirigir sus esfuerzos a una descrip- esos cambios ambientales, aunque se ignora ción amplia de la diversidad filogenética de am- la manera cuali y cuantitativa del impacto de bientes comunes y exóticos tales como aguas esos efectores. oceánicas de superficie y profundidad, rumen El suelo es un reservorio muy importante de de animales, superficie de redes y cañerías de carbono, y son los microorganismos quienes agua, aguas termales surgentes y suelo. Más desempeñan roles protagónicos en el reciclado allá de permitirles realizar una descripción de del carbono. Asimismo, funciones importantes la comunidad microbiana, con un nivel de reso- tales como la captación del nitrógeno molecu- lución taxonómico preciso, promovió la acep- lar, la movilización de fósforo inorgánico, y la tación y difusión del concepto ecológico de formación de nitratos residen en actividades consorcio microbiano para lo cual el estudio de microbianas, los cuales impactan en la fertili- microorganismos aislados y cultivados in vitro dad de los suelos (Daniel, 2005). resulta insuficiente para explicar la funcionali- Teniendo en cuenta la complejidad fisico- dad y dinámica poblacional. química del suelo y la diversidad de funciones Mirar más allá de los microorganismos que que transcurren en el mismo, es posible ima- se pueden aislar, alcanzando al metagonoma ginar al suelo como un cuerpo orgánico con permitirá responder no sólo la pegunta cuáles capacidades metabólicas asociadas a pobla- son los componentes de una determinada co- ciones microbianas diversas, que su vez se munidad sino aún más importante qué hacen complementan entre sí en forma semejante a o serían capaces de hacer. lo encontrado entre los órganos de un cuer- En el desarrollo de este capítulo se describi- po. Coincidentemente con este paralelismo, rán las potencialidades de la metagenómica en se ha renovado el enfoque del estudio de los general, haciendo énfasis en el suelo. genomas dirigido a la consideración global de las interacciones mutuas y la coordinación de El suelo: Un hábitat complejo la complejidad del sistema, que se lo conoce El suelo constituye un soporte para la vida como biología de sistemas (“system biology”). formado por partículas minerales de diferen- Actualmente, el estudio del tamaño y la diver- tes formas, tamaños y composición química, sidad de las comunidades del suelo, es un de- compuestos orgánicos en distintas etapas de safío para los microbiólogos de suelo, que se degradación, e inmersos en este medio encon- proyecta en aspectos aplicados tales como la tramos a la biota. A nivel macroscópico se de- fertilidad de los suelos y su sustentabilidad. tectan complejos de arcilla, materia orgánica, Se ha estimado que un gramo de suelo con- partículas de arena, todo en su conjunto for- tiene aproximadamente 4 x 107 células pro- mando agregados que constituyen una matriz. cariotas. El estudio de esta diversidad puede Los procariotes son los componentes predomi- encararse aplicando métodos de cultivo directo nantes de la biomasa del suelo, los cuales se o métodos moleculares de metagenómica. Los encuentran adheridos o adsorbidos a las partí- métodos tradicionales de aislamiento y cultivos culas del suelo. Dada la heterogeneidad de la en medios nutritivos y condiciones de labora- matriz del suelo, los microorganismos pueden torio son apropiados pero insuficientes. Se ha constituir micro-ambientes sobre la superficie estimado que solamente entre 0.1% y 1.0% de y en los poros que se forman. La persistencia las bacterias de suelo son cultivables, lo cual y el metabolismo de los microorganismos del remarca la magnitud de la comunidad aún no suelo dependen de la disponibilidad de agua examinada. Estos números dan una idea de la y nutrientes. El suelo es un ambiente que ex- magnitud de la complejidad, y del tamaño de perimenta cambios drásticos en sus niveles la “caja negra” que representa descubrir los

Biotecnología y Mejoramiento Vegetal II 159 elementos de esa biodiversidad presentes en el protocolo de extracción aplicado y la natura- una “pizca” de suelo. Es importante tener en leza del suelo. Por otro lado y aplicando un pro- cuenta que la metagenómica es aplicable no cedimiento basado en cinética de reasociación sólo a examinar la diversidad microbiana de un de ADN, se ha estimado que 1 gramo de suelo ambiente natural con el objetivo último de lo- comprendería entre 2.000 y 18.000 genomas. grar el ensamble de genomas a partir de datos - Según el vector usado para el clonado del fragmentados (“meta análisis”), sino también ADN metagenómico de suelo, se estima reco- revelar un espectro amplio de productos géni- mendable examinar más de 10 7 clones plas- cos con potencialidades biotecnológicas. mídicos o 106 clones BACs , con insertos de un tamaño de 5 kb y 100 kb, respectivamente. Métodos de análisis Para lograr representación significativa de los El análisis metagenómico implica el aisla- genomas de miembros raros de la comunidad miento del ADN de la muestra, clonado de frag- (menos del 1%) se ha calculado necesario se- mentos de ADN usando vectores plasmídicos cuenciar 10.000 Gb del ADN extraído de suelo. y transformación en alguna cepa apropiada de Por otro lado, se ha estimado en 1013 genes en la bacteria E. coli (Figura 1). Aparentemente, un gramo de suelo provinentes de al menos 103 el procedimiento es experimentalmente muy especies, lo que indicaría que hay al menos 106 directo sin embargo el metagenoma compren- genes nuevos en 1 gramo de suelo (Schloss y de a numerosos genomas individuales que Handelsman, 2006). El objetivo de establecer contribuyen, con distintos grados de represen- el metagenoma teniendo en cuenta estos nú- tatividad, al tamaño y la complejidad del mis- meros adquiere un valor relativo cuando se los mo. Esto impacta en el tamaño de la muestra pone en el contexto de los recursos tecnológi- a examinar. cos y financieros necesarios para su abordaje. La etapa siguiente al clonado molecular Actualmente, con el desarrollo de tecnologías constituye la oportunidad de aplicar estrategias de secuenciación de alta generación de da- alternativas y en general exigen la creatividad tos, basadas en el denominado procedimien- del investigador a los efectos de maximizar las to de pirosecuenciación que no requiere de la posibilidades de alcanzar resultados deseables construcción de bibliotecas metagenómicas, e interesantes. En términos generales, los pro- el tiempo requerido para la resolución de un cedimientos de análisis de clones interesantes metagenoma adquiere una dimensión real. Sin se pueden agrupar en aquellos basados en se- embargo, la limitación de estos procedimientos cuenciación masiva de ADN y en aquellos otros consistente en generar lecturas relativamen- basados en la expresión heteróloga de funcio- te cortas –aproximadamente entre 100 y 200 nes buscadas. Adoptaremos en este texto el nucleótidos- complica la tarea posterior de en- anglicismo screening para referirnos a la etapa samble de secuencias parciales en un genoma experimental de análisis de clones e identifica- completo. ción de genes y secuencias de interés. No obstante, y aún haciendo uso de la tecno- Para lograr una idea de la envergadura de la logía precedente basada en el procedimiento tarea de screening hagamos la siguiente refe- de Sanger, el costo de secuenciación masi- rencia a algunas estimaciones numéricas so- va es caro en general, y más aún para nues- bre el tamaño del ADN metagenómico. tro país. Sin embargo, y como se trata en las - Es muy probable que el número de geno- secciones siguientes de este capítulo, existen mas distintos presentes en el suelo refleje el estrategias alternativas a la secuenciación de tipo y características del mismo; aquellos de- bibliotecas metagenómicas, que “asisten” la dicados a la agricultura con un buen nivel de búsqueda y resultan útiles para revelar diversi- materia orgánica y humedad presentarán una dad y descubrir nuevos genes. diversidad más amplia que un suelo oligotrópi- co y características extremas de pH, humedad Screening basado en el análisis del gen y/o salinidad. A partir de 1 gramo de suelo se 16S rARN puede obtener entre 1-500 ug de ADN, según Este método está basado en el análisis de la

160 Biotecnología y Mejoramiento Vegetal II secuencia del gen que codifica para el gen que ción acerca de la diversidad y de la evolución codifica la subunidad 16S r ARN de los- ribo de poblaciones microbiana, sin embargo el gen somas procarióticos. Todos los microorganis- 16S representa aproximadamente el 0.05% mos poseen este ARN que presenta una alta de un genoma procariota. Se ha demostrado similitud entre ellos pero con diferencias sufi- que microorganismos que poseen secuencias cientes para su uso como medida de distancias de 16S rADN idénticas pueden poseer geno- evolutivas. Existe una amplia base de datos de mas muy distintos y presentar diferentes fisio- secuencias del 16S rARN de organismos diver- logías y temperaturas óptimas de crecimiento. sos que ha permitido elaborar un árbol filoge- Los miembros de una comunidad microbiana nético llamado árbol de la vida. Esto permite pueden diferir enormemente en sus activida- usar los datos metagenómicos de 16S rADN des bioquímicas e interacciones, no sólo entre generado a partir de una determinada muestra especies sino dentro de una misma especie. ambiental, para posicionar filogenéticamente a Por ende la filogenética nos dice en el mejor las distintas secuencias, y eventualmente in- de los casos quiénes son los miembros de la ferir la biología y ecología de los mismos. El comunidad pero muy poco acerca de qué es análisis del (los) gen (es) 16S rARN es econó- lo que hace cada miembro. Uno de los prin- micamente accesible a los laboratorios y es útil cipales objetivos de la ecología microbiana es para evaluar diversidad microbiana. En parti- el poder asociar la identidad de los diferentes cular, ha sido efectivo para revelar la abundan- microorganismos dentro de un hábitat con los cia de especies, y la estructura poblacional de procesos que ellos llevan a cabo en ese am- muestras de suelo (Aguilar et al., 2006). biente. Los métodos metagenómicos, que se- La amplificación mediante la PCR, usando rán discutidos más adelante, comienzan a dar oligonucleótidos cebadores que hibridan las respuestas a esta segunda cuestión. regiones conservadas de los genes 16S rARN de bacterias y arqueas, genera fragmentos Construcción de bibliotecas genómicas que pueden ser clonados y secuenciados. El ambientales tamaño del ADN resultante de la amplificación, Muchos de los métodos corrientemente uti- de aproximadamente 1,4 Kb se inserta en un lizados en la construcción de bibliotecas am- plásmido vector tipo TA, seguido de transfor- bientales, son adaptaciones de las técnicas mación de E. coli. El ADN usado como molde empleadas para la construcción de bibliotecas puede ser el ADN metagenómico o también de insertos grandes de organismos eucariotas, el proveniente de una biblioteca metagenómi- tales como clonado en cromosomas artificiales ca (Furlong et al., 2002). Los datos primarios (BACs) y lísis celular en tacos de agarosa. Sin pueden ser examinados con programas com- embargo, en la construcción de genotecas am- putacionales apropiados que permiten evaluar bientales se encuentran obstáculos que no se la predominancia de especies (DOTOUR), y el presentan en la construcción de bibliotecas de grado de similitud entre los miembros de dos organismos aislados. La diversidad de nichos comunidades (SONS, LIBSHUFF, http://www. ecológicos plantea desafíos interesantes a la libshuff.mib.uga.edu). hora de diseñar una estrategia adecuada para El método tiene sus limitaciones. Por ejem- la obtención de un ADN de calidad apropia- plo, a- provee un marco filogenético de la co- da y que el mismo represente la población de munidad pero da información escasa sobre la microorganismos presentes en ese ambiente. funcionalidad de la misma; b- como todo pro- En la actualidad se han preparado diversas bi- cedimiento basado en PCR, no todos los ge- bliotecas metagenómicas de variados ambien- nes rARN amplifican igualmente, resultando en tes, en esta sección discutiremos algunos de la sub-estimación de especies, y c– los genes los aspectos críticos a tener en cuenta en su 16S rARN pueden existir en múltiples copias preparación. no idénticas. La primera biblioteca ambiental se constru- Es claro entonces que el análisis genético yó a partir de ADN de microorganismos oceá- empleando 16S rARN provee valiosa informa- nicos, los que fueron concentrados a partir de

Biotecnología y Mejoramiento Vegetal II 161 agua de mar antes de la extracción de ADN. de resinas de intercambio catiónico, seguido Sin embargo en el caso de otros habitat tales de gradiente de densidad o centrifugación dife- como el suelo, existen procedimientos alterna- rencial. En este caso el ADN obtenido es casi tivos, cada uno con sus ventajas y desventajas. exclusivamente procariótico. Además, el ADN La construcción de una biblioteca metagenó- recuperado por este método parece ser me- mica de suelo se inicia con la toma de muestra. nos contaminado con compuestos de la matriz Como las muestras de suelo son heterogéneas, compuestos, entre ellos sustancias húmicas. los datos fisicoquímicos tales como tamaño de Además, el tamaño medio de los ADN aislados partícula, tipo de suelo, contenido de agua, pH, es mayor que el que suele obtenerse mediante temperatura y las plantas que lo cubren son lisis directa y, por lo tanto, es más adecuado útiles para la evaluación y comparación de los para la generación de bibliotecas de insertos resultados obtenidos en estos estudios. Dado grandes. que las poblaciones microbianas son grandes, Como los diferentes microorganismos del los volúmenes de muestras pueden ser peque- suelo tienen diferentes susceptibilidades a los ños. Durante la toma de muestra necesaria- métodos de lisis celular, las secuencias pre- mente se generan perturbaciones que pueden sentes en el ADN aislado y en las bibliotecas modificar la composición de las comunidades dependen del método de extracción. No se ha microbianas del suelo, por lo que es importante estudiado cuál es el sesgo que se introduce en disminuir al mínimo el tiempo de transporte y las bibliotecas debido al método de extracción, sin embargo es de presumir que el ADN aisla- almacenamiento de la misma. do por lisis directa represente mejor la diversi- Los métodos de extracción de ADN se pue- dad microbiana de una muestra de suelo, ya den dividir en dos categorías: a) lisis directa de que este no incluye el paso de separación de las células contenidas en la matriz de la mues- las células, por lo tanto serán lisados aún los tra seguido de la separación del ADN de la ma- microorganismos que se adhieren fuertemente triz y los desechos celulares, o b) la separación a las partículas. de las células de la matriz del suelo seguido por El análisis metagenómico puede requerir de lisis celular. El ADN crudo recuperado por am- bibliotecas con insertos de tamaño grande o bos métodos se purifica por los procedimientos pequeño. Las bibliotecas de insertos pequeños habituales. La recuperación de ADN aislado de son suficientes en el caso en que el análisis in- diferentes tipos de suelo utilizando ambos tipos volucre el estudio de un único gen o un peque- de protocolos van desde menos de aproxima- ño grupo de genes. Por el contrario, se requie- damente 1 μg a 500 μg de ADN por gramo de ren insertos mayores para el estudio de rutas suelo, sin embargo el rendimiento es entre 10 metabólicas completas, procesos complejos u y 100 veces mayor por lisis directa cuando se organización genómica. Independientemente compara para una misma muestra. Para lograr del tamaño de inserto requerido, la prepara- la lisis celular directa, se utilizan una combina- ción de ADN es crítica para el éxito del análisis. ción de tratamientos enzimáticos, detergente y En el caso de emplear digestiones parciales de altas temperaturas. Además del ADN de las cé- ADN para la construcción de la biblioteca se re- lulas procariotas lisadas, también se recupera quiere partir de un ADN de un tamaño prome- ADN extracelular y eucariota. dio 3 veces mayor al de los insertos deseados. Los métodos de extracción de ADN basa- Por ende si se desea un inserto de 100 kb se dos en la separación de células como una deberá partir de un ADN de tamaño promedio > etapa previa a la lisis de las mismas, aunque 300 kb. Un ADN de este tamaño es muy vulne- menos eficientes en términos de cantidad de rable a las fuerzas de cizalla que se producen ADN recuperado son menos dañinos para la en el manipuleo de las soluciones, centrifuga- integridad del mismo. La separación de los mi- ciones, congelado-descongelado, etc. Por ello croorganismos de la matriz del suelo se logra en estos casos la lisis de las células para la mediante suaves fuerzas mecánicas como los liberación del ADN y su posterior digestión par- procedimientos de mezcla, la rotación del pilón cial con enzimas de restricción, se realiza en en mortero o químicos, tales como la adición tapones de agarosa.

162 Biotecnología y Mejoramiento Vegetal II Dependiendo del tamaño promedio de los in- ADN ambiental debe contener el/los gen(es) sertos, las bibliotecas se construyen emplean- que codifican las funciones buscadas, y es do diferentes tipos de vectores. Así las de in- deseable que las secuencias correspondien- sertos pequeños (menores a 15 kb) emplean tes se encuentren representadas en una fre- vectores plasmídicos, en tanto que las de in- cuencia alta en el ADN ambiental; segundo, sertos de hasta 40 kb hacen uso de cósmidos o los procedimientos de preparación del ADN fósmidos, y BACs para más de 40 kb. Los vec- metagenómico y de clonado molecular deben tores tipo BACs con número de copia inducible permitir la recuperación e integridad de genes son particularmente útiles, dado que permiten y operones; y finalmente, los genes deben ser un mantenimiento en la célula huésped a bajo detectables genéticamente o fenotípicamente. número de copia, pero permiten el incremento Resulta obvio al encarar un proyecto de este del número de copias para facilitar el estudio tipo, que la correcta selección del ambiente de expresión. apropiado, constituya una de las etapas fun- Si bien el huésped de elección para la cons- damentales para darle una base probabilística trucción y mantenimiento de todas las bibliote- razonable de éxito a nuestro diseño experi- cas publicadas es E.coli, es fácil de notar que mental. Por ejemplo, en un trabajo publicado la búsqueda de fenotipos interesantes se verá por Rhee et al., (2005), cuyo objetivo fue el restringida a aquellos que nos permita expre- aislamiento de genes nuevos codificantes de sar este huésped. Se han construido vectores enzimas termoestables con actividad esterasa, se realizó la búsqueda sobre el metagenoma cosmídicos y BACs que permiten la transferen- de muestras de suelo de sitios con aguas ter- cia de bibliotecas producidas en E. coli a otros males cuyas temperaturas fueron entre 65 y 90 especies huéspedes tales como Streptomyces oC (Rhee et al., 2005). Esta consideración da o Pseudomonas (Martínez et al., 2004; Wexler cierta certeza sobre la presencia de las funcio- et al., 2005). nes buscadas en la muestra pero, no asegura que la representación de los genes buscados Screening basado en la exresión funcional en el metagenoma, sea suficientemente alta Otra forma de acceder al metagenoma, par- para lograr su recuperación. Por ejemplo, la ticularmente cuando se trata de ambientes búsqueda de clones con actividad lipolítica en complejos en cuanto a su diversidad poblacio- una biblioteca proveniente de ADN de suelo, nal y a su alta densidad de microorganismos resultó en la identificación de un clon entre diferentes, es la búsqueda de genes que ge- 730.000 clones examinados. Con el propósito neren productos definidos e identificables, o de aumentar la probabilidad de detección de asociados a determinadas actividades que se genes de interés se ha recurrido a la inclusión pueden evaluar in vitro aplicando bio-ensayos. en el diseño experimental de etapas de enri- La ventaja más importante de este aborda- quecimiento previas a la construcción de las je es el desarrollo de un proyecto acotado de bibliotecas génicas. En la mayoría de estos menor envergadura que el análisis alternativo estudios, las fuentes de carbono y/o nitrógeno dirigido a la secuenciación masiva del metage- han sido los criterios selectivos de especies mi- noma. Este criterio de screening comprende crobianas con genes deseados que son reque- varias estrategias agrupadas dentro de la lla- ridos para su desarrollo en esas condiciones mado metagenómica funcional. A continuación de incubación. El análisis metagenómico de se describirán algunas estrategias que ilustran cultivos enriquecidos ha demostrado su poten- formas ingeniosas de abordar el conocimiento cialidad para el aislamiento de genes determi- del metagenoma con un propósito directo de nantes de funciones catalíticas, degradativas, descubrimiento y uso de propiedades específi- y nuevos antibióticos a partir de suelo y otros cas codificadas por el metagenoma. ambientes (Entcheva et al., 2001; Gupta et al., El usufructo exitoso de actividades micro- 2002; Knietsch et al., 2003; Daniel et al., 2004; bianas o vías metabólicas requiere del logro Mori et al., 2008). Sin embargo, se deben con- de varias etapas críticas. En primer lugar, el siderar sus limitaciones: Las poblaciones mi-

Biotecnología y Mejoramiento Vegetal II 163 crobianas que contienen los genes deseados rasas que forman un grupo nuevo. Estos ge- no responden eficientemente a las condiciones nes resultaron del análisis de una biblioteca de enriquecimiento, su crecimiento lento deter- consistente en 4 Gb de ADN, equivalente a 106 mina baja representación en la muestra previa genes, sugiriendo la obvia y baja representa- a la extracción de ADN. ción de dichos genes en la biblioteca. El uso Los métodos de screening funcional son po- del procedimiento experimental de selección tencialmente útiles para descubrir nuevas va- positiva hizo posible su detección que de otra riantes de funciones interesantes. Su eficiencia, manera –por ejemplo mediante secuenciación- usando bibliotecas metagenómicas, depende a hubiera resultado una tarea casi imposible. No su vez de la eficiencia y sensibilidad del ensa- obstante, el número de clones/muestras indi- yo in vitro y también de la compatibilidad del viduales de una biblioteca que son necesarios sistema de trascripción y traducción de la cé- examinar, sigue siendo experimentalmente un lula hospedadora para transcribir y traducir el/ número grande. Con el objetivo de encontrar los gen(es) contenidos en el clon transgénico. resultados en tiempo real y examinar un univer- Aunque la bibliografía demuestra que el hospe- so grande, se han diseñado estrategias de alta dador más usado es Escherichia coli, el rango productividad (en Inglés son referidas como de hospedadores se ha ampliado en los últi- “high-throughput screen”), las cuales incorpo- mos años a otras microorganismos tales como ran sistemas automatizados y robotizados con Streptomyces lividans, Pseudomona putida, alta tecnología instrumental. y Rhizobium leguminosarum (Martínez et al., Otro enfoque es el estudio de antibióticos 2004; Li et al., 2005) e incluso eucariotes (Al nuevos en metagenoma de suelo el cual ha Hasani et al., 2003). Esto permitirá un mayor expandido nuestra visión de las comunicacio- acceso hacia la expresión de un amplio rango nes entre comunidades microbianas. Se ha de actividades génicas del medio ambiente. encontrado que concentraciones sub-inhibido- El análisis metagenómico basado en identi- ras de crecimiento inducen respuesta del tipo ficación de clones que expresan una determi- quórum sensing, aún cuando los compuestos nada función ha sido exitoso cuando se lo ha no muestran similitud con las conocidas homo- combinado al uso de mutantes de E. coli. Por serina lactonas que han sido descritas como ejemplo, Daniel y su grupo usaron mutantes de inductores naturales en bacterias. Esto sugiere E. coli deficientes en sus sistemas antiporter la existencia de un diálogo comunicativo entre Na+ (Li+)/H+ para descubrir dos antiporters nue- microorganismos que activan funciones en el vos a partir del screening de una biblioteca de entorno. Además, este hallazgo ha sido adop- aproximadamente 1,5 x 106 clones. El procedi- tado para el screening de moléculas que fun- miento experimental consistió en transferir los cionan como inductoras de quórum sensing y clones a E. coli, y evaluar el crecimiento de los eventualmente también como antibióticos. Esta transformantes en cajas de petri conteniendo oportunidad condujo al diseño de un procedi- un medio de cultivo con 7,5 mM LiCl (Majernik miento de screening con alta eficiencia cuanti- et al., 2001). Aplicando un procedimiento simi- tativa de análisis de clones e identificación de lar se identificaron genes participantes en la compuestos que funcionan como inductores de biosíntesis de biotina, a partir de ADN de suelo genes que se encuentran bajo el control de (Entcheva et al., 2001). un promotor sensible a quórum sensing. Este Por otro lado, la selección por resistencia sensor consiste en el promotor del gen luxR fu- a antibióticos ha conducido al aislamiento de sionado al gen reportero gfp, residente en un nuevas formas de resistencia a tetraciclina y a plásmido replicativo en una variante de E. coli aminoglicósidos a partir de muestras de la bio- que no induce quórum sensing. En el caso que ta de la boca humana, y de suelo, respectiva- el ADN metagenómico exprese un inductor del mente. El descubrimiento de resistencia a ami- promotor luxR, se sintetizará la proteina GFP noglicósidos es un buen ejemplo del uso del revelándose fluorescencia. Este procedimiento screening funcional. Se identificaron 9 clones, acoplado a cell sorting activada por fluorescen- de los cuales 6 codifican para 6´-acetiltransfe- cia, permite capturar aquellos clones potencial-

164 Biotecnología y Mejoramiento Vegetal II mente productores de compuestos de quorum las poblaciones provenientes del suelo con- sensing (Figura 2) (Lynn et al., 2005; Uchiyama centrando aquellas asociadas a una función et al., 2005). (por ejemplo degradación de un compuesto Otro método de enriquecimiento se basa en hidrocarburo que es asimilado). Sin embargo, el uso de isótopos estables, en el cual se admi- el método tiene sus limitaciones principalmente nistra -como única fuente de carbono- un sus- generadas por el llamado “cross feeding”, en trato marcado con 13C a una comunidad de mi- el cual bacterias carentes de esa propiedad croorganismos provenientes de suelo. Aquella pueden desarrollar en el medio a expensas comunidad bacteriana capaz de utilizar ese de metabolitos provistos por otras bacterias sustrato incorporará 13C en sus macromolé- (Radajewaski et al., 2000) culas, particularmente en ADN, determinando que el ADN será más denso que el ADN normal Lo no cultivable se vuelve cultivable de la bacteria. El procedimiento continúa con El estudio metagenómico del biofilm que la ultracentrifugación del ADN en gradientes de se forma sobre las aguas que drenan de una densidad de CsCl para separar el ADN marca- mina de hierro abandonada, ubicada en la Iron do del ADN normal o no marcado. Este ADN Mountain en Richmond, California ha permitido puede separarse de la columna de gradiente, establecer la estructura de la comunidad y las someterse a diálisis y posteriormente concen- funciones metabólicas y biogeoquímicas. Esa trarse por precipitación etanólica. El ADN se agua de drenaje constituye un medio extrema- fragmenta y clona en vectores plasmídicos. La damente adverso, su acidez es de pH 1.0 y biblioteca resultante puede analizarse median- posee un alto contenido en metales. También te un screening funcional, o haciendo uso de es rica en pirita (FeS2). No hay fuentes asimi- sondas dirigidas a revelar un determinado gen. lables de carbono o nitrógeno más allá de las El método tiene potencialidad para fraccionar que pueden derivar del aire. Tyson et al. (2004)

Figura 2. Aislamiento de clones provenientes de un biblioteca metagenómica, que expresan productos génicos inductores/activadores de quórum sensing. LuxR es un producto génico que interacciona con moléculas efectoras producidas por microorganismos, activador de un promotor sensible fusionado al gen reportero para GFP (green fluorescent protein) facilitando su detección.

Biotecnología y Mejoramiento Vegetal II 165 secuenciaron una biblioteca construida con la formulación del medio de cultivo y logro ADN extraído del biofilm, y lograron ensam- de su cultivación in vitro. blar a partir de datos metagenómicos los ge- nomas de miembros del grupo Leptospirillum Potencialidades de la metagenómica y Ferroplasma tipo II, también una sustanciosa Las posibilidades que este nuevo campo información de otros miembros de la comuni- ofrece son alucinantes. Descifrar la enorme dad. El análisis de estos resultados fue muy gama de procesos e interacciones que ca- sugestivo. Los autores notaron que no habían racterizan las comunidades microbianas en la detectado la presencia de Leptospirillum fe- Tierra puede conducir a avances en la salud rrooxidants, la especie fijadora de N2. Por el humana, la mejora de la comprensión a gran contrario, el genoma de la comunidad reveló escala de los cambios climáticos y atmosfé- la presencia de miembros pertenecientes a ricos, los métodos para obtener cultivos más los grupos II y III de Leptospirillum. El género fuertes y nutritivos, nuevos enfoques para la Leptospirillum ha sido sub-dividido en 3 gru- limpieza de la contaminación ambiental, y el pos, de los cuales aún no se había logrado cul- desarrollo de nuevas fuentes de energía reno- tivar a representativos del grupo III. El estudio vable. Estos son sólo algunos ejemplos de las también reveló la presencia de genes nif (ge- muchas posibles aplicaciones prácticas de la nes de fijación biológica de nitrógeno) que los metagenómica. autores asociaron al genoma de Leptospirillum El ser humano siempre vivió en un mundo grupo III. Estos datos permitieron concluir que dominado por los microbios, y la estrecha re- la contribución de esta población al consorcio lación entre los microbios y los seres humanos del biofilm de la mina ácida, es el aporte de es un tema antiguo. Las células microbianas nitrógeno asimilable, y además, el conocimien- que viven en el cuerpo humano adulto son diez to de las capacidades metabólicas inferidas veces más numerosos que las células huma- de los datos metagenómicos guió los pasos nas. Los genomas microbianos de las comuni- siguientes dirigidos a lograr la cultivación en dades que viven dentro y en el cuerpo humano el laboratorio de Leptospirillum grupo III y a la (el microbioma humano) contiene muchos más definición de la especie L. ferrodiazotrophum genes que el genoma humano. Estudiar el mi- (Tyson et al., 2005). De la misma manera, estu- crobioma humano puede dar lugar a valiosas diando los datos resultantes, se ha especulado nuevas herramientas en nutrición humana y que Ferroplasma y Leptospirillum sp derivarían animal, el descubrimiento de medicamentos, la energía a partir de la oxidación del hierro. y en medicina preventiva. Este estudio tam- Además, se encontró que todos los genomas bién puede ampliar mucho la profundidad de muestran genes asociados con la remoción de nuestra comprensión de enfermedades com- elementos potencialmente tóxicos, tales como plejas tales como obesidad, el cáncer y ciertas sistemas de flujo de protones y bombas de ex- enfermedades inmunológicas, como el asma clusión de metales (Tyson et al., 2004). (Turnbaugh et al., 2006). El estudio de las comunidades en el drenaje La inmensa mayoría de nuestros microorga- de aguas de la mina ácida de Richmond, es un nismos asociados viven en el intestino. Estos modelo de complementariedad de funciones 10 a 100 billones microorganismos desempe- asignables a miembros del consorcio micro- ñan funciones tales como la extracción de nu- biano. Es posible imaginar que la proyección trientes y calorías de componentes de nuestras de este modelo de estudio a otros sistemas dietas y la síntesis de vitaminas esenciales y ambientales no resulte fácil. La extrema adver- aminoácidos. Las bacterias intestinales tam- sidad de la mina ácida limita la diversidad de bién ayudan a detoxificar productos químicos genomas en la comunidad y facilitó el análisis potencialmente nocivos que pueden estar pre- sentes en lo que comemos. Algunos de los mi- El mensaje intrínseco de este descubri- crobios que viven en y sobre el cuerpo humano miento de componentes importantes de las desempeñan un papel fundamental en la de- comunidades del suelo, aplicando un análi- fensa contra agentes patógenos. Esta relación sis metagenómico, es su uso como guía en mutuamente beneficiosa nos ayuda a prote-

166 Biotecnología y Mejoramiento Vegetal II gernos de enfermedades al tiempo que se da vectores de tipo BAC. Se generaron dos biblio- a los microbios un lugar para vivir. El uso de tecas metagenómicas una con un tamaño de metagenómica para obtener un conocimiento inserto promedio de 27 kb y otra de 44.5 kb. más profundo de las comunidades microbianas Pese a que el tamaño de inserto no es mayor al en el cuerpo humano podría ser inmensamente de una biblioteca convencional construida con valioso en la comprensión tanto de microbios vectores de tipo cósmido o fago lambda, es la dañinos como de beneficiosos y puede - con primera publicación en la que se informa el clo- ducir a formas más efectivas de diagnosticar, nado de fragmentos de ese tamaño a partir de tratar y prevenir enfermedades. las poblaciones microbianas de suelo. A partir El enfoque metagenómico ofrece la posibi- de estas bibliotecas logran identificar clones lidad no sólo de analizar la diversidad filoge- que expresan fenotipos tales como, lipasas y nética de diversos ambientes y biofilms, sino amilasas. De igual modo Brady y col, recupe- también de localizar los genes y operones que raron a partir de una biblioteca cosmídica de codifican propiedades de interés biotecnoló- ADN de suelo el conjunto de genes necesarios gico. La metagenómica ha dado lugar al des- para la síntesis de violaceína, un antibiótico de cubrimiento y caracterización de una amplia gama de biocatalizadores, que revela mucho amplio espectro,. acerca de la diversidad natural de las enzimas Aunque las bibliotecas metagenómicas y los factores que influyen en sus funciones. constituyen en la actualidad la herramienta Uno de los principales enfoques para la de- más poderosa para evaluar la diversidad fun- tección de nuevos biocatalizadores implica la cional de comunidades microbianas naturales, detección funcional lo que requiere la expre- no cubren los genomas de baja abundancia en sión de genes heterólogos generalmente en ambientes complejos como los suelos. Como Escherichia coli. Mediante el enfoque metage- resultado, la frecuencia de clones con un feno- nómico se estudian hábitats tan diversos como tipo deseado en una biblioteca puede ser muy intestinos de termitas, el rumen de rumiantes baja. Esto implica la búsqueda y selección en como ciervos o vacas, las muestras de suelo miles de clones, lo que significa una tarea larga de los desiertos y glaciares, así como hábitats y tediosa. En la actualidad se dispone de equi- extremos como géiseres, mar abierto de agua pos con tecnologías que facilitan la recolección o chimeneas hidrotermales de aguas profun- de colonias, y la inoculación en placas de nu- das. Es de esperar que la composición genó- merosos clones al mismo tiempo. mica de las poblaciones microbianas en estos Mientras que la industria de alimentos y de hábitats se diferencien unos de otros, y con detergentes se concentran en un número limi- ella los biocatalizadores y biomoléculas que tado de reacciones enzimáticas y sustratos, las componen las respectivas bibliotecas metage- industrias química y farmacéutica trabajan con nómicas. La metagenómica industrial se cen- miles de moléculas química y estructuralmente tra principalmente en procariotes, ya que sus diversas, y la producción de cada uno de estos genomas puede ser objeto fácilmente de las requiere soluciones enzimáticas individuales. herramientas de selección funcional disponi- En consecuencia, debido a la riqueza de bio- bles en la actualidad, y porque se supone que catalizadores potencialmente útiles, el uso de la mayor diversidad se encuentra entre estos recursos microbianos es cada vez más difun- microorganismos. Las enzimas se utilizan en dido en las industrias químicas y son conside- una amplia gama de aplicaciones e industrias. Su versatilidad permite su uso tanto en los pro- rados indispensables para la química orgánica cesos para degradar polímeros naturales entre moderna. Es obvio que existe una amplia de- ellos almidón, celulosa y proteínas, así como manda de nuevos enzimas y biocatalizadores, para las síntesis enantioselectiva asimétrica de y la metagenómica aparece como una de las productos químicos, aunque hay muchas más tecnologías con mayor potencialidad para pro- aplicaciones. veer de las moléculas necesarias. En el año 2000 Rondon y col. publican las Es creciente la conciencia y la percepción primeras bibliotecas de suelos clonados en global de que la disponibilidad de combusti-

Biotecnología y Mejoramiento Vegetal II 167 bles fósiles no renovables no es sostenible de los disacáridos en azúcares simples. Este en el futuro próximo, y se deberá superar esa gen fue aislado a partir de microbios presen- dependencia energética. Además, las emisio- tes en el rumen de vaca. Mediante ingeniería nes de gases de invernadero como resultado genética este gen ha sido modificado de forma de la quema de combustibles fósiles son una tal de dirigir el producto de su expresión hacia de las causas principales del calentamiento vacuolas, de esta forma las enzimas digestivas global. Estos factores determinan la búsqueda permanecen almacenadas hasta su cosecha de combustibles renovables, y amigables para (Sticken, 2008). Estos son algunos ejemplos el medio ambiente sea una de las principales que ponen de manifiesto la potencialidad de prioridades para el mundo. Una fuente de ener- los enfoques metagenómicos tanto en su pro- gía emergente es el etanol (alcohol de grano)- pósito biotecnológico como en el análisis de un biocombustible de alto octanaje de derivado las comunidades ambientales. En definitiva, la de maíz, caña de azúcar, o de otro tipo de fuen- metagenómica surge hoy como una disciplina tes agrícolas. El etanol celulósico se fabrica a nueva que nos permitirá ampliar nuestro cono- partir de la celulosa que se encuentra en el co- cimiento de la microbiología hasta dimensio- mún de los desechos agrícolas tales como la nes aún inimaginables. fibra de maíz, tallos de maíz, paja de trigo, y otras como la biomasa derivada del mijo y el Lecturas recomendadas miscanthus. Pero el proceso que convierte la celulosa a partir de residuos agrícolas a eta- Aguilar O.M., M. V. López , M. Donato, B. Morón, nol utilizable depende de un ingrediente esen- M. E. Soria-Diaz, C. Mateos, A. Gil-Serrano, C. cial: las comunidades microbianas. En primer Sousa, and M. Megías. 2006. Phylogeny and lugar, varios tipos de microorganismos deben nodulation signal molecule of rhizobial popula- tions able to nodulate common beans -other than trabajar en conjunto para transformar la celulo- the predominant species Rhizobium etli- present sa a partir de desechos agrícolas en azúcares. in soils from the Northwest of Argentina. Soil Bio- Luego, los azúcares son fermentados-también logy and Biochemistry 38:573-586. por los microbios- para producir etanol. Al-Hasani, K., Simpfendorfer, K., Warden, H., Vado- Las vacas, con la ayuda de las bacterias, las, J., Zaibak, F., Villain, R., and Ioannou, P.A. son capaces de convertir las fibras vegetales 2003. Development of a novel bacterial artificial (celulosa) en energía, pero este es un proceso chromosome cloning system for functional stu- complejo para mimetizarlo para la producción dies. Plasmid 49:184-187. de biocombustibles. Brady SF, Chao CJ, Handelsman J, Clardy J. 2001. La enzima que permite que una vaca digiera Cloning and heterologous expression of a natu- los pastos y otras fibras vegetales puede ser ral product biosynthetic gene cluster from cDNA. Org Lett 3:1981-1984. usada para convertir otras fibras vegetales en Daniel, R. 2005. The metagenomics of soil. Nature azúcares simples. Transformar las fibras -ve 3:470-478. getales en azúcar requiere de tres enzimas. Entcheva P., Liebl, W., Johann, A., Hartsch, T., and Estas tres enzimas han sido recientemente in- Streit, W.R. 2001. Direct cloning from enrichment troducidas en una variedad de maíz denomi- cultures, a reliable strategy for isolation of com- nada Spartan III, que deriva de dos versiones plete operons and genes from microbial consor- anteriores. La primera versión contiene una tia. Appl. Environ. Microbiol. 67:89-99. enzima que procede de un microbio que vive Environmental Microbiology www.blackwell-syner- en agua manantial caliente, y que es capaz de gy.com/toc/emi/7/12 transformar el gran polímero de celulosa en Furlong, M.A., Singleton, D.R., Coleman, D.C. and fragmentos de menor tamaño. La segunda ver- Whitman, W.B. 2002. Molecular and Culture-Ba- sed Analyses of Prokaryotic Communities from sión contiene un gen de un hongo natural que an Agricultural Soil and the Burrows and Casts codifica para una enzima capaz de clivar estos of the Earthworm Lumbricus rubellus. Appl. En- fragmentos de celulosa en disacáridos. En la viron. Microbiol. 68:1265-1279. última versión se introdujo el gen codificante Knietsch, A., Bowien, S., Whited, G., Gottschalk, G. de una enzima capaz de catalizar la hidrólisis and Daniel, R. 2003. Identification and Charac-

168 Biotecnología y Mejoramiento Vegetal II terization of Coenzyme B12-Dependent Glycerol grini, V., Mardis, E.R., and Gordon, J.I. 2006. Dehydratase- and Diol Dehydratase-Encoding An obesity-associated gut microbiome with in- Genes from Metagenomic DNA Libraries Deri- creased capacity for energy harvest. Nature ved from Enrichment Cultures. Appl. Environ. 444:1027-1031. Microbiol. 69:3048-3060. Tyson, G.W., Chapman, J., Hugenholtz, P., Allen, Lynn, L., Williamson B.R., Borlee, R. Schloss P.D., E.E., Ram, R.J., Richardson, P.M., Solovyev, Guan C., Allen, H.K., and Handelsman, J. 2005. V.V., Rubin, E.M., Rokshar, D.S., and Banfield, Intracellular screen to identify metagenomic J.F. 2004. Community structure and metabolism clones that induce or inhibit a quorum sensing through reconstruction of microbial genomes biosensor. Appl. Environm. Microbiol. 71:6335- from the environment. Nature 428:399-428. 6344. Tyson, G.W., Lo, I., Baker, B.J., Allen, E.E., Hug- Majernik, A., Gottschalk, G., Daniel, R. 2001. Scree- enholtz, P., and Banfield, J.F. 2005. Genome- ning of Environmental DNA Libraries for the Directed Isolation of the Key Nitrogen Fixer Presence of Genes Conferring Na super(+)(Li Leptospirillum ferrodiazotrophum sp. nov. from super(+))/H super(+) Antiporter Activity on Es- an Acidophilic Microbial Community. Appl Envi- cherichia coli: Characterization of the Recovered ronm. Microbiol. 71:6319-6324. Genes and the Corresponding Gene Products . Uchiyama, T., Abe, T., Ikemura, T. and Watanabe, J. Bacteriol. 183:6645-6653. K. 2005. Substrate-induced gene-expression of Martínez, A. Kolvek, S.J., Yip, C.L.Y., Hopke, J., environmental metagenome libraries for isolation Brown, K.A., MacNeil, I.A., and Osbourne, M.S. of catabolic genes. Nature 23:88-93. 2004. Genetically modified bacterial strains and Waksman, S.A., and Starkey, R.L. 1931. The soil novel bacterial artificial chromosome shuttle vec- and the microbe. John Wiley, New York, N.Y. tors for constructing environmental libraries and Wexler, M., Bond, P.L., Richardson, D.J., and An- detecting heterologous natural products in múlti- drew W. B. Johnston. 2005. A wide host-range ple expresión hosts. Appl. Environm. Microbiol. metagenomic library from a waste. Environmen- 70:2452-2463. tal Microbiology 7:1917–1926 Mori, T., Mizuta, S., Suenaga, H. And Miyazaki, K. Woese, C.R. 1987. Bacterial evolution. Microbiol. 2008. Metagenomic Screening for Bleomycin Rev. 51:221–271. Resistance Genes. Appl. Environm. Microbiol. 74:6803-6805. Pace, N.R. 1997. A molecular view of microbial di- versity and the biosphere. Science 276:734-740. Radajewski, S., Ineson, P., Parekh, N.R., and Mu- rrell, J.C. 2000. Stable isotope probing as a tool in microbial ecology. Nature 403:646-649. Rhee, J.K., Ahn, D-G, Kim, Y-G and Oh, J-W. 2005 New Thermophilic and Thermostable Esterase with Sequence Similarity to the Hormone-Sensi- tive Lipase Family, Cloned from a Metagenomic Library. Appl Environm Microbiol 71:817-825. Rondon MR, August PR, Bettermann AD, Brady SF, Grossman TH, Liles MR, Loiacono KA, Lynch BA, MacNeil IA, Minor C et al.. 2000. Cloning the soil metagenome: a strategy for accessing the genetic and functional diversity of uncultured mi- croorganisms. Appl Environ Microbiol 66:2541- 2547. Staley J.T., and Konopka, A. 1985. Measurement of in situ activity of nonphotosynthetic microorga- nisms in aquatic and terrestrial habitats. Annu. Rev. Microbiol. 39:321-346. Sticklen, M.B. 2008. Plant genetic engineering for biofuel production: towards affordable cellulosic ethanol, Nature Reviews Genetics 9, 433-443. Turnbaugh, P.J., Ley, R.E., Mahowald, M.A., Ma-

Biotecnología y Mejoramiento Vegetal II 169 I. CAPÍTULO 12 sido adoptado por la comunidad científica des- de el inicio de las iniciativas genómicas para fa- cilitar la organización y la difusión de los datos. Bioinformática aplicada a la Esto hace que se distingan distintas categorías biotecnología vegetal de bases de datos, entre las principales están aquellas que son repositorios públicos a gran N Paniego; R Heinz; P Fernández; V Lia; escala y bases de datos específicas de iniciati- C Fusari vas comunitarias Los repositorios públicos a gran escala son Introducción bases de datos estables, generalmente man- La Bioinformática es una disciplina científica tenidas por agencias gubernamentales, que que ha evolucionado rápidamente en los últi- archivan principalmente información estática, mos años respondiendo al avance y a las ne- un ejemplo típico es Genbank. La información cesidades de procesamiento, almacenamiento disponible en esa base de datos en particular y análisis de datos biológicos derivados de las puede ser accedida a través de ENTREZ, un tecnologías asociadas a las ómicas, para ge- buscador que combina la interrogación simul- nerar nueva información y conocimientos en tánea de 35 bases de datos disponibles en el área de la biología. El campo de la bioinfor- el sitio NCBI. Algunas de éstas son bases de mática es multidisciplinario abarcando el de- datos secundarias que agregan información a sarrollo de bases de datos, el alineamiento de los datos primarios (secuencias nucleotídicas), secuencias, la predicción de estructuras protei- entre las cuales podemos mencionar Gene, cas, la construcción de árboles filogenéticos, UniGene, HomoloGen o RefSeq. entre otros. En este capítulo nos dedicaremos Dentro de las bases de datos comunitarias específicamente a la bioinformática aplicada están aquellas que almacenan datos deriva- a la biotecnología vegetal, particularmente a dos de estudios sobre especies modelo, gene- cultivos agronómicos y plantas modelo, con ralmente focalizando en una especie o en un el propósito de guiar al estudiante de un cur- grupo de especies relacionadas. La primera so inicial de biotecnología vegetal o de biolo- base de datos de esta categoría establecida gía molecular de plantas en la aplicación de para especies vegetales es “The Arabidopsis los conceptos y las herramientas básicas de la Information Resource” (TAIR), que reúne la bioinformática, complementando los conceptos información asociada a esta especie modelo introducidos en la primera edición de este libro. en relación a secuencias, genes y proteínas, Este material no pretende cubrir la totalidad de marcadores, alelos, mapas, vías metabólicas, los recursos existentes para la materia, el obje- literatura, protocolos, microarreglos, ontología tivo es motivar el interés de los estudiantes en de genes, anotaciones, disponibilidad de ger- la exploración y el uso de recursos y métodos moplasma/semillas y herramientas de análi- computacionales básicos para el desarrollo de sis. En los últimos años, ha surgido una nueva su actividad científica o profesional futura. Para generación de bases de datos que integran la ello, describiremos en primer lugar algunas ba- información de muchas especies para permitir ses de datos específicas de iniciativas genó- la comparación de genomas, entre ellas está micas de plantas e introduciremos el concepto Gramene que integra recursos para la compa- de anotación de datos genómicos. La segunda ración de mapas genéticos y físicos de arroz parte del capítulo esta dedicada a la bioinfor- y otras especies de gramíneas; LIS permite mática aplicada a estudios de expresión, la la comparación genómica y de transcriptos de búsqueda de marcadores moleculares funcio- distintas especies de leguminosas; finalmente nales y el análisis de su variabilidad genética. Phytozome (http://www.phytozome.net: Tool for green plant comparative genomics) reúne la in- Bases de datos generales y específicas formación competa de 14 genomas vegetales, de especie agrupamientos de genes ortólogos, parálogos El uso de tecnologías de bases de datos ha y familias de genes y herramientas de análisis

170 Biotecnología y Mejoramiento Vegetal II como BLAST para hacer comparaciones con- en el proceso de anotación funcional, se basa tra los proteomas de cada una de las especies en la característica que tienen las proteínas ho- representadas en la base de datos. La Tabla 1 mologas de conservar la misma función y se condensa un número importante de bases de sustenta con bases de datos de secuencias de datos específicas junto con sus accesos Web proteínas curadas cuidadosamente como por para facilitar la exploración de las mismas. ejemplo SwissProt o PIR. Asimismo, existen bases de datos específi- No obstante, puede asumirse en general que cas de patógenos que afectan cultivos agronó- las bases de datos de proteínas asociadas a micamente importantes. Estas bases aportan organismos modelo se encuentran correcta- información sobre la secuencia del genoma de mente anotadas y pueden usarse como refe- los patógenos, la cual puede ser asociada a la rencia para inferir posibles funciones molecu- información derivada de estudios funcionales lares. Sin embargo, para que los procesos de de transcriptos inducidos durante la interacción anotación dentro y entre especies en organis- con la planta huésped, permitiendo el diseño mos no-modelo sean lo más eficiente y compa- de estrategias de mejoramiento de los cultivos rable posible, lo óptimo es referir la anotación para lograr resistencia. Entre estas bases de asignada a vocabularios estructurados u onto- datos se pueden mencionar a: Phytophthora logías. Existen diferentes iniciativas para es- Functional Genomics Database y PathoPlant. tablecer vocabularios controlados, una de las más frecuentemente usadas es la “Ontología Anotación funcional de los datos de genes” (Gene Ontology, GO), que establece genómicos tres categorías o jerarquías: (1) las funciones El proceso de anotación de los datos genó- moleculares, (2) los procesos biológicos y (3) la micos a nivel de proteínas consiste en tratar de localización sub-celular o componente celular. deducir a partir de los datos de secuenciación El proceso de anotación es un proceso conti- nucleotídica, las características funcionales del nuo que debe ser constantemente actualizado genoma de un organismo, explorando y descri- con el fin de agregar nueva información y refi- biendo los niveles intermedios de organización nar la información existente. como funciones y procesos moleculares, ce- lulares, fisiológicos, compartimentalización de Anotación de secuencias en especies de las funciones, etc. Este proceso de anotación plantas no-modelo demanda una gran integración de los datos e Acorde a lo mencionado, la anotación genó- información disponible para la especie o para mica llevada a cabo en la mayoría de los pro- especies relacionadas, haciendo uso de herra- yectos y en especial en los proyectos de peque- mientas de la bioinformática para la compara- ña envergadura dedicados a la caracterización ción y la extracción de datos y de las bases de transcriptos o ESTs, se basan en el uso del de datos generales y específicas, del conoci- algoritmo BLAST. La calidad de los resultados miento biológico acumulado en publicaciones en todos los casos depende de los parámetros y de los análisis transcriptómicos o genómicos definidos para recuperar secuencias similares disponibles. en la comparación usando BLASTX o BLASTP, Una de las primeras etapas en este proceso recomendándose como parámetros óptimos E es la de tratar de asignar una función molecu- valores menores de e-10, identidades mayores lar a la mayoría de las secuencias incógnitas a 30% y coberturas mayores o iguales a 50%. mediante la comparación con genes de función Las bases de datos contra las cuales se rea- conocida. La forma más precisa para hacer lizan las comparaciones juegan también un rol esta comparación es a nivel de productos de importante en relación al número y calidad de genes, o sea, trabajando con las secuencias los “hits” recuperados. Algunas de las bases de de aminoácidos obtenidas a partir de la tra- datos de nucleótidos y proteínas más utilizadas ducción de las secuencias nucleotídicas a los para la anotación de secuencias de plantas son seis marcos de lectura posibles. Este método los Índice de Genes (DFCI: http://compbio.dfci. de comparación de secuencias, que es central harvard.edu/tgi/), Unigenes (NCBI) y PlantGDB

Biotecnología y Mejoramiento Vegetal II 171 (http://www.plantgdb.org/). Las bases de datos que adjudica una numeración basada en una de proteínas que se utilizan en general son: clasificación esquemática de enzimas según la NR, SwissProt, Trembl, Uniprot, Uniprotsw, reacción que se encuentran catalizando y el Uniprot-tr, Uniref100 y bases de proteínas de Consorcio KEGG (The Kyoto Encyclopedia of proyectos específicos (Tabla 1). Genes and Genomes) que genera anotación En base al mejor valor de similitud obteni- de vías metabólicas para aquellas especies do en la comparación, se asigna una función que presentan su genoma secuenciado o en génica probable a cada secuencia analizada. vías finalización. La anotación funcional basa- Posteriormente, dicha anotación se mapea da en ontologías puede realizarse usando soft- contra una base de datos de Gene Ontology ware libre por ejemplo Blast2GO o GOtcha. para finalmente anotar los productos de ge- nes acorde a las normas del Consorcio de Expresión de Genes Ontología Génica (GO). Otros vocabularios El análisis de patrones de expresión consis- controlados complementarios a GO, son la te en la identificación de todos los transcrip- Comisión de Enzimas (Enzyme Comisión, EC) tos presentes en una determinada muestra

Tabla 1: Bases de datos genómicas específicas de especie.

172 Biotecnología y Mejoramiento Vegetal II de tejido. El desarrollo de tecnologías de alto las actuales técnicas de secuenciación masiva procesamiento de datos ha permitido abordar que prometen en un futuro cercano capacidad estudios de expresión génica en forma concer- de procesamiento elevada a costos accesibles tada para miles de genes a partir de distintos a la comunidad en general. Aún con el adveni- genotipos en determinados órganos, tejidos, miento de proyectos genómicos de gran esca- y condiciones de crecimiento. El diseño de los la, la secuenciación de ESTs permite la identifi- experimentos de expresión, así como las he- cación de genes que se expresan en pocos te- rramientas de análisis de la información gene- jidos y/o su expresión es muy baja, mediante la rada constituyen factores claves para obtener construcción de colecciones de ADNc normali- información con significado biológico. zadas o enriquecidas en determinados trans- Las distintas estrategias que permiten eva- criptos como las colecciones derivadas de téc- luar perfiles transcripcionales pueden dividirse nicas de hibridación sustractiva o “Suppressed en dos grupos. Un primer grupo corresponde Subtracted Hybridization” Asimismo, el agru- a estrategias en las que la estimación del ni- pamiento de ESTs derivados de distintas co- vel de la expresión se basa en la intensidad lecciones de ADNc para una dada especie en relativa de una señal de hibridación e incluye grupos o clusters de secuencias no redundan- los tradicionales experimentos de northern blot tes, utilizando rutinas de análisis como las es- y los microarreglos de ADNc, en los cuales se quematizadas en la Figura 1 permite estimar el toma la intensidad relativa de la señal como número de genes de una especie. medida de la trascripción. El otro grupo de Respecto al análisis de expresión génica, estrategias se basa en una cuenta directa del los ESTs contribuyen a estos estudios a través número de cada transcripto presente en una de dos vías: 1) la proporción de ESTs corres- muestra, incluyendo la secuenciación de se- pondientes a un determinado gen respecto a cuencias expresadas o “Expressed Sequence un conjunto de ESTs generados en distintas Tags” (ESTs), el análisis de la expresión génica condiciones experimentales refleja el nivel de en serie o “Serial Analysis of Gene Expresión” expresión del mismo; y 2) en segundo lugar las (SAGE) y la secuenciación masiva en paralelo bases de ESTs se utilizan para el diseño de oli- o “Massively Parallel Signature Sequencing” gonucleótidos en experimentos de microarre- (MPSS). En este capítulo se discutirán las es- glos de ADNc para evaluar expresión génica. trategias de análisis de expresión que permiten la evaluación concertada de un gran número Los experimentos de microarreglos repre- de genes en forma procesiva. sentan una de las herramientas más frecuen- tes para aproximarse a los análisis de expre- Expressed Sequence Tags (ESTs): sión de genes a gran escala. Una vez que se La secuenciación de moléculas de ADN obtienen los resultados surgen interrogantes complementario (ADNc) sintetizadas a partir como ¿Cuáles son los genes sobre o sub-ex- de ARN mensajeros obtenidos de muestra bio- presados en el experimento?, ¿Cuáles son los lógica en particular, realizada a través de una perfiles de expresión que pueden revelarse en única lectura, da origen a un conjunto de se- general a partir de este experimento? En esta cuencias denominadas ESTs, que representan sección ejemplificaremos un caso de estudio secuencias parciales de las colecciones origi- para ilustrar el proceso de análisis utilizando nales de ADNc. programas de libre distribución basados en el Actualmente, la división EST de GenBank lenguaje estadístico R (Bioconductor). cuenta con un total aproximado de 6.000.000 En el Instituto de Biotecnología de INTA secuencias y se encuentran representadas Castelar (IB) se diseñó un microarreglo de más de 100 especies de plantas. ADNc conteniendo 317 secuencias de tipo La secuenciación de ADNc constituyó una ESTs previamente desarrollados en base a herramienta alternativa de los proyectos genó- secuencias órgano-específicas de una línea de micos para el descubrimiento de nuevos genes girasol cultivado). Para la impresión de los mi- para distintas especies, cuando la secuencia- croarreglos de ADNc sobre soporte de vidrio, ción de genomas complejos no contaba con se amplificaron por PCR los fragmentos- re

Biotecnología y Mejoramiento Vegetal II 173 Figura 1: eBiopipeline. A. vista esquemática; B. página inicial, menú de programación y salidas del programa. presentativos de los unigenes anotados en las da de la misma para la posterior interpretación bibliotecas previamente caracterizadas. Estos que se obtendrá como resultado. microarreglos fueron hibridados con ARN total de plantas crecidas en invernáculo y someti- Normalización das a dos condiciones de estrés abiótico dife- La normalización es un término genérico que renciales: frío y salinidad. Una vez impresos, se refiere a la resolución de errores sistemáti- los vidrios fueron escaneados (usando cana- cos y desvíos producidos en un microarreglo les para ambos fluoróforos) a tres intensidades debido a condiciones experimentales inevita- diferentes, usando el lector de fluorescencia bles y propias de la plataforma utilizada. La VersArray Chip Reader (BioRad). Las imáge- normalización y el análisis de expresión global nes obtenidas fueron analizadas utilizando el se realizaron en este caso a través de pro- programa de acceso libre Spotfinder (www. gramas generados utilizando el programa R tm4.org/spotfinder.html), cuantificándose la in- (University of Auckland) a través de su versión tensidad de señal para cada spot. Luego, se R 1.9.0 (http://www.rproject.org). Los datos de realizó una integración de los datos de las imá- cada vidrio fueron normalizados corrigendo la genes escaneadas (Figura 2). dependencia por intensidad mediante la utiliza- ción del suavizador no paramétrico LOWESS Preprocesamiento de los datos (regresión local ponderada). Se realizó una in- La imagen obtenida a partir de un microarre- tegración de los datos de las réplicas técnicas glo corresponde a la información cruda de un dentro de cada soporte (cada spot fue impreso experimento de estas características. Es así 4 veces) y las réplicas técnicas entre sopor- que los algoritmos computacionales convierten tes (intercambio de fluoróforos o “dye-swap”). la imagen en información numérica que cuan- Luego de este paso el producto obtenido es tifica dicha expresión: este es el primer paso una matriz de expresión génica cuyo análisis en un análisis de datos de microarreglos, y es se focaliza en la identificación de genes con fundamental la calidad y la rigurosidad obteni- expresiones diferenciales.

174 Biotecnología y Mejoramiento Vegetal II Figura 2: Imagen de una micromatriz de dos canales (Bello y col. 2006)

Biotecnología y Mejoramiento Vegetal II 175 Limpieza de datos y transformación la tasa de falsos positivos, presentan a su vez Una vez obtenida la matriz de expresión gé- la dificultad de generar una alta tasa de falsos nica, existe una serie de pasos que se llevan a negativos. Por consiguiente, la metodología cabo para asegurar una alta calidad en el aná- utilizada en este trabajo consistió en comple- lisis. Ellos son: la remoción de spots dudosos o mentar las técnicas de inferencia clásicas con conflictivos flagged( features), que se resuelve un criterio de selección basado en el ordena- ya sea eliminando los spots con error aparente miento de genes y tratamientos en el espacio (con el consiguiente riesgo de pérdida de da- generado por los dos primeros ejes principa- tos valiosos), o marcándolos para luego refe- les obtenidos de un análisis de componentes rirlos a la imagen original en el momento de su principales de la matriz de expresión génica. análisis; la corrección y/o sustracción del ruido Posteriormente, y dentro del conjunto de genes de fondo (corrección o sustracción de back- seleccionados en el paso anterior, se realizó el ground). La señal de fondo es indicadora de reconocimiento de grupos de genes con perfiles una hibridación inespecífica siempre y cuando de expresión similar mediante la aplicación de la intensidad del spot de interés sea mayor que un algoritmo de clasificación no supervisada, la intensidad del ruido de fondo. Si ocurre al k-centroides para nuestro caso de estudio. El revés, existe la posibilidad que esté represen- análisis transcripcional mediante la aplicación tando un problema local en el microarreglo y la de k-centroides permitió detectar 3 grupos de intensidad del spot se convierta en información genes bien diferenciados en sus patrones de no confiable; y por último la transformación lo- expresión. Por una parte el Grupo 2, integrado garítmica de los valores para hacer constante por 126 genes, no mostró variación en sus ni- la variabilidad a todos los niveles de intensidad veles medios a través de los tratamientos. En detectados. cambio, el Grupo 1 (integrado por 112 genes) evidenció sobre-expresión respecto del control Análisis estadístico de los datos cuando las plantas fueron sometidas a estrés (por frío o por salinidad). De manera análoga, Evaluación de consistencia en las 49 genes conformaron el Grupo 3, pero en este repeticiones caso se observó una sub-expresión respecto Para evaluar las diferencias asociadas a las del control en ambos tratamientos. repeticiones biológicas de este experimento se obtuvo una ordenación de las mismas en un Obtención de la lista de genes plano de ordenación generado mediante aná- diferencialmente expresados lisis de componentes principales aplicado a la Para combinar esta aproximación, basada matriz de expresiones génicas. Esta aproxima- en la ordenación de genes por ACP y el criterio ción tuvo en cuenta la información de todos los clásico de prueba de hipótesis para igualdad genes simultáneamente y permitió establecer de medias, se consideraron sólo aquellos ge- si una repetición se comportaba de manera atí- nes que para la prueba clásica de análisis de pica o no. la varianza tuvieran un p-valor menor o igual a 0,05 y que estuvieran a un distancia del origen Identificación de grupos de genes con expre- en la Figura 3 mayor que 9 (correspondiente, sión diferencial. aproximadamente al percentil 70 de la distribu- El análisis de la matriz de expresión génica ción de distancias al origen). Este criterio de se focalizó en la identificación de genes con ex- corte se seleccionó teniendo en cuenta el gen presiones diferenciales. Existen diversas estra- T411 (Genbank AN BU671801), que había sido tegias para obtener un listado de genes candi- previamente validado experimentalmente. datos. La estrategia más sencilla es aplicar una Para cada uno de los 80 genes seleccio- prueba de hipótesis tradicional gen a gen. Esta nados como genes candidatos se graficó el aproximación tiene el inconveniente de gene- perfil de expresión según su comportamiento rar un gran número de falsos positivos. Los en cada tratamiento a través de un gráfico de métodos correctivos, basados en el control de colores de expresión diferencial (heatmap) de

176 Biotecnología y Mejoramiento Vegetal II Figura 3. Bi-plot que muestra genes con p-valor para un test F< 0,05 y con una distancia al origen < per- centilo 70 de la distancia al origen de la distribución (círculos rellenos).

modo de analizar cualitativamente el gradiente dos para las condiciones evaluadas, producto diferencial por tratamiento y por gen mediante final de un análisis de microarreglos. un gráfico de perfiles de expresión individua- les. De estos resultados surgieron genes can- Búsqueda de marcadores funcionales en didatos de interés para su análisis de expresión bases de datos genómicos diferencial, de los cuales 15 fueron selecciona- Como mencionamos anteriormente, la se- dos para validar mediante la técnica de PCR cuenciación completa de los genomas de es- cuantitativa (qPCR). pecies modelo o parcial de especies de interés Este último paso de validación es de una ha generado una rápida acumulación de infor- herramienta indispensable en el análisis de mación biológica que es depositada en bases microarreglos ya que por todo lo expuesto de datos genómicas y es fácilmente accesible anteriormente podemos inferir que los genes a través de Internet. Esta información, que de- obtenidos son producto de transformaciones riva en muchos casos de la caracterización de numéricas y una evaluación subjetiva al crite- líneas elite de una misma especie, de especies rio estadístico aplicado. Es así que podemos de un mismo género o de distintas fuentes re- concluir que la validación experimental confie- lacionadas, constituye el recurso que permite re rigurosidad biológica a un conjunto de su- sistematizar el desarrollo de marcadores mo- puestos genes candidatos obtenidos a partir de leculares potencialmente asociados a la varia- una lista de genes diferencialmente expresa- ción fenotípica para caracteres de interés. El

Biotecnología y Mejoramiento Vegetal II 177 potencial de descubrir marcadores molecu- se realizan los alineamientos base a base para lares funcionales analizando las secuencias cada uno de los grupos de secuencias y los depositadas en las bases de datos generales, mismos son analizados para detectar las dife- fundamentalmente de ESTs, ha permitido su- rencias nucleotídicas o SNPs. La rigurosidad y perar una de las limitaciones más importantes detallada evaluación de esta instancia es fun- de los marcadores moleculares locus-específi- damental para encontrar verdaderas variantes co que es el costo inicial de desarrollo. alélicas dentro de los diferentes grupos. Es por ello que se encuentran disponibles diver- Identificación insilico de SNPs sas herramientas estadísticas que permiten di- Los polimorfismos de nucleótido simple ferenciar los errores de secuenciación de las (SNPs) o los generados por pequeñas inser- verdaderas variantes alélicas basándose en ciones/deleciones (Indels) se han convertido el valor de calidad de la base secuenciada y en una de las herramientas más utilizadas en medidas de exactitud de la secuencia. Los para la caracterización genética tanto de plan- programas desarrollados para la detección de tas como de animales debido a su baja tasa de SNPs, tanto para uso académico (PolyBayes mutación y a su gran abundancia, ubicuidad y y PolyPhred) como aquellos sujetos a licen- dispersión en los genomas. Su uso se ha ex- cias comerciales (Sequencher, Gene Codes tendido a aplicaciones tales como la construc- Corporation) utilizan los datos de calidad de ción de mapas genéticos de alta resolución, secuencia para eliminar los falsos positivos o mapeo de asociación, estudios de diversidad incorporan el concepto de velocidad de muta- genética y conservación, identificación y análi- ciones esperadas para distinguir los verdade- sis de la estabilidad de cultivares, delimitación ros SNPs. Asimismo, estos programas ofrecen y asignación de grupos heteróticos, análisis fi- la ventaja de presentar una interfase gráfica logenéticos, selección asistida por marcadores y pueden ser usados tanto para comparación y caracterización de recursos genéticos. de secuencias cortas como para estimar SNPs Un SNP representa una diferencia en una dentro de largas regiones genómicas. Muchos base nucleotídica entre 2 secuencias de ADN grupos han explorado además métodos alter- y puede ser categorizada como transición (C/T nativos de detección de SNPs basados en el or G/A) o transversión (C/G, A/T, C/A, o T/G) de uso de microarreglos de ADN de alta densidad. acuerdo a la sustitución nucleotídica observa- da. El uso de marcadores SNP para cualquiera Identificación insilico de SSRs de las aplicaciones mencionadas requiere de Los microsatélites (repeticiones en tandem una primera etapa de detección y desarrollo de mono, di, tri, tetra o pentanucleótidos) son que puede ser abordada a partir de una estra- herramientas muy útiles como marcadores tegia “de laboratorio” (ej. secuenciación y com- genotípicos debido a que son relativamente paración de genes o regiones candidatas en un abundantes, multialélicos (hipervariables con conjunto de materiales de interés) o bien estar respecto al número de repeticiones), hereda- basada en aproximaciones in silico que hacen dos en forma estable y codominantes (se dis- uso de la información de secuencia disponible tinguen los alelos de un locus), permitiendo en las bases de datos biológicas. En este úl- distinguir materiales estrechamente relaciona- timo caso, el procedimiento de búsqueda ge- dos. Desde el punto de vista metodológico, son neralmente involucra un protocolo de pocos fáciles de detectar mediante PCR, requiriendo pasos. Primero se identifican secuencias con poca cantidad de ADN para el análisis y poco alta similitud entre múltiples individuos a partir equipamiento. de una o varias bases de datos previamente La identificaciónin silico de SSRs a partir de seleccionadas en función del organismo o tipo la abundancia de secuencias genómicas dis- de carácter que se desee estudiar, utilizando ponibles para genomas vegetales, al igual que habitualmente los algoritmos de búsqueda de para los SNPs, se ha convertido en la alterna- similitud de secuencias de tipo BLAST (Basic tiva más económica de desarrollar este tipo Local Alignment Search Tool). Posteriormente, de marcadores haciendo uso de herramientas

178 Biotecnología y Mejoramiento Vegetal II computacionales eficientes. Asimismo, es muy plemento de las aproximaciones convenciona- frecuente poder asociar una función molecular les (ej. Mapeo de QTLs) y han ido cobrando determinada por similitud a la secuencia que cada vez más importancia como herramientas alberga la repetición convirtiéndolo en un mar- para alcanzar un mayor grado de resolución. cador funcional. En pocas palabras, el razonamiento subyacen- Existen distintas herramientas computa- te al mapeo de asociación consiste en utilizar cionales basadas en la web para el descubri- eventos de recombinación históricos a lo largo miento de SSRs y el diseño de iniciadores es- de un linaje, y no solamente aquellos ocurridos pecíficos para la amplificación de los mismos. en una determinada población de mapeo, para Se pueden mencionar como ejemplos el pro- establecer posibles relaciones entre genotipo grama SSRPoly accesible desde el sitio http:// y fenotipo. Los polimorfismos responsables de acpfg.imb.uq.edu.au/ssrpoly.php, que permite la variación fenotípica no son observados en la identificación de SSR polimórficos que se forma directa, si no que surgen a partir de in- distinguen de las variantes monomórficas por ferencia estadística. La base para la detección la representación de tamaños variables del mi- de tales correlaciones es la asociación no alea- crosatélite identificado en alineamientos múlti- toria entre un polimorfismo dado y la variación ples de secuencias representadas en la bases fenotípica para cierto rasgo de interés, es decir de datos. Otra herramienta valiosa disponible la identificación de desequilibrio de ligamiento en la web es CUGI SSR Server (http://www.ge- (DL) entre las variantes genéticas causales de nome.clemson.edu/cgi-bin/cugi_ssr). la variación del carácter y los polimorfismos analizados. Análisis de la variabilidad genética Previo a cualquier estudio de mapeo por aso- Finalizada la etapa de desarrollo de marca- ciación, y para realizar un diseño experimen- dores moleculares, la fase siguiente general- tal apropiado, es necesario conocer el grado mente consiste en la genotipificación de gran- y la estructura genómica del DL en la especie des cantidades de individuos a fin de determinar a evaluar, ya que éste es variable tanto entre las variantes alélicas presentes en cada uno de especies como para las diferentes regiones de ellos para cada uno de los marcadores detec- un mismo genoma. Las dos medidas preferi- tados. La elección de la metodología mas apro- das en la literatura para cuantificar DL son el piada dependerá de los recursos disponibles y coeficiente de desequilibrio estandarizado (D’) del nivel de procesamiento que se desee al- y la correlación de frecuencias alélicas al cua- canzar. Entre las más utilizadas para el caso de drado (r2). La estimación del DL generalmente los SNPs pueden mencionarse: secuenciación involucra grandes cantidades de marcadores, directa, amplificación alelo-especifica por reac- razón por la cual suelen resultar útiles las he- ción en cadena de la polimerasa (PCR), mé- rramientas de software que permiten sistemati- todos de digestión enzimática, hibridación con zar el cálculo de ambas medidas y representar oligonucleótidos alelo-específicos, y por último gráficamente las asociaciones halladas (por las plataformas de microarreglos GoldenGate ej.: DNAsp, Arlequin, Gold, GoldSurfer). e Infinium desarrolladas por Illumina (Illumina, El desarrollo de un estudio de mapeo por San Diego, CA, USA). asociación involucra la evaluación fenotípica La tecnología de SNPs presenta un gran po- del carácter agronómico de interés (ej. peso tencial para la identificación de las formas aléli- del grano, contenido de aceite, días a flora- cas que controlan procesos biológicos comple- ción, AUDPC, etc) y la genotipificación de un jos, como la resistencia a los estreses bióticos conjunto apropiado de SNPs para cada una de y abióticos que afectan la productividad de los las entidades a comparar (líneas, variedades, cultivos. Sin embargo, para ser aprovechado etc). El número y naturaleza de los polimorfis- en su totalidad, este potencial debe ser com- mos a caracterizar dependerá de la estrategia binado con metodologías analíticas apropia- de análisis que se haya seleccionado. Si se das. En los últimos años las metodologías de desea explorar todo el genoma (genome-wide mapeo por asociación han surgido como com- analysis) el número de SNPs será mucho ma-

Biotecnología y Mejoramiento Vegetal II 179 yor (entre 10.000 y 100.000) que el requerido Lecturas recomendadas si sólo se estudian los polimorfismos corres- pondientes a un grupo de genes candidatos. Altschul, S.F., W. Gish, W. Miller, E.W. Myers, and Sin embargo, en este último caso es necesario D.J. Lipman. 1990. Basic local alignment search un conocimiento previo de la base genética del tool. J Mol Biol 215:403-10. carácter fenotípico en estudio. Otro aspecto Ashburner, M., C.J. Mungall, and S.E. Lewis. 2003. Ontologies for biologists: a community model for importante del diseño experimental es la selec- the annotation of genomic data. Cold Spring Harb ción de individuos. En humanos generalmente Symp Quant Biol 68:227-35. es la utilización de metodologías basadas en Ashburner, M., C.A. Ball, J.A. Blake, D. Botstein, H. poblaciones de enfermos vs. controles sanos Butler, J.M. Cherry, A.P. Davis, K. Dolinski, S.S. (case-control) o aquellas que involucran indi- Dwight, J.T. Eppig, M.A. Harris, D.P. Hill, L. Issel- viduos relacionados o familias en donde algún Tarver, A. Kasarskis, S. Lewis, J.C. Matese, J.E. individuo es enfermo (Transmission disequi- Richardson, M. Ringwald, G.M. Rubin, and G. librium tests). En plantas, los individuos de la Sherlock. 2000. Gene ontology: tool for the unifi- población en estudio usualmente incluyen ger- cation of biology. The Gene Ontology Consortium. moplasma de distinto origen geográfico con el Nat Genet 25:25-9. Bairoch, A. 2000. The ENZYME database in 2000. objeto de abarcar la mayor cantidad posible de Nucleic Acids Res 28:304-5. variación genética y fenotípica. Bairoch, A., and R. Apweiler. 1996. The SWISS- Las inferencias estadísticas del mapeo por PROT protein sequence data bank and its new asociación para rasgos continuos son general- supplement TREMBL. Nucleic Acids Res 24:21-5. mente realizadas a través de análisis de regre- Balding, D.J. 2006. A tutorial on statistical methods sión lineal, si bien también son aplicables otras for population association studies. Nat Rev Ge- aproximaciones. Dado que existen diversos net 7:781-91. factores que pueden llevar al establecimiento Cervigni, G.D., N. Paniego, M. Diaz, J.P. Selva, D. de asociaciones espurias, se han desarrolla- Zappacosta, D. Zanazzi, I. Landerreche, L. Mar- do modelos específicos en donde es posible telotto, S. Felitti, S. Pessino, G. Spangenberg, and V. Echenique. 2008. Expressed sequence incorporar las distintas variables intervinien- tag analysis and development of gene associ- tes y controlar su efecto en la detección de ated markers in a near-isogenic plant system of asociaciones. Entre los procesos que pueden Eragrostis curvula. Plant Mol Biol 67:1-10. interferir en el análisis se encuentran: la sub- Conesa, A., and S. Gotz. 2008. Blast2GO: A Com- estructuración de las poblaciones estudiadas, prehensive Suite for Functional Analysis in Plant las interacciones epistáticas y pleiotrópicas, Genomics. Int J Plant Genomics 2008:619832. las interacciones entre genotipo y ambiente, el Diatchenko, L., Y.F. Lau, A.P. Campbell, A. tamaño muestral pequeño, la complejidad del Chenchik, F. Moqadam, B. Huang, S. Lukyanov, carácter en estudio y la calidad de los registros K. Lukyanov, N. Gurskaya, E.D. Sverdlov, and fenotípicos. El software Tassell es uno de los P.D. Siebert. 1996. Suppression subtractive hy- bridization: a method for generating differentially paquetes más utilizados para los estudios de regulated or tissue-specific cDNA probes and li- asociación en plantas ya que incluye metodolo- braries. Proc Natl Acad Sci U S A 93:6025-30. gías que permiten tener en cuenta la estructura Fernandez, P., N. Paniego, S. Lew, H.E. Hopp, and poblacional y el grado de parentesco entre los R.A. Heinz. 2003. Differential representation of individuos analizados. sunflower ESTs in enriched organ-specific cDNA En conclusión, el mapeo por asociación libraries in a small scale sequencing project. constituye una poderosa herramienta para la BMC Genomics 4:40. disección genética de caracteres complejos, Fernandez, P., J. Di Rienzo, L. Fernandez, H. Hopp, siendo los SNPs marcadores ideales para la N. Paniego, and R. Heinz. 2008. Transcriptomic implementación de tales estudios dada su alta identification of candidate genes involved in sun- flower responses to chilling and salt stresses frecuencia y ubicuidad en los genomas. based on cDNA microarray analysis. BMC Plant Biol 8:11. Gupta, P.K., J.K. Roy, and M. Prasad. 2001. Single nucleotide polymorphisms: A new paradigm for

180 Biotecnología y Mejoramiento Vegetal II molecular marker technology and DNA polymor- Stich, B., and A.E. Melchinger. 2009. Comparison phism detection with emphasis on their use in of mixed-model approaches for association map- plants. Curr Sci 80:524-535. ping in rapeseed, potato, sugar beet, maize, and Kanehisa, M., S. Goto, S. Kawashima, and A. Na- Arabidopsis. BMC Genomics 10:94. kaya. 2002. The KEGG databases at Genom- Wold, B., and R.M. Myers. 2008. Sequence census eNet. Nucleic Acids Res 30:42-6. methods for functional genomics. Nat Methods Martin, D.M., M. Berriman, and G.J. Barton. 2004. 5:19-21. GOtcha: a new method for prediction of protein Wu, C.H., L.S. Yeh, H. Huang, L. Arminski, J. Castro- function assessed by the annotation of seven ge- Alvear, Y. Chen, Z. Hu, P. Kourtesis, R.S. Ledley, nomes. BMC Bioinformatics 5:178. B.E. Suzek, C.R. Vinayaka, J. Zhang, and W.C. Oraguzie N. et al., eds. 2007. Association Mapping Barker. 2003. The Protein Information Resource. in Plants. Springer Science+Business Media, Nucleic Acids Res 31:345-7. LLC. Rafalski, A. 2002. Applications of single nucleotide polymorphisms in crop genetics. Curr Opin Plant Biol 5:94-100. Stekel, D. 2003. Image Processing, In P. C. Univer- sity, ed. Microarray Bioinformatics, NY, USA.

Biotecnología y Mejoramiento Vegetal II 181 182 Biotecnología y Mejoramiento Vegetal II