Selección De Un Subconjunto De Loci Altamente Informativo Para La Asignación De Muestras De Origen Bovino a Sus Razas Correspondientes
Total Page:16
File Type:pdf, Size:1020Kb
ESCUELA TÉCNICA SUPERIOR DE INGENIERÍAS AGRARIAS Máster en Ingeniería Agronómica SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES Alumno/a: Fernando Bueno Gutiérrez Tutor/a: Jesús Ángel Baro de la Fuente TRABAJO DE FIN DE MASTER MAYO 2015 Copia para el tutor/a Quisiera mostrar mis agradecimientos al Dr. Jesús Ángel Baro de la Fuente, tutor de este estudio, por su esencial ayuda, la cercanía de su trato y en general, por su implicación en mi formación. Quisiera agradecerle también al Dr. Carlos Enrique Carleos Artime, profesor de la Universidad de Oviedo, por su valiosa contribución en el manejo de R y su interés por el estudio. Por último, mis más profundos agradecimientos a mis padres por su incesante apoyo. SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES DEDICATORIA A la memoria de Cristino Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 3 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES ABREVIATURAS Abreviaturas ADN - ácido desoxirribonucleico (DNA - desoxyribonucleic acid) AFLP- polimorfismos en la longitud de fragmentos amplificados (amplified fragment length polymorphism) AVIL- Avileña-Negra ibérica ARCA- Sistema Nacional de Información de Razas Ganaderas ASTV- Asturiana de los Valles AUC- área debajo de la curva (area under curve) BLUP- mejor predictor lineal insesgado (best linear unbiased prediction) BRUP -Bruna dels Pirineus BRSW – Brown Swiss CP(s)-componente(s) principal(es) CV- validación cruzada (cross validation) DOP- Denominación de Origen Protegida HWE - equilibrio de Hardy-Weinberg (Hardy-Weinberg equilibrium) EE.UU- Estados Unidos FAO- organización para la agricultura y la alimentación (food and agrocultural organization) Feagas- Federación Española de Asociaciones de Ganado Selecto Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 5 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES ABREVIATURAS FLCH - Fleckvieh GRR- Representación gráfica de los errores de relación (graphical representation of relationship errors) GUER – Guernesey GWAS- estudio de asociación del genoma completo (genome-wide association study) IA- inseminación artificial IBD- idéntico por descendencia (identical by descendt) IBS- idéntico por estado (identical by state) IGP- Indicación Geográfica Protegida DL- desequilibrio de ligamiento EL – equilibrio de ligamiento LG- Libro Genealógico MAGRAMA- Ministerio de Agricultura, Alimentación y Medio Ambiente MLR- regresión lineal múltiple (multiple linear regression) MORU- Morucha Ne- tamaño efectivo de población (effective population number) OLS- mínimos cuadrados ordinarios (ordinary least squares) OR- razón de momios (odd ratio) PCA- análisis de componentes principales (principal components analysis) Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 6 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES ABREVIATURAS PCR- reacción en cadena de la polimerasa (polymerase chain reaction) PCR- regresión de componentes principales (principal components regression) QTL- locus de un carácter cuantitativo (quantitative trait locus) PIRE- Pirenaica PLS- mínimos cuadrados parciales (partial least squares) PLS-LDA- mínimos cuadrados parciales para análisis discriminante (partial least squares, discriminant analysis) PLSR- regresión por mínimos cuadrados parciales (partial least squares regression) RETI -Retinta RGAL- Rubia gallega ROC- característica operativa del receptor (receiver operating characteristic) SIMM– Simmental SITRAN- Sistema Integral de Trazabilidad Animal SNP - polimorfismo de nucleótido único (single nucleotide polymorphism) UE- Unión Europea VD(´s)- variable dependietne(s) VE- Varianza Explicada Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 7 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES ABREVIATURAS VI(´s)- variable(s) independiente(s) VIF- factor de inflación de la varianza (variance inflation factor) Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 8 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES GLOSARIO DE FÓRMULAS Glosario de fórmulas A: número de componentes T A k x n: matriz transpuesta de A bpls : coeficientes de regresión PLS Bpls k×m: matriz de coeficientes de regresión de PLS. Por la que se multiplica a las variables originales para obtener Y. βo: intercepto en la ecuación de regresión β1: pendiente en la ecuación de regresión clda: proyección de los valores x en la dirección wlda D: matriz diagonal en PCR E nxp: matriz de errores aleatorios al predecir X F nxq: matriz de errores aleatorios al predecir Y FST: efecto de subpoblaciones con respecto a la población total J (w): distancia entre las proyecciones medias. Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 9 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES GLOSARIO DE FÓRMULAS K: número de predictores m: número de variables respuesta n: número de observaciones Ne: tamaño efectivo de la población Nf: número efectivo de hembras Nm: número efectivo de machos P k×a: matriz de cargas de PLS . Por la que se multiplica para obtener los nuevos valores. Q m×a: matriz de cargas para Y. Por la que se multiplica a Y para obtener las nuevas puntuaciones del variable respuesta. S: matriz de covarianzas en PCA ST: matriz de dispersión total SW: matriz de dispersión dentro-de-clases Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 10 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES GLOSARIO DE FÓRMULAS SB: matriz de dispersión entre-clases Si: dispersión dentro de la clase I T n×a: matriz de puntuaciones de PLS (nuevos valores) T: suma de los eigenvalores U n×a: matriz de puntuaciones de PLS para la variable respuesta Y. Nuevos valores por nuevos pesos μi: vector medio de la clase i en el espacio x ~μ i : vector medio de la clase i en el espacio y ⃗v i: iº eigenvetor extraído w: vector de coeficientes. Multiplicando su transpuesta por la izquierda a la matriz de predictores, obtenemos el vector de la variable respuesta. W*: proyección óptima en LDA wlda: proyecciones de LDA X ó A n×k: matriz de predictores Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 11 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES GLOSARIO DE FÓRMULAS xi: observación i, de la que se conocen p predictores Y n×m: matriz de predictores. Generalmente: Y n x 1 Y^ : variable respuesta estimada, en término matricial Yo^ : variable respuesta estimada, álgebra lineal Z: matriz de nuevas variables en PCR λ1: eigenvalor del iº eigenvector extraído Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 12 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES ÍNDICE ÍNDICE Alumno: Fernando Bueno Gutiérrez UNIVERSIDAD DE VALLADOLID (CAMPUS DE PALENCIA) – E.T.S. DE INGENIERÍAS AGRARIAS Titulación de: Máster en Ingeniería Agronómica 13 / 244 SELECCIÓN DE UN SUBCONJUNTO DE LOCI ALTAMENTE INFORMATIVO PARA LA ASIGNACIÓN DE MUESTRAS DE ORIGEN BOVINO A SUS RAZAS CORRESPONDIENTES ÍNDICE ÍNDICE DE CONTENIDO 1. RESUMEN..................................................................................................................21 2. INTRODUCCIÓN.......................................................................................................25 1. Justificación..............................................................................................................27 1.1. Justificación en el mercado..................................................................................27 1.2. Justificación tecnológica......................................................................................29 1.3. Justificación en el marco ganadero......................................................................36 2. Antecedentes ............................................................................................................43