Atolladeros Del Pensamiento Aleatorio: Batallas En Torno De La Prueba Estadística De La Hipótesis Nula En Ciencias Sociales
Total Page:16
File Type:pdf, Size:1020Kb
Carlos Reynoso – Antropología y estadísticas Antropología y estadísticas: Batallas en torno de la Hipótesis Nula Carlos Reynoso Universidad de Buenos Aires http://carlosreynoso.com.ar Versión 04-09 – Abril de 2021 Segunda edición corregida y ampliada Atolladeros del pensamiento aleatorio: Batallas en torno de la Prueba Estadística de la Hipótesis Nula en Ciencias Sociales ................................................................................ 1 1. Introducción .............................................................................................................. 2 2. Prueba de la Hipótesis Nula – Teoría e historia ....................................................... 5 3. El discurso del método ........................................................................................... 13 4. El lado oscuro de la inferencia inductiva................................................................ 17 5. El surgimiento de la crítica ..................................................................................... 24 6. Errores de tipo I y II ............................................................................................... 30 7. Significancia y significado ..................................................................................... 36 8. El elusivo significado de la hipótesis nula.............................................................. 43 9. Los valores de p ...................................................................................................... 49 10. El arte de la interpretación sistemáticamente indebida ........................................ 54 11. Pragmática e imagen de la NHST ........................................................................ 58 12. Los abismos de la normalidad y las distribuciones sin media .............................. 62 13. NHST en antropología, arqueología y estudios territoriales ................................ 78 14. Conclusiones ......................................................................................................... 91 Referencias bibliográficas .......................................................................................... 97 1 Carlos Reynoso – Antropología y estadísticas Antropología y estadísticas: Batallas en torno de la Hipótesis Nula Carlos Reynoso Universidad de Buenos Aires http://carlosreynoso.com.ar Nada sucede por azar. “Azar” [chance] no es un término técnico en estadística. Algunos practican- tes usan “azar” para referirse a sucesos con igua- les probabilidades, otros pueden tener en mente una independencia estadística entre variables, y otros más pueden usarla meramente para indicar que todavía no se conoce que esté sujeta a leyes. En discusiones técnicas es mejor evitar la pala- bra. Del mismo modo, “nada sucede al azar” aun- que el muestreo al azar sea posible. Louis Guttman (1977: 94-95) 1. Introducción1 Hacia fines del siglo XX el estudio de las estructuras en red de la World Wide Web y la Internet demostró de manera dramática que las diversas distribuciones estadísticas que les eran propias no respondían al modelo de las distribuciones normales sino que se a- justaban a leyes de potencia (Barabási 2002; Reynoso 2011). Estas leyes de potencia (en lo sucesivo LP), similares a las viejas leyes de Pareto y de Zipf, difieren de las distribu- ciones gaussianas y afines tanto como es posible que dos cosas difieran, cualitativa y cuantitativamente. Al ser la LP una distribución en la que no es ni útil ni posible definir promedios o ejemplares representativos, en la que no existe un valor que pueda reputar- se “normal” (intermedio más o menos exacto entre los valores extremos) y a la que no puede llegarse mediante operaciones aleatorias de muestreo, gran parte de las estadís- ticas convencionales no le son aplicables. El problema que deseo tratar aquí tiene que ver con el hecho de que si bien la vigencia de la LP en la mayor parte de los fenómenos y procesos sociales y culturales ha sido plenamente reconocida, las ciencias humanas en general y el análisis de redes sociales en particular siguen adelante su negocio sin tomar cabalmente en cuenta el nuevo estado de cosas. No se han cambiado correspondientemente ni los diseños investigativos ni las 1 La investigación que fundamenta este ensayo se realizó en el contexto del proyecto trianual UBACYT F-155 (2008-2010) de la Universidad de Buenos Aires (“Modelos de Casos en Antropología y Complejidad”). 2 Carlos Reynoso – Antropología y estadísticas herramientas de software, que siguen aplicándose como si la distribución normal siguie- ra siendo, como se creyó que lo era hasta hace poco, la madre de todas las leyes. En nin- gún lugar esto es más evidente que en el uso continuado y acrítico del manual por anto- nomasia del análisis de redes sociales (ARS), el tratado de Wasserman y Faust (1994). Respecto de él escribía yo hace diez años: Cuatro o cinco años después de editado ese manual considerado pináculo en su género se descubrió que las redes de la vida real no exhiben las propiedades estadísticas que Was- serman y Faust dan por sentadas. No son pocos los cálculos que propone este tratado que deberían plantearse ahora de otra manera; lo mismo se aplica a diversos supuestos meto- dológicos (distribuciones de Bernoulli, muestreo, monotonía) y a las correspondientes es- trategias de modelado y visualización. Aquí y allá el texto de Wasserman-Faust habla […] de modelado estadístico y pruebas de significancia sin reconocer que estas técnicas de statistical testing (englobadas en la sigla NHST) hace mucho se saben problemáticas (véase p. ej. Bakan 1960; Berkson 1938; Rozeboom 1960; Meehl 1967; Morrison y Hen- kel 1970; Carver 1978; Carver 1993; Gigerenzer 1993; Cohen 1994; Falk y Greenbaum 1995; Harlow, Mulaik y Steiger 1997; Hunter 1997; Shrout 1997; Daniel 1998; Feinstein 1998; Krueger 2001; Haller y Krauss 2002; Gigerenzer 2004; Armstrong 2007a; 2007b; McCloskey y Zilliak 2008). Conceptos que se han vuelto fundamentales (la fuerza de los lazos débiles, los mundos pequeños, las transiciones de fase, la coloración de grafos y sus generalizaciones, la teoría de Ramsey, las cajas de Dirichlet, el principio de los pigeonholes, los grafos de intersec- ción, de intervalo y de tolerancia, los grafos pesados, los árboles abarcadores mínimos, la tratabilidad, la percolación, la escala, la no-linealidad, las alternativas a la ley del semicír- culo, la teoría extremal de grafos, la optimización combinatoria, el análisis espectral, las matrices laplacianas, la noción misma de vectores o de valores propios) no se tratan en absoluto o se despachan a la ligera. El texto, de apariencia extrañamente setentista, per- manece anclado en una concepción estructural-estática de las redes que contrasta con la visión procesual-dinámica que hoy se cultiva en los principales centros de investigación. Lo más grave, consecuentemente, es que el libro consolidó una visión analítica de las re- des sociales, sin interrogar a través de un modelado genuino los mecanismos que hacen a su accionar o la posibilidad de intervenir en ellas (Reynoso 2011a: 23-24, n. 5). Aunque hay razones técnicas de peso para introducir más de un cambio drástico, las perspectivas estocastológicas (como las llama Paul Meehl [1978]), indiferenciables de la Realidad Lineal General (Abbott 1988) y del paradigma de Mediocristán (como lo bautiza el polémico Nassim Taleb [2007]) siguen siendo dominantes. Aunque este con- servadurismo engendra muchos factores que invitan a una discusión de gran interés, en este ensayo sólo me ocuparé de poner en tela de juicio uno solo de ellos, que es el que concierne a la prueba estadística de la hipótesis nula [NHST], una práctica que se ha im- puesto como un requisito imperioso en el Análisis de Redes Sociales y en la investiga- ción en general pese a haber sido cuestionada severamente desde mucho antes y con in- dependencia del redescubrimiento de la preponderancia de la LP en una proporción sig- nificativa de las cosas humanas. Todo un largo capítulo del mencionado manual canóni- co del ARS (Wasserman y Faust 1994: 603-674), por ejemplo, continúa patrocinando métodos de prueba de hipótesis que hace rato se saben engañosos sin decir palabra sobre el conflicto que ha estallado en torno suyo. 3 Carlos Reynoso – Antropología y estadísticas Ante este escenario, en el estudio que aquí comienza me propongo no sólo arrojar algu- na luz sobre el estado de la polémica a propósito de la NHST, sino demostrar que los factores que hacen a la fragilidad del método tienen menos que ver con la interpretación de los resultados de oscuras operaciones aritméticas que con las premisas epistémicas de linealidad, sumatividad, homogeneidad y distribución normal alentadas por las corrien- tes principales de la estadística en su conjunto, comenzando por la lógica que rige las o- peraciones de muestreo. Aunque en un lado se promueva la cuantificación a ultranza y en el otro se cultive una escritura intensamente esteticista, cuando se las mira bien se descubre además que aquellas premisas se fundan en las mismas concepciones de en- capsulamiento del todo en la parte, de monotonía y de representatividad que gobiernan la hermenéutica del conocimiento local en la antropología interpretativa, en sus deriva- ciones posmodernas y perspectivistas y en todo el campo de lo que han sido los estudios culturales (Geertz 1983: 16; 2000: 133-140; compárese con Kruskal 1979a; 1979b; 1979c; 1980). Cabe presumir que estas concordancias se deben a que dichos postulados de linealidad, convexidad y proporcionalidad