Por Miguel Zavala.
«El error es el último refugio de los mentirosos»
Máxima de mi hechura
Los encuestadores siempre andan con muchas ínfulas de ser unos sabihondos en estos menesteres.
Algunos, muchos o todos los electores estarán persuadidos de que las encuestas electorales mienten. Motivos razonables hay de sobra para esto porque nuestra experiencia acumulada nos habla de unas encuestas que se «equivocan» en sus proyecciones con demasiada frecuencia.
Por definición, el muestreo probabilístico postula la existencia de un error de muestreo inevitable en toda muestra. Esto constituye una concesión a la realidad con respecto a la limitación y falibilidad humana. Sin embargo, cuando los encuestadores cometen demasiados «errores» humanos que no se pueden explicar con el error de muestreo inevitable, que es el fracaso que vemos de ordinario, entonces tenemos una de dos explicaciones a esas fallas recurrentes: o los encuestadores son una bola de incompetentes en los estudios por muestreo o de plano son una banda de mentirosos.
Los encuestadores siempre andan con muchas ínfulas de ser unos sabihondos en estos menesteres. Pues bien, la buena noticia para ellos, los encuestadores, es que la gente ordinaria compra sus ínfulas como ciertas, porque atribuyen la causa de sus fallos recurrentes, no al error, que es algo inadmisible en los sabios, sino a la mentira.
En este artículo le ofrezco al lector una serie de pruebas para que se convenza de que algunas o todas las encuestas mienten. Pero antes de entrar en materia, haré algunas aclaraciones conceptuales que serán de gran ayuda al lector para entender a cabalidad lo que diré. Trataré de ser lo más sencillo y ordinario que me sea posible considerando que el común de los lectores no tiene conocimientos de estadística avanzada y menos de muestreo; un saber al cual no están obligados.
Marco conceptual:
En todo momento del proceso electoral la población total de electores – personas que pueden ejercer su voto – en Nuevo León está dividida en diferentes grupos poblacionales según preferencias de candidatos a la gubernatura. El porcentaje que cada uno de esos grupos poblacionales representa dentro del total de electores es un parámetro poblacional al que llamaremos «preferencia verdadera» de cada candidato. Y todos los candidatos tienen sólo una «preferencia verdadera» en cualquier momento del tiempo y es desconocida durante las campañas porque es prácticamente imposible calcularla por limitaciones técnicas y económicas. Así que las «preferencias verdaderas» de la población de electores en Nuevo León sólo serán conocidas al final de la jornada electoral, cuando se publiquen los resultados definitivos de las votaciones.
Afortunadamente, existen técnicas de investigación científica que nos permiten cubrir ese vacío de conocimiento sobre las «preferencias verdaderas» de la población de electores estimándolas en un momento determinado del tiempo y con algún margen de error probable y un nivel de confianza determinados. Una de esas técnicas es la aplicación de cuestionarios de preferencias electorales a una muestra probabilística y representativa de electores, y que es lo que en teoría pretenden hacer las encuestas electorales que conocemos en nuestra experiencia ordinaria.
Cada encuesta electoral obtiene como resultado unos estadísticos que llamaremos «preferencias estimadas» para los candidatos. Éstas «preferencias estimadas» son los resultados que ordinariamente vemos en las encuestas publicadas en los medios de información. Y como su nombre lo indica, esas «preferencias estimadas» son estimaciones de las «preferencias verdaderas» de la población total de electores. Pero esas estimaciones no son exactas en virtud de que están sujetas a un margen de error probable. Este margen de error probable es inevitable porque toda encuesta está sujeta por definición a un error de muestreo determinado.
Una encuesta de preferencias electorales que esté «bien hecha» – que esté realizada conforme a los axiomas y reglas del muestreo y la recopilación no sesgada de datos -, obtendrá como resultado «preferencias estimadas» que estarán muy cerca de las «preferencias verdaderas» de la población total de electores dentro del margen de error que se haya propuesto en el diseño de la muestra. Esto significa que las «preferencias verdaderas» de la población total de electores estarán dentro del margen de error que se haya propuesto la encuesta con un nivel de confianza determinado, que normalmente es de 95%. Bajo esta premisa, podemos afirmar que todas las encuestas electorales que estén bien hechas y que se hayan aplicado a la misma población en tiempos iguales o muy semejantes, tenderán a ofrecer «preferencias estimadas» muy parecidas o con diferencias no significativas entre sí. Esto tiene que ser así forzosamente por lo que ya señalé arriba: cada candidato tiene sólo una «preferencia verdadera» en la población de electores bajo estudio.
Es por lo anterior que sabemos que hemos llegado a un escenario anómalo o aberrante cuando varias encuestas obtienen «preferencias estimadas» que son significativamente diferentes entre sí y no obstante que se aplicaron a la misma población y en tiempos iguales o muy semejantes. Esta aberración o anomalía nos obliga a concluir que algunas o todas las encuestas están mintiendo.
Este escenario aberrante y absurdo es el que casi siempre se presenta al final de los procesos electorales, cuando el público se entera de que las «preferencias estimadas» de las encuestas fueron muy diferentes de las «preferencias verdaderas» que resultaron al final del día en las votaciones. Es en ese momento en que el público tiene la prueba definitiva de que algunas o todas las encuestas mintieron. Y para nuestra desgracia, este escenario aberrante y absurdo de las encuestas se ha vuelto demasiado frecuente en nuestra experiencia, y no es sino por esto que las encuestas han caído en un completo descrédito.
Vamos a las pruebas:
Me puse a recolectar los resultados de algunas de las encuestas electorales más recientes para realizar pruebas estadísticas. Sólo consideré a las encuestas más importantes. No estoy considerando a todas esas encuestas que, en base a mi amplia experiencia, considero que son mentiras descaradas. En este grupo de encuestas basura están, por ejemplo, las que está inventando Samuel García para distribuirlas a granel en redes sociales y cruceros de la ciudad.
La siguiente tabla, la imagen 1, resume algunas características de las encuestas que tomé en cuenta para este análisis. El lector puede ver fácilmente que las encuestas difieren entre sí en cuanto a las «preferencias estimadas» para los candidatos a la gubernatura de Nuevo León. Si juzgamos las diferencias a simple vista para determinar si son importantes o no, entraremos a una controversia sin solución porque estamos en el terreno subjetivo. Así que para evitar esto y poder llegar a conclusiones de común acuerdo sobre las diferencias, opté por desarrollar una prueba estadística que nos permita cumplir con el criterio de la objetividad.
Elegí una prueba de hipótesis muy sencilla de z-score, pero no entraré en detalles técnicos sobre la forma en que se realizan estas pruebas porque creo que no es del interés del lector común. Sólo aclararé la forma genérica en que esto se hace.
La prueba consiste en comparar los resultados de dos encuestas específicas para determinar si existen entre ambas diferencias estadísticamente significativas. Para este efecto, calculamos un z-score y lo comparamos con los valores críticos de Z para el 95% y el 99% de confianza. Si el valor absoluto del z-score (valor absoluto significa que no tomemos en cuenta el signo de los cálculos del z-core) es igual o mayor que el valor crítico de Z, entonces podemos concluir que hay diferencias entre las «preferencias estimadas» de las dos encuestas, y que dichas diferencias son estadísticamente significativas. Finalmente, la comparación se tiene que hacer entre encuestas que se hayan aplicado a la misma población en tiempos iguales o al menos aproximadamente iguales.
Bien, la siguiente tabla, la imagen 2, nos da el resultado de la prueba para la comparación entre la encuesta más reciente del periódico El Norte y otra de Demotecnia. En este caso estamos usando la encuesta escandalosa que El Norte sacó de imprevisto recientemente y donde disparó a Samuel García hasta el 32% y castigó a Clara Luz Flores con un 16%.
En esa tabla los valores absolutos de los z-score o z-calculados (sin tomar en cuenta el signo del cálculo) para las «preferencias estimadas» de las dos encuestas superan los valores críticos de Z al 95% y el 99% en el caso de los tres candidatos principales para la gubernatura de Nuevo León: Clara Luz Flores, Adrián de la Garza y Samuel García. Sólo en el caso de Fernando Larrazábal el z-score es inferior al valor crítico de Z. Lo anterior nos permite afirmar, con el 99% de confianza, que las «preferencias estimadas» por las dos encuestas para los tres candidatos principales tienen diferencias estadísticamente significativas que no pueden ser explicadas con el error de muestreo («Sí» en la tabla). Pero esto también nos obliga a concluir, con el 99% de confianza, que una de las dos encuestas o las dos están mintiendo. Y debemos concluir esto por lo que ya afirmamos antes en el marco conceptual: dos encuestas que son realizadas correctamente sobre la misma población y en el mismo tiempo deben dar resultados muy parecidos o con diferencias no significativas.
Desgraciadamente, no podemos determinar de manera concluyente cuál de esas dos encuestas está mintiendo, o si las dos están mintiendo, porque no conocemos en este momento las «preferencias verdaderas» de la población electoral total en Nuevo León – nos referimos a este vacío de conocimiento inevitable en el marco conceptual -.
El lector puede observar también que el caso de Clara Luz Flores es donde el valor absoluto del z-score o calculado supera al valor crítico de Z con más amplitud: 6.61 contra 2.575 para el 99% de confianza. Esto se debe a que El Norte castigó demasiado a esta candidata en su encuesta bajándola hasta el 16%, mientras que Demotecnia le da el 23% de las preferencias. Pero como ya vimos en nuestra prueba estadística, esta diferencia escandalosa entre las dos encuestas es prueba de que una de las dos o las dos están mintiendo.
Pero este problema no es un caso único. Lo cierto es que, como de costumbre, la mentira se está presentando con demasiada frecuencia en las encuestas electorales en Nuevo León. La siguiente tabla, la imagen número tres, es bastante elocuente al respecto.
En esa tabla estamos viendo comparativas para diferentes pares de encuestas. Aunque logré formar diez pares o comparativas, en estricto sentido técnico sólo podemos hacer pruebas de hipótesis para tres comparativas porque son las que se empalman total o parcialmente en fechas de levantamiento. Me estoy refiriendo a la «Comparativa 1» (Enkoll – Demotecnia), la «Comparativa 2» (Enkoll – El Heraldo), y tal vez la «Comparativa 5» (Demotecnia – El Heraldo), y que son los renglones coloreados de amarillo.
Sobre esas tres comparativas se puede decir, con el 95% de confianza, que todas tienen diferencias estadísticamente significativas en sus «preferencias estimadas» para Clara Luz Flores y Samuel García («Sí» en la tabla). Pero de nueva cuenta, este hallazgo nos permite concluir, con el 95% de confianza, que algunas de estas encuestas están mintiendo al menos en el caso de estos dos candidatos. Y todo indica que la mentira se debe a que están inflando a Samuel García y castigando a Clara Luz Flores.
La «Comparativa 8» (El Heraldo – El Norte) es muy interesante y digna de tomarse en cuenta. Aunque las dos encuestas fueron realizadas en tiempos diferentes pero muy cercanos – El Heraldo entre el 27 y el 28 de marzo y El Norte entre el 29 y el 31 de marzo -, sólo presentan una diferencia estadísticamente significativa en el caso de Clara Luz Flores. Esta diferencia se debe a algo que ya es recurrente en lo que hemos visto: El Heraldo le dio a Clara Luz el 24% de las preferencias, y El Norte la castigó con un 19%. Estamos hablando de la encuesta normal o protocolaria de El Norte, la mensual, no de la encuesta escandalosa que este periódico sacó de imprevisto recientemente y donde disparó a Samuel García hasta el 32% y castigó a Clara Luz Flores con un 16% de las preferencias.
Ahora bien, como la prueba de hipótesis para la «Comparativa 8» arroja «preferencias estimadas» estadísticamente iguales para la mayoría de los candidatos, y pese a que las dos encuestas fueron levantadas en tiempos diferentes, aunque muy cercanos, entonces creo que resulta razonable suponer que todas las encuestas de la tabla anterior podrían compararse con independencia de su fecha de levantamiento. Esto tiene sentido porque todas esas encuestas fueron levantadas en un breve período de tiempo que va del 25 de marzo al 1 de abril, tiempo en el cual las condiciones políticas tal vez no variaron de manera significativa en la percepción de las gentes.
Atenidos a lo anterior, si relajamos la condición de la fecha de levantamiento y realizamos una prueba de hipótesis para las 10 comparativas de la tabla, resulta que en 24 casos las «preferencias estimadas» tienen diferencias estadísticamente significativas al 95% de confianza («Sí» en la tabla), y sólo en 14 casos no hay diferencias estadísticamente significativas («No» en la tabla). Así que podemos decir con el 95% de confianza que algunas o todas estas encuestas de la tabla están mintiendo parcial o totalmente.
Creo que con lo anterior es suficiente para concluir que algunas o todas las encuestas electorales de Nuevo León están mintiendo parcial o totalmente. Desgraciadamente, no podemos determinar cuáles encuestas están mintiendo, en qué y en cuánto están mintiendo, por lo que ya dije antes: todos desconocemos las «preferencias verdaderas» de la población total electoral de Nuevo León en las fechas en que se aplicaron estas encuestas.
Para que el lector entienda lo que está ocurriendo aquí lo pongo en un escenario hipotético. Suponga el lector que las elecciones para gobernador de Nuevo León se realizaron el 2 de abril pasado. Pues bien, podemos asegurar con el 95% de confianza que los resultados de las votaciones hubieran sido significativamente diferentes a las proyecciones de algunas o todas esas encuestas que hemos analizado, y estaríamos de nuevo acusando a los encuestadores de mentirosos.
Debo hacer una aclaración respecto la encuesta de El Financiero. Resulta que este medio publicó sus encuestas el 6 de abril, pero su metodología publicada es muy deficiente y pobre. Por ejemplo, no indican las fechas de levantamiento para cada una de sus encuestas, lo cual hace imposible cualquier análisis sobre las cifras reportadas. Días antes de publicar este artículo hablé a ese periódico para pedir la fecha de levantamiento de la encuesta para Nuevo León, pero no la pude obtener. Hasta donde sé, este problema no se ha corregido. Desconozco el motivo por el cual no publicaron las fechas de levantamiento, pero me resulta difícil atribuirlo a un error. Y fue por este «error» de publicación que las pruebas de hipótesis para la encuesta de este diario las tuve que hacer suponiendo que la levantaron entre el 25 de marzo y el 1 de abril.
Algunas de las pruebas que ya hemos visto las presenté en una serie de dos programas de televisión por Internet al que fui invitado como opinador. Estoy hablando del programa «La Polémika con K» del medio de información Antena X, y conducido por los periodistas Francisco Peña y Juan José Coello.
Mi primera intervención en ese programa de televisión ocurrió el 5 de abril pasado y detonó mucho ruido y polémica en torno a las encuestas. Tengo entendido que esto motivó que el señor Mauricio Fernández, el candidato del PAN a la alcaldía de San Pedro, lanzara un reto al periódico El Norte para que probara que sus encuestas son verdaderas, y poniendo de por medio una apuesta monetaria millonaria en su monto. Incluso el señor Mauricio Fernández asistió al programa «La Polémika con K» a los siguientes días para tratar este asunto de las encuestas y otros temas de su campaña política. A la reacción crítica contra las encuestas del señor Mauricio Fernández, se sumaron otros analistas y periodistas, como el arquitecto Héctor Benavides, de Multimedios.
Pocos días después, y en un evento que desconozco si esté conectado o no con lo anterior, también el presidente de México, Andrés Manuel López Obrador, se refirió al problema de las encuestas mentirosas y propagandísticas en Nuevo León. En esa ocasión el presidente se refirió crítica y específicamente a las encuestas del periódico El Norte, al cual calificó prácticamente de un partido político informal que suele intervenir en las elecciones de ese estado para tratar de imponer a sus peleles en los gobiernos locales.
Sobre las encuestas mentirosas y la «profecía autorrealizada»:
Ahora voy a relajar el rigorismo técnico para ofrecer mis opiniones sobre lo que está ocurriendo en este asunto.
Como ya dije antes, por un razonable acto de prudencia debo atribuir las fallas sistemáticas de las encuestas electorales a la mentira deliberada, y no al error humano. Creo también que la mentira tiene una intencionalidad política, donde no hay nada nuevo bajo el Sol si nos atenemos a la experiencia acumulada. Tal como dije en el programa de televisión «La Polémika con K», para nuestra desgracia las encuestas se han ido pervirtiendo para convertirse de instrumentos de investigación científica en instrumentos de propaganda política. Y como instrumentos de propaganda que son, las encuestas se valen de la psiquiatría aplicada haciendo uso del truco de la profecía autocumplida o autorrealizada, y soportada por la falacia de la autoridad. Voy a explicar esto enseguida en términos de encuestas.
Una profecía autorrealizada se da al principio como una falsa proyección estadística de «preferencias estimadas» para los candidatos en una contienda – encuestas que mienten -. Pero gracias a falacias, sesgos e ilusiones que imperan en el pensamiento instintivo de las personas, y donde brilla por su poder de autoengaño la falacia de la autoridad – «Si lo dijo El Norte, entonces es cierto», por ejemplo -, esa profecía falsa genera un comportamiento social agregado que hace que aquellas falsas «preferencias estimadas» se vuelvan realidad como «preferencias verdaderas» de la población electoral total el día de las votaciones.
Mi opinión es que al menos la mayoría de las encuestas están ocupadas en este trabajo de psiquiatría aplicada y de propaganda política, y donde su objetivo es ya bastante claro hasta para el sentido común: inflar en preferencias a Samuel García y derrumbar a Clara Luz Flores. Y desde luego que estas encuestas pueden lograr su propósito a través de ese truco de la «profecía autorrealizada» porque, desgraciadamente, las personas suelen pensar instintivamente y no críticamente, con lo cual se dejan dominar por falacias, ilusiones y sesgos y se hacen víctimas de manipulación mediática. Vaya, me atrevería a decir que estas encuestas mentirosas que hemos analizado sí han logrado su propósito en algún grado inflando a Samuel García en preferencias y bajando a Clara Luz Flores.
Sobre el contenido de la intencionalidad política en estas encuestas mentirosas, hablaré en el siguiente artículo.