Modelos estadísticos con datos electorales multipartidistas

Featured

El próximo 3 de mayo de este año se presentará el libro Aplicaciones en Economía y Ciencias Sociales con Stata en el Encuentro de Usuarios de Stata en México. Javier Aparicio y su atento servidor escribimos el capítulo 8: “Modelos estadísticos para sistemas electorales multipartidistas en Stata”.

¿Por qué un capítulo sobre modelos estadísticos con datos electorales multipartidistas? A pesar de que la literatura académica sobre este tema se encuentra relativamente bien establecida, la gran mayoría de los análisis electorales en México raramente incorporan sus recomendaciones. Continue reading

Mapa de resultados electorales en México

Featured

En esta entrada del blog describí una paleta de colores con el propósito de elaborar un nuevo formato de mapas para datos electorales en México, similar a los que se utilizan en Estados Unidos.

El resultado de aplicar esa paleta se muestra en el mapa de abajo, que ilustra el % de votos para los tres principales candidatos presidenciales en 2012 por municipio.

map_triplot

En términos de competencia electoral, el mapa presenta las mismas conclusiones que el mapa de Diego Valle y al mismo tiempo muestra el grado de apoyo hacia los candidatos presidenciales, como los mapas secuenciales de Magaloni y Díaz-Cayeros.

El mapa de abajo muestra los resultados de la elección de Diputados Federales de 2006:

map_mun_featured

 

Promedio de encuestas – Estado de México 2017

También te puede interesar: Promedio de encuestas – Coahuila 2017

El próximo domingo 4 de junio se realizará la elección para elegir al Gobernador del Estado de México. Algunos sitios especializados han recopilado los resultados de diversas encuestas publicadas durante la campaña electoral. Mi propósito en este post es presentar un promedio de dichas encuestas o poll of polls.

La técnica que utilizo se denomina meta-análisis. Dicha técnica se suele emplear para sintetizar los resultados de varios estudios muestrales que buscan estimar un mismo parámetro poblacional. El meta-análisis permite calcular la intención de voto que subyace a los resultados de distintas encuestas al estimar la heterogeneidad que existe entre ellas y considerando su variabilidad muestral. La implementación que utilizo es un modelo de regresión con efectos mixtos que incluye efectos temporales como mediadores para estimar los cambios en la intención de voto durante la campaña.

Desafortunadamente, el número de encuestas publicadas fue relativamente limitado, por lo que consideré únicamente cuatro periodos en los que se concentran los levantamientos de campo:

  • Periodo 1: del 15 de febrero al 15 de marzo (pre-campaña)
  • Periodo 2: del 16 de marzo al 15 de abril (arranque de campaña)
  • Periodo 3: del 15 de abril al 15 de mayo (campaña)
  • Periodo 4: del 16 de mayo al 1 de junio (cierre de campañas y último día de publicación de encuestas)

La gráfica de abajo muestra los resultados del meta-ánalisis. La gráfica incluye la preferencia bruta de cada encuesta junto a sus intervalos de confianza y el promedio para cada periodo de tiempo (la fecha que se reporta es el mid-point entre el inicio y el final del levantamiento).

plot_metanalisis

*La más reciente encuesta de El Universal no fue incorporada debido a que en la publicación no reporta la No-respuesta de la pregunta de intención de voto. La encuesta de El Universal da ventaja a Alfredo del Mazo en preferencia efectiva.

La gráfica de abajo muestra mil simulaciones de trayectorias que provienen de los promedios de encuestas estimados en el meta-análisis.

plot_time_series

Finalmente, la siguiente gráfica presenta la distribución de probabilidad del promedio de la preferencia “efectiva”; es decir, los porcentajes de intención de voto cuando se omite la No-respuesta.

plot_final


Metodología

El modelo para estimar el promedio de encuestas se puede describir de la siguiente manera:

\begin{aligned}  \begin{array}{ccc}  y_{i,j} & = & \theta_{i,j}+e_{i,j}\\  \theta_{i,j} & = & \mu_{j}+u_{i,j}\\  \mu_{j} & = & \alpha_{j}+\beta_{p[i]j}\\  e_{i,j} & \sim & N\left(0,\tau_{j}^{2}\right)\\  u_{ij} & \sim & N\left(0,\nu_{j}^{2}\right)\\  \tau_{j}^{2} & = & \frac{y_{i,j}(1-y_{i,j})}{n*}\\  n* & = & \frac{n}{deff}  \end{array}  \end{aligned}

donde i denota cada encuesta,j a los candidatos, yp al periodo de tiempo. y_{i,j} representa la preferencia bruta estimada en cada estudio. n* indica el tamaño de muestra “efectivo”, que resulta de dividir al tamaño de muestra observado entre el efecto de diseño o deff (la pérdida de eficiencia ocasionada por el muestreo por conglomerados fijada en 1.5). De este modo, \tau_{j}^{2} denota la varianza de las proporciones de intención de voto aproximadas con la distribución normal. \beta_{p[i]j} representan los efectos temporales. \mu_{j} puede interpretarse como el promedio de intención de voto. La heterogeneidad de los métodos empleados en cada encuesta es capturada por u_{ij}, mientras que e_{i,j} es un componente residual de error.

Promedio de Encuestas – Coahuila 2017

También te puede interesar: Promedio de encuestas – Estado de México

El próximo domingo 4 de junio se realizará la elección para elegir al Gobernador de Coahuila. Algunos sitios especializados han recopilado los resultados de diversas encuestas publicadas durante la campaña electoral. Mi propósito en este post es presentar un promedio de dichas encuestas o poll of polls.

La técnica que utilizo se denomina meta-análisis. Dicha técnica se suele emplear para sintetizar los resultados de varios estudios muestrales que buscan estimar un mismo parámetro poblacional. El meta-ánalisis permite calcular la intención de voto que subyace a los resultados de distintas encuestas al estimar la heterogeneidad que existe entre ellas y considerando su variabilidad muestral. La implementación que utilizo es un modelo de regresión con efectos mixtos que incluye efectos temporales como mediadores para estimar los cambios en la intención de voto durante la campaña.

Desafortunadamente, el número de encuestas publicadas fue limitado, por lo que consideré únicamente cuatro periodos en los que se concentran los levantamientos de campo:

  • Periodo 1: del 15 de febrero al 15 de marzo (pre-campaña)
  • Periodo 2: del 16 de marzo al 15 de abril (arranque de campaña)
  • Periodo 3: del 15 de abril al 15 de mayo (campaña)
  • Periodo 4: del 16 de mayo al 1 de junio (cierre de campañas y último día de publicación de encuestas)

La gráfica de abajo muestra los resultados del meta-ánalisis. La gráfica incluye la preferencia bruta de cada encuesta junto a sus intervalos de confianza y el promedio para cada periodo de tiempo (la fecha que se reporta es el mid-point entre el inicio y el final del levantamiento). Los promedios estimados indican que las encuestas (en su conjunto) registraron una contienda cerrada entre los candidatos del PAN y del PRI.

plot_metanalisis_coah

*La más reciente encuesta de El Universal no fue incorporada debido a que en la publicación no reporta la No-respuesta de la pregunta de intención de voto.

La gráfica muestra un patrón estilizado: aunque la preferencia bruta es similar en las diversas encuestas para la mayoría de los candidatos, existe cierta dependencia entre la intención de voto por Guillermo Anaya y la No-Respuesta: cuando la No-Respuesta es alta, la preferencia por el candidato del PAN tiende a disminuir y viceversa.  En consecuencia, el promedio de la intención de voto por Anaya presenta alta variabilidad e incertidumbre.

La gráfica de abajo ilustra más claramente ese patrón. En ella se muestran mil simulaciones de trayectorias que provienen de los promedios de encuestas estimados en el meta-análisis. Como se observa, las trayectorias del candidato del PAN presentan un rango considerablemente mayor al del resto de los candidatos.

plot_time_series_coah

Finalmente, la siguiente gráfica presenta la distribución de probabilidad del promedio de la preferencia “efectiva”; es decir, los porcentajes de intención de voto cuando se omite la No-respuesta.

plot_final_coah


Metodología

El modelo para estimar el promedio de encuestas se puede describir de la siguiente manera:

\begin{aligned}  \begin{array}{ccc}  y_{i,j} & = & \theta_{i,j}+e_{i,j}\\  \theta_{i,j} & = & \mu_{j}+u_{i,j}\\  \mu_{j} & = & \alpha_{j}+\beta_{p[i]j}\\  e_{i,j} & \sim & N\left(0,\tau_{j}^{2}\right)\\  u_{ij} & \sim & N\left(0,\nu_{j}^{2}\right)\\  \tau_{j}^{2} & = & \frac{y_{i,j}(1-y_{i,j})}{n*}\\  n* & = & \frac{n}{deff}  \end{array}  \end{aligned}

donde i denota cada encuesta,j a los candidatos, yp al periodo de tiempo. y_{i,j} representa la preferencia bruta estimada en cada estudio. n* indica el tamaño de muestra “efectivo”, que resulta de dividir al tamaño de muestra observado entre el efecto de diseño o deff (la pérdida de eficiencia ocasionada por el muestreo por conglomerados fijada en 1.5). De este modo, \tau_{j}^{2} denota la varianza de las proporciones de intención de voto aproximadas con la distribución normal. \beta_{p[i]j} representan los efectos temporales. \mu_{j} puede interpretarse como el promedio de intención de voto. La heterogeneidad de los métodos empleados en cada encuesta es capturada por u_{ij}, mientras que e_{i,j} es un componente residual de error.

Asamblea Constituyente CDMX

La Asamblea Constituyente de la Ciudad de México estará integrada por 100 diputados, de los cuales 60 serán electos por el principio de representación proporcional el domingo 5 de junio. Algunos políticos y analistas han pronosticado que la composición de la Asamblea contrastará notablemente con los votos que obtendrán los partidos en la elección del próximo domingo debido a que 40 de los 100 diputados serán designados de manera directa por el Congreso y por los gobiernos federal y de la Ciudad de México.

Continue reading

Cómo analizar la ENVIPE en Stata

De acuerdo con el INEGI, a nivel nacional 73% percibe a su estado como “inseguro”, pero si uno analiza la base de datos, la cifra es 68%.¿Por qué existen esas diferencias?

[También revisa Cómo analizar la ENVIPE en R]
La Encuesta Nacional de Victimización y Percepción sobre Seguridad Pública (ENVIPE) del INEGI es una fuente de datos muy valiosa para los expertos en seguridad pública. Sin embargo, es común que al analizar la base de datos de la encuesta, algunos no puedan replicar los resultados que proporciona el INEGI. Por poner un ejemplo, de acuerdo a los tabulados del INEGI, a nivel nacional 24.5% de los individuos percibe a su estado como “seguro” y 73.2% como “inseguro”; pero si uno realiza un tabulado directamente de la base de datos, los porcentajes son 29.3% y 68%, respectivamente.¿Por qué existe esa discrepancia?

Continue reading

Cómo analizar la ENVIPE en R

De acuerdo con el INEGI, a nivel nacional 73% percibe a su estado como “inseguro”, pero si uno analiza la base de datos, la cifra es 68%.¿Por qué existen esas diferencias?

[También revisa Cómo analizar la ENVIPE en Stata]
La Encuesta Nacional de Victimización y Percepción sobre Seguridad Pública (ENVIPE) del INEGI es una fuente de datos muy valiosa para los expertos en seguridad pública. Sin embargo, es común que al analizar la base de datos de la encuesta, algunos no puedan replicar los resultados que proporciona el INEGI. Por poner un ejemplo, de acuerdo a los tabulados del INEGI, a nivel nacional 24.5% de los individuos percibe a su estado como “seguro” y 73.2% como “inseguro”; pero si uno realiza un tabulado directamente de la base de datos, los porcentajes son 29.3% y 68%, respectivamente.¿Por qué existe esa discrepancia?

Continue reading

Morena, efecto de spolier y cálculos estratégicos

Quote

En un post anterior abordé el efecto de spoiler que MORENA podría ocasionar a la izquierda en las recientes elecciones para la Cámara de Diputados. (Próximamente publicaré una entrada en la que calculo el número de curules que la coalición gobernante ganó en la pasada elección como consecuencia de la fragmentación de la izquierda).

Continue reading

Voto nulo, ¿voto de protesta?

Un argumento fundamental del movimiento anulista es que el voto nulo envía una señal clara de desaprobación hacia los políticos, mientras que abstenerse de votar podría interpretarse simplemente como falta de interés por parte de los ciudadanos. Sin embargo, el aumento del voto nulo en 2009 no tuvo esa intencionalidad; en realidad, se debió en gran medida a  errores atribuibles al nuevo diseño de la boleta electoral y a las coaliciones que formaron los partidos políticos.

Continue reading

Tres errores al interpretar intervalos de confianza

En días pasados, Consulta Mitofsky difundió su más reciente encuesta de preferencia electoral. Los resultados muestran que los intervalos de confianza de la intención de voto del PAN y del PRI se traslapan, por lo que algunos analistas (e incluso pollsters) aseguran que –en términos estrictos– la diferencia entre ambos partidos “no es estadísticamente significativa”. Esta “regla de dedo” es generalmente correcta cuando el área de traslape es sustantiva. Pero en el caso de la encuesta de Consulta, la respuesta es más compleja de lo que parece.

Continue reading

Morena afectará al PRD

El día de ayer, El Universal publicó un artículo que escribí sobre el posible impacto de MORENA en los resultados de la próxima elección de Diputados Federales de 2015. El artículo se basa en dos análisis que publiqué previamente en el blog:

Aquí la versión completa del artículo (como es natural, tuvo que ser editado por razones de espacio).

Continue reading