Medición del sesgo partidista con Modelos de Mezclas Finitas

En el post anterior presenté los resultados de un modelo estadístico para estimar el sesgo partidista en México con los datos de las elecciones 1991-2012 (King, 1990). Desafortunadamente, los modelos basados en resultados históricos suelen proporcionar resultados poco robustos (Linzer, 2012: 402):

One approach to assessing this quantity might compare election outcomes across multiple years, to see how parties’ seat and vote shares actually covaried […]. However, as discussed by Niemi and Fett (1986) and Jackman (1994), there are weaknesses to multiyear methods. They require data from a large number of elections to achieve stable estimates. They are unable to capture over-time changes in parties’ seats–votes relationship. Nor do they effectively accommodate changes to a country’s party system or handle uncontested electoral districts in a consistent manner. Models for estimating the swing ratio based upon data from a single election represent a superior approach.

En esta ocasión presento los resultados de otro modelo (Linzer, 2012) para medir el sesgo partidista con los datos de la elección de 2006. Como Linzer señala, la relación entre votos y curules puede variar de una elección a otra. Por lo tanto, el sesgo de la elección de 2006 no es necesariamente igual al de otras elecciones. Sin embargo, como discutiré en el siguiente post, dicha elección muestra algunas regularidades que tienen implicaciones importantes para la elección intermedia de 2015.

La elección de 2006

Recordemos brevemente lo que significa un sistema electoral equitativo o neutral (King 1990: 164):

[Several authors] define a fair electoral system as one in which, if one party received y% of the seats for x% of the votes, then the other party would be allocated the same y% of the seats if it were to receive x% of the votes.

Así pues, el sistema electoral tiene un sesgo partidista si dos partidos reciben el mismo % de votos, pero uno de ellos obtiene más curules que el otro.

En consecuencia, para analizar el sesgo partidista debemos calcular cuántas curules obtendrían los partidos políticos si recibieran el mismo porcentaje de votos. El problema radica en que es necesario estimar dicho escenario, pues no lo hemos observado en la realidad.

La elección de 2006 es útil porque en ese año la votación de los tres principales partidos políticos se ubicó en un rango relativamente estrecho: el PAN obtuvo 33.4% de los votos, el PRI 28.2% y el PRD 28.9%. Ninguna otra elección de Diputados Federales ha sido tan competida. Así pues, la ventaja de usar los datos de 2006 es que no es necesario plantear contrafactuales “extremas” para nuestro análisis.

ELECCIÓN DE 2006:

PARTIDO % VOTOS NÚM. CURULES % CURULES
PAN 33.39% 137 45.6%
PRI + PVEM 28.21% 65 21.6%
PRD + PT + MC 28.99% 98 32.6%

Modelo estadístico

El propósito original del modelo de Linzer es medir el efecto marginal de la votación de un partido sobre el número de curules que recibe en la legislatura (swing ratio).

En términos generales, su modelo consiste en dos pasos. El primero es estimar una distribución multivariada que describa el porcentaje de votos de los partidos políticos a través de una mezcla de distribuciones normales (Finite Mixture Models). Básicamente se trata de encontrar un conjunto de distribuciones normales, que al mezclarlas, describan razonablemente bien los patrones de votación en los distritos.

El procedimiento enfrenta una dificultad para su aplicación en los sistemas electorales multipartidistas. La proporción de votos de los partidos son un conjunto de datos composicionales, y por lo tanto, para satisfacer los supuestos del modelo, deben ser transformados a logaritmos de razones (log-ratios) antes de efectuar el análisis. [En este otro post describo brevemente la utilidad de esta transformación para modelar los datos electorales multipartidistas].

La gráfica de abajo ilustra la distribución estimada  para los distintos pares de variables (Tamaño de distrito y log-ratios de los partidos; la abstención es la categoría de referencia).

density

El segundo paso consiste en obtener valores aleatorios provenientes de las distribuciones estimadas en el paso anterior (Simulaciones de Monte Carlo). Por ejemplo, al simular 300 valores de la mezcla de las distribuciones obtenemos una elección simulada (un valor para cada distrito electoral). Este procedimiento se repite un número grande de veces para producir varias elecciones hipotéticas. En cada elección hipotética calculamos el porcentaje de votos y el número de distritos ganados por los partidos políticos. Con los resultados podemos analizar la relación entre votos y curules en un conjunto de elecciones que provienen de la misma distribución que la elección observada en la realidad.

Resultados

La gráfica de abajo muestra el % de votos y curules de los tres principales partidos políticos (o coaliciones) calculados a partir de 50 mil elecciones hipotéticas. Las líneas representan el promedio de las elecciones simuladas para los intervalos de votación que se encuentran alrededor del porcentaje que se indica en la gráfica.

local_curve

Las áreas sombreadas representan los percentiles 2.5 y 97.5 de la distribución de curules en dichos intervalos de votación (p. 410). Es decir, representan el porcentaje de curules factibles para distintas combinaciones de resultados que dan lugar a un mismo porcentaje nacional de votos. Por ejemplo, existen varias maneras en las que un partido puede obtener 30% los votos, dependiendo de cómo los demás partidos se reparten el 70% restante. Naturalmente, cada combinación da lugar a un % de curules distinto. Los puntos negros en la gráfica indican los resultados reales de la elección de 2006. Como se observa, dichos resultados pertenecen al conjunto de los resultados “factibles” del modelo.

La gráfica sugiere dos patrones estilizados. Primero, la curva de curules-votos del PAN es parecida a la curva del PRD. Esto significa que si la votación de ambos partidos fuera la misma en el rango que se muestra, obtendrían un número similar de curules. Segundo, la curva del PRI se encuentra debajo de la del PRD, y en consecuencia, del PAN. Esto significa que el PAN y PRD obtendrían más curules que el PRI para porcentajes de votación similares (como ocurrió en la elección de 2006). Es importante subrayar que estos patrones pueden ser distintos en otros rangos de votación (tema que abordaré en el siguiente post).

Para estimar el sesgo partidista debemos enfocarnos en el escenario en que los tres partidos o coaliciones obtienen el mismo porcentaje de votos. El modelo sugiere que ese escenario ocurre entre 31% y 32% de los votos.

La tabla de abajo muestra los resultados de la gráfica anterior, e incluye una predicción lineal de la curva para el PAN y el PRI (celdas marcadas con asterisco; véase Linzer, 2012: 408)

% VOTOS CURULES PAN CURULES PRI+PVEM CURULES PRD+PT+CONV
0.26 72 [63,82]
0.27 56 [46,66] 80 [70,90]
0.28 62 [51,73] 86 [76,96]
0.29 68 [56,80] 92 [82,103]
0.3 74 [63,86] 98 [88,109]
0.31  111 [99,120]* 82 [71,95] 105 [94,116]
0.32 118 [106,127]  89 [78,102]* 112 [101,122]
0.33 125 [113,136] 118 [105,128]
0.34 132 [120,143]
0.35 139 [127,150]
0.36 146 [134,157]
0.37 152 [141,164]

Cuando los tres partidos obtienen 32% de los votos, el PAN recibe 118 curules, el PRD 112 curules y el PRI 89. Es decir, en promedio, el sesgo del PAN con respecto al PRI es de 29 curules, mientras que el sesgo del PRD con respecto al PRI es de 23 curules. El sesgo del PAN con respecto al PRD es de tan solo 6 curules. En suma, la elección de Diputados de 2006 presentó un sesgo que perjudicó principalmente al PRI.

Implicaciones

Los resultados tienen dos implicaciones importantes. La primera tiene que ver con los procesos de redistritación. Los límites distritales determinan el sesgo partidista en los sistemas de mayoría relativa. Como expliqué en otro post, existe la idea generalizada de que la redistritación en México es neutral y equitativa con los partidos porque la realiza un organismo autónomo-apartidista y porque se realiza con criterios estrictamente técnicos. Sin embargo, la elección de 2006 –en la que observamos sesgo– se celebró apenas un año después de la de la redistritación de 2005. La neutralidad del proceso de redistritación no tiene nada que ver con la neutralidad de sus resultados.

La segunda implicación es que, si bien el sesgo de la elección de 2006 no es generalizable a otras elecciones, su causa (que abordaré en el siguiente post) es un patrón recurrente. Mi análisis sugiere que el PRI es fuertemente afectado en términos de curules cuando su votación es menor a 33% aproximadamente. Normalmente la votación del PRI es mayor a 36%; sin embargo, si consideramos que la votación del partido del Presidente en turno suele disminuir considerablemente en las elecciones intermedias, el PRI podría enfrentar un panorama adverso en la elección de 2015 como consecuencia del sesgo partidista.

Material de replicación

El modelo de Linzer está implementado en el paquete seatsvotes de R. Sin embargo, para incorporar los efectos del malapportionment y la participación electoral escribí una función con el paquete Mclust. El material para replicar el análisis se encuentra en mi Dataverse.