viernes, 4 de junio de 2010

Bipartidismo y Teoría de Juegos

Otro ensayo: el bipartidismo y sus negativas consecuencias, con un enfoque pseudomatemático. Es pseudomatemático porque no soy -en absoluto- un experto en teoría de juegos, y estoy seguro de que el ensayo está lleno de incorrecciones, pero aún así, creo que la idea general se puede entender igualmente.

Ahí va:

Teoría de Juegos: Esta rama de las matemáticas (desarrollada por John Nash, al que recordaréis aquellos que hayáis visto la película “Una Mente Maravillosa”) busca “estrategias ganadoras” y “puntos de equilibrio” en modelizaciones de situaciones de la vida real, en las que una serie de “jugadores” buscan maximizar sus beneficios, beneficios que dependen tanto de sus actos como de los actos del resto de jugadores.

Un ejemplo clásico que se usa para ilustrar estos conceptos es el llamado “Dilema del Prisionero”. En este ejemplo, dos personas son detenidas por la policía por el mismo delito y están arrestadas en habitaciones separadas sin poder hablar entre ellas. A los dos se le hace la siguiente oferta: Si ninguno de los incrimina al otro, sólo los podrán detener por cargos menores y cumplirán una condena mínima . Si A acusa a B, pero B no acusa a A, A saldrá libre sin cargos (por su colaboración) mientras que B sufrirá la pena completa. Si los dos se acusan mutuamente, ambos sufrirán un poco menos de la pena completa.

¿Qué debe hacer el prisionero? Lo importante aquí es que el prisionero no sabe qué va a hacer el otro. Tiene dos opciones: acusa al otro o no lo hace. El otro prisionero tiene las mismas opciones.

El prisionero podría razonar así:
“Pongamos que el otro no me acusa:
Si yo no lo acuso a él, me caerán cargos menores. Si le acuso, yo saldré libre. En este caso me conviene acusarle.”
“Ahora pongamos que el otro me acusa:
Si yo no lo acuso a él, me caerá la pena máxima. Si le acuso, rebajaré un poco la pena.”
“Haga lo que haga el otro, yo salgo mejor parado si le acuso.”

El razonamiento del prisionero en cuestión es impecable. El razonamiento del segundo prisionero debería ser un reflejo de éste: así que lo se espera de dos individuos racionales, preocupados por sí mismos y sin comunicación entre ellos es que ambos se acusen mutuamente, sufriendo cada uno la segunda peor condena de las posibles.

No hace falta ser muy perspicaz para ver que la solución en la que ninguno delata al otro les beneficia a ambos mucho más que la de acusarse mutuamente. Sin embargo, esa solución no es un “equilibrio de Nash”, al contrario que la otra, porque, suponiendo que estas dos personas se pudieran poner de acuerdo para no acusarse, cada uno seguiría teniendo la posibilidad de traicionar su acuerdo ya que eso le supone una mejora (salir libre en vez de con cargos menores). Y si uno piensa que puede traicionar al otro, enseguida piensa que el otro puede hacerlo también: y si el otro le traiciona y le acusa y él no lo hace, entonces sufrirá el peor castigo.

En otras palabras: el “pacto” es endeble pues ambos pueden beneficiarse de romperlo.

Normalmente las diferentes posibilidades se ponen en una tablita:

B calla B acusa a A
A calla A: -1, B: -1 A: -20, B: 0
A acusa a B A: 0, B: -20 A: -15, B: -15

Se asignan unos valores numéricos a los diferentes resultados de manera que se pueda ver qué resultados son mejores que otros (lo de maximizar las ganancias)

En este caso, en vez de ganancias hablamos de pérdidas (por eso el valor negativo) pero la idea es la misma. El mejor resultado posible es 0 (salir libre) y el peor es –20 (digamos que estar 20 años en la cárcel).

La mejor estrategia individual lleva a la solución –15, -15. Individualmente es la segunda peor de cuatro (0, -1, -15, -20). Colectivamente, es la peor: al final entre los dos cumplirán 30 años (-2, -20, -20, -30). La mejor solución colectiva es –1, -1, donde entre los cumplirán dos años.

Este juego tiene la particularidad de que desmiente el postulado keynesiano (en el cual está basado el liberalismo económico actual) que afirma que cualquier grupo de personas actuando libremente (sin normas del gobierno), de manera racional (inteligentemente) y egoísta (buscando la máxima ganancia individual) al final obtienen como resultado colateral las mejores decisiones para el grupo (las máximas ganancias colectivas).

Esta situación es un perfecto contraejemplo que invalida dicha afirmación.

Ahora que hemos visto, a modo de ejemplo introductorio, el dilema del prisionero, veamos el “dilema del partido político”.

Postulemos dos partidos políticos (A y B), siempre los mismos, aspirando al gobierno en cada ocasión posible (situación bastante parecida a la realidad). Digamos que las ganancias cuando no se está en el gobierno son 0, las ganancias cuando se está en el gobierno cumpliendo los deseos del pueblo son 1, y no cumpliéndolos (lo llamaremos “hacer trampas”) son 3.

La mejor estrategia una vez en el poder evidentemente es hacer trampas, ya que 3 es mayor que 1. La mejor estrategia estando en la oposición es aparentar que no se van a hacer trampas, para poder ganar las elecciones y pasar de ganancia 0 a ganancia 1 ó 3. Esas son las mejores opciones individuales, sin coordinación entre los partidos.

Ahora veamos casos simultáneos:

El caso en que tanto A como B no hacen nunca trampas, es bastante trivial. Cada uno puede ganar o perder casi con igual probabilidad, obteniendo una ganancia de 1 cuando ganan y una de 0 cuando pierden. La ganancia media, a lo largo de un periodo de tiempo suficientemente largo, sería de 0,5 para cada uno.

Pongamos que A siempre hace trampas y que B nunca las hace (al menos, en principio). Las ganancias de A siempre son 0 ya que nadie les vota, puesto que hay una opción mejor, que es B, y las ganancias de B, que siempre gana y nunca hace trampas, son en cada legislatura 1. La ganancia media de A sería 0 y la ganancia media de B sería 1.

Pongamos que los dos hacen trampas. Cada uno puede ganar o perder con casi igual probabilidad, obteniendo una ganancia de 3 cuando ganan y una de 0 cuando pierden. La ganancia media sería de 1,5 para los dos.
Este juego así modelizado no tiene una “solución”, lo que se llama una “estrategia dominante”. Veamos:

Si mi oponente hace trampas y yo no, gano 1
Si mi oponente hace trampas y yo también, gano 1,5
Si mi oponente no hace trampas y yo sí, gano 0
Si mi oponente no hace trampas y yo tampoco, gano 0,5

La opción que maximiza los beneficios no es siempre hacer trampas o no hacerlas. Se puede ver que el algoritmo a seguir es hacer siempre lo mismo que el otro, con lo cual la mejor opción depende de lo que vaya a hacer el otro.

Así que, asumiendo que un partido no tiene ningún poder ni influencia sobre los actos del otro, la estrategia consiste en “donde fueres, haz lo que vieres”.

Sin embargo, este último enunciado no es totalmente cierto. Nada impide a un partido hablar con el otro e influir sobre su comportamiento, por una razón muy sencilla: existe una solución óptima conjunta, y es que los dos acuerden siempre hacer trampas, ya que es la situación conjunta en la que se obtiene la mayor ganancia.

Se puede comparar este juego (hasta cierto punto) con el “dilema del prisionero”. En ambos juegos, la mejor estrategia cuando no se sabe lo que va a hacer el oponente no es la misma que cuando se puede intercambiar información con el oponente.

Una vez establecida la estrategia conjunta de que los dos hagan siempre trampas, sí que se alcanza un estado de equilibrio, ya que si uno de los dos rompiera el pacto y empezara a dejar de hacer trampas, pasaría de una ganancia 1,5 a una ganancia 1, con lo cual ninguno de los partidos tiene motivos para cambiar de estrategia.

Por supuesto todas estas conclusiones son válidas para los parámetros que se han establecido, y cambiar estos parámetros puede suponer que las conclusiones sean otras.

Así que la principal crítica a este desarrollo sería la elección arbitraria de los valores 0, 1 y 3 para estar en la oposición, no hacer trampas y hacer trampas.

Sin embargo estos valores son bastante “defendibles”. Se puede demostrar matemáticamente que este juego ofrece las mismas conclusiones para cualquier valor de “hacer trampas” superior a 2. Es bastante evidente que el gobierno que no está en el poder no tiene demasiadas opciones de ganancia, por ello el cero. Los miembros del gobierno que está en el poder reciben sueldos (1, que representa la ganancia básica). Los miembros del gobierno que están en el poder y “hacen trampas” reciben sueldos y además el dinero de la corrupción (que suele ser muy superior a sus sueldos).

Siempre que asumamos que ser corrupto suponga más del doble de ganancias que no serlo (lo cual no es algo demasiado difícil de concebir) hemos de aceptar las conclusiones anteriores como ciertas.

Podemos resumirlo como: “Si la corrupción permite a un partido obtener al menos más del doble (en un sistema bipartidista) de ganancias que la no-corrupción, el sistema evolucionará a un estado de equilibrio, con beneficios máximos, en el que los dos partidos acordarán permitir la corrupción del contrario”

Parece ser matemáticamente inevitable una vez establecidos los parámetros iniciales. Está bastante claro que el comportamiento de los partidos está determinado por la gran ganancia que supone usar el poder de estar en el gobierno para obtener beneficios. ¿Se podría eliminar ésta “tentación”?

La solución obvia (y casi imposible, como todas las soluciones obvias) es acabar con la corrupción, de manera que tanto hacer trampas como no hacerlas supusiera una ganancia 1 estando en el poder. Esta situación evolucionaría a dos posibles estrategias óptimas: los dos partidos haciendo trampas siempre, o los dos partidos nunca haciendo trampas. En ambos casos la ganancia de cada partido sería 0,5.

Sin embargo la solución óptima de “ambos hacer trampa” no es una situación de equilibrio, ya que el partido que empiece a dejar de hacer trampa va a mejorar sus ganancias, pasando de 0,5 a 1. Una vez hecho esto, el otro partido está forzado también a dejar de hacer trampas para no quedarse con 0 y llegar de nuevo a 0,5. La solución “ninguno hace trampa”, pese a tener las mismas ganancias que la de “los dos hacemos trampa”, sí es una situación de equilibrio.

Esto demuestra, según la teoría de juegos, que eliminar la corrupción efectivamente corrige la tendencia a hacer trampas (o sea no seguir los deseaos del pueblo) de los partidos políticos.

Por supuesto, eliminar la corrupción no tiene nada de sencillo. Veamos otras alternativas:

¿Y si subimos el sueldo de los políticos? Pongamos que en vez de tener ganancia 1 estando en el poder, les damos ganancia 4, de manera que “hacer trampas” pierda parte de su encanto.

Sin embargo, hay que tener en cuenta que la corrupción sigue siendo posible, de manera que si hacemos que estar en el poder sin hacer trampas tenga valor 4, estar en el poder haciéndolas pasa a tener valor 6 (misma corrupción pero más sueldo base)

¿Corrige esto la tendencia?

Si ninguno hace trampa: ganancia 2 de media
Si los dos hacen trampa: ganancia 3 de media
Si A hace trampa y B no: ganancia de 0 para A y 4 para B

Lo mejor en este escenario es no hacer trampa y que tu adversario sí. Pero como no puedes elegir qué va a hacer ese adversario, esta situación no se va a dar, ya que el adversario no va a elegir voluntariamente la opción que le da 0 ganancias. Si tu adversario ve que no vas a hacer trampa, no tiene otra opción que, a su vez, tampoco hacerlas.

Por fin, vemos que el estado de “ninguno hace trampa”, sin ser la mejor solución común (que sería hacer los dos trampas), sí es un estado de equilibrio. Descolgarse de este estado supondría, al partido que lo hiciera, reducir sus ganancias. El estado “los dos hacemos trampas” no es un estado de equilibrio, porque empezar a “ser bueno” hace que las ganancias del partido en cuestión pasen de 3 a 4.

Entonces ¿Esta es la solución?

Pues sí y no. ¿Cuánto “costaba” un partido político en la primera situación, en la que su sueldo era 1? ¿Y en la otra, en la que su sueldo es 4?

Suponiendo la situación de equilibrio en cada caso, el partido que estuviera en el poder en el primer caso (corrupto) costaba 3. En el segundo caso, el partido en el poder, (no corrupto) cuesta 4.

Se elimina la corrupción, sí, pero a un coste mayor que el propio coste de la corrupción. No parece tampoco una solución deseable.

¿Existe alguna otra solución? Para un sistema bipartidista, yo no he sido capaz de encontrar ninguna.

El problema parece residir entonces en la propia existencia del bipartidismo, así que habría que plantearse otras alternativas. Esto lo veremos en próximos ensayos.

No hay comentarios:

Publicar un comentario