jueves, 2 de junio de 2011

TEORÍA DE JUEGOS

TEORÍA DE JUEGOS





CONCEPTOS BÁSICOS

Juegos bipersonales de suma cero
En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante.
La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el "jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de que el jugador renglón usa acción i y el jugador columna usa acción j.

Estrategia mixta, Valor esperado

Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si a cada turno escoge al azar un acción para que cada acción se está usado una fracción determinada del tiempo.
Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad):
R = [a   b   c  . . . ]

con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1.

Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por vectores probabilidad con un solo 1 y el resto de las entradas 0.
El valor esperado del juego con matriz de pagos P que resulta por las estrategias mixtasR y C es dado por
e = RPC
El valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificado por R y C después de un gran número de turnos.

Criterio minimax, Principios fundamentales de la teoría de juegos

Criterio Minimax

Un jugador quien usa el criterio minimax escoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el contrincante.
Encontrar la estrategia se llama solucionar el juego. La tercera parte del tutorial para esta tema muestra un método gráficamente para solucionar juegos 2×2. Para juegos general, se puede usar el método simplex. Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado" (vea más abajo).
Principios fundamentales de la teoría de juegos Cuando analizamos cualquier juego, hacemos los siguientes supuestos acerca de los dos jugadores:
  1. Cada jugador hace la acción mejor posible.
  2. Cada jugador sabe que su contrincante está también haciendo la acción mejor posible.
Reducir por predominioUna acción domina a otra si todos sus pagos son por lo menos tan provechoso al jugador que los pagos correspondientes de la otra. En términos de la matriz de pagos, podemos decirlo como sigue:
  1. Renglón r en la matriz de pagos domina a renglón s si cada pago en renglón r ≥ el pago correspondiente en renglón s.
  2. Columna r en la matriz de pagos domina a columna s si cada pago en columna r ≤ el pago correspondiente en columna s.
Observe que si dos renglones o columnas son iguales, cada uno domina al otro. Un renglón o columna domina estrictamente a un otro si el uno domina al otro y son desiguales.Siguiendo el primero principios de la teoría de juegos, la acción que corresponde a un renglón o columna estrictamente dominado nunca será jugado, y ambos jugadores son conscientes de esto por el segundo principio. Entonces cada jugador quien sigue los principios de la teoría de juegos eliminará repetidamente renglones y columnas dominadas como podría ser el caso. (En el caso que son iguales dos renglones o columnas, no hay razón para elegir uno sobre el otro, entonces cualquiera de los dos puede ser eliminado.) Este proceso se llama reducción por predominio.



Punto de silla, juego estrictamente determinado

Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja los máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja.

Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinado:

  1. Todos los puntos de silla en un juego tienen los mismos valores de pago.
  2. Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias minimax para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.

El valor de un juego estrictamente determinado es el valor del punto de silla. Un juego justo tiene un valor igual a cero, si no, es injusto o parcial.


EJERCICIO


Hay dos jugadores, los cuales tienen dos alternativas de juego, mostrar un dedo o mostrar dos. presentaremos a continuación las ganancias o perdidas de cada jugador y se deberá hallar el valor del juego.




JUGADOR COLUMNA
I
II
JUGADOR RENGLÓN
I
3
2
II
4
-9
JUGADOR COLUMNA
I
II
Minimax
JUGADOR RENGLÓN
I
3
2
2
Valor del juego
II
4
-9
-9
Maximin
4
2
JUEGO ESTRICTAMENTE DETERMINADO


En algunos casos tendremos lo siguiente:


JUGADOR COLUMNA
I
II
JUGADOR RENGLÓN
I
3
-2
II
-1
5
JUGADOR COLUMNA
I
II
Minimax
JUGADOR RENGLÓN
I
3
-2
-2
II
-1
5
-1
Maximin
3
5
JUEGO NO ESTRICTAMENTE DETERMINADO


Para obtener la solución a este tipo de problemas y encontrar el valor del juego recurrimos a el método desarrollados por Jhon Von Neuman y Oscar Morgerstein. 
Para esto asignamos a cada opción de los jugadores una probabilidad a la hora del juego:


JUGADOR COLUMNA
I
II
PROBABILIDAD
 1/3
 2/3
JUGADOR RENGLÓN
I
 3/4
3
-2
II
 1/4
-1
5


Hallamos  el valor esperado del jugador renglón si el jugador columna juega la primera opción y si muestra la segunda opción:

Como podemos ver el jugador renglón ganara 2 si el jugador columna juega la primera opción y perderá ¼ si muestra la opción dos.

Lo que se quiere ahora es buscar la probabilidad más adecuada para que el jugador obtenga el máximo premio, para esto tenemos:

P1 = estrategia 1
P2= estrategia 2

a)    Asumiendo que el jugador columna jugará con la estrategia 1.

Ve = 3P1 – 1P2
Si P1 =  0 →P2=1-P1
Ve = 3(P1) – 1(1-P1)
Si P1=0 Tenemos; Ve = 3(0) – 1(1-0)= -1
Si p1=1 Tenemos; Ve = 3(1) – 1(1-1)=3

b)    Asumiendo que el jugador columna jugará con la estrategia 2.

Ve = -2P1 + 5P2
Si P1 =  0 →P2=1-P1
Ve = -2(P1) + 5(1-P1)
Si P1=0 Tenemos; Ve = -2(0)  + 5(1-0)= 5
Si P1=1 Tenemos; Ve = -2(1) + 5(1-1)=-2


A partir de esto obtenemos las ecuaciones del valor esperado para cada una de las estrategias:

Ecuación 1: Ve= 4P1-1
Ecuación 2: Ve= -7P1+5

Graficamos cada una:


Como podemos observar nuestro valor del juego sera el punto en que las rectas se cruzan, ya que aquí se igualan el valor de las ecuaciones.

4P1-1= -7P1+5
11P1 = 6
P1 = 6/11

Hallamos el valor de P2 reemplazamos P1 en la ecuación anterior.

6/11 +P2= 1
P2= 1-6/11
P2= 5/11
El valor del juego seria:
Ve= 4P1-1 = 4*(6/11)-1= 13/11



No hay comentarios:

Publicar un comentario