Teoría De Juegos - Comillas

Transcription

Teoría de juegosAndrés os@comillas.edu

Contenido1.Introducción2.Juegos bipersonales de suma 0 con estrategias puras3.Juegos bipersonales de suma 0 con estrategias mixtas4.Equilibrios de Cournot y de BertrandInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos2

IntroducciónJuegos bipersonales de suma 0 con estrategias purasJuegos bipersonales de suma 0 con estrategias mixtasEquilibrios de Cournot y de Bertrand1Introducción

Introducción Contrapuesta a análisis de decisión Situaciones de conflicto y competencia entre decisores La consecución de objetivos no sólo depende de decisionespropias y del azar sino de las decisiones de los competidores Criterios racionales de selección de estrategias para su propiobeneficioInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos4

Clasificación teoría de juegos (i) Número de jugadoresBipersonal– N-personales– Número de estrategiasFinito– Infinito– Evolución temporalEstática– Dinámica– Intercambio de información entre jugadoresCooperativo– No cooperativo–Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos5

Clasificación teoría de juegos (ii) Variación de la riquezaSuma constante– Suma no constante– Cantidad de información de otros jugadores de que disponenCompleta– No completa– Cantidad de información que adquieren en el desarrollo deljuegoPerfecta– Imperfecta–Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos6

Matriz de pagos X conjunto de estrategias del jugador 1 (finitas)Y conjunto de estrategias del jugador 2 (finitas)M1(x,y) utilidad o pago que recibe el jugador 1M1(x,y) utilidad o pago que recibe el jugador 2J2 ( a11 , b11 ) J1 ( aij , bij ) ( amn , bmn ) matriz de pagosaij pago que recibe el jugador 1 si elige la i-ésima estrategia yel jugador 2 elige la j-ésima estrategiabij pago que recibe el jugador 2 si elige la j-ésima estrategia yel jugador 1 elige la i-ésima estrategiaInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos7

Dilema del prisionero Juego bipersonal, finito, estático, no cooperativo, de suma noconstante Dos delincuentes son detenidos y acusados de cometer undelito conjuntamente. Los delincuentes están incomunicadosy pueden delatar o no al otro. Si ambos delatan les caen 5años de prisión a cada uno. Si uno delata y el otro no le caen20 años para el delatado y 0 para el delator. Si ninguno delatales caen 1 año a cada uno.J2J1Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAIDelatarNo DelatarDelatar(-5,-5)(0,-20)No Delatar(-20,0)(-1,-1)Teoría de Juegos8

Estrategias de equilibrio (Nash) (x*,y*) es un par de estrategias de equilibrio si y sólo si ningúnjugador quiere cambiar de estrategia de forma unilateral.En el dilema del prisionero (Delatar, Delatar) es la estrategiade equilibrio. Si el juego fuera cooperativo (paso deinformación entre jugadores) la estrategia de equilibrio seríala (No Delatar, No Delatar).No siempre existen estrategias de equilibrio únicas. Equilibrioscorrelacionados.MujerHombreInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería 1,-1)(1,2)Teoría de Juegos9

IntroducciónJuegos bipersonales de suma 0 con estrategias purasJuegos bipersonales de suma 0 con estrategias mixtasEquilibrios de Cournot y de Bertrand2Juegos bipersonales de suma 0 conestrategias puras

Resolución de un juego bipersonal de suma nula1.Buscar estrategias puras en equilibrio. Si existe es lasolución, si no ir a punto 2.2.Resolver el problema con estrategias mixtas por LP En cualquier momento se puede reducir la matriz de pagoseliminando estrategias dominadas.Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos12

Juegos bipersonales de suma 0 Por naturaleza son no cooperativos.Basta con dar la matriz de pagos de un jugador.Cada jugador debe esperar lo peor del otro.Matriz de pagos vista como pagos al jugador 1.El punto de equilibrio es el punto óptimo del juego.J2J1Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAIE1E2E3E1124E2105E301-1Teoría de Juegos13

Eliminación de estrategias dominadas (i) Estrategia dominadaEstrategia de un jugador que independientemente de lo quehaga el otro jugador siempre es igual o peor que otra.Ejemplo: se elimina estrategia E3 del jugador 1J1 E1E2E111J2E220E345Se elimina estrategia E3 del jugador 2J1Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAIE1E2E111J2E220Teoría de Juegos14

Eliminación de estrategias dominadas (ii) Se elimina estrategia E2 del jugador 1E1E11J2E22J1 Se elimina estrategia E2 del jugador 2J2E1E11J1 Estrategia óptima E1 de jugador 1 y E1 de jugador 2Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos15

Valor del juego y juego justo Valor del juegoPago al jugador 1 cuando ambos jugadores lo hacen de maneraóptima.– Ejemplo: valor del juego es 1– Juego justo–Cuando el valor del juego es 0Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos16

Criterio minimax Minimizar la pérdida máxima (criterio de aversión al nMínimosMáximos506minimax Maximin: máximo de los pagos mínimos para el jugador 1Minimax: mínimo de los pagos máximos para el jugador 2Si minimax y maximin coinciden en una estrategia entonces lasolución es estable, se trata de un punto de equilibrio.Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos17

Solución 42minimaxInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos18maximin

IntroducciónJuegos bipersonales de suma 0 con estrategias purasJuegos bipersonales de suma 0 con estrategias mixtasEquilibrios de Cournot y de Bertrand3Juegos bipersonales de suma 0 conestrategias mixtas

Juegos con estrategias mixtas (i) A cada posible estrategia de cada jugador éste le asigna unaprobabilidad.– xiprobabilidad de que el jugador 1 use la estrategia i, i 1,.,mm xi 1– yjprobabilidad de que el jugador 2 use la estrategia j, j 1,.,nn yj 1– 1ij 1pij pago para el jugador 1 si éste utiliza la estrategia i y el jugador2 utiliza la jm nxi y j pijPago esperado para el jugador 1 i 1 j 1v valor del juegov maximin para jugador 1̅ minimax para jugador 2Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos20

Juegos con estrategias mixtas (ii) Criterio minimax para estrategias mixtas– Un jugador debe elegir la estrategia mixta que minimice lamáxima pérdida esperada.Teorema minimax–Si se permiten estrategias mixtas, las estrategias óptimas segúnel criterio minimax proporcionan solución estable si v v v demanera que ningún jugador quiere cambiar unilateralmente suestrategia.Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos21

Solución por programación lineal Pago esperado para el jugador 1mn x yi 1 j 1 x pi 1iijpij j 1, , n vLa suma de las probabilidades es 1m xi 1 jPara cualquier estrategia pura del competidorm ii 1xi 0 i 1, , mMaximizar el pago del jugador 1max vInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos22

Visión del jugador 2 en función de decisiones del 1 Maximización de la mínimas pérdidas. Mayor menor de laspérdidasmax vm x pi 1im xi 1iij v j 1, , n 1xi 0 i 1, , mInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos23

Visión del jugador 1 en función de decisiones del 2 Minimización de la máximas ganancias. Menor mayor de lospagosmin wn yj 1jpij w i 1, , mj 1n yj 1y j 0 j 1, , n Son problemas duales, es suficiente con resolver uno. En elóptimo v* w*Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos24

Ejemplo juego de 2 jugadores de suma nula No hay estrategias dominadas. No tiene punto de equilibrio enestrategias 01-1Tijeras1-10-1111MaxInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos25

Problema de optimización del jugador 2min wy2 y1y1 y2y1 y2 y3 w y3 w( y1* , y2* , y3* ) (1 3,1 3,1 3) w(π 1* , π 3* , π 3* ) ( 1 3, 1 3, 1 3) y3 1yi 0( x1* , x2* , x3* ) (1 3,1 3,1 3) Se cambia el signo de las variables duales Valor del juego 0 Para cada jugador la estrategia óptima es sacar cualquierelemento con igual probabilidad.Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos26

IntroducciónJuegos bipersonales de suma 0 con estrategias purasJuegos bipersonales de suma 0 con estrategias mixtasEquilibrios de Cournot y de Bertrand4Equilibrios de Cournot y deBertrand

Modelo de equilibrio de Cournot (i) Dos empresas compiten en un mercado por un productohomogéneo (i.e., no hay diferencia en quién lo produce). Lasempresas no pueden cooperarEl proceso se realiza sólo una vez (juego estático)Precio del producto es elástico a Q Q aP (Q) Q a 0 Coste de producción unitario igual para las dos empresas.Coste total función de la cantidad producida C (qi ) cqiy menor que el precio máximo de venta c aLa cantidad total a producir es Q q1 q2a tamaño del mercado-1 (coeficiente de Q) sensibilidad del consumidor al precioInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos28

Modelo de equilibrio de Cournot (ii) Espacio de estrategias de cada empresa X i [0, )Función de pagos (beneficios netos)π i (qi , q j ) qi [ P ( qi q j ) c ] qi [ a ( qi q j ) c ] Queremosmaximizar la funciónde pagos**max π i (qi , q j ) max qi [a (qi q j ) c]qi 0 qi 0Para la* empresa i π i (qi , q j ) qi Punto de equilibrio, cantidad total y precioq1* q2* 1 a 2qi q*j c 0 qi* ( a q*j c)2a c32Q* ( a c )32a 2cP (Q ) a ( a c ) 33Beneficio neto conjunto2(a c) 2(q1 q2 )( P c) 9Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos29

Modelo de equilibrio de Cournot (iii) ¿Y si las empresas pueden cooperar entre ellas, actúan comouna única (monopolio)?π (Q ) max Q[a Q c]Maximiza maxQ 0Q 0a c a ca cP(Q) a Punto de equilibrio y precio Q* 222Beneficio neto conjunto(a c)2Q( P c) 4La producción es mayor en un duopolio 2(a-c)/3 que en unmonopolio (a-c)/2.El precio es menor en un duopolio (a 2c)/3 que en unmonopolio (a c)/2.Incentivo a coludir (formar un cartel) (a-c)2/36Dado que los carteles normalmente son ilegales, los agentes tratan decoludir tácitamente usando estrategias de reducción de producciónautoimpuestas que tendrán un efecto de subida de precios y porconsiguiente un aumento en los beneficios de los agentes participantes.Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos30

Colusión entre empresas lácteas (3-marzo-2015)Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos31

Demanda de energía eléctrica del 29-nov-2012Instituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos32

Modelo de equilibrio de Bertrand (i) Las empresas producen artículos diferenciadosPueden elegir el precio de venta: pi precio para la empresa iLa demanda de un producto es elástica qi ( pi , p j ) a pi bp jCoste de producción unitario c igual para las dos empresasInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAITeoría de Juegos33

Modelo de equilibrio de Bertrand (ii) Espacio de estrategias de cada empresaFunción de pagos (beneficios netos)X i [0, )π i ( pi , p j ) qi ( pi , p j )[ pi c ] (a pi bp j )( pi c) Maximizar la función de pagosmax π i ( pi , p*j ) max ( a pi bp*j )( pi c)pi 0 pi 0Para la empresa i π i ( pi , p*j ) pi 1 pi c a pi bp*j 0 pi* (a bp*j c)2Punto de equilibriop1* p2* a c2 bInstituto de Investigación TecnológicaEscuela Técnica Superior de Ingeniería ICAI(b 2)Teoría de Juegos34

Andrés os@comillas.eduInstituto de Investigación TecnológicaSanta Cruz de Marcenado, 2628015 MadridTel 34 91 542 28 00Fax 34 91 542 31 76info@iit.comillas.eduwww.comillas.edu

Instituto de Investigación Tecnológica 7 Escuela Técnica Superior de Ingeniería ICAI Teoría de Juegos Matriz de pagos X conjunto de estrategias del jugador 1 (finitas) Y conjunto de estrategias del jugador 2 (finitas) M1(x,y) utilidad o pago que recibe el jugador 1 M1(x,y) utilidad o pago que recibe el jugador 2 matriz de pagos aij pago que recibe el jugador 1 si elige .