Acessibilidade / Reportar erro

Prêmio Nobel de Economia de 1994: Contribuições de Nash, Harsanyi e Selten à Teoria de Jogos

1994 Nobel Prize Economists: Contributions from Nash, Harsanyi and Selten to the Game Theory

RESUMO

O artigo tenta destacar a influência dos três ganhadores do Prêmio Nobel de 1994 - J. Nash, R. Selten e J. Harsanyi na teoria dos jogos e na teoria econômica. Nos exemplos básicos de livros didáticos, o artigo também pode servir como uma breve introdução à própria teoria dos jogos. Alguns conceitos importantes como equilíbrio de Nash, equilíbrio perfeito entre sub-jogos, equilíbrio de mão trêmula e transformação de Harsanyi são introduzidos para mostrar com alguns exemplos a crescente importância da teoria dos jogos na teoria econômica moderna.

PALAVRAS-CHAVE:
Prêmio Nobel; teoria dos jogos; Nash; Harsanyi; Selten

ABSTRACT

The paper tries to highlight the influence of the 1994 three Nobel prize winners - J. Nash, R. Selten and J. Harsanyi on game theory as well as on economic theory. On the basic of textbooks examples the paper may also serve as a brief introduction to game theory itself. Some major concepts like Nash equilibrium, subgame-perfect equilibrium, trembling hand equilibrium and Harsanyi’s transformation are introduced to show with some examples the growing importance of game theory in modem economic theory.

KEYWORDS:
Nobel Prize, game theory; Nash; Harsanyi; Selten

“However, there are some names that cannot pass unmentioned. The acronym NASH may assist in remembering who they are. Nash himself gets the letter N; A is for Aumann, S is both for Shapley and Selten; and H is for Harsanyi. By the end of the book you won’t be needing acronym.”

Ken Binmore (1992BINMORE, K. Fun and Games: A Text on Game Theory. Cambridge: Health and Company, 1992., p. 13)

1. INTRODUÇÃO

Em 1994 a Teoria de Jogos foi finalmente contemplada com o Nobel de Economia. Foram premiados três pesquisadores: o americano John Nash, o alemão Reinhard Selten e o húngaro naturalizado americano John Harsanyi1 1 Aumann e Shapley não foram premiados pelo comitê de Estocolmo possivelmente porque as contribuições de ambos estão mais ligadas aos jogos cooperativos e, como explica Binmore (1992, p. 13): “What is perhaps most important about the last twenty years in game theory is that all major advances have been made in noncooperative theory.” . Como enfatiza a citação acima, esses professores dedicaram grande parte de suas carreiras para formar o escopo daquilo que hoje é um corpo teórico sólido e importante para entender os avanços da moderna teoria econômica. Os três receberam o prêmio em homenagem aos seus trabalhos no campo da Teoria de Jogos não-cooperativa que, atualmente, é uma das ferramentas mais utilizadas na economia.

Nessa nota pretendemos enfatizar alguns dos princípios básicos da Teoria de Jogos não­cooperativos, salientando as principais contribuições dos três premiados nesse campo para, por fim, mostrar as aplicações desse instrumental na Teoria Econômica.

2. JOGOS NÃO-COOPERATIVOS - UM BREVE HISTÓRICO

A teoria de jogos é, segundo Harsanyi e Selten (1988HARSANYI, J .C. & SELTEN, R. A General Theory of Equilibrium Selection in Games. Cambridge: MIT Press, 1988.), um método para analisar situações de conflitos e de cooperação que dependem do comportamento estratégico, onde as ações dos agentes são parcialmente dependentes do que os outros agentes poderão fazer. Enquanto método, a Teoria de Jogos não é algo que possa ser restrito à ciência econômica muito embora a maior parte das contribuições esteja diretamente associada a esse ramo de conhecimento.

O lançamento do livro de von Neumann e Oskar Morgenstern, The Theory of Games and Economic BehaviorVON NEUMANN, J. & MORGENSTERN, O. The Theory of Games and Economic Behavior. Princeton: Princeton University Press, 1944., em 1944, marca o início da Teoria de Jogos, mas a contribuição anterior de outros pesquisadores não pode ser desprezada.2 2 Entre eles destacam-se: Cournot (1838), Edgeworth (1881) e o próprio von Neumann (1928). Neste trabalho, os autores analisam duas abordagens. A primeira é a dos jogos cooperativos e procura descrever o comportamento ótimo em jogos com um número muito grande de jogadores. O objetivo desta classe de jogos é estabelecer os tipos de coalizões possíveis que são consistentes com o comportamento racional. A segunda abordagem é a estratégica ou de jogos não-cooperativos. Para evitar problemas relacionados às regras do jogo e à estrutura de payoffs, exigidos por este tipo de arcabouço, von Neumann e Morgenstern restringiram a análise ao caso particular de dois jogadores com preferências diametralmente opostas. Esses jogos são chamados de soma zero ou estritamente competitivos, pois o ganho de um é igual à perda do outro. Contudo, embora esse arcabouço seja aplicado a jogos de xadrez, pôquer entre outros, as situações em economia raramente se assemelham a jogos de soma zero. Por esse motivo, a Teoria de Jogos ficou estagnada até o começo dos anos 50 quando o americano John Nash publicou uma série de artigos que definiram um novo conceito de equilíbrio: o chamado equilíbrio estratégico ou de Nash3 3 Como afirma Binmore (1992, p. 12): “Nowadays the notion of a Nash equilibrium is perhaps the most important of the tools that game theorists have in their disposal.” O equilíbrio Nash-Coumot é utilizado em alguns manuais de Teoria de Jogos para indicar o comportamento de Cournot em equilíbrios de Nash. .

3. A CONTRIBUIÇÃO DE JOHN NASH

Para introduzir este conceito iremos usar o jogo clássico do “dilema de prisioneiros”. Dois suspeitos são presos e acusados de um crime. A polícia acredita que ambos estão envolvidos, mas não dispõe de evidências suficientes para condená-los a menos que um deles opte por “falar”, isto é, confessar sua parcela de culpa. A polícia coloca os suspeitos em celas separadas e explica as consequências que poderão emergir a partir do depoimento de cada um. Se nenhum deles optar por “falar” ambos serão acusados de um delito menor que implica uma pena simbólica de apenas um mês de prisão. Se ambos “falarem” assumindo a participação no crime, então, os dois serão condenados a seis meses de prisão. Por fim, se um “falar” mas o outro não, então aquele que “falar” será libertado imediatamente e o outro será condenado à sentença máxima permitida pela lei: nove meses na cadeia (seis meses pelo crime mais três meses por obstruir a justiça).

Na matriz 1 os suspeitos são chamados de “jogador 1” e “jogador 2” sendo que cada um dispõe de duas estratégias: “falar” (confessar) ou “não falar” (não confessar o crime). Os valores expressos nas células da matriz 1 são os payoffs dos jogadores e representam o “prêmio” de cada um por escolher uma determinada estratégia. Por convenção, o payoff do jogador 1 é o primeiro termo expresso no canto superior esquerdo da matriz 1 abaixo, seguido pelo payoff do jogador 2 na parte inferior de cada célula. O objetivo de cada jogador é maximizar seus payoffs, conforme expresso na matriz abaixo.

O equilíbrio de Nash do jogo é a solução Pareto inferior (-6,-6) onde os dois confessam o crime e ficam presos por 6 meses. Esse resultado ocorreu porque “falar” é a melhor resposta de cada um frente às demais estratégias. Para confirmar este resultado basta mostrar que nenhum dos jogadores possui incentivos para alterar unilateralmente suas estratégias de equilíbrio. Assim, supondo que o jogador 1 escolha “não falar”, o jogador 2 deve optar entre -1 e O, e, portanto, escolhe “falar” e é libertado imediatamente (com um payoff associado de 0). Mas se o jogador 2 escolhe “falar”, o jogador 1 irá preferir “falar” pois essa estratégia confere um payoff maior do que a opção “não falar” (-6 contra -9). Isso confirma que (“falar”; “falar”) é um equilíbrio de Nash: dado o comportamento dos outros jogadores, a estratégia que cada um escolhe é a melhor resposta às estratégias dos demais (melhor resposta recíproca) de modo que não há incentivos para desviar do caminho de equilíbrio.

A combinação de estratégias (não falar, não falar), embora forneça um payoff individual maior do que o auferido pela estratégia de equilíbrio (falar, falar), não pode ser atingida, num jogo finito, porque não existem mecanismos de cooperação capazes de forçar os jogadores a escolher aquela estratégia. Na ausência de cooperação, a escolha de “não falar” não é uma ação racional por parte dos jogadores visto que o oponente sempre terá estímulos a desviar dessa estratégia jogando “falar”.

4. REFINANDO E QUESTIONANDO O CONCEITO DE EQUILÍBRIO DE NASH: AS CONTRIBUIÇÕES DE SELTEN

O conceito de equilíbrio de Nash é até hoje uma das ferramentas mais valiosas da Teoria de Jogos. Contudo, este conceito, por si mesmo, não evita a existência de equilíbrios múltiplos. Assim, um jogo pode ter várias soluções Nash sendo que todas satisfazem a condição da melhor resposta recíproca. Nesse caso, o conceito de Nash não consegue estabelecer o resultado final do jogo. A seleção do equilíbrio de Nash do jogo é importante pois alguns dos candidatos potenciais não passam de ameaças, que nunca irão se concretizar fora do caminho de equilíbrio do jogo. Para reduzir o número de equilíbrio de um jogo os “teóricos de jogos” vêm desenvolvendo diversos tipos de refinamentos4 4 Os refinamentos são técnicas elaboradas para selecionar, entre os diversos candidatos ao equilíbrio, o resultado do jogo. . O pioneiro na introdução desta ideia foi Selten, que em meados da década de 60 introduziu o conceito de subgame perfect. Enquanto o equilíbrio de Nash exige um comportamento racional apenas no caminho de equilíbrio, o conceito de subgame perfect garante a ocorrência desse mesmo tipo de comportamento não apenas no caminho de equilíbrio, mas também fora dele. Logo, é possível mostrar que todo o equilíbrio subgame perfect é também um equilíbrio de Nash, mas que a recíproca não é verdadeira.

4.1 O refinamento de subgame perfect

O jogo conhecido como “entry deterrence”, que é uma versão do paradoxo da cadeia de lojas (chainstore paradox) de Selten para jogos repetidos um número finito de vezes, é um bom exemplo da aplicação do subgame perfect. Há dois participantes no jogo: um monopolista (ou incumbente) e o concorrente (ou entrante) que deseja entrar neste mercado para auferir parte dos lucros de monopólio.

A forma extensiva ou árvore do jogo, expressa na matriz 2, mostra a ordem dos eventos (o concorrente joga primeiro e em seguida o monopolista escolhe sua estratégia), as estratégias e os payoffs dos jogadores. As estratégias para o concorrente são (entrar, não entrar) e para o monopolista (combater, não combater). O payoff do concorrente é o primeiro termo do par ordenado seguido pelo payoff do monopolista. Assim, se o concorrente escolhe “entrar” o monopolista deve optar entre “combater” ou “aceitar”, o que significa dividir com o concorrente os lucros de monopólio. A curto prazo, o combate é mais custoso para os dois jogadores do que o conluio, conforme indicam os payoffs dos jogadores na matriz 2. Caso o concorrente decida “não entrar”, o monopolista tornar-se-á indiferente entre suas duas estratégias puras. O concorrente nesta situação aufere um payoff de 0 e o monopolista preserva seu lucro de monopólio, expresso pelo payoff de 100. Os dois nódulos ilustrados na forma extensiva expressam os dois únicos sub jogos do jogo. O primeiro deles é o nódulo inicial, onde o concorrente escolhe sua estratégia, e o segundo nódulo é expresso pela decisão do monopolista caso o concorrente escolha “entrar”. O traço pontilhado ‘na figura 2 enfatiza que todo o subjogo é um jogo em si mesmo: o ramo inferior da árvore é um jogo em si mesmo visto que uma vez que o sistema atingiu aquele ponto, o equilíbrio daí resultante independe das estratégias nos demais ramos da árvore.

O jogo possui dois equilíbrios de Nash: (entrar, aceitar) e (não entrar, combater), onde o primeiro termo do par representa a estratégia do concorrente, e, o segundo, a estratégia do monopolista. O primeiro equilíbrio foi encontrado sabendo que a melhor estratégia do concorrente é “entrar” e, assim, o jogo atinge o nódulo inferior onde o monopolista prefere “aceitar” o que resulta em payoffs de (40, 40). Caso o monopolista ameace o entrante dizendo que irá “combater” numa eventual entrada, a melhor estratégia do concorrente é “não entrar” e, portanto, estamos no ramo superior da árvore onde o equilíbrio de Nash (não entrar, combater) resulta num payoff de (0, 100)5 5 Cabe lembrar que os dois equilíbrios de Nash satisfazem o requisito da melhor resposta recíproca. . A partir do refinamento de subgame perfect poderemos eliminar este último equilíbrio. Para tanto, com o auxílio da forma extensiva, basta notar que se o concorrente optou por “entrar” a melhor estratégia do monopolista é “aceitar” e obter um payoff de 40 ao invés de “combater” e auferir um payoff de -1O. Como a ameaça do monopolista em “combater” o concorrente não é crível, no equilíbrio o concorrente sempre entra e o monopolista sempre “aceita”, sendo este resultado (entrar, aceitar) o único equilíbrio que satisfaz o requisito de subgame perfect.

4.2 Um questionamento ao refinamento de subgame perfectness: o equilíbrio de “trembling-hand”

Vimos que o equilíbrio de Nash (entrar, aceitar), ilustrado acima, satisfaz o refinamento de subgame perfect. Mas, será que esse equilíbrio é mantido mesmo quando os jogadores cometem “erros”6 6 Os “erros” ocorrem porque, de acordo com Selten, as mãos dos jogodores podem começar a tremer na hora de escolher a estratégia (“trembling hand”) e, assim, os jogadores terminam por fazer algo que não era planejado. sucessivos? O chamado “trembling hand equilibrium” foi desenvolvido por Selten (1975SELTEN, R. “Re-examination of the perfectness concept for equilibrium points in extensive games”. International Journal of Game Theory nº 4, 1975.) para mostrar que existe uma pequena probabilidade de os jogadores apertarem o “botão errado” e, com isso, provocar uma mudança do equilíbrio. O “erro” é apenas uma analogia ao fato de os jogadores possuírem incerteza sobre as ações do oponente. Os jogos de informação completa são em geral situações onde, no limite, a chance de errar tende a zero. Para verificar se o equilíbrio na forma extensiva da matriz 2 é também um equilíbrio de “trernbling hand”, basta admitir que o monopolista escolhe “combater” com uma probabilidade positiva e verificar se a estratégia do concorrente será mantida. Neste caso, não se trata apenas de ameaças, por parte do monopolista, mas sim, de ações com probabilidade positiva de ocorrência e assim, a melhor estratégia para o concorrente é “não entrar”. Portanto, o equilíbrio (entrar, aceitar) não admite a possibilidade de erros e, por isso, não é possível classificá-lo como um equilíbrio “trembling hand”. Isso enfatiza que o refinamento subgame perfect é muito forte para a maioria das situações, onde uma sucessão de erros não indica irracionalidade dos jogadores, refletindo - isto sim - a incerteza prevalecente na maioria das interações estratégicas.

5. INFORMAÇÃO INCOMPLETA NA TEORIA DE JOGOS: A CONTRIBUIÇÃO DE HARSANYI

Os aspectos discutidos até aqui (com exceção do “trembling-hand equilibrium”) são aplicáveis apenas em situações de informação completa, ou seja, quando todos têm certeza acerca das reações dos oponentes em relação a uma determinada ação. A hipótese de conhecimento pleno, porém, é muito forte pois, na maioria das situações cotidianas, existe algum tipo de incerteza sobre a reação dos jogadores frente a uma determinada ação. Assim, por exemplo, o jogador pode desconhecer os payoffs do oponente, e, por isso, não conseguir estabelecer a sua melhor resposta frente a uma certa ação. Neste caso, o conceito original de equilíbrio de Nash não é útil para determinar o resultado do jogo. Até o final dos anos 60, os jogos que possuíam algum tipo de incerteza eram chamados de “jogos de informação incompleta”. Ou seja, faltavam informações básicas (como o conhecimento acerca dos payoffs dos jogadores) para encontrar a solução do jogo. O desafio da Teoria de Jogos era, portanto, encontrar uma forma de incorporar a incerteza às ações dos jogadores, preservando a hipótese de assimetria informacional, ou seja, o fato de um dos jogadores possuir mais informação sobre o oponente.

Em grande parte por tal motivo, a Teoria de Jogos ficou praticamente estagnada até o final da década de 60 quando Harsanyi (1967-68HARSANYI, J. “Games with Incomplete Information Played by Baysian Players”. Management Science nº 14, 1967-68.) desenvolveu aquilo que ficou conhecido como “transformação de Harsanyi”, Em termos bastante simplificados, o jogo de informação incompleta é modificado atribuindo probabilidades aos eventos desconhecidos, de modo que o jogo que emerge é de informação imperfeita. A transformação de Harsanyi consiste em atribuir probabilidades a cada um dos eventos do jogo e fixar as opiniões iniciais dos jogadores sobre as possíveis estratégias dos oponentes. Estas probabilidades, atualizadas a partir da regra de Bayes7 7 A partir de uma distribuição inicial de probabilidades, a Regra de Bayes estabelece a probabilidade (condicionada) de o evento A ocorrer, dado que o evento B já ocorreu, isto é: PAIB=PBIA.PA/PB. , expressam o aprendizado dos jogadores a partir das possíveis ações do oponente. O equilíbrio que emerge deste processo é análogo ao equilíbrio de Nash: dada a revisão bayesiana de probabilidades nenhum dos jogadores possui incentivo para desviar da estratégia escolhida. O chamado “equilíbrio bayesiano” ou “equilíbrio de Bayes/Nash” é apenas uma aplicação destes conceitos, onde a referência ao equilíbrio bayesiano indica o uso da metodologia de Harsanyi e a menção ao equilíbrio de Nash indica que as propriedades daquele tipo de equilíbrio passam a valer nesta estrutura informacional. Assim, o chamado “equilíbrio bayesiano em jogos de informação incompleta” nada mais é do que um equilíbrio de Nash num jogo de informação imperfeita, após a estrutura informacional ter sido completada.

6. APLICAÇÕES DA TEORIA DE JOGOS NA TEORIA ECONÔMICA

A aproximação com a Teoria Econômica deu-se, de forma mais intensa, a partir da Transformação de Harsanyi visto que a maioria das situações econômicas - além de envolverem interação estratégica - também são exemplos típicos de estruturas informacionais imperfeitas. A partir daí a Teoria de Jogos começou a desenvolver uma classe de modelos conhecida como “jogos de sinalização” onde o jogador mais informado (agente) assume “tipos” distintos (por exemplo, governo forte ou fraco) e o menos informado (principal) apenas observa as ações de cada um dos tipos. Quando um dos tipos consegue diferenciar-se do outro a partir de uma ação que o oponente é incapaz de tomar, o jogador menos informado (o público, por exemplo) separa cada um dos tipos e o equilíbrio que emerge daí é chamado “separating equilibrium”. Caso ambos os tipos não tenham incentivos para estabelecer uma distinção aos olhos do menos informado, o equilíbrio resultante é conhecido como “pooling equilibrium”.

Os jogos de sinalização ampliaram as aplicações da Teoria de Jogos para a economia. Se até a metade da década de 80, o instrumental da Teoria de Jogos era algo restrito a alguns modelos de Organização Industrial que explicavam a dinâmica da competição em oligopólios, no início dos anos 90 esse tipo de abordagem praticamente abarcou os demais ramos da Teoria Econômica. Assim, na macroeconomia a Teoria de Jogos é aplicada para explicar problemas como a independência do Banco Central, a credibilidade das políticas econômicas, as negociações salariais, o desenho de mecanismos institucionais para recuperar a capacidade de gestão do Estado, a influência dos “ciclos eleitorais” em situações de estabilização, entre outros temas.8 8 Para maiores detalhes ver: Alesina (1987), Cukierman (1992), Drazen & Masson (1993), Persson & Tabellini (1990), Rogoff (l989), Rogoff & Silbert (1988). Na área de economia internacional os trabalhos tratam da coordenação monetária internacional, crises de balança de pagamentos e, por exemplo, da abertura econômica9 9 Ver: Canzoneri & Herderson (1991) e Rodrik & Femandez (1991). . Em organização industrial, a Teoria de Jogos é utilizada para investigar, entre outros aspectos, as estratégias usadas por um monopolista para preservar sua fatia de mercado na presença de competidores potenciais (“entrantes”) que desejam auferir uma parcela dos lucros de monopólio, ou mesmo as estratégias de investimento da firma na presença de externalidades que afetam o consumidor e influenciam as decisões de investimento dos competidores10 10 Ver: Tirole (1991) e Laffont & Tirole (1993). .

Das aplicações mencionadas acima, selecionamos algumas contribuições que aplicam os “jogos de sinalização” a certos problemas macroeconômicos, como é o caso da credibilidade da política monetária. Essas aplicações são particularmente interessantes porque, ao contrário· dos modelos keynesianos, onde a política monetária era algo exógeno ao sistema, os “jogos de política” procuram captar os impactos das escolhas do governo sobre a sociedade, tomando endógena a política monetária. Assim, a reação da sociedade face a uma determinada ação do Banco Central não é conhecida a priori, e passa a depender da estrutura informacional do sistema e da interação entre os jogadores.

Um dos trabalhos pioneiros nessa linha foi o de Canzoneri (1985CANZONERI, M. B. “Monetary policy games and the role of private information”. American Economic Review, 75(5), 1985.) cujo intuito é mostrar que em situações em que o Banco Central possui informação privada sobre algum parâmetro utilizado pelo público na formação de expectativas, o sistema pode alternar períodos de inflação alta e baixa. No modelo o Banco Central possui informação privada sobre a demanda de moeda, conforme expresso pela equação quantitativa: mt-pt=y¯+μt onde mt, pt e y¯ são, respectivamente, os logaritmos da oferta de moeda, nível de preços, nível de produto e µ é uma variável estocástica que segue um “random walk”. Supondo y=y¯ e diferenciando a equação acima temos: mtmt-1=pt+φt. O lado esquerdo dessa equação é a taxa de crescimento do estoque de moeda, fixado pelo Banco Central, e os termos do lado direito expressam, respectivamente, a taxa de inflação e um distúrbio do tipo “white noise” (φ). O Banco Central determina a taxa de crescimento da oferta monetária conhecendo o ruído do sistema (φ). O público, ao contrário, não conhece <p e, por isso, utiliza a estimativa divulgada pelo governo - expressa por Eφt=e1 - para formar suas expectativas inflacionárias no primeiro período. O Banco Central, usa essa assimetria informacional (dada pela informação privada sobre (φt) para “confundir” o público sobre a sua verdadeira meta monetária. Ao invés de anunciar a estimativa correta dada por mtmt-1=et, o governo comunica uma previsão e*, maior que et . O público, à medida que o tempo passa, aprende a distinguir o ruído do sistema (φt) do sinal emitido pelo governo (e*). Desta forma, o público aumenta suas expectativas inflacionárias sempre que mtmt-1>φt+e*, e reduz a inflação esperada, se (m1mt-1<φt+e*. Esta estratégia, conhecida como “trigger strategy”, alterna períodos de inflação alta e inflação baixa à medida que o público distinguir os estímulos à inflação por parte do Banco Central daqueles elementos aleatórios que provocam variações involuntárias na meta monetária.

O estabelecimento de uma regra monetária dificilmente é adotado pelos Bancos Centrais, inclusive aqueles que possuem elevada autonomia. O trabalho de Cukierman & Meltzer (1986CUKIERMAN A. & MELTZER A. “A theory of ambiguity, credibility and inflation under discretion and asymmetric information”. Econometrica 54(5), 1986.) procura mostrar que, se os Bancos Centrais pudessem escolher o nível de “ótimo” de ruído, eles não iriam optar por um sistema sem ruídos, onde o público pudesse monitorar perfeitamente a sua atuação. No modelo, a escolha do nível de ruído é informação privada do Banco Central. Assim, a política monetária torna-se “ambígua” pois o público não consegue distinguir a atuação do Banco Central do nível de ruído sistema e, portanto, não pode atribuir à autoridade monetária o eventual fracasso no cumprimento das metas propostas. O caráter ambíguo da política e a informação privada acerca do nível de ruído do sistema são precondições para que uma política monetária não antecipada venha a surtir efeitos sobre o lado real do sistema pois, caso contrário, o público iria antecipar corretamente a política escolhida, que assim não surtiria impactos sobre o sistema. A percepção por parte do público sobre as intenções do governo é dificultada pelo elevado nível de ruído. Por decorrência, as expectativas inflacionárias são mais altas do que na situação de informação completa e, as tentativas estabilização representam estratégias mais custosas em termos de produto e emprego.

Um terceiro trabalho associado aos nomes de Cukierman & Liviatan (1992CUKIERMAN, A. Central Bank Strategy, Credibility and Independence: Theory and Evidence. Cambridge: MIT Press, 1992.) explica as chamadas “estabilizações graduais” como, por exemplo, o caso do Chile durante o governo Pinochet. O modelo admite a existência de dois tipos potenciais de governo - forte e fraco - com preferências muito distintas em relação à inflação e ao nível de emprego. O único aspecto comum aos dois tipos é o controle imperfeito dos instrumentos de política e, portanto, da taxa de inflação do sistema. A rigidez das expectativas inflacionárias, em situações recessivas, reflete a incerteza do público quanto às verdadeiras intenções do governo. O controle apenas parcial dos instrumentos de política toma os dois tipos muito semelhantes, impedindo assim que o público separe o forte do fraco. A combinação destes fatores reduz a credibilidade do plano e, portanto, conduz à uma desinflação gradual.

Por fim, importa salientar que a maioria dos jogos de sinalização enfatiza que em situações de informação imperfeita a conquista de credibilidade se dá a partir da implementação de políticas econômicas que reduzam a assimetria informacional do sistema, recuperando a capacidade do governo controlar os instrumentos de política econômica. É a credibilidade do plano que pode vir a conferir um aumento da credibilidade do governo e não o contrário: políticas de cunho “populista” provocam quedas transitórias da inflação e aumentos na credibilidade do governo, mas, por não alterarem o nível de ruído do sistema, não sinalizam à sociedade mudanças de regime que venham a conferir credibilidade ao plano.

7. SOBRE O POSSÍVEL FUTURO DA TEORIA DE JOGOS

Nenhum dos autores se atreve a fazer qualquer tipo de previsão acerca dos rumos futuros da Teoria de Jogos. Na verdade, há ainda um grande número de controvérsias não resolvidas pelos “gamesters11 11 Esse termo é usado por Binmore (1992) referindo-se aos “teóricos de jogos” como uma combinação de “game theorists” e “gangsters” Assim, autores como Binmore, Levine e Kreps são unânimes em afirmar que dificilmente o uso indiscriminado de refinamentos irá trazer alguma solução ao problema dos equilíbrios múltiplos. Isso, contudo, vem sendo resolvido graças à ampliação dos conceitos estáticos de jogos para ambientes dinâmicos.

Um aspecto que vem sendo cada vez mais questionado pelos estudiosos da assunto é o próprio conceito de racionalidade subjacente à noção básica de equilíbrio de Nash.12 12 Uma das principais objeções ao equilíbrio de Nash é o fato de cada jogador antecipar sempre de forma correta as ações do oponente. Contudo, algumas vezes, mesmo que os jogadores não antecipem corretamente as ações do oponente, o jogo atinge um equilíbrio que, apesar de não ser Nash, é confirmado ao longo do caminho de equilíbrio. Esse resultado, conhecido como “self-confirming equilibrium”, desenvolvido por Fundenberg e Levine (1993), admite hipóteses mais compatíveis com o comportamento estratégico, podendo, até mesmo, se constituir numa alternativa promissora ao equilíbrio de Nash.

Para que o resultado de Nash seja obtido, os jogadores precisam assumir uma racionalidade extrema, isto é, precisam ter lido um manual de teoria de jogos.13 13 Maurice Allais (1953) já havia criticado os postulados de Von Neumann/Morgenstern, mostrando que esses conceitos não refletiam o verdadeiro comportamento estratégico dos agentes. . Uma forma de solucionar este problema é a partir da incorporação da hipótese de racionalidade limitada nos modelos de Teoria de Jogos.14 14 O conceito pioneiro de racionalidade limitada é devido a Simon (1957). Para os desenvolvimentos mais recentes, v. Sargent (1993), Selten (1990) e Klopstech & Selten (1981). No entanto, a principal dificuldade encontrada é estabelecer a fronteira da racionalidade e, a partir daí, determinar a interação de comportamentos limitadamente racionais.

Uma outra linha de pesquisa promissora, que vem sendo desenvolvida com mais ênfase nos últimos anos, é a dos chamados “laboratórios de jogos”. Assim, diversos alunos (não necessariamente economistas ou conhecedores de Teoria de Jogos) devem jogar entre si ou contra uma máquina. Esses laboratórios possuem uma dupla finalidade: testar a aderência dos modelos à realidade e desenvolver novos caminhos conceituais que venham a suprir a lacuna estabelecida entre o comportamento racional, idealizado pelos economistas e o comportamento verdadeiro das pessoas.

As aplicações ilustradas ao longo dessa nota apenas ilustram a vasta gama de temas que hoje são tratados com o auxílio da Teoria de Jogos. Um observador mais cético diria que estes exemplos não possuem nada de novo visto que os mesmos aspectos podem ser tratados sem o imenso arsenal matemático exigido pela Teoria de Jogos. Esse tipo de crítica, embora verdadeiro (o instrumental, em si, não aumenta o conhecimento econômico de ninguém), está descolado da realidade. Assim como a “arte” do cinema atual está em encontrar novas maneiras para contar velhas histórias, o “mérito” desse instrumental matemático associado à economia é o de organizar as ideias e aumentar o conhecimento acerca de temas que, no passado, eram praticamente esquecidos.

REFERÊNCIAS BIBLIOGRÁFICAS

  • ALESINA, A “Macroeconomic policy in a two-part system as a repeteated game”. Quarterly Journal of Economics, vol. 102, agosto/1987.
  • ALLAIS, M. “Le comportement de l’homme rationel devant le risque: critique de postulats et axiomes de l’école americane”. Econometrica nº 21, 1953.
  • BARRO, R. (org.). Modern Business Cycle Theory. Cambridge: Harvard University Press, 1989.
  • BINMORE, K. Fun and Games: A Text on Game Theory. Cambridge: Health and Company, 1992.
  • CANZONERI, M. B. “Monetary policy games and the role of private information”. American Economic Review, 75(5), 1985.
  • CANZONERI, M. B. & HENDERSON, D. “Monetary Policy in Interdependent Economies: A Game Theoretic Approach”. Cambridge: MIT Press, 1991.
  • COURNOT, A. Recherches sur les Príncipes Mathématique de la Théorie des Richesses. Paris: Hachette, 1838.
  • CUKIERMAN, A. Central Bank Strategy, Credibility and Independence: Theory and Evidence. Cambridge: MIT Press, 1992.
  • CUKIERMAN, A. & LIVIATAN, N. “Optimal accommodation by strong policy-makers under incomplete information”. Journal of Monetary Economics, vol. 27, 1991.
  • CUKIERMAN A. & MELTZER A. “A theory of ambiguity, credibility and inflation under discretion and asymmetric information”. Econometrica 54(5), 1986.
  • DRAZEN, A & MASSON, P. “Credibility of policies versus credibility of policy-makers”. National Bureau of Economic Research - NBER Working Paper nº 4448, setembro/1993.
  • EDGEWORTH, F. An Essay on the Application of Mathematics to the Moral Sciences. Nova York, August M. Kelley, 1881.
  • FUDENBERG, D. & LEVINE, D. “Self-confirming Equilibrium”. Econometrica 61(3), 1993.
  • FUDENBERG, D. & TIROLE, J. Game Theory, Cambridge: MIT Press, 1991.
  • HARSANYI, J. “Games with Incomplete Information Played by Baysian Players”. Management Science nº 14, 1967-68.
  • HARSANYI, J .C. & SELTEN, R. A General Theory of Equilibrium Selection in Games. Cambridge: MIT Press, 1988.
  • KLOPSTECH, A. & SELTEN, R. Formale Konzepte Eingeschrãnkt Rationalen Verhaltens. Bielefeld, Selbstverlag, 1981.
  • KREPS, D. & WILSON, R. “Sequential Equilibria”. Econometrica 50 (4), 1982.
  • LAFFONT, J .J. & TIROLE, J. A Theory of Incentives in Regulation and Procurement. Cambridge: MIT Press, 1993.
  • NASH, J. Equilibrium Points in n-Person Games. Proceedings of the National Academy of Sciences nº 36, 1950.
  • NASH, J. “The Bargaining Problem”. Econometrica nº 18, 1950.
  • NASH, J. “Non-cooperative games”. Annals of Mathematics, 1951.
  • NASH, J. “Two-Person Cooperative Games”. Econometrica nº 21, 1953.
  • PERSSON, T. & TABELLINI, G. Macroeconomic Policy, Credibility and Politics. Suíça: Harwood Academic Publishers, 1990.
  • RODRIK, D. & FERNANDEZ, R. “Resistance to reform: status quo bis in the presence of individual-specif uncertanity”. American Economic Review 81(5), 1991.
  • ROGOFF, K. “Reputation, coordination and monetary policy”. In R. Barro, org. 1989.
  • ROGOFF, K. & SILBERT, A. “Elections and macroeconomics policy cycles”. Review of Economic Studies 55 (181), 1988.
  • SARGENT, T. Bounded Rationality in Macroeconomics. Nova York: Oxford University Press, 1993.
  • SELTEN, R. “Spieltheoretische Behandlung eines Oligopolmodells mit Nachfragetrãgheit”. Zeitschrift fiir die gesamte Staatswissenschafl nº 12, 1965.
  • SELTEN, R. “Re-examination of the perfectness concept for equilibrium points in extensive games”. International Journal of Game Theory nº 4, 1975.
  • SELTEN, R. “The chain store paradox”. Theory and Decision nº 9, 1978.
  • SELTEN, R. “Some remarks on bounded rationality”. Discussion Paper nº B-172, University of Bonn, 1990.
  • SIMON, H. A. Models of Man. Nova York: John Wiley & Sons, 1957.
  • SIMONSEN, M. H. “Macroeconomia e teoria de jogos”. Revista Brasileira de Economia 3(3), julho-setembro, 1989.
  • TIROLE, J. The Theory of Industrial Organization. Cambridge: MIT Press, 1988.
  • VON NEUMANN, J. “Zur Theorie der Gesellschaftsspiele”. Mathematische Annalen nº 100, 1928.
  • VON NEUMANN, J. & MORGENSTERN, O. The Theory of Games and Economic Behavior. Princeton: Princeton University Press, 1944.
  • 1
    Aumann e Shapley não foram premiados pelo comitê de Estocolmo possivelmente porque as contribuições de ambos estão mais ligadas aos jogos cooperativos e, como explica Binmore (1992BINMORE, K. Fun and Games: A Text on Game Theory. Cambridge: Health and Company, 1992., p. 13): “What is perhaps most important about the last twenty years in game theory is that all major advances have been made in noncooperative theory.”
  • 2
    Entre eles destacam-se: Cournot (1838COURNOT, A. Recherches sur les Príncipes Mathématique de la Théorie des Richesses. Paris: Hachette, 1838.), Edgeworth (1881EDGEWORTH, F. An Essay on the Application of Mathematics to the Moral Sciences. Nova York, August M. Kelley, 1881.) e o próprio von Neumann (1928VON NEUMANN, J. “Zur Theorie der Gesellschaftsspiele”. Mathematische Annalen nº 100, 1928.).
  • 3
    Como afirma Binmore (1992BINMORE, K. Fun and Games: A Text on Game Theory. Cambridge: Health and Company, 1992., p. 12): “Nowadays the notion of a Nash equilibrium is perhaps the most important of the tools that game theorists have in their disposal.” O equilíbrio Nash-Coumot é utilizado em alguns manuais de Teoria de Jogos para indicar o comportamento de Cournot em equilíbrios de Nash.
  • 4
    Os refinamentos são técnicas elaboradas para selecionar, entre os diversos candidatos ao equilíbrio, o resultado do jogo.
  • 5
    Cabe lembrar que os dois equilíbrios de Nash satisfazem o requisito da melhor resposta recíproca.
  • 6
    Os “erros” ocorrem porque, de acordo com Selten, as mãos dos jogodores podem começar a tremer na hora de escolher a estratégia (“trembling hand”) e, assim, os jogadores terminam por fazer algo que não era planejado.
  • 7
    A partir de uma distribuição inicial de probabilidades, a Regra de Bayes estabelece a probabilidade (condicionada) de o evento A ocorrer, dado que o evento B já ocorreu, isto é: PAIB=PBIA.PA/PB.
  • 8
    Para maiores detalhes ver: Alesina (1987ALESINA, A “Macroeconomic policy in a two-part system as a repeteated game”. Quarterly Journal of Economics, vol. 102, agosto/1987.), Cukierman (1992CUKIERMAN, A. Central Bank Strategy, Credibility and Independence: Theory and Evidence. Cambridge: MIT Press, 1992.), Drazen & Masson (1993DRAZEN, A & MASSON, P. “Credibility of policies versus credibility of policy-makers”. National Bureau of Economic Research - NBER Working Paper nº 4448, setembro/1993.), Persson & Tabellini (1990PERSSON, T. & TABELLINI, G. Macroeconomic Policy, Credibility and Politics. Suíça: Harwood Academic Publishers, 1990.), Rogoff (l989ROGOFF, K. “Reputation, coordination and monetary policy”. In R. Barro, org. 1989.), Rogoff & Silbert (1988ROGOFF, K. & SILBERT, A. “Elections and macroeconomics policy cycles”. Review of Economic Studies 55 (181), 1988.).
  • 9
    Ver: Canzoneri & Herderson (1991CANZONERI, M. B. & HENDERSON, D. “Monetary Policy in Interdependent Economies: A Game Theoretic Approach”. Cambridge: MIT Press, 1991.) e Rodrik & Femandez (1991RODRIK, D. & FERNANDEZ, R. “Resistance to reform: status quo bis in the presence of individual-specif uncertanity”. American Economic Review 81(5), 1991.).
  • 10
    Ver: Tirole (1991) e Laffont & Tirole (1993LAFFONT, J .J. & TIROLE, J. A Theory of Incentives in Regulation and Procurement. Cambridge: MIT Press, 1993.).
  • 11
    Esse termo é usado por Binmore (1992BINMORE, K. Fun and Games: A Text on Game Theory. Cambridge: Health and Company, 1992.) referindo-se aos “teóricos de jogos” como uma combinação de “game theorists” e “gangsters”
  • 12
    Uma das principais objeções ao equilíbrio de Nash é o fato de cada jogador antecipar sempre de forma correta as ações do oponente. Contudo, algumas vezes, mesmo que os jogadores não antecipem corretamente as ações do oponente, o jogo atinge um equilíbrio que, apesar de não ser Nash, é confirmado ao longo do caminho de equilíbrio. Esse resultado, conhecido como “self-confirming equilibrium”, desenvolvido por Fundenberg e Levine (1993FUDENBERG, D. & LEVINE, D. “Self-confirming Equilibrium”. Econometrica 61(3), 1993.), admite hipóteses mais compatíveis com o comportamento estratégico, podendo, até mesmo, se constituir numa alternativa promissora ao equilíbrio de Nash.
  • 13
    Maurice Allais (1953ALLAIS, M. “Le comportement de l’homme rationel devant le risque: critique de postulats et axiomes de l’école americane”. Econometrica nº 21, 1953.) já havia criticado os postulados de Von Neumann/Morgenstern, mostrando que esses conceitos não refletiam o verdadeiro comportamento estratégico dos agentes.
  • 14
    O conceito pioneiro de racionalidade limitada é devido a Simon (1957SIMON, H. A. Models of Man. Nova York: John Wiley & Sons, 1957.). Para os desenvolvimentos mais recentes, v. Sargent (1993SARGENT, T. Bounded Rationality in Macroeconomics. Nova York: Oxford University Press, 1993.), Selten (1990SELTEN, R. “Some remarks on bounded rationality”. Discussion Paper nº B-172, University of Bonn, 1990.) e Klopstech & Selten (1981KLOPSTECH, A. & SELTEN, R. Formale Konzepte Eingeschrãnkt Rationalen Verhaltens. Bielefeld, Selbstverlag, 1981.).
  • 15
    JEL Classification: C70; B31.

Datas de Publicação

  • Publicação nesta coleção
    24 Out 2022
  • Data do Fascículo
    Jan-Mar 1995
Centro de Economia Política Rua Araripina, 106, CEP 05603-030 São Paulo - SP, Tel. (55 11) 3816-6053 - São Paulo - SP - Brazil
E-mail: cecilia.heise@bjpe.org.br