Introdução à Teoria dos Jogos

Teoria dos jogos é o estudo das interações, onde cada envolvido é um jogador e cada situação, um jogo. Faz parte de um ramo da matemática aplicada, e é extremamente importante para tomada de decisão e para economia no geral. Normalmente, aulas introdutórias de teoria dos jogos começam explicando do que se trata o assunto através de um exemplo muito famoso, o “Dilema dos Prisioneiros”. E é isso que faremos aqui hoje.

Para começar, imagine a seguinte situação: dois suspeitos, pegos pela polícia, são colocados em salas diferentes para um interrogatório, e, a cada um deles, isoladamente, é oferecida a seguinte proposta:

“Se você confessar o crime agora e o seu parceiro não falar nada, você é liberado, mas ele pega 10 anos de cadeia. Por outro lado, se vocês dois confessarem, os dois vão presos por 3 anos. Se ninguém se manifestar, 1 ano para cada”

Sabendo que mesmo se preso ou liberado você nunca mais verá o seu parceiro novamente, o que você faria?

Vamos analisar o problema em forma de números: se você confessar, você pode pegar ou 0 anos de cadeia ou 3, agora se você não confessar, você pode pegar 1 ou 10 anos. Até aí confessar aparenta ser a melhor opção. Mas, para melhorar ainda mais a nossa análise, vamos escrever esse jogo em forma de tabela:

Teoria dos Jogos -- Dilema dos Prisioneiros
O número a esquerda é referente ao jogador 1, e o número a direita, ao jogador 2.

Ou seja, supondo que você fosse o jogador 1, olhando na tabela, se o jogador 2 confessasse, você poderia confessar também e pegar 3 anos de cadeia ou então não confessar e pegar 10. Obviamente que você escolheria confessar certo? Agora se ele não confessasse, você poderia confessar e sair livre ou não confessar e pegar 1 ano de cadeia. Nessa situação você também confessaria, pois 0 é melhor do que -1 (utilizamos essa notação na tabela para deixar mais claro o que é mais vantajoso em forma de números, tornando os mais positivos como preferíveis). Veja então que, em qualquer situação, você confessaria, e o mesmo acontece do ponto de vista dele, levando a um equilíbrio de confessa/confessa, cada um com 3 anos de cadeia.

Nesse momento você pode pensar “ué, mas então se nós dois sabemos que se pensarmos desse jeito pegaremos 3 anos ao invés de 1, porque então nós dois não escolhemos não confessar?”. E a resposta é simples. Imagine que realmente você acredite que ele pensa como você e que ele possa, então, escolher não confessar. Sabendo disso, você pode escolher confessar e então sair livre, ou seja, você não mudaria de opinião, porque qualquer que seja a decisão que ele tomar, para você sempre é melhor escolher confessar.

Se você entendeu até aqui, já entendeu o básico de teoria dos jogos. Nomeando os termos, os números da tabela se chamam payoffs, ou em outras palavras, o seu retorno relativo aquela decisão. A representação do jogo pela tabela, ou pela bi-matriz se preferir, é chamada forma normal,onde os jogadores escolhem simultaneamente (ou seja, não é uma situação onde um escolhe e só depois o outro, baseado na escolha do primeiro, toma sua decisão) suas estratégias e a combinação delas resulta nos payoffs para cada um. O equilíbrio de confessa/confessa que achamos se chama equilíbrio de Nash, em homenagem a John Nash, pois nenhum dos jogadores tem incentivos a desviar do equilíbrio. Já a possível mudança de escolha para não-confessa/não-confessa resultando em (-1,-1) e melhorando ambos é atrativa a primeira vista pois se trata de uma melhoria de Pareto (uma situação em que se melhora alguém sem piorar o outro, no caso, melhorando os dois), onde os ganhos de forma geral seriam maiores (ou não tão ruins).

Aplicando esse conceito a economia podemos levantar o seguinte exemplo: 2 firmas que competem entre si tem a opção de investir ou não investir em propaganda. Se caso uma investir e a outra não, a que investiu ganha parte dos clientes da concorrente e o ganho de vendas irá compensar o gasto com a propaganda. Porém se ambas investirem em propaganda, pode ser até que clientes de ambos os lados tendam a trocar de marca, mas de forma geral nada muda, nenhuma das duas ganha vantagem sobre a outra.

Para tornar o problema mais preciso, vamos supor que o custo de se fazer a propaganda seja de 10 mil e o ganho estimado com ela, caso ela for efetiva, é de 22 mil. Vamos analisar esse jogo pela forma normal:

Teoria dos Jogos - Firmas

Repare que esse problema é bem similar ao dos prisioneiros, pois ambas as firmas terão de tomar uma atitude frente a outra. Claro que no mundo real normalmente existe um lag (defasagem) entre as decisões de cada empresa e o jogo é bem mais complexo, pois ele pode ser repetido ou mesmo de informação incompleta (você não tem clareza sobre os payoffs do outro jogador), mas desconsideraremos isso aqui para efeito didático.

Vamos chegar no equilíbrio do jogo então. Primeiro, o que se faz é comparar linha com linha, e depois, coluna com coluna. Começando pela linha, se você fosse o jogador 1 e fizesse propaganda, o seu payoff seria ou -10 ou 12, já se você não fizer o seu payoff seria ou -22 ou 0. Para afinar ainda mais a forma de comparar esses payoffs, você analisa cada escolha que o seu adversário pode fazer. Na situação em que o jogador 2 (empresa 2) escolhe fazer propaganda, qual a melhor escolha para empresa 1? -10 ou -22? -10 é claro, ou seja, fazer a propaganda. Agora se a firma 2 escolher não fazer propaganda, qual a melhor escolha? 12 ou 0? 12 Claramente 12, ou seja, fazer propaganda. Veja que a sua resposta é invariavelmente fazer propaganda, e se o mesmo processo for repetido com a empresa 2 também indicará fazer propaganda. Ou seja, o equilíbrio de Nash se deu em (-10,-10), as duas fazendo propaganda.

Observando esse resultado fica mais fácil entender agora o porquê da existência de decisões socialmente indesejáveis tomadas por agentes racionais. Nos próximos posts de teoria dos jogos, aprofundarei mais em como as empresas e o governo interagem formando equilíbrios.

0 comentários:

Postar um comentário