Teoria de Jogos
Resumo
O episódio apresenta a teoria de jogos como um ramo da matemática que estuda a tomada de decisão e a interação estratégica entre agentes. Os participantes discutem os conceitos fundamentais, como a definição de jogos, estratégias, payoff (premiação) e a suposição de racionalidade dos agentes. É destacada a importância de entender as regras, as informações disponíveis e os objetivos de cada participante, que podem variar (dinheiro, poder, prazer, etc.).
Um dos exemplos centrais discutidos é o dilema do prisioneiro, que ilustra o paradoxo onde a decisão individual racional leva a um resultado pior para o coletivo. Os participantes exploram diferentes formulações do dilema, incluindo uma versão envolvendo uma troca de malas (baseada em Douglas Hofstadter), e como ele modela situações de cooperação versus traição. A conversa também aborda o equilíbrio de Nash, onde nenhum agente tem incentivo para mudar sua estratégia unilateralmente, e a diferença para um equilíbrio de Pareto.
O programa avança para outros jogos canônicos, como o jogo do bem público (que modela problemas de contribuição para bens coletivos, como a Wikipedia) e o jogo do ultimato (uma barganha onde rejeições podem ocorrer por questões de justiça e não apenas por racionalidade econômica). São mencionados experimentos reais com esses jogos, inclusive com crianças e em diferentes culturas.
A discussão conecta a teoria de jogos a debates mais amplos na biologia evolutiva e nas ciências sociais, sobre a origem da cooperação. São citados autores como Robert Axelrod (“A Evolução da Cooperação”), que usou torneios do dilema do prisioneiro iterado, e Martin Nowak, que propôs cinco mecanismos para a evolução da cooperação (reciprocidade direta, indireta, espacial, seleção de parentesco e seleção de grupo). Exemplos concretos incluem o comportamento de morcegos que compartilham sangue e as “tréguas tácitas” nas trincheiras da Primeira Guerra Mundial.
Por fim, os participantes refletem sobre as limitações e a aplicabilidade dos modelos da teoria de jogos. Eles reconhecem que, como qualquer modelo científico, é uma simplificação da realidade, mas argumentam que é uma ferramenta valiosa para isolar mecanismos básicos de interação, aplicável desde vírus até complexas interações humanas, embora sua extrapolação para explicações gerais sobre a natureza humana exija cautela.
Indicações
Conceitos-Teoricos
- Equilíbrio de Nash — Situação em um jogo onde, dada a estratégia dos outros jogadores, nenhum participante tem incentivo para mudar unilateralmente sua própria estratégia.
- Equilíbrio de Pareto — Situação onde não é possível melhorar o resultado de um agente sem piorar o de outro. Contrastado com o Equilíbrio de Nash.
- Tit for Tat (Olho por olho) — Estratégia vencedora nos torneios de Axelrod para o dilema do prisioneiro iterado. Começa cooperando e depois repete a ação anterior do oponente (coopera se ele cooperou, trai se ele traiu).
Filmes
- O Bom, o Feio e o Mau (Il buono, il brutto, il cattivo) — Filme de Sergio Leone usado como exemplo concreto de um trielo, uma situação de jogo com três agentes que ilustra a tomada de decisão estratégica.
- Uma Mente Brilhante (A Beautiful Mind) — Filme biográfico sobre John Nash, vencedor do Prêmio Nobel de Economia por suas contribuições à teoria de jogos, citado durante a discussão.
Livros
- A Evolução da Cooperação — Livro de Robert Axelrod mencionado como um clássico que usou torneios do dilema do prisioneiro iterado para estudar como a cooperação pode emergir.
- Supercooperação — Livro de divulgação científica de Martin Nowak, que sintetiza os cinco mecanismos para a evolução da cooperação (reciprocidade direta, indireta, espacial, seleção de parentesco e seleção de grupo).
- Gödel, Escher, Bach — Obra de Douglas Hofstadter, citada indiretamente como fonte de uma versão alternativa do dilema do prisioneiro envolvendo a troca de malas.
Pessoas
- John Nash — Matemático, ganhador do Prêmio Nobel de Economia, conhecido pelo conceito de Equilíbrio de Nash, fundamental na teoria de jogos.
- John Harsanyi — Economista, ganhador do Prêmio Nobel junto com Nash, por estender a teoria para jogos com informação incompleta, tornando os modelos mais realistas.
- Reinhard Selten — Economista, terceiro ganhador do mesmo Prêmio Nobel, citado como mais voltado para aplicações políticas da teoria.
- Pyotr Kropotkin — Geógrafo, anarquista e teórico russo, citado como um defensor da cooperação e da ajuda mútua como fatores evolutivos, autor de ‘Ajuda Mútua’.
- Robert Axelrod — Cientista político conhecido por organizar torneios do dilema do prisioneiro iterado e escrever ‘A Evolução da Cooperação’.
- Martin Nowak — Biólogo matemático que propôs uma síntese dos cinco mecanismos para a evolução da cooperação, autor de ‘Supercooperação’.
Linha do Tempo
- 00:00:00 — Introdução à teoria de jogos e sua relevância — O programa é apresentado como uma discussão sobre a teoria de jogos, um ramo da matemática que estuda como agentes interagem seguindo regras para obter algum retorno. É mencionado de forma provocativa a derrota do Brasil por 7x1 para a Alemanha como um gancho. Os convidados especialistas são apresentados.
- 00:01:17 — Definições fundamentais: tomada de decisão e premissas — A teoria de jogos é definida como o estudo da tomada de decisão. São discutidas as premissas necessárias, como o grau de racionalidade dos agentes, o conhecimento das informações disponíveis, o leque de estratégias e a definição de payoff (premiação). É destacado que a função de utilidade (o que cada agente maximiza) pode variar, o que é um desafio para uma escala comum de premiação.
- 00:02:57 — Prêmio Nobel e a evolução dos modelos (Nash, Harsanyi, Selten) — É mencionado o Prêmio Nobel de Economia concedido a John Nash, John Harsanyi e Reinhard Selten. A contribuição de Harsanyi para jogos com informação incompleta é destacada como uma extensão mais realista do modelo de Nash, que assumia informação completa. Selten é citado como mais voltado para aplicações políticas.
- 00:04:00 — Exemplo concreto: o trielo de “O Bom, o Feio e o Mau” — Usando a cena do filme “O Bom, o Feio e o Mau” como exemplo, é ilustrado um jogo (trielo) onde três agentes devem decidir em quem atirar. A decisão de cada um depende do conhecimento prévio sobre os outros (pontaria, interesses). Isso introduz a ideia de que uma estratégia só é boa ou má em relação às escolhas dos outros, não de forma absoluta.
- 00:05:52 — Conceito de Equilíbrio de Nash e Equilíbrio de Pareto — É explicado o Equilíbrio de Nash: uma situação onde, dada a estratégia dos outros, nenhum agente pode melhorar seu resultado mudando apenas a sua própria estratégia. É contrastado com o Equilíbrio de Pareto, onde uma mudança conjunta de estratégias poderia melhorar o resultado para todos. A discussão antecipa a exploração de modelos específicos como o dilema do prisioneiro.
- 00:09:28 — O dilema do prisioneiro: formulação clássica e paradoxo — Apresentado como um jogo canônico para entender o surgimento da cooperação. Na formulação clássica, dois prisioneiros separados devem decidir entre ficar quieto ou confessar/delatar. A análise racional individual mostra que confessar é a melhor estratégia independente da escolha do outro, levando ambos a um resultado pior (2 anos) do que se ambos cooperassem ficando quietos (1 ano). Isso ilustra o conflito entre interesse individual e coletivo.
- 00:11:36 — Outra versão do dilema: a troca de malas (Hofstadter) — É apresentada uma versão alternativa do dilema, inspirada em Douglas Hofstadter: dois agentes combinam trocar uma mala com dinheiro por uma mala com um produto ilegal. A análise racional mostra que, independente da ação do outro, é melhor levar uma mala vazia. Isso leva a um resultado onde nenhuma troca benéfica ocorre, exemplificando como o individualismo pode levar ao pior cenário para todos.
- 00:13:05 — Jogos sociais: o jogo do bem público e a punição — Introduzido o jogo do bem público, uma generalização do dilema do prisioneiro onde vários agentes contribuem para um fundo que é depois multiplicado e dividido igualmente entre todos. O problema do carona (free-rider) surge, pois é racional não contribuir. São mencionados experimentos que mostram como mecanismos de punição, mesmo custosos para quem pune, podem emergir para sustentar a cooperação.
- 00:14:48 — O jogo do ultimato e a rejeição por justiça — Descrito o jogo do ultimato: um proponente divide uma quantia, e um respondedor aceita (ambos ganham conforme a divisão) ou rejeita (ninguém ganha). O equilíbrio de Nash prediz que o respondedor deve aceitar qualquer oferta positiva. No entanto, experimentos com crianças e em diferentes culturas mostram que ofertas consideradas injustas (ex.: 9 para 1) são frequentemente rejeitadas, indicando que fatores como equidade e emoção influenciam a decisão.
- 00:18:20 — Debate histórico: cooperação vs. competição (Rousseau, Hobbes, Darwin) — A discussão conecta a teoria de jogos ao debate filosófico entre visões da natureza humana como cooperativa (Rousseau) ou competitiva/egoísta (Hobbes). É mencionado que o darwinismo foi historicamente associado à competição, mas que autores como o anarquista e geógrafo Pyotr Kropotkin defenderam a importância da ajuda mútua na evolução.
- 00:19:48 — A evolução da cooperação (Axelrod) e os mecanismos de Nowak — Citado o livro “A Evolução da Cooperação” de Robert Axelrod, que usou torneios do dilema do prisioneiro iterado. A estratégia vencedora foi “Tit for Tat” (olho por olho, dente por dente). Em seguida, são listados os cinco mecanismos para a evolução da cooperação propostos por Martin Nowak: reciprocidade direta, indireta, espacial (ou de rede), seleção de parentesco e seleção de grupo (este último controverso).
- 00:22:30 — Exemplos reais: morcegos e a guerra de trincheira — São dados exemplos concretos dos mecanismos de cooperação. Morcegos-vampiros compartilham sangue com vizinhos regulares (reciprocidade espacial). Nas trincheiras da Primeira Guerra Mundial, batalhões opostos desenvolviam tréguas tácitas (“live and let live”), um comportamento que espontaneamente seguia a lógica do “Tit for Tat” e que os generais tentavam quebrar rotacionando tropas.
- 00:25:08 — Aplicações em biologia: vírus e o dilema do prisioneiro — É apresentada uma aplicação clara em biologia: vírus dentro de uma célula competindo por recursos. Alguns vírus produzem uma proteína necessária para o capsídeo (cooperadores), enquanto outros mutantes não a produzem (não-cooperadores ou trapaceiros). Este sistema é um análogo quase perfeito do dilema do prisioneiro, mostrando a aplicabilidade do modelo a agentes não pensantes.
- 00:26:10 — Limitações e críticas aos modelos sociais (exemplo de Gelman) — É discutida a crítica de J.G. Gelman ao trabalho de Axelrod, usando o exemplo das trincheiras. Gelman argumenta que o comportamento cooperativo dos soldados poderia ser explicado por uma redução imediata de risco, sem necessidade de um raciocínio complexo sobre a estratégia do oponente. Isso ilustra a limitação de pressupor que agentes humanos sempre agem conforme a racionalidade estrita do modelo.
- 00:28:58 — Conclusão: a teoria como ferramenta para evidenciar mecanismos — Os participantes concluem que a teoria de jogos é uma ferramenta valiosa para isolar e entender mecanismos básicos de interação, desde vírus até sociedades humanas. Reconhecem suas limitações como modelo simplificado, mas defendem seu poder explicativo. O episódio fecha com uma brincadeira sobre não ter descoberto a razão da derrota do Brasil por 7x1, reiterando os nomes dos participantes.
Dados do Episódio
- Podcast: Fronteiras da Ciência
- Autor: Fronteiras da Ciência/IF-UFRGS
- Categoria: Science
- Publicado: 2014-07-14T19:00:00Z
Referências
- URL PocketCasts: https://pocketcasts.com/podcast/fronteiras-da-ci%C3%AAncia/fb4669d0-4a98-012e-1aa8-00163e1b201c/teoria-de-jogos/de07b8f0-edd1-0131-933e-5f4c86fd3263
- UUID Episódio: de07b8f0-edd1-0131-933e-5f4c86fd3263
Dados do Podcast
- Nome: Fronteiras da Ciência
- Site: http://frontdaciencia.ufrgs.br
- UUID: fb4669d0-4a98-012e-1aa8-00163e1b201c
Transcrição
[00:00:00] Este é o programa Fronteiras da Ciência, da rádio da Universidade, onde discutiremos
[00:00:09] os limites entre o que é ciência e o que é limitação.
[00:00:12] Hoje no Fronteiras da Ciência a gente vai discutir por que o Brasil perdeu de 7 a 1
[00:00:18] para a Alemanha.
[00:00:19] Então é muito oportuno a gente fazer um programa que nos dê as ferramentas para entender
[00:00:24] o que está acontecendo.
[00:00:25] Então o programa de hoje vai ser sobre teoria de jogos, um ramo da matemática, que se
[00:00:28] debruça sobre o entendimento de como é que o coletivo de agentes que usam regras interagem.
[00:00:34] Esses agentes estão interagindo buscando algum tipo de retorno.
[00:00:38] Pode ser financeiro, pode ser de prazer, pode ser até ganhar um jogo.
[00:00:42] Os convidados são o Roberto Silva e o Jefferson Arenzon, do Departamento de Física da Urgues.
[00:00:47] O Jefferson vem agora como especialista.
[00:00:49] E o pessoal do programa, Jorge Kielfeld e eu, Marco Idiarte, Jorge da biofísica.
[00:00:54] Teoria de jogos, expressão teoria nesse caso, é um pouquinho diferente do que usualmente
[00:00:58] se usa, por exemplo, a teoria da evolução, a teoria psicanalítica.
[00:01:02] Então teoria aqui é um conjunto de resultados matemáticos que são auxiliares, são ferramentas
[00:01:08] que são usadas para o entendimento desses sistemas que são chamados de jogos.
[00:01:12] Existe a definição curta, a teoria de jogos pode ser pensada como o estudo da tomada de
[00:01:17] decisões.
[00:01:18] A explicação longa envolve uma série de hipóteses.
[00:01:21] Por exemplo, a gente precisa definir se os agentes, os tomadores de decisão, se eles
[00:01:27] vão basear essa decisão na sua racionalidade, a gente supõe que eles são completamente
[00:01:31] racionais ou se eles têm uma parcela de racionalidade, se eles têm conhecimento de toda a informação
[00:01:36] disponível, ou seja, eles conhecem qual é o leque completo de possibilidades suas, de
[00:01:42] estratégias que eles podem assumir, eles conhecem se o leque de estratégias do oponente
[00:01:47] é o mesmo, e será que o oponente tem a mesma informação que ele, a premiação no final
[00:01:51] do jogo será que é a mesma para mim que para o meu oponente?
[00:01:55] Eu posso estar interessado em obter grana, outro pode estar interessado em obter poder,
[00:01:59] outro pode estar interessado em obter sexo.
[00:02:01] Quer dizer, mesmo a função que está sendo maximizada, aquilo que alguém quer obter
[00:02:05] varia de agente para agente.
[00:02:07] Esse é um dos grandes problemas da teoria de jogos clássica, é que não existe uma
[00:02:10] escala premiação, ou payoff, como vocês dizem, não existe uma escala única, comum
[00:02:15] a todos.
[00:02:16] Se a agente quiser aplicar a teoria de jogos em biologia, então o que se chama de teoria
[00:02:20] de jogos evolutivos, existe uma escala muito clara que é o número de filhotes, se a estratégia
[00:02:27] que eu faço, se a escolha que eu fiz em função das escolhas de quem está em volta é a melhor,
[00:02:33] eu vou deixar mais filhotes.
[00:02:34] Tem uma coisa que você sabe para comentar, você falou em racionalidade da decisão
[00:02:38] versus irracionalidade, mas eu acho que tem uma coisa é a racionalidade da decisão,
[00:02:42] entre os usos das regras lógicas e outra coisa, é quantos informados está, embora
[00:02:46] tenha modelos com mais ou menos grau de informação, mas se tu não tem informação, tu vai decidir
[00:02:50] como, exatamente, em função do desconhecido.
[00:02:53] Eu acho que isso, aí a gente até se remete ao criminóvel que foi dado, quando foi dado
[00:02:57] ao Nash, e mais dois cientistas, que eram o Harzani e o Selton.
[00:03:02] Justamente o…
[00:03:03] Esse é o primeiro Nobel de economia.
[00:03:04] De economia, dado em economia, na verdade era um…
[00:03:06] O Nash do famoso filme, aquele…
[00:03:08] Sim, o Nash.
[00:03:09] Um momento ineligente.
[00:03:10] Um momento ineligente.
[00:03:11] O Harzani, ele trabalhou com extensões do modelo de Nash, porque o modelo do Nash considerava
[00:03:17] que a função utilidade do adversário, que é como…
[00:03:20] Essa é a palavra que estava me faltando, função utilidade.
[00:03:22] Isso, como o adversário age, era completamente conhecido, e o Harzani ganhou o primeiro Nobel
[00:03:27] junto com o Nash por considerar jogos com informação incompleta, você tinha falhas
[00:03:31] na informação.
[00:03:32] Que são mais realistas.
[00:03:33] Exatamente.
[00:03:34] Justamente por isso, ele diz no próprio trabalho dele que ele queria considerar situações
[00:03:38] mais realistas do que a teoria do Nash.
[00:03:41] Após os jogos de azar são baseados principalmente no Bleff, ou seja, na contação, na informação.
[00:03:46] Então o Harzani ganhou isso.
[00:03:47] E o Selton ganhou junto, mas o Selton era um cara mais voltado para a parte política mesmo.
[00:03:53] Eu quero dar um exemplo concreto.
[00:03:54] O exemplo que eu sempre uso é uma situação do filme Il Bono, Il Bruto, Il Cattivo.
[00:04:00] A tradução.
[00:04:01] O bom, o feio e o mau.
[00:04:04] Esse é um filme de Far West, do Sérgio Leone, e ele tem uma cena que é uma generalização
[00:04:09] do duelo, é um trielo.
[00:04:11] Então tem os três, informação triangular.
[00:04:15] No centro, o Clint Eastwood, que é o bom, ele colocou um papel dizendo aonde ele escondeu
[00:04:21] o tesouro.
[00:04:22] E o vencedor desse trielo vai poder pegar.
[00:04:24] A premiação está bem clara, o payoff, que é conhecer a localização do tesouro.
[00:04:28] Depois a estratégia que cada um tem que decidir qual vai ser a sua é, eu tenho dois oponentes
[00:04:34] em qual dos dois eu vou atirar.
[00:04:36] Essa tomada de decisão é feita no conhecimento prévio que cada gente tem dos seus oponentes.
[00:04:42] Qual é a pontaria de cada um, quais são os interesses que os outros têm e qual é
[00:04:48] a chance de eu sair vitroyoso.
[00:04:49] A minha escolha não é boa ou má em si mesma.
[00:04:53] Eu não tenho como saber se a minha estratégia é boa sem saber qual foi a escolha dos outros.
[00:04:58] Ela é boa em relação ao conjunto de estratégias.
[00:05:00] Essa é uma das características fundamentais da teoria de jogos.
[00:05:04] Você tem uma estratégia, uma antecipação do que é possível com os elementos que você
[00:05:07] tem e depois que você ver o resultado da sua primeira ação você pode reatualizá-la.
[00:05:11] Sim, isso já está acontecendo no jogo iterado.
[00:05:13] No caso do trielo ele vai acontecer uma única vez?
[00:05:16] Isso é um modelo, um modelo matemático, um modelo mais simples seria uma única rodada.
[00:05:21] Então não tem como reaproveitar o que aprendeu.
[00:05:23] Isso é um one shot, é uma única.
[00:05:26] Esse tipo de situação pode ser modelada, dependendo de quanto o futuro se projeta.
[00:05:32] Se eu antecipo esse jogo vai ser repetido duas vezes ou dez vezes ou com uma probabilidade
[00:05:39] tudo isso muda o resultado do jogo.
[00:05:41] Eu saber o que vai acontecer no futuro é importante.
[00:05:44] A gente tem o conceito de estratégia, tem o conceito de premiação.
[00:05:48] Isso já está chegando no conceito de equilíbrio também de Nash.
[00:05:52] A história é que você tem uma estratégia boa em relação aos seus adversários.
[00:05:57] E todo mundo tem uma estratégia boa em relação aos seus adversários.
[00:06:01] E o equilíbrio de Nash significa que se você mudar uma…
[00:06:03] Uma você piora para todo mundo.
[00:06:04] É para todo mundo.
[00:06:05] Não, não, não, é para ele.
[00:06:07] É unilateral.
[00:06:08] É unilateral, então se eu tenho três agentes a minha escolha, dada a escolha dos outros,
[00:06:13] eu fixo os outros dois, a escolha que eu fiz é melhor em relação às minhas opções.
[00:06:18] Qualquer outra opção que eu fizer piora para mim.
[00:06:21] É unilateral.
[00:06:23] Só que vale para os três vértices do treino?
[00:06:25] De cada vez, um de cada vez.
[00:06:27] Eu posso achar uma solução onde eu pego os três e mudo as estratégias dos três
[00:06:31] e pode ser que eu ache uma solução para os três melhor.
[00:06:35] É equilíbrio de pareto.
[00:06:36] Equilíbrio de pareto, exatamente.
[00:06:37] Vai ficar mais claro quando a gente entrar em modelos específicos de jogos,
[00:06:41] por exemplo, o dilema do Prisioneiro.
[00:06:42] Acho que vamos passar para esse aqui.
[00:06:43] Eu acho que tem um comentário aqui, então, Laci, que em teoria de jogos o nome sugere
[00:06:47] e promete, às vezes, muito mais do que é uma descrição fiel da realidade de um jogo.
[00:06:51] Eu estou pensando aqui, de uma forma imaginada, como classificar os tipos de jogos que existem.
[00:06:55] Por exemplo, o xadrez não se enquadra em nenhum modelo desses aí, não tem nada a ver.
[00:06:58] Porque ele é um jogo histórico, que depende de uma sequência, tem regras complexas,
[00:07:02] mas rígidas, não dá para inventar.
[00:07:04] É, gente, ela é uma nuance de uma situação real.
[00:07:06] Acho que ela descreve nuances de uma situação real.
[00:07:09] Isso que eu queria descrever, ou seja, a teoria de jogos descreve o modelo matemático
[00:07:14] como um modelo, ele é uma simplificação bastante expressiva da realidade.
[00:07:20] Não, não, eu não estou terminando isso com a física, na verdade.
[00:07:22] Com toda a ciência de forma geral.
[00:07:23] A gente tem as equações de Newton para a mecânica, mas muitas vezes elas são inaplicáveis para a prática.
[00:07:29] Eu quero só terminar minha decisão e dizer que sim, como qualquer modelo científico,
[00:07:33] que é uma aproximação da realidade em uma hora menor ou maior grau,
[00:07:36] mas a diferença das da física, que estão descrevendo uma realidade bem mais simples e preditível,
[00:07:40] aqui está se aplicando a situações de interação entre agentes inteligentes, com livre arbítrio,
[00:07:45] que aí então o grau de complexidade, a imprevisibilidade associada, é diferente de uma lei da física.
[00:07:50] Eu não excordo.
[00:07:51] A teoria de jogos é aplicada para agentes tão simples quanto o vírus.
[00:07:56] Pode ser, pode ser.
[00:07:57] Não pode atingir racionalidade.
[00:07:58] Acho que a gente está esquecendo.
[00:07:59] Sim, mas na hora de fazer uma aplicação por uma interação social, por exemplo, um jogo econômico,
[00:08:02] uma sociedade, aí vai ter momentos e vai ter situações em que ele se aplica.
[00:08:07] Mas aí eu acho que ela começa a ser muito mais próxima do real,
[00:08:12] quando você, por exemplo, pega a teoria de jogos, coloca numa topologia diferente,
[00:08:17] permite que os jogadores possam se comunicar, possam andar na rede,
[00:08:21] fazendo um protocolo simples, executando esse jogo simples,
[00:08:25] a coisa acaba pegando muito mais da realidade do que a gente imagina.
[00:08:29] Então acho que esse é o ponto.
[00:08:30] Para esse programa Fronteiras da Ciência, a gente está discutindo hoje a teoria de jogos.
[00:08:34] Como ficou bem claro para o ouvinte, um conjunto de ferramentas suficientemente abrangente,
[00:08:39] que vai poder ser usado tanto em economia, política, na relação dos animais com seu meio ambiente,
[00:08:45] com as outras espécies e até jogos de cartas, jogos de azar e coisa e tal.
[00:08:48] Nesse momento eu queria saber os canônios da teoria de jogos.
[00:08:51] São aqueles jogos que as pessoas conhecem, aqueles jogos que são as referências do uso da teoria.
[00:08:56] Saiu um artigo na Ciência uns 10 anos atrás com a lista dos 25 problemas
[00:09:00] para os quais a gente não tem uma solução definitiva, completa até hoje,
[00:09:05] que é o problema de como cooperação aparece em populações.
[00:09:09] Porque do ponto de vista darwiniano, a gente enxerga a evolução muito mais competitiva do que cooperativa.
[00:09:15] Então como diabos a gente encontra exemplos reais de agentes
[00:09:20] em simbiose e em situações de autorismo cooperando entre si.
[00:09:23] Então o modelo que foi proposto para idealizar essa situação é o dilema do prisioneiro.
[00:09:28] Formulação clássica, então são duas pessoas que foram capturadas tentando cometer um crime.
[00:09:34] Algumas evidências, nada muito claro.
[00:09:36] Então se nada acontecer, eles vão pegar um ano de cadeira.
[00:09:40] Daí eles pegam separadamente os dois e fazem uma proposta.
[00:09:44] Se tu confessar, tu tá livre.
[00:09:46] Teu companheiro leva toda a culpa e pega três anos.
[00:09:49] E fazem a mesma proposta para o outro.
[00:09:51] Se os dois ficarem inquietos, eles vão pegar um ano e estão livres.
[00:09:55] A melhor situação.
[00:09:56] Se os dois confessam, os dois se ralam e eles vão pegar dois anos.
[00:10:01] Se um só confessa, ele tá livre.
[00:10:04] Eu agora vou decidir o que eu vou fazer.
[00:10:06] Esse não é um problema que tem que ser encarado usando regras morais, o que é o certo, o que é errado.
[00:10:12] A minha única régua aqui é quanto tempo eu vou ficar na cadeira.
[00:10:16] E é isso que eu vou tentar minimizar.
[00:10:17] Não pensa na vingança da família do outro.
[00:10:19] Tu não pensa em nada.
[00:10:20] Se tu é amigo, nada.
[00:10:21] Então é um problema realmente retirado de todas as complexidades do mundo real.
[00:10:26] Então quais são as minhas opções?
[00:10:28] Eu tenho duas opções.
[00:10:29] Ou eu fico quieto ou eu entrego o meu companheiro.
[00:10:32] O que acontece se…
[00:10:33] Não tem terceira opção.
[00:10:34] Não, não tem terceira opção.
[00:10:35] Na versão do dilema do prisioneiro tradicional.
[00:10:38] Então eu penso, o que ele pode fazer?
[00:10:39] Ele pode ficar quieto.
[00:10:40] Se ele ficar quieto, melhor eu entregar ele.
[00:10:43] Porque daí eu tô livre.
[00:10:44] Se ele ficar quieto, pra mim é melhor falar.
[00:10:45] Qual é a outra opção do meu amigo lá?
[00:10:47] É ele falar.
[00:10:48] Aí não faz diferença pra ti.
[00:10:50] Não, se ele falar e eu ficar quieto, eu fico três anos.
[00:10:53] Mas se ele falar e eu falo, eu só fico dois.
[00:10:55] Então a ideia é, independente dos números,
[00:10:57] quando eu vou decidir o que fazer,
[00:10:59] se o meu companheiro abrir a boca,
[00:11:01] é melhor eu abrir a boca.
[00:11:02] Se ele ficar quieto, é melhor eu abrir a boca.
[00:11:05] Então…
[00:11:05] Mas tu não sabe o que ele vai fazer.
[00:11:07] Tu não sabe o que ele vai fazer.
[00:11:07] Mas a minha decisão vai ser abrir a boca.
[00:11:09] O meu companheiro vai pensar exatamente da mesma maneira.
[00:11:12] E a decisão dele vai ser abrir a boca.
[00:11:14] Conclusão, a única estratégia
[00:11:16] que funciona pra cada um deles individualmente
[00:11:19] é abrir a boca.
[00:11:20] E acabam os dois pegando dois anos.
[00:11:22] Se os dois tivessem ficado quietos,
[00:11:24] eles pegariam um ano.
[00:11:25] Então é por isso que se chama o dilema, o paradoxo.
[00:11:28] Mas eles poderiam ter pego três.
[00:11:30] Porque tem esse ponto.
[00:11:32] Tem uma outra formulação que é bem mais clara,
[00:11:34] que é a do Douglas Hofstadter.
[00:11:36] Escreveu o Guedl Eicheribach.
[00:11:37] Ele é filho de um físico que ganhou Nobel de Física.
[00:11:41] Em homenagem ao pai dele,
[00:11:42] existe o Hofstadter no Big Bang Theory.
[00:11:45] Então é uma situação assim,
[00:11:46] eu tenho interesse em comprar um produto
[00:11:47] que o Jorge está vendendo.
[00:11:48] E é uma coisa ilegal.
[00:11:49] Então não pode ser feito muito às claras.
[00:11:51] Então eu combino com o Jorge,
[00:11:53] hoje no final do dia, seis horas,
[00:11:55] a gente se encontra na praça,
[00:11:57] tu leva o produto numa mala,
[00:11:58] eu levo o dinheiro numa mala,
[00:11:59] a gente troca as malas e vamos embora.
[00:12:01] O que acontece se o Jorge colocar o produto na mala?
[00:12:04] O que é melhor para mim?
[00:12:05] É eu não dar o dinheiro,
[00:12:05] porque eu fico com o produto e não gasto nada.
[00:12:07] Então eu vou lá e entrego uma mala vazia.
[00:12:09] Qual é a outra opção do Jorge?
[00:12:10] É me entregar uma mala vazia.
[00:12:12] Nesse caso, se eu der o dinheiro,
[00:12:13] eu vou estar perdendo.
[00:12:14] Então é melhor eu entregar uma mala vazia.
[00:12:16] Qualquer que seja a decisão dele,
[00:12:19] para mim é melhor entregar uma mala vazia.
[00:12:20] Ela vai fazer o mesmo raciocínio
[00:12:22] e vai me entregar uma mala vazia.
[00:12:23] No fim os dois vão se trocar malas vazias
[00:12:26] e não vão fazer um negócio que interessava os dois.
[00:12:28] Essa é uma postura de individualismo,
[00:12:30] de egoísta, selfish,
[00:12:32] que leva a minimização do benefício para ambos
[00:12:34] e leva ao pior dos cenários.
[00:12:36] Se alguma forma tivesse uma informação,
[00:12:38] se eles conseguissem trocar a informação,
[00:12:39] era o melhor,
[00:12:40] mas a coisa é feita de forma individual.
[00:12:42] Para um modelo, ele é bastante esperto,
[00:12:44] porque eu tenho uma visão de longe,
[00:12:46] e bem inseto,
[00:12:47] eu conheço pouco o modelo,
[00:12:48] que o Diogo, por exemplo,
[00:12:49] parece que foi engenheirado
[00:12:51] para tu concluir,
[00:12:52] quase que moralmente,
[00:12:53] que ser cooperativo é benéfico.
[00:12:55] Porque o jogo sempre,
[00:12:56] na maioria das formulações,
[00:12:57] a cooperação é a melhor solução.
[00:12:59] Então, esse é o problema.
[00:13:00] Por isso que tem outros programas abertos,
[00:13:01] como o jogo do ultimato,
[00:13:02] o jogo do ditador.
[00:13:03] O jogo do bem público também.
[00:13:04] Pois é.
[00:13:05] O jogo do bem público,
[00:13:06] acho que mostra bem,
[00:13:07] aí a questão é uma generalização
[00:13:09] quase do dilema do prisioneiro,
[00:13:11] onde você, no fundo,
[00:13:12] você tem um fundo e você quer,
[00:13:14] as pessoas querem, por exemplo,
[00:13:15] construir algo numa sociedade pequena.
[00:13:18] Como já foram feitos os experimentos?
[00:13:20] Então, as pessoas contribuem com uma quantia,
[00:13:23] todo mundo contribui com uma determinada quantia.
[00:13:25] E esse dinheiro,
[00:13:26] depois de uma aplicação,
[00:13:28] ele é revertido para essas pessoas
[00:13:29] em forma igualitária,
[00:13:31] ou seja, é dividido pelo número de pessoas.
[00:13:33] O bolo é aumentado.
[00:13:34] O bolo é aumentado por algum fator,
[00:13:36] as pessoas depositaram,
[00:13:37] ele foi colocado na poupança,
[00:13:39] ou algo do tipo.
[00:13:39] É importante dizer que o dinheiro
[00:13:41] é dividido por todo mundo,
[00:13:42] independente do que cada um deu.
[00:13:44] Sim, independente.
[00:13:45] E aí que surge o problema.
[00:13:47] É quando as pessoas percebem
[00:13:49] que não depositando,
[00:13:50] elas vão ter dinheiro de volta.
[00:13:51] Isso é bem realista, no caso assim,
[00:13:53] quando a gente está se beneficiando
[00:13:55] de algum tipo de infraestrutura
[00:13:57] que está sendo dada por todo mundo.
[00:13:58] A gente pode decidir se pode dar ou não.
[00:14:00] Por exemplo, tipo coisa,
[00:14:01] por exemplo, o Wikipedia,
[00:14:02] de vez em quando, pede doações.
[00:14:04] Tem gente que está doando,
[00:14:05] mas tem gente que usa,
[00:14:06] que usa o Wikipedia, mas não doa.
[00:14:08] Principalmente se o jogo for iterado.
[00:14:10] Aí o fundo vai realmente degringulando.
[00:14:12] E essa é a questão.
[00:14:13] Quais são os mecanismos que você faz
[00:14:15] com que esse fundo se mantenha?
[00:14:17] Aí vem punição,
[00:14:18] as pessoas têm esquemas,
[00:14:19] têm vários trabalhos,
[00:14:20] falam sobre esquemas de punishment.
[00:14:22] Tem um experimento em que
[00:14:23] ela paga um dólar para punir
[00:14:25] uma pessoa que não contribuiu com três.
[00:14:27] Existem pessoas que de fato fazem isso
[00:14:29] para tentar manter o fundo funcionando.
[00:14:31] Roberto fala em experimento
[00:14:32] porque realmente se faz experimento.
[00:14:33] Se faz experimento.
[00:14:34] Isso é um artigo da nature.
[00:14:35] Com sujeitos que interagem via computador.
[00:14:38] Isso é um artigo da nature conhecido.
[00:14:39] As instituições que punem
[00:14:41] acabam perdurando muito mais
[00:14:43] do que as instituições que não punem.
[00:14:46] Tem um segundo exemplo que eu queria dar,
[00:14:47] que é o jogo do Ultimaton,
[00:14:48] que também tem esse esquema,
[00:14:50] mas é para o bem, digamos assim.
[00:14:52] Mas o jogo do Ultimaton é assim,
[00:14:53] é uma barganha.
[00:14:54] A pessoa tem um valor,
[00:14:56] uma quantia para ser dividida
[00:14:58] e ele diz assim,
[00:14:59] eu fico com uma fração dessa quantia
[00:15:01] e você fica com o restante.
[00:15:03] Se o responder,
[00:15:04] que é o cara que aceita ou não
[00:15:06] aceitar essa proposta,
[00:15:07] o que acontece?
[00:15:09] Os dois ganham.
[00:15:09] Se ele rejeitar, ninguém ganha.
[00:15:11] Então a questão é…
[00:15:12] Por que o cara vai rejeitar?
[00:15:14] Vai rejeitar porque pode ser
[00:15:15] uma quantia muito pequena.
[00:15:17] Pode te ofender.
[00:15:17] Você se sente ofendido.
[00:15:20] Você sabe quanto vai ser dividido.
[00:15:22] Eu tenho dez moedas de chocolate.
[00:15:24] O que o Marco está pensando…
[00:15:25] Claro, o comportamento racional…
[00:15:27] O equilíbrio de Nash
[00:15:29] nessa situação é aceitar
[00:15:31] qualquer que seja o que você está ganhando,
[00:15:33] ou é isso ou nada.
[00:15:33] Então qualquer coisa é bom.
[00:15:34] Mas o Ultimaton é um jogo
[00:15:35] mais simplificado.
[00:15:36] Só que me interessa, por exemplo,
[00:15:38] uma fraçãozinha de um chocolate,
[00:15:40] ou algo do tipo.
[00:15:41] Mas não é melhor que nada.
[00:15:42] Bom, e o outro?
[00:15:43] Bom, eu não aceitaria.
[00:15:44] Se você souber que o outro tem dez barras,
[00:15:46] você sabe o total.
[00:15:47] Você sabe o total.
[00:15:48] Você tem que saber.
[00:15:49] Não é desconhecido.
[00:15:50] Mas é mais divertido se você não souber.
[00:15:52] Se você não souber,
[00:15:54] vai dependendo da habilidade para quem.
[00:15:55] Mas se você não souber,
[00:15:56] você vai sempre cair no equilíbrio de Nash
[00:15:58] e o problema é muito real.
[00:15:59] Porque aí você aceita tudo.
[00:16:00] Crianças, a gente acha que crianças…
[00:16:02] Eles sabem fazer isso.
[00:16:03] Eles punem severamente.
[00:16:05] Porque quando as crianças
[00:16:07] fizeram esse experimento
[00:16:08] com dez moedas de chocolate,
[00:16:10] geralmente o que a maioria faz?
[00:16:12] Pega oito, deixa duas.
[00:16:14] Na verdade, alguns são até mais…
[00:16:16] São piores.
[00:16:16] Ele pega, fica com nove
[00:16:17] e tenta dar uma para o outro.
[00:16:19] O outro aceita, ele fica com as noves.
[00:16:21] O outro não aceita, as dez vão embora.
[00:16:23] A maioria das crianças rejeitam.
[00:16:25] E na segunda geração,
[00:16:27] ela já vai para o 50-50.
[00:16:28] Metade-metade.
[00:16:29] Ou então alguns ainda tentam fazer
[00:16:30] seis com quatro.
[00:16:31] Esse experimento também foi repetido
[00:16:33] até com pessoas na Polinésia.
[00:16:35] Em culturas.
[00:16:37] Exatamente, eles fazem com culturas diferentes
[00:16:39] para ver se o 50-50 é alcançado.
[00:16:41] Acho que o que está representado
[00:16:43] nos dois exemplos,
[00:16:44] nas duas versões do Dilema do Prisioneiro
[00:16:46] que você apresentou e um pouco nos outros também,
[00:16:48] é assim. Embora ele tenha que envolver
[00:16:50] uma decisão racional baseado em algum,
[00:16:52] na quantidade de informação,
[00:16:54] esse jogo além de tudo, esses jogos como modelos
[00:16:56] e aí entra a limitação dela para representar
[00:16:58] coisas mais ambas como sociedades
[00:17:00] complexas com muitos elementos em jogo,
[00:17:02] é o fato de que há uma série de pressupostos
[00:17:04] não declarados para um modelo.
[00:17:06] Por exemplo, o pressuposto de que a pessoa
[00:17:08] vai se importar de fazer uma tentativa
[00:17:10] ou supor se ela vai se mobilizar
[00:17:12] para isso. As questões motivacionais
[00:17:14] e outros, está tudo muito achatado.
[00:17:16] Mas eu não acho que seja uma limitação
[00:17:18] de teoria de jogos, é uma limitação de alguns
[00:17:20] modelos de teoria de jogos. A teoria de jogos
[00:17:22] é ampla o suficiente para eu fazer um modelo mais complicado
[00:17:24] que eu possa. Poderia fazer.
[00:17:26] Porque muitas das ciências sociais,
[00:17:28] bastante na economia, mas muitas das ciências sociais
[00:17:30] até algumas da antropologia,
[00:17:32] tentam extrapolar desses modelos para fazer
[00:17:34] uma teoria geral sobre
[00:17:36] a natureza humana. E aí para chegar
[00:17:38] até nos fundamentos da ética, da moral
[00:17:40] e tudo mais, que na minha humilde
[00:17:42] opinião ele representa, certamente,
[00:17:44] uma fenomenologia real. Tem coisas
[00:17:46] que estão acontecendo, mas uma série
[00:17:48] de pressupostos faz ele não ser realista o suficiente
[00:17:50] para ter essa aspiração. Eu não sei
[00:17:52] se essa aspiração é tão
[00:17:54] difundida assim. A maneira como eu vejo
[00:17:56] é a atitude que o físico
[00:17:58] encara esse tipo de problema.
[00:18:00] Tu quer entender quais são os mecanismos
[00:18:02] básicos?
[00:18:04] Existem efeitos inesperados,
[00:18:06] situações de conflito.
[00:18:08] A gente fica procurando,
[00:18:10] digamos, as unidades básicas
[00:18:12] de construção para esses modelos.
[00:18:14] De alguma forma, o resto é uma composição
[00:18:16] de todos.
[00:18:18] Por que eu estou trazendo isso? Até porque, principalmente,
[00:18:20] para falar um pouco do outro lado da história,
[00:18:22] o jogo é baseado em uma competição, cooperação
[00:18:24] no balanço dessas duas coisas, que é um velho
[00:18:26] debate na cultura ocidental. É a cooperação
[00:18:28] do Jean-Jacques Rousseau, que partiu do princípio
[00:18:30] que as pessoas naturalmente nascem boas,
[00:18:32] a sociedade as corrompe. E por outro lado, Thomas Hobbes,
[00:18:34] que as pessoas são intensamente
[00:18:36] egoístas e mais e a sociedade tem como
[00:18:38] correlá-las. Interessante que os dois atores
[00:18:40] se confluem no final da vida. O contrato social
[00:18:42] é uma solução hobbesiana, de certo modo.
[00:18:44] Mas, assim, nesse debate,
[00:18:46] dá para dizer também que na biologia Darwin,
[00:18:48] ele acabou incorporando, até por razões históricas
[00:18:50] e ideológicas, muito o ângulo
[00:18:52] apenas da competição, embora ele detectasse
[00:18:54] observações de tipo cooperativo,
[00:18:56] mas ele não se destacou por promover isso.
[00:18:58] E o darwinismo é visto como uma espécie de teoria geral
[00:19:00] do egoísmo na natureza, que é a fundamento
[00:19:02] da seleção natural, que é a solução
[00:19:04] da vitória do mais adaptado.
[00:19:06] Existe um autor, que é um geógrafo,
[00:19:08] que descrevia a natureza, trabalhava
[00:19:10] com animais, descrevendo animais, mas também
[00:19:12] com populações humanas, que é o Pyotr Kropotkin,
[00:19:14] príncipe russo, e que também
[00:19:16] é um dos fundadores de uma das escolas importantes
[00:19:18] do anarquismo, mas ele é um teórico da cooperação
[00:19:20] e escreveu alguns livros importantes sobre isso,
[00:19:22] que são sobre cooperação e evolução, e outros
[00:19:24] sobre o que é o mais famoso, que é a ajuda mútua,
[00:19:26] onde ele descreve desde as situações de insetos,
[00:19:28] animais, depois aldeias pequenas,
[00:19:30] cidades grandes, suas civilizações antigas.
[00:19:32] É bem interessante o estudo que ele tenta fazer.
[00:19:34] Isso foi, inclusive, antes do von Neumann
[00:19:36] formalizar a credibilidade.
[00:19:38] Muito antes, isso é coisa do fim do século XIX,
[00:19:40] virada do século. Então, o que eu quero dizer com isso é assim,
[00:19:42] uma coisa conflui, digamos, um dos livros
[00:19:44] que tenta mostrar a influência disso na biologia
[00:19:46] é esse clássico do Robert Auxelrod,
[00:19:48] a evolução da cooperação, onde precisamente
[00:19:50] ele usa o genoma do prisioneiro, a labora.
[00:19:52] E esse livro acabou levando a uma crítica
[00:19:54] interessante, uma das mais fáceis
[00:19:56] de achar essa, desse tal Gellman,
[00:19:58] que tenta analisar o aspecto ideológico
[00:20:00] da metodologia, tentando mostrar,
[00:20:02] exatamente, a limitação dos pressupostos
[00:20:04] embutidos que tem no modelo, que talvez
[00:20:06] limite o alcance das conclusões que possa levar.
[00:20:08] Mas aí, uma coisa que ele destaca
[00:20:10] no livro, e o Auxelrod deixa claro
[00:20:12] isso, é que ele tenta mostrar,
[00:20:14] usando jogos como o dilema do prisioneiro,
[00:20:16] tem uma natureza, assim, inescapável
[00:20:18] que cooperação é a melhor solução
[00:20:20] no ponto de vista social de qualquer solução.
[00:20:22] O que, obviamente, provoca um arrepio de alguns pensadores
[00:20:24] mais, tipo, ultraliberais,
[00:20:26] ou coisas desse tipo, porque, não, tem que ser
[00:20:28] todo mundo egoísta e individualista com uma economia.
[00:20:30] Se bem que, na economia, essas regrações
[00:20:32] são uma coisa, nas relações, ou em
[00:20:34] sociedade, ou no ambiente cultural,
[00:20:36] são outras, dependendo do tamanho do
[00:20:38] grupo, enfim, para mostrar que, na verdade,
[00:20:40] esse é um debate que está de pé, e
[00:20:42] a cooperação, na verdade, esse é, tem um
[00:20:44] outro autor bem recente, que é o Novak,
[00:20:46] que é bem interessante, que fez uma classificação, inclusive,
[00:20:48] dos cinco tipos de cooperação, a cooperação
[00:20:50] direta, reciprocidade direta, indireta,
[00:20:52] de espacial, que ele chama
[00:20:54] reciprocidade de rede, seleção de grupo,
[00:20:56] seleção de parentesco, que, né, são
[00:20:58] cinco, na verdade, ele elaborou a teoria
[00:21:00] e ele escreveu esse livro, que é
[00:21:02] super cooperação, são os humanos,
[00:21:04] são os únicos animais que usam todos esses tipos.
[00:21:06] Super cooperação é um livro de divulgação
[00:21:08] científica, que o Martin Novak
[00:21:10] escreveu, ele tem um livro anterior, onde ele
[00:21:12] coloca um pouco mais, ele tem
[00:21:14] um review na SAIS, de uns anos
[00:21:16] atrás, onde ele, não é que
[00:21:18] ele tenha montado uma teoria, esses são
[00:21:20] os mecanismos básicos
[00:21:22] que as pessoas, nos últimos 30
[00:21:24] anos, identificaram, através
[00:21:26] desses modelos simples, não é uma teoria do
[00:21:28] novo. Mas é a única integração
[00:21:30] sintética que tem lá. Não, não, não,
[00:21:32] se fala, se fala desde o início,
[00:21:34] o primeiro livro de teoria de jogos
[00:21:36] aplicada a biologia, é o do
[00:21:38] Martin Smith, naquela época se falava muito
[00:21:40] em seleção de parentesco, então esse foi o primeiro
[00:21:42] mecanismo identificado, bom,
[00:21:44] e se identificou, depois as pessoas identificaram
[00:21:46] o segundo mecanismo, que é reciprocidade
[00:21:48] direta, que é eu te ajudo, tu me ajuda,
[00:21:50] mas foi identificado nesses modelos,
[00:21:52] depois se identificou o terceiro, que é reciprocidade
[00:21:54] indireta, que é eu ajudo o
[00:21:56] Roberto, porque eu sei que ele ajudou
[00:21:58] Jorge. Boia não tenha feito nenhuma
[00:22:00] interação direta com
[00:22:02] Jorge, e mais recentemente
[00:22:04] que é a reciprocidade espacial,
[00:22:06] que é simplesmente o fato dos
[00:22:08] indivíduos, sem nenhuma relação entre
[00:22:10] si, de eles permanecerem próximos
[00:22:12] espacialmente, e a gente tem exemplos
[00:22:14] que vão, morcegos que compartilham
[00:22:16] sangue, eles quando voltam para as
[00:22:18] cavernas, eles ficam sempre na mesma
[00:22:20] posição, então se o vizinho aquela noite não
[00:22:22] conseguiu sangue, o morcego regurgita
[00:22:24] e compartilha, porque ele sabe que
[00:22:26] um dia no futuro ele vai receber,
[00:22:28] tem o segundo exemplo famoso, que foi a
[00:22:30] guerra de trincheira, durante a primeira guerra
[00:22:32] mundial, que o fato dos batalhões permanecerem
[00:22:34] próximos, sem combinação
[00:22:36] nenhuma, eles criavam regras do
[00:22:38] tipo, eu te deixo viver,
[00:22:40] tu me deixa viver, então os
[00:22:42] generais eles eram obrigados
[00:22:44] a cada dois meses,
[00:22:46] eles eram obrigados a
[00:22:48] quebrar essas combinações e
[00:22:50] continuar a guerra, porque senão eles
[00:22:52] moviam os batalhões de lugar, porque
[00:22:54] novos batalhões se encontravam,
[00:22:56] não tinha nenhuma relação, e aí
[00:22:58] por algum tempo, mas naturalmente essas
[00:23:00] regras, e depois
[00:23:02] o quinto
[00:23:04] mecanismo, que ainda
[00:23:06] é muito controverso, que é a seleção
[00:23:08] de grupo, é realmente controverso,
[00:23:10] então os quatro primeiros são bem
[00:23:12] consensuais,
[00:23:14] o novo é que coloca
[00:23:16] os cinco pontos de fato, no livro dele
[00:23:18] ele coloca assim, que ele não coloca quatro
[00:23:20] os quatro primeiros
[00:23:22] são bem estabelecidos,
[00:23:24] o quinto que é
[00:23:26] controverso, porque ainda tem gente que diz
[00:23:28] que não há seleção de grupo,
[00:23:30] é que é uma seleção individual, mas que aparece assim
[00:23:32] vocês podem exemplificar algum
[00:23:34] caso onde se pode dizer assim, a teoria de jogos
[00:23:36] foi bem sucedida na
[00:23:38] explicação de tal fenômeno,
[00:23:40] fez um bom fitting pelo menos, a teoria
[00:23:42] de jogos nesse momento,
[00:23:44] ela serve pra nos mostrar
[00:23:46] o tamanho da dificuldade de
[00:23:48] abordar esses problemas
[00:23:50] o próprio exemplo da guerra das trincheiras,
[00:23:52] o comportamento que esses
[00:23:54] batalhões apresentam, o tipo de
[00:23:56] regra que eles usam, intuitivamente
[00:23:58] sem combinação,
[00:24:00] é uma regra que foi introduzida pelo Rappelpot
[00:24:02] num dos combates, num dos torneios
[00:24:04] organizados pelo Axelrod,
[00:24:06] que é o tit for tat, que é o olho por olho,
[00:24:08] dente por dente, que é uma regra
[00:24:10] extremamente simples, que apareceu
[00:24:12] entre as várias regras
[00:24:14] propostas pro torneio, foi a que ganhou
[00:24:16] as duas realizações do torneio
[00:24:18] mas só se o jogo for iterado
[00:24:20] porque não é um jogo de uma razão, é um jogo populacional
[00:24:22] são muitos agentes interagindo
[00:24:24] com muitos agentes, não é uma única
[00:24:26] rodada
[00:24:28] e essa regra
[00:24:30] é muito simples, pelo fato de ser simples
[00:24:32] ela é clara, ela começa cooperando
[00:24:34] e ela repete o que o
[00:24:36] oponente faz, então se tu
[00:24:38] me sacaneia, eu te sacaneio na próxima vez
[00:24:40] então ela retalia, e ela é boa, ela perdoa
[00:24:42] se tu voltar a cooperar, a regra volta a cooperar
[00:24:44] e é exatamente isso que
[00:24:46] acontecia nas guerras de Trincher
[00:24:48] se os caras não respeitassem o acordo tácito
[00:24:50] tinha a retaliação, se eles voltassem
[00:24:52] a colaborar, o outro lado
[00:24:54] voltava a colaborar
[00:24:56] o torneio que o Axelrod organizou
[00:24:58] ele depois se reproduziu na vida real
[00:25:00] numa situação super complexa que é o
[00:25:02] combate numa guerra
[00:25:04] em escala muito grande
[00:25:06] tu pode ir pro outro extremo e aplicar
[00:25:08] por exemplo o dilema do prisioneiro que a gente
[00:25:10] estava comentando, no que acontece
[00:25:12] com vírus que ocupam
[00:25:14] uma mesma célula e que estão competindo
[00:25:16] por matéria prima pra se reproduzir
[00:25:18] então tu pode ter o vírus do tipo A
[00:25:20] que tem um gen que codifica
[00:25:22] uma proteína que vai ser usada
[00:25:24] depois pra formar aquela casquinha
[00:25:26] nesses casos não há dúvida que o modelo é imbatível
[00:25:28] porque não temos agentes pensantes
[00:25:30] o modelo é aplicado e o modelo é testado
[00:25:32] existem instrumentos feitos pelo
[00:25:34] Turner e pelo Chao
[00:25:36] uns anos atrás, então tem uma variante
[00:25:38] do vírus que tem o gen que codifica essa proteína
[00:25:40] então ele tem todo o custo energético
[00:25:42] de produzir a proteína
[00:25:44] e tem uma segunda variante que embora
[00:25:46] precise da mesma proteína pra montar
[00:25:48] o capsídeo ali dele
[00:25:50] não tem o gen, então não gasta nenhuma energia
[00:25:52] então o que produz a proteína é o cooperador
[00:25:54] e o outro é o não cooperador
[00:25:56] exatamente pra enfatizar
[00:25:58] que é um modelo importante
[00:26:00] e não tenho dúvida que tenha aplicações inclusive do social
[00:26:02] mas por exemplo enfatizando um pouco
[00:26:04] essas limitações do uso social, por exemplo esse
[00:26:06] é um exemplo que o J.G.Gelman que faz a crítica do trabalho do Axel Rodd lá
[00:26:08] ele mostra assim por exemplo que
[00:26:10] não foi levado em conta pra interpretar o exemplo das trincheiras
[00:26:12] aplicando o J.G.Gelman no prisioneiro
[00:26:14] modificado por titular tetan, não sei o que
[00:26:16] porque existem outras alternativas mais simples
[00:26:18] ele considera inclusive que essa interpretação
[00:26:20] das trincheiras da primeira guerra é errada
[00:26:22] é erronea, porque não considera esse é o exemplo
[00:26:24] real de J.G.Gelman no prisioneiro
[00:26:26] porque por exemplo o comportamento cooperativo
[00:26:28] pode ser explicado por meio de uma redução imediata
[00:26:30] de riscos, seja o coopere, o cara não tira em mim
[00:26:32] o pare tira e não tira em mim e eu fico
[00:26:34] de olho nos meus agentes, nos meus generais
[00:26:36] pra ver o que eles estão cobrando, se eles não estão cobrando
[00:26:38] eu fico assim, isso é uma decisão que
[00:26:40] independe do desenho de um supor
[00:26:42] o que o outro está fazendo, eu decido baseado apenas
[00:26:44] no que tem do lado de cá, enfim, ou seja
[00:26:46] como qualquer coisa vai explicado pra fazer uma teoria
[00:26:48] tu vai ter várias teorias competitivas explicando
[00:26:50] não quer dizer que não haja situações reais, sociais
[00:26:52] onde tu possa aplicar, mas nesse caso por exemplo
[00:26:54] essa é uma crítica relevante, por isso é pra
[00:26:56] fazer assim, é aquela coisa do que tu
[00:26:58] pressupõe que estão se passando na cabeça das pessoas
[00:27:00] tomando decisões, ou seja, vai haver situações em que
[00:27:02] essa simbificação passa a ser simples demais
[00:27:04] na minha opinião, pra ser
[00:27:06] mas enfim, isso é um debate
[00:27:08] eu acho que também tem assim, a pergunta
[00:27:10] quando a gente traz o modelo
[00:27:12] pra uma resposta que a gente já conhece
[00:27:14] ou a gente inventa o modelo
[00:27:16] então por exemplo, no Ultimatum Game
[00:27:18] geralmente é normal
[00:27:20] a gente fala assim
[00:27:22] você sabe que deixar vários jogadores
[00:27:24] jogando ali, eles vão chegar
[00:27:26] na equidivisão, eu proponho
[00:27:28] o que acontece, eu sou punido, eu faço
[00:27:30] eu faço uma divisão, o jogador não concorda
[00:27:32] ele me pula
[00:27:34] eu sou ganancioso, eu vou lá e vou controlando
[00:27:36] então por exemplo, existem vários experimentos
[00:27:38] inclusive trabalhos até nossos
[00:27:40] que a gente faz o que, a gente vai lá e coloca
[00:27:42] ah, o cara é paviloviano, o cara é
[00:27:44] darwiniano, e aí você claro, você vai
[00:27:46] enxergar que ele vai pra aquela
[00:27:48] 50-50, mas no fundo a gente monta
[00:27:50] um modelo sabendo que o experimento
[00:27:52] dá aquilo, digamos assim
[00:27:54] a gente nunca enxergou, eu não
[00:27:56] conheço outro experimento do Ultimatum Game
[00:27:58] que conduz a outra coisa
[00:28:00] porque se eu conhecer eu vou lá e vou tentar
[00:28:02] fazer um modelo que cubra aquela situação
[00:28:04] então essa história do 50-50
[00:28:06] a gente consegue, é facilmente, você coloca
[00:28:08] um conjunto de jogadores
[00:28:10] jogando Ultimatum e que vão
[00:28:12] mudando a sua proposta de acordo
[00:28:14] com se eles fecham ou não
[00:28:16] um negócio, isso converge
[00:28:18] pro meio a meio, agora se existem outras
[00:28:20] situações, tem elementos externos
[00:28:22] exatamente, é isso que o cara diz
[00:28:24] tem elementos externos que influem ali
[00:28:26] só pra concluir eu quero só enfatizar
[00:28:28] de novo, quando a gente faz um modelo
[00:28:30] que a gente quer evidenciar mecanismos
[00:28:32] e independente das
[00:28:34] complicações que vão aparecer depois na
[00:28:36] hora de aplicar, então isso é uma complicação
[00:28:38] mas o modelo ele é feito pra evidenciar
[00:28:40] os mecanismos envolvidos
[00:28:42] depois a gente pode tentar montar
[00:28:44] experimentos com pessoas, não numa situação
[00:28:46] de guerra mas num laboratório mais controlado
[00:28:48] e tentar reproduzir exatamente
[00:28:50] a situação do torneio do Axel
[00:28:52] isso foi feito e a regra que sai
[00:28:54] se foi explicado esse torneio
[00:28:56] em resumo o Axel Ford ele fez uma chamada
[00:28:58] dizendo eu vou fazer uma competição
[00:29:00] de Dilema do Prisioneiro
[00:29:02] enviem as suas regras, então as pessoas enviavam
[00:29:04] sub rotinas, foi um campeonato
[00:29:06] final de 70, início dos 80
[00:29:08] o livro ele escreveu já pra
[00:29:10] publicar, então o livro
[00:29:12] foi a síntese dos dois torneios
[00:29:14] ele fez a chamada do primeiro
[00:29:16] recebeu da ordem de 50
[00:29:18] propostas
[00:29:20] ele fez competições
[00:29:22] duas a duas e foi acumulando
[00:29:24] os pre-offs e disse, bom, Tit for Tet é a mais
[00:29:26] bem-sedida, publicou um artigo
[00:29:28] com esses resultados dizendo, olha, essas foram as regras
[00:29:30] submetidas, a que ganhou foi a do Rapoporto
[00:29:32] que é o Tit for Tet, sabendo disso mandem
[00:29:34] novas regras, ele fez um segundo torneio
[00:29:36] o Rapoporto mandou de novo o Tit for Tet
[00:29:38] e ganhou de novo, o torneio foi reproduzido
[00:29:40] há uns anos atrás, uma comemoração
[00:29:42] dos 20, 30 anos do torneio original
[00:29:44] ganhou outra regra, mas essa regra
[00:29:46] violava o espírito
[00:29:48] inicial porque eles tinham vários agentes
[00:29:50] com regras diferentes, mas que se reconheciam
[00:29:52] então, ah, se tu é do meu time, então
[00:29:54] eu colaboro contigo, então isso violava
[00:29:56] tu mandou regras pro jogo?
[00:29:58] oi?
[00:30:00] então esse foi o programa Fronteiras da Ciência
[00:30:02] a gente discutiu a teoria dos jogos
[00:30:04] a teoria de jogos, não ficamos sabendo
[00:30:06] porque que o Brasil perdeu de 7 a 1 da Alemanha
[00:30:08] talvez nunca saibamos
[00:30:10] o pessoal é teórico demais, os convidados foram
[00:30:12] o Roberto da Silva e o Jefferson Aranzon
[00:30:14] do Departamento de Física da URI
[00:30:16] que são especialistas em teoria de jogos
[00:30:18] o Marco de Arte da Física
[00:30:20] e o Jorge Kufel da Biofísica da URI
[00:30:22] o programa Fronteiras da Ciência
[00:30:24] é um projeto do Instituto de Física da URI
[00:30:26] técnica de Gilson de César
[00:30:28] e direção técnica
[00:30:30] de Francisco Guazelli