Teoria de Jogos

Resumo

O episódio apresenta a teoria de jogos como um ramo da matemática que estuda a tomada de decisão e a interação estratégica entre agentes. Os participantes discutem os conceitos fundamentais, como a definição de jogos, estratégias, payoff (premiação) e a suposição de racionalidade dos agentes. É destacada a importância de entender as regras, as informações disponíveis e os objetivos de cada participante, que podem variar (dinheiro, poder, prazer, etc.).

Um dos exemplos centrais discutidos é o dilema do prisioneiro, que ilustra o paradoxo onde a decisão individual racional leva a um resultado pior para o coletivo. Os participantes exploram diferentes formulações do dilema, incluindo uma versão envolvendo uma troca de malas (baseada em Douglas Hofstadter), e como ele modela situações de cooperação versus traição. A conversa também aborda o equilíbrio de Nash, onde nenhum agente tem incentivo para mudar sua estratégia unilateralmente, e a diferença para um equilíbrio de Pareto.

O programa avança para outros jogos canônicos, como o jogo do bem público (que modela problemas de contribuição para bens coletivos, como a Wikipedia) e o jogo do ultimato (uma barganha onde rejeições podem ocorrer por questões de justiça e não apenas por racionalidade econômica). São mencionados experimentos reais com esses jogos, inclusive com crianças e em diferentes culturas.

A discussão conecta a teoria de jogos a debates mais amplos na biologia evolutiva e nas ciências sociais, sobre a origem da cooperação. São citados autores como Robert Axelrod (“A Evolução da Cooperação”), que usou torneios do dilema do prisioneiro iterado, e Martin Nowak, que propôs cinco mecanismos para a evolução da cooperação (reciprocidade direta, indireta, espacial, seleção de parentesco e seleção de grupo). Exemplos concretos incluem o comportamento de morcegos que compartilham sangue e as “tréguas tácitas” nas trincheiras da Primeira Guerra Mundial.

Por fim, os participantes refletem sobre as limitações e a aplicabilidade dos modelos da teoria de jogos. Eles reconhecem que, como qualquer modelo científico, é uma simplificação da realidade, mas argumentam que é uma ferramenta valiosa para isolar mecanismos básicos de interação, aplicável desde vírus até complexas interações humanas, embora sua extrapolação para explicações gerais sobre a natureza humana exija cautela.

Indicações

Conceitos-Teoricos

Equilíbrio de Nash — Situação em um jogo onde, dada a estratégia dos outros jogadores, nenhum participante tem incentivo para mudar unilateralmente sua própria estratégia.
Equilíbrio de Pareto — Situação onde não é possível melhorar o resultado de um agente sem piorar o de outro. Contrastado com o Equilíbrio de Nash.
Tit for Tat (Olho por olho) — Estratégia vencedora nos torneios de Axelrod para o dilema do prisioneiro iterado. Começa cooperando e depois repete a ação anterior do oponente (coopera se ele cooperou, trai se ele traiu).

Filmes

O Bom, o Feio e o Mau (Il buono, il brutto, il cattivo) — Filme de Sergio Leone usado como exemplo concreto de um trielo, uma situação de jogo com três agentes que ilustra a tomada de decisão estratégica.
Uma Mente Brilhante (A Beautiful Mind) — Filme biográfico sobre John Nash, vencedor do Prêmio Nobel de Economia por suas contribuições à teoria de jogos, citado durante a discussão.

Livros

A Evolução da Cooperação — Livro de Robert Axelrod mencionado como um clássico que usou torneios do dilema do prisioneiro iterado para estudar como a cooperação pode emergir.
Supercooperação — Livro de divulgação científica de Martin Nowak, que sintetiza os cinco mecanismos para a evolução da cooperação (reciprocidade direta, indireta, espacial, seleção de parentesco e seleção de grupo).
Gödel, Escher, Bach — Obra de Douglas Hofstadter, citada indiretamente como fonte de uma versão alternativa do dilema do prisioneiro envolvendo a troca de malas.

Pessoas

John Nash — Matemático, ganhador do Prêmio Nobel de Economia, conhecido pelo conceito de Equilíbrio de Nash, fundamental na teoria de jogos.
John Harsanyi — Economista, ganhador do Prêmio Nobel junto com Nash, por estender a teoria para jogos com informação incompleta, tornando os modelos mais realistas.
Reinhard Selten — Economista, terceiro ganhador do mesmo Prêmio Nobel, citado como mais voltado para aplicações políticas da teoria.
Pyotr Kropotkin — Geógrafo, anarquista e teórico russo, citado como um defensor da cooperação e da ajuda mútua como fatores evolutivos, autor de ‘Ajuda Mútua’.
Robert Axelrod — Cientista político conhecido por organizar torneios do dilema do prisioneiro iterado e escrever ‘A Evolução da Cooperação’.
Martin Nowak — Biólogo matemático que propôs uma síntese dos cinco mecanismos para a evolução da cooperação, autor de ‘Supercooperação’.

Linha do Tempo

00:00:00 — Introdução à teoria de jogos e sua relevância — O programa é apresentado como uma discussão sobre a teoria de jogos, um ramo da matemática que estuda como agentes interagem seguindo regras para obter algum retorno. É mencionado de forma provocativa a derrota do Brasil por 7x1 para a Alemanha como um gancho. Os convidados especialistas são apresentados.
00:01:17 — Definições fundamentais: tomada de decisão e premissas — A teoria de jogos é definida como o estudo da tomada de decisão. São discutidas as premissas necessárias, como o grau de racionalidade dos agentes, o conhecimento das informações disponíveis, o leque de estratégias e a definição de payoff (premiação). É destacado que a função de utilidade (o que cada agente maximiza) pode variar, o que é um desafio para uma escala comum de premiação.
00:02:57 — Prêmio Nobel e a evolução dos modelos (Nash, Harsanyi, Selten) — É mencionado o Prêmio Nobel de Economia concedido a John Nash, John Harsanyi e Reinhard Selten. A contribuição de Harsanyi para jogos com informação incompleta é destacada como uma extensão mais realista do modelo de Nash, que assumia informação completa. Selten é citado como mais voltado para aplicações políticas.
00:04:00 — Exemplo concreto: o trielo de “O Bom, o Feio e o Mau” — Usando a cena do filme “O Bom, o Feio e o Mau” como exemplo, é ilustrado um jogo (trielo) onde três agentes devem decidir em quem atirar. A decisão de cada um depende do conhecimento prévio sobre os outros (pontaria, interesses). Isso introduz a ideia de que uma estratégia só é boa ou má em relação às escolhas dos outros, não de forma absoluta.
00:05:52 — Conceito de Equilíbrio de Nash e Equilíbrio de Pareto — É explicado o Equilíbrio de Nash: uma situação onde, dada a estratégia dos outros, nenhum agente pode melhorar seu resultado mudando apenas a sua própria estratégia. É contrastado com o Equilíbrio de Pareto, onde uma mudança conjunta de estratégias poderia melhorar o resultado para todos. A discussão antecipa a exploração de modelos específicos como o dilema do prisioneiro.
00:09:28 — O dilema do prisioneiro: formulação clássica e paradoxo — Apresentado como um jogo canônico para entender o surgimento da cooperação. Na formulação clássica, dois prisioneiros separados devem decidir entre ficar quieto ou confessar/delatar. A análise racional individual mostra que confessar é a melhor estratégia independente da escolha do outro, levando ambos a um resultado pior (2 anos) do que se ambos cooperassem ficando quietos (1 ano). Isso ilustra o conflito entre interesse individual e coletivo.
00:11:36 — Outra versão do dilema: a troca de malas (Hofstadter) — É apresentada uma versão alternativa do dilema, inspirada em Douglas Hofstadter: dois agentes combinam trocar uma mala com dinheiro por uma mala com um produto ilegal. A análise racional mostra que, independente da ação do outro, é melhor levar uma mala vazia. Isso leva a um resultado onde nenhuma troca benéfica ocorre, exemplificando como o individualismo pode levar ao pior cenário para todos.
00:13:05 — Jogos sociais: o jogo do bem público e a punição — Introduzido o jogo do bem público, uma generalização do dilema do prisioneiro onde vários agentes contribuem para um fundo que é depois multiplicado e dividido igualmente entre todos. O problema do carona (free-rider) surge, pois é racional não contribuir. São mencionados experimentos que mostram como mecanismos de punição, mesmo custosos para quem pune, podem emergir para sustentar a cooperação.
00:14:48 — O jogo do ultimato e a rejeição por justiça — Descrito o jogo do ultimato: um proponente divide uma quantia, e um respondedor aceita (ambos ganham conforme a divisão) ou rejeita (ninguém ganha). O equilíbrio de Nash prediz que o respondedor deve aceitar qualquer oferta positiva. No entanto, experimentos com crianças e em diferentes culturas mostram que ofertas consideradas injustas (ex.: 9 para 1) são frequentemente rejeitadas, indicando que fatores como equidade e emoção influenciam a decisão.
00:18:20 — Debate histórico: cooperação vs. competição (Rousseau, Hobbes, Darwin) — A discussão conecta a teoria de jogos ao debate filosófico entre visões da natureza humana como cooperativa (Rousseau) ou competitiva/egoísta (Hobbes). É mencionado que o darwinismo foi historicamente associado à competição, mas que autores como o anarquista e geógrafo Pyotr Kropotkin defenderam a importância da ajuda mútua na evolução.
00:19:48 — A evolução da cooperação (Axelrod) e os mecanismos de Nowak — Citado o livro “A Evolução da Cooperação” de Robert Axelrod, que usou torneios do dilema do prisioneiro iterado. A estratégia vencedora foi “Tit for Tat” (olho por olho, dente por dente). Em seguida, são listados os cinco mecanismos para a evolução da cooperação propostos por Martin Nowak: reciprocidade direta, indireta, espacial (ou de rede), seleção de parentesco e seleção de grupo (este último controverso).
00:22:30 — Exemplos reais: morcegos e a guerra de trincheira — São dados exemplos concretos dos mecanismos de cooperação. Morcegos-vampiros compartilham sangue com vizinhos regulares (reciprocidade espacial). Nas trincheiras da Primeira Guerra Mundial, batalhões opostos desenvolviam tréguas tácitas (“live and let live”), um comportamento que espontaneamente seguia a lógica do “Tit for Tat” e que os generais tentavam quebrar rotacionando tropas.
00:25:08 — Aplicações em biologia: vírus e o dilema do prisioneiro — É apresentada uma aplicação clara em biologia: vírus dentro de uma célula competindo por recursos. Alguns vírus produzem uma proteína necessária para o capsídeo (cooperadores), enquanto outros mutantes não a produzem (não-cooperadores ou trapaceiros). Este sistema é um análogo quase perfeito do dilema do prisioneiro, mostrando a aplicabilidade do modelo a agentes não pensantes.
00:26:10 — Limitações e críticas aos modelos sociais (exemplo de Gelman) — É discutida a crítica de J.G. Gelman ao trabalho de Axelrod, usando o exemplo das trincheiras. Gelman argumenta que o comportamento cooperativo dos soldados poderia ser explicado por uma redução imediata de risco, sem necessidade de um raciocínio complexo sobre a estratégia do oponente. Isso ilustra a limitação de pressupor que agentes humanos sempre agem conforme a racionalidade estrita do modelo.
00:28:58 — Conclusão: a teoria como ferramenta para evidenciar mecanismos — Os participantes concluem que a teoria de jogos é uma ferramenta valiosa para isolar e entender mecanismos básicos de interação, desde vírus até sociedades humanas. Reconhecem suas limitações como modelo simplificado, mas defendem seu poder explicativo. O episódio fecha com uma brincadeira sobre não ter descoberto a razão da derrota do Brasil por 7x1, reiterando os nomes dos participantes.

Dados do Episódio

Podcast: Fronteiras da Ciência
Autor: Fronteiras da Ciência/IF-UFRGS
Categoria: Science
Publicado: 2014-07-14T19:00:00Z

Referências

URL PocketCasts: https://pocketcasts.com/podcast/fronteiras-da-ci%C3%AAncia/fb4669d0-4a98-012e-1aa8-00163e1b201c/teoria-de-jogos/de07b8f0-edd1-0131-933e-5f4c86fd3263
UUID Episódio: de07b8f0-edd1-0131-933e-5f4c86fd3263

Dados do Podcast

Nome: Fronteiras da Ciência
Site: http://frontdaciencia.ufrgs.br
UUID: fb4669d0-4a98-012e-1aa8-00163e1b201c

Transcrição

[00:00:00] Este é o programa Fronteiras da Ciência, da rádio da Universidade, onde discutiremos

[00:00:09] os limites entre o que é ciência e o que é limitação.

[00:00:12] Hoje no Fronteiras da Ciência a gente vai discutir por que o Brasil perdeu de 7 a 1

[00:00:18] para a Alemanha.

[00:00:19] Então é muito oportuno a gente fazer um programa que nos dê as ferramentas para entender

[00:00:24] o que está acontecendo.

[00:00:25] Então o programa de hoje vai ser sobre teoria de jogos, um ramo da matemática, que se

[00:00:28] debruça sobre o entendimento de como é que o coletivo de agentes que usam regras interagem.

[00:00:34] Esses agentes estão interagindo buscando algum tipo de retorno.

[00:00:38] Pode ser financeiro, pode ser de prazer, pode ser até ganhar um jogo.

[00:00:42] Os convidados são o Roberto Silva e o Jefferson Arenzon, do Departamento de Física da Urgues.

[00:00:47] O Jefferson vem agora como especialista.

[00:00:49] E o pessoal do programa, Jorge Kielfeld e eu, Marco Idiarte, Jorge da biofísica.

[00:00:54] Teoria de jogos, expressão teoria nesse caso, é um pouquinho diferente do que usualmente

[00:00:58] se usa, por exemplo, a teoria da evolução, a teoria psicanalítica.

[00:01:02] Então teoria aqui é um conjunto de resultados matemáticos que são auxiliares, são ferramentas

[00:01:08] que são usadas para o entendimento desses sistemas que são chamados de jogos.

[00:01:12] Existe a definição curta, a teoria de jogos pode ser pensada como o estudo da tomada de

[00:01:17] decisões.

[00:01:18] A explicação longa envolve uma série de hipóteses.

[00:01:21] Por exemplo, a gente precisa definir se os agentes, os tomadores de decisão, se eles

[00:01:27] vão basear essa decisão na sua racionalidade, a gente supõe que eles são completamente

[00:01:31] racionais ou se eles têm uma parcela de racionalidade, se eles têm conhecimento de toda a informação

[00:01:36] disponível, ou seja, eles conhecem qual é o leque completo de possibilidades suas, de

[00:01:42] estratégias que eles podem assumir, eles conhecem se o leque de estratégias do oponente

[00:01:47] é o mesmo, e será que o oponente tem a mesma informação que ele, a premiação no final

[00:01:51] do jogo será que é a mesma para mim que para o meu oponente?

[00:01:55] Eu posso estar interessado em obter grana, outro pode estar interessado em obter poder,

[00:01:59] outro pode estar interessado em obter sexo.

[00:02:01] Quer dizer, mesmo a função que está sendo maximizada, aquilo que alguém quer obter

[00:02:05] varia de agente para agente.

[00:02:07] Esse é um dos grandes problemas da teoria de jogos clássica, é que não existe uma

[00:02:10] escala premiação, ou payoff, como vocês dizem, não existe uma escala única, comum

[00:02:15] a todos.

[00:02:16] Se a agente quiser aplicar a teoria de jogos em biologia, então o que se chama de teoria

[00:02:20] de jogos evolutivos, existe uma escala muito clara que é o número de filhotes, se a estratégia

[00:02:27] que eu faço, se a escolha que eu fiz em função das escolhas de quem está em volta é a melhor,

[00:02:33] eu vou deixar mais filhotes.

[00:02:34] Tem uma coisa que você sabe para comentar, você falou em racionalidade da decisão

[00:02:38] versus irracionalidade, mas eu acho que tem uma coisa é a racionalidade da decisão,

[00:02:42] entre os usos das regras lógicas e outra coisa, é quantos informados está, embora

[00:02:46] tenha modelos com mais ou menos grau de informação, mas se tu não tem informação, tu vai decidir

[00:02:50] como, exatamente, em função do desconhecido.

[00:02:53] Eu acho que isso, aí a gente até se remete ao criminóvel que foi dado, quando foi dado

[00:02:57] ao Nash, e mais dois cientistas, que eram o Harzani e o Selton.

[00:03:02] Justamente o…

[00:03:03] Esse é o primeiro Nobel de economia.

[00:03:04] De economia, dado em economia, na verdade era um…

[00:03:06] O Nash do famoso filme, aquele…

[00:03:08] Sim, o Nash.

[00:03:09] Um momento ineligente.

[00:03:10] Um momento ineligente.

[00:03:11] O Harzani, ele trabalhou com extensões do modelo de Nash, porque o modelo do Nash considerava

[00:03:17] que a função utilidade do adversário, que é como…

[00:03:20] Essa é a palavra que estava me faltando, função utilidade.

[00:03:22] Isso, como o adversário age, era completamente conhecido, e o Harzani ganhou o primeiro Nobel

[00:03:27] junto com o Nash por considerar jogos com informação incompleta, você tinha falhas

[00:03:31] na informação.

[00:03:32] Que são mais realistas.

[00:03:33] Exatamente.

[00:03:34] Justamente por isso, ele diz no próprio trabalho dele que ele queria considerar situações

[00:03:38] mais realistas do que a teoria do Nash.

[00:03:41] Após os jogos de azar são baseados principalmente no Bleff, ou seja, na contação, na informação.

[00:03:46] Então o Harzani ganhou isso.

[00:03:47] E o Selton ganhou junto, mas o Selton era um cara mais voltado para a parte política mesmo.

[00:03:53] Eu quero dar um exemplo concreto.

[00:03:54] O exemplo que eu sempre uso é uma situação do filme Il Bono, Il Bruto, Il Cattivo.

[00:04:00] A tradução.

[00:04:01] O bom, o feio e o mau.

[00:04:04] Esse é um filme de Far West, do Sérgio Leone, e ele tem uma cena que é uma generalização

[00:04:09] do duelo, é um trielo.

[00:04:11] Então tem os três, informação triangular.

[00:04:15] No centro, o Clint Eastwood, que é o bom, ele colocou um papel dizendo aonde ele escondeu

[00:04:21] o tesouro.

[00:04:22] E o vencedor desse trielo vai poder pegar.

[00:04:24] A premiação está bem clara, o payoff, que é conhecer a localização do tesouro.

[00:04:28] Depois a estratégia que cada um tem que decidir qual vai ser a sua é, eu tenho dois oponentes

[00:04:34] em qual dos dois eu vou atirar.

[00:04:36] Essa tomada de decisão é feita no conhecimento prévio que cada gente tem dos seus oponentes.

[00:04:42] Qual é a pontaria de cada um, quais são os interesses que os outros têm e qual é

[00:04:48] a chance de eu sair vitroyoso.

[00:04:49] A minha escolha não é boa ou má em si mesma.

[00:04:53] Eu não tenho como saber se a minha estratégia é boa sem saber qual foi a escolha dos outros.

[00:04:58] Ela é boa em relação ao conjunto de estratégias.

[00:05:00] Essa é uma das características fundamentais da teoria de jogos.

[00:05:04] Você tem uma estratégia, uma antecipação do que é possível com os elementos que você

[00:05:07] tem e depois que você ver o resultado da sua primeira ação você pode reatualizá-la.

[00:05:11] Sim, isso já está acontecendo no jogo iterado.

[00:05:13] No caso do trielo ele vai acontecer uma única vez?

[00:05:16] Isso é um modelo, um modelo matemático, um modelo mais simples seria uma única rodada.

[00:05:21] Então não tem como reaproveitar o que aprendeu.

[00:05:23] Isso é um one shot, é uma única.

[00:05:26] Esse tipo de situação pode ser modelada, dependendo de quanto o futuro se projeta.

[00:05:32] Se eu antecipo esse jogo vai ser repetido duas vezes ou dez vezes ou com uma probabilidade

[00:05:39] tudo isso muda o resultado do jogo.

[00:05:41] Eu saber o que vai acontecer no futuro é importante.

[00:05:44] A gente tem o conceito de estratégia, tem o conceito de premiação.

[00:05:48] Isso já está chegando no conceito de equilíbrio também de Nash.

[00:05:52] A história é que você tem uma estratégia boa em relação aos seus adversários.

[00:05:57] E todo mundo tem uma estratégia boa em relação aos seus adversários.

[00:06:01] E o equilíbrio de Nash significa que se você mudar uma…

[00:06:03] Uma você piora para todo mundo.

[00:06:04] É para todo mundo.

[00:06:05] Não, não, não, é para ele.

[00:06:07] É unilateral.

[00:06:08] É unilateral, então se eu tenho três agentes a minha escolha, dada a escolha dos outros,

[00:06:13] eu fixo os outros dois, a escolha que eu fiz é melhor em relação às minhas opções.

[00:06:18] Qualquer outra opção que eu fizer piora para mim.

[00:06:21] É unilateral.

[00:06:23] Só que vale para os três vértices do treino?

[00:06:25] De cada vez, um de cada vez.

[00:06:27] Eu posso achar uma solução onde eu pego os três e mudo as estratégias dos três

[00:06:31] e pode ser que eu ache uma solução para os três melhor.

[00:06:35] É equilíbrio de pareto.

[00:06:36] Equilíbrio de pareto, exatamente.

[00:06:37] Vai ficar mais claro quando a gente entrar em modelos específicos de jogos,

[00:06:41] por exemplo, o dilema do Prisioneiro.

[00:06:42] Acho que vamos passar para esse aqui.

[00:06:43] Eu acho que tem um comentário aqui, então, Laci, que em teoria de jogos o nome sugere

[00:06:47] e promete, às vezes, muito mais do que é uma descrição fiel da realidade de um jogo.

[00:06:51] Eu estou pensando aqui, de uma forma imaginada, como classificar os tipos de jogos que existem.

[00:06:55] Por exemplo, o xadrez não se enquadra em nenhum modelo desses aí, não tem nada a ver.

[00:06:58] Porque ele é um jogo histórico, que depende de uma sequência, tem regras complexas,

[00:07:02] mas rígidas, não dá para inventar.

[00:07:04] É, gente, ela é uma nuance de uma situação real.

[00:07:06] Acho que ela descreve nuances de uma situação real.

[00:07:09] Isso que eu queria descrever, ou seja, a teoria de jogos descreve o modelo matemático

[00:07:14] como um modelo, ele é uma simplificação bastante expressiva da realidade.

[00:07:20] Não, não, eu não estou terminando isso com a física, na verdade.

[00:07:22] Com toda a ciência de forma geral.

[00:07:23] A gente tem as equações de Newton para a mecânica, mas muitas vezes elas são inaplicáveis para a prática.

[00:07:29] Eu quero só terminar minha decisão e dizer que sim, como qualquer modelo científico,

[00:07:33] que é uma aproximação da realidade em uma hora menor ou maior grau,

[00:07:36] mas a diferença das da física, que estão descrevendo uma realidade bem mais simples e preditível,

[00:07:40] aqui está se aplicando a situações de interação entre agentes inteligentes, com livre arbítrio,

[00:07:45] que aí então o grau de complexidade, a imprevisibilidade associada, é diferente de uma lei da física.

[00:07:50] Eu não excordo.

[00:07:51] A teoria de jogos é aplicada para agentes tão simples quanto o vírus.

[00:07:56] Pode ser, pode ser.

[00:07:57] Não pode atingir racionalidade.

[00:07:58] Acho que a gente está esquecendo.

[00:07:59] Sim, mas na hora de fazer uma aplicação por uma interação social, por exemplo, um jogo econômico,

[00:08:02] uma sociedade, aí vai ter momentos e vai ter situações em que ele se aplica.

[00:08:07] Mas aí eu acho que ela começa a ser muito mais próxima do real,

[00:08:12] quando você, por exemplo, pega a teoria de jogos, coloca numa topologia diferente,

[00:08:17] permite que os jogadores possam se comunicar, possam andar na rede,

[00:08:21] fazendo um protocolo simples, executando esse jogo simples,

[00:08:25] a coisa acaba pegando muito mais da realidade do que a gente imagina.

[00:08:29] Então acho que esse é o ponto.

[00:08:30] Para esse programa Fronteiras da Ciência, a gente está discutindo hoje a teoria de jogos.

[00:08:34] Como ficou bem claro para o ouvinte, um conjunto de ferramentas suficientemente abrangente,

[00:08:39] que vai poder ser usado tanto em economia, política, na relação dos animais com seu meio ambiente,

[00:08:45] com as outras espécies e até jogos de cartas, jogos de azar e coisa e tal.

[00:08:48] Nesse momento eu queria saber os canônios da teoria de jogos.

[00:08:51] São aqueles jogos que as pessoas conhecem, aqueles jogos que são as referências do uso da teoria.

[00:08:56] Saiu um artigo na Ciência uns 10 anos atrás com a lista dos 25 problemas

[00:09:00] para os quais a gente não tem uma solução definitiva, completa até hoje,

[00:09:05] que é o problema de como cooperação aparece em populações.

[00:09:09] Porque do ponto de vista darwiniano, a gente enxerga a evolução muito mais competitiva do que cooperativa.

[00:09:15] Então como diabos a gente encontra exemplos reais de agentes

[00:09:20] em simbiose e em situações de autorismo cooperando entre si.

[00:09:23] Então o modelo que foi proposto para idealizar essa situação é o dilema do prisioneiro.

[00:09:28] Formulação clássica, então são duas pessoas que foram capturadas tentando cometer um crime.

[00:09:34] Algumas evidências, nada muito claro.

[00:09:36] Então se nada acontecer, eles vão pegar um ano de cadeira.

[00:09:40] Daí eles pegam separadamente os dois e fazem uma proposta.

[00:09:44] Se tu confessar, tu tá livre.

[00:09:46] Teu companheiro leva toda a culpa e pega três anos.

[00:09:49] E fazem a mesma proposta para o outro.

[00:09:51] Se os dois ficarem inquietos, eles vão pegar um ano e estão livres.

[00:09:55] A melhor situação.

[00:09:56] Se os dois confessam, os dois se ralam e eles vão pegar dois anos.

[00:10:01] Se um só confessa, ele tá livre.

[00:10:04] Eu agora vou decidir o que eu vou fazer.

[00:10:06] Esse não é um problema que tem que ser encarado usando regras morais, o que é o certo, o que é errado.

[00:10:12] A minha única régua aqui é quanto tempo eu vou ficar na cadeira.

[00:10:16] E é isso que eu vou tentar minimizar.

[00:10:17] Não pensa na vingança da família do outro.

[00:10:19] Tu não pensa em nada.

[00:10:20] Se tu é amigo, nada.

[00:10:21] Então é um problema realmente retirado de todas as complexidades do mundo real.

[00:10:26] Então quais são as minhas opções?

[00:10:28] Eu tenho duas opções.

[00:10:29] Ou eu fico quieto ou eu entrego o meu companheiro.

[00:10:32] O que acontece se…

[00:10:33] Não tem terceira opção.

[00:10:34] Não, não tem terceira opção.

[00:10:35] Na versão do dilema do prisioneiro tradicional.

[00:10:38] Então eu penso, o que ele pode fazer?

[00:10:39] Ele pode ficar quieto.

[00:10:40] Se ele ficar quieto, melhor eu entregar ele.

[00:10:43] Porque daí eu tô livre.

[00:10:44] Se ele ficar quieto, pra mim é melhor falar.

[00:10:45] Qual é a outra opção do meu amigo lá?

[00:10:47] É ele falar.

[00:10:48] Aí não faz diferença pra ti.

[00:10:50] Não, se ele falar e eu ficar quieto, eu fico três anos.

[00:10:53] Mas se ele falar e eu falo, eu só fico dois.

[00:10:55] Então a ideia é, independente dos números,

[00:10:57] quando eu vou decidir o que fazer,

[00:10:59] se o meu companheiro abrir a boca,

[00:11:01] é melhor eu abrir a boca.

[00:11:02] Se ele ficar quieto, é melhor eu abrir a boca.

[00:11:05] Então…

[00:11:05] Mas tu não sabe o que ele vai fazer.

[00:11:07] Tu não sabe o que ele vai fazer.

[00:11:07] Mas a minha decisão vai ser abrir a boca.

[00:11:09] O meu companheiro vai pensar exatamente da mesma maneira.

[00:11:12] E a decisão dele vai ser abrir a boca.

[00:11:14] Conclusão, a única estratégia

[00:11:16] que funciona pra cada um deles individualmente

[00:11:19] é abrir a boca.

[00:11:20] E acabam os dois pegando dois anos.

[00:11:22] Se os dois tivessem ficado quietos,

[00:11:24] eles pegariam um ano.

[00:11:25] Então é por isso que se chama o dilema, o paradoxo.

[00:11:28] Mas eles poderiam ter pego três.

[00:11:30] Porque tem esse ponto.

[00:11:32] Tem uma outra formulação que é bem mais clara,

[00:11:34] que é a do Douglas Hofstadter.

[00:11:36] Escreveu o Guedl Eicheribach.

[00:11:37] Ele é filho de um físico que ganhou Nobel de Física.

[00:11:41] Em homenagem ao pai dele,

[00:11:42] existe o Hofstadter no Big Bang Theory.

[00:11:45] Então é uma situação assim,

[00:11:46] eu tenho interesse em comprar um produto

[00:11:47] que o Jorge está vendendo.

[00:11:48] E é uma coisa ilegal.

[00:11:49] Então não pode ser feito muito às claras.

[00:11:51] Então eu combino com o Jorge,

[00:11:53] hoje no final do dia, seis horas,

[00:11:55] a gente se encontra na praça,

[00:11:57] tu leva o produto numa mala,

[00:11:58] eu levo o dinheiro numa mala,

[00:11:59] a gente troca as malas e vamos embora.

[00:12:01] O que acontece se o Jorge colocar o produto na mala?

[00:12:04] O que é melhor para mim?

[00:12:05] É eu não dar o dinheiro,

[00:12:05] porque eu fico com o produto e não gasto nada.

[00:12:07] Então eu vou lá e entrego uma mala vazia.

[00:12:09] Qual é a outra opção do Jorge?

[00:12:10] É me entregar uma mala vazia.

[00:12:12] Nesse caso, se eu der o dinheiro,

[00:12:13] eu vou estar perdendo.

[00:12:14] Então é melhor eu entregar uma mala vazia.

[00:12:16] Qualquer que seja a decisão dele,

[00:12:19] para mim é melhor entregar uma mala vazia.

[00:12:20] Ela vai fazer o mesmo raciocínio

[00:12:22] e vai me entregar uma mala vazia.

[00:12:23] No fim os dois vão se trocar malas vazias

[00:12:26] e não vão fazer um negócio que interessava os dois.

[00:12:28] Essa é uma postura de individualismo,

[00:12:30] de egoísta, selfish,

[00:12:32] que leva a minimização do benefício para ambos

[00:12:34] e leva ao pior dos cenários.

[00:12:36] Se alguma forma tivesse uma informação,

[00:12:38] se eles conseguissem trocar a informação,

[00:12:39] era o melhor,

[00:12:40] mas a coisa é feita de forma individual.

[00:12:42] Para um modelo, ele é bastante esperto,

[00:12:44] porque eu tenho uma visão de longe,

[00:12:46] e bem inseto,

[00:12:47] eu conheço pouco o modelo,

[00:12:48] que o Diogo, por exemplo,

[00:12:49] parece que foi engenheirado

[00:12:51] para tu concluir,

[00:12:52] quase que moralmente,

[00:12:53] que ser cooperativo é benéfico.

[00:12:55] Porque o jogo sempre,

[00:12:56] na maioria das formulações,

[00:12:57] a cooperação é a melhor solução.

[00:12:59] Então, esse é o problema.

[00:13:00] Por isso que tem outros programas abertos,

[00:13:01] como o jogo do ultimato,

[00:13:02] o jogo do ditador.

[00:13:03] O jogo do bem público também.

[00:13:04] Pois é.

[00:13:05] O jogo do bem público,

[00:13:06] acho que mostra bem,

[00:13:07] aí a questão é uma generalização

[00:13:09] quase do dilema do prisioneiro,

[00:13:11] onde você, no fundo,

[00:13:12] você tem um fundo e você quer,

[00:13:14] as pessoas querem, por exemplo,

[00:13:15] construir algo numa sociedade pequena.

[00:13:18] Como já foram feitos os experimentos?

[00:13:20] Então, as pessoas contribuem com uma quantia,

[00:13:23] todo mundo contribui com uma determinada quantia.

[00:13:25] E esse dinheiro,

[00:13:26] depois de uma aplicação,

[00:13:28] ele é revertido para essas pessoas

[00:13:29] em forma igualitária,

[00:13:31] ou seja, é dividido pelo número de pessoas.

[00:13:33] O bolo é aumentado.

[00:13:34] O bolo é aumentado por algum fator,

[00:13:36] as pessoas depositaram,

[00:13:37] ele foi colocado na poupança,

[00:13:39] ou algo do tipo.

[00:13:39] É importante dizer que o dinheiro

[00:13:41] é dividido por todo mundo,

[00:13:42] independente do que cada um deu.

[00:13:44] Sim, independente.

[00:13:45] E aí que surge o problema.

[00:13:47] É quando as pessoas percebem

[00:13:49] que não depositando,

[00:13:50] elas vão ter dinheiro de volta.

[00:13:51] Isso é bem realista, no caso assim,

[00:13:53] quando a gente está se beneficiando

[00:13:55] de algum tipo de infraestrutura

[00:13:57] que está sendo dada por todo mundo.

[00:13:58] A gente pode decidir se pode dar ou não.

[00:14:00] Por exemplo, tipo coisa,

[00:14:01] por exemplo, o Wikipedia,

[00:14:02] de vez em quando, pede doações.

[00:14:04] Tem gente que está doando,

[00:14:05] mas tem gente que usa,

[00:14:06] que usa o Wikipedia, mas não doa.

[00:14:08] Principalmente se o jogo for iterado.

[00:14:10] Aí o fundo vai realmente degringulando.

[00:14:12] E essa é a questão.

[00:14:13] Quais são os mecanismos que você faz

[00:14:15] com que esse fundo se mantenha?

[00:14:17] Aí vem punição,

[00:14:18] as pessoas têm esquemas,

[00:14:19] têm vários trabalhos,

[00:14:20] falam sobre esquemas de punishment.

[00:14:22] Tem um experimento em que

[00:14:23] ela paga um dólar para punir

[00:14:25] uma pessoa que não contribuiu com três.

[00:14:27] Existem pessoas que de fato fazem isso

[00:14:29] para tentar manter o fundo funcionando.

[00:14:31] Roberto fala em experimento

[00:14:32] porque realmente se faz experimento.

[00:14:33] Se faz experimento.

[00:14:34] Isso é um artigo da nature.

[00:14:35] Com sujeitos que interagem via computador.

[00:14:38] Isso é um artigo da nature conhecido.

[00:14:39] As instituições que punem

[00:14:41] acabam perdurando muito mais

[00:14:43] do que as instituições que não punem.

[00:14:46] Tem um segundo exemplo que eu queria dar,

[00:14:47] que é o jogo do Ultimaton,

[00:14:48] que também tem esse esquema,

[00:14:50] mas é para o bem, digamos assim.

[00:14:52] Mas o jogo do Ultimaton é assim,

[00:14:53] é uma barganha.

[00:14:54] A pessoa tem um valor,

[00:14:56] uma quantia para ser dividida

[00:14:58] e ele diz assim,

[00:14:59] eu fico com uma fração dessa quantia

[00:15:01] e você fica com o restante.

[00:15:03] Se o responder,

[00:15:04] que é o cara que aceita ou não

[00:15:06] aceitar essa proposta,

[00:15:07] o que acontece?

[00:15:09] Os dois ganham.

[00:15:09] Se ele rejeitar, ninguém ganha.

[00:15:11] Então a questão é…

[00:15:12] Por que o cara vai rejeitar?

[00:15:14] Vai rejeitar porque pode ser

[00:15:15] uma quantia muito pequena.

[00:15:17] Pode te ofender.

[00:15:17] Você se sente ofendido.

[00:15:20] Você sabe quanto vai ser dividido.

[00:15:22] Eu tenho dez moedas de chocolate.

[00:15:24] O que o Marco está pensando…

[00:15:25] Claro, o comportamento racional…

[00:15:27] O equilíbrio de Nash

[00:15:29] nessa situação é aceitar

[00:15:31] qualquer que seja o que você está ganhando,

[00:15:33] ou é isso ou nada.

[00:15:33] Então qualquer coisa é bom.

[00:15:34] Mas o Ultimaton é um jogo

[00:15:35] mais simplificado.

[00:15:36] Só que me interessa, por exemplo,

[00:15:38] uma fraçãozinha de um chocolate,

[00:15:40] ou algo do tipo.

[00:15:41] Mas não é melhor que nada.

[00:15:42] Bom, e o outro?

[00:15:43] Bom, eu não aceitaria.

[00:15:44] Se você souber que o outro tem dez barras,

[00:15:46] você sabe o total.

[00:15:47] Você sabe o total.

[00:15:48] Você tem que saber.

[00:15:49] Não é desconhecido.

[00:15:50] Mas é mais divertido se você não souber.

[00:15:52] Se você não souber,

[00:15:54] vai dependendo da habilidade para quem.

[00:15:55] Mas se você não souber,

[00:15:56] você vai sempre cair no equilíbrio de Nash

[00:15:58] e o problema é muito real.

[00:15:59] Porque aí você aceita tudo.

[00:16:00] Crianças, a gente acha que crianças…

[00:16:02] Eles sabem fazer isso.

[00:16:03] Eles punem severamente.

[00:16:05] Porque quando as crianças

[00:16:07] fizeram esse experimento

[00:16:08] com dez moedas de chocolate,

[00:16:10] geralmente o que a maioria faz?

[00:16:12] Pega oito, deixa duas.

[00:16:14] Na verdade, alguns são até mais…

[00:16:16] São piores.

[00:16:16] Ele pega, fica com nove

[00:16:17] e tenta dar uma para o outro.

[00:16:19] O outro aceita, ele fica com as noves.

[00:16:21] O outro não aceita, as dez vão embora.

[00:16:23] A maioria das crianças rejeitam.

[00:16:25] E na segunda geração,

[00:16:27] ela já vai para o 50-50.

[00:16:28] Metade-metade.

[00:16:29] Ou então alguns ainda tentam fazer

[00:16:30] seis com quatro.

[00:16:31] Esse experimento também foi repetido

[00:16:33] até com pessoas na Polinésia.

[00:16:35] Em culturas.

[00:16:37] Exatamente, eles fazem com culturas diferentes

[00:16:39] para ver se o 50-50 é alcançado.

[00:16:41] Acho que o que está representado

[00:16:43] nos dois exemplos,

[00:16:44] nas duas versões do Dilema do Prisioneiro

[00:16:46] que você apresentou e um pouco nos outros também,

[00:16:48] é assim. Embora ele tenha que envolver

[00:16:50] uma decisão racional baseado em algum,

[00:16:52] na quantidade de informação,

[00:16:54] esse jogo além de tudo, esses jogos como modelos

[00:16:56] e aí entra a limitação dela para representar

[00:16:58] coisas mais ambas como sociedades

[00:17:00] complexas com muitos elementos em jogo,

[00:17:02] é o fato de que há uma série de pressupostos

[00:17:04] não declarados para um modelo.

[00:17:06] Por exemplo, o pressuposto de que a pessoa

[00:17:08] vai se importar de fazer uma tentativa

[00:17:10] ou supor se ela vai se mobilizar

[00:17:12] para isso. As questões motivacionais

[00:17:14] e outros, está tudo muito achatado.

[00:17:16] Mas eu não acho que seja uma limitação

[00:17:18] de teoria de jogos, é uma limitação de alguns

[00:17:20] modelos de teoria de jogos. A teoria de jogos

[00:17:22] é ampla o suficiente para eu fazer um modelo mais complicado

[00:17:24] que eu possa. Poderia fazer.

[00:17:26] Porque muitas das ciências sociais,

[00:17:28] bastante na economia, mas muitas das ciências sociais

[00:17:30] até algumas da antropologia,

[00:17:32] tentam extrapolar desses modelos para fazer

[00:17:34] uma teoria geral sobre

[00:17:36] a natureza humana. E aí para chegar

[00:17:38] até nos fundamentos da ética, da moral

[00:17:40] e tudo mais, que na minha humilde

[00:17:42] opinião ele representa, certamente,

[00:17:44] uma fenomenologia real. Tem coisas

[00:17:46] que estão acontecendo, mas uma série

[00:17:48] de pressupostos faz ele não ser realista o suficiente

[00:17:50] para ter essa aspiração. Eu não sei

[00:17:52] se essa aspiração é tão

[00:17:54] difundida assim. A maneira como eu vejo

[00:17:56] é a atitude que o físico

[00:17:58] encara esse tipo de problema.

[00:18:00] Tu quer entender quais são os mecanismos

[00:18:02] básicos?

[00:18:04] Existem efeitos inesperados,

[00:18:06] situações de conflito.

[00:18:08] A gente fica procurando,

[00:18:10] digamos, as unidades básicas

[00:18:12] de construção para esses modelos.

[00:18:14] De alguma forma, o resto é uma composição

[00:18:16] de todos.

[00:18:18] Por que eu estou trazendo isso? Até porque, principalmente,

[00:18:20] para falar um pouco do outro lado da história,

[00:18:22] o jogo é baseado em uma competição, cooperação

[00:18:24] no balanço dessas duas coisas, que é um velho

[00:18:26] debate na cultura ocidental. É a cooperação

[00:18:28] do Jean-Jacques Rousseau, que partiu do princípio

[00:18:30] que as pessoas naturalmente nascem boas,

[00:18:32] a sociedade as corrompe. E por outro lado, Thomas Hobbes,

[00:18:34] que as pessoas são intensamente

[00:18:36] egoístas e mais e a sociedade tem como

[00:18:38] correlá-las. Interessante que os dois atores

[00:18:40] se confluem no final da vida. O contrato social

[00:18:42] é uma solução hobbesiana, de certo modo.

[00:18:44] Mas, assim, nesse debate,

[00:18:46] dá para dizer também que na biologia Darwin,

[00:18:48] ele acabou incorporando, até por razões históricas

[00:18:50] e ideológicas, muito o ângulo

[00:18:52] apenas da competição, embora ele detectasse

[00:18:54] observações de tipo cooperativo,

[00:18:56] mas ele não se destacou por promover isso.

[00:18:58] E o darwinismo é visto como uma espécie de teoria geral

[00:19:00] do egoísmo na natureza, que é a fundamento

[00:19:02] da seleção natural, que é a solução

[00:19:04] da vitória do mais adaptado.

[00:19:06] Existe um autor, que é um geógrafo,

[00:19:08] que descrevia a natureza, trabalhava

[00:19:10] com animais, descrevendo animais, mas também

[00:19:12] com populações humanas, que é o Pyotr Kropotkin,

[00:19:14] príncipe russo, e que também

[00:19:16] é um dos fundadores de uma das escolas importantes

[00:19:18] do anarquismo, mas ele é um teórico da cooperação

[00:19:20] e escreveu alguns livros importantes sobre isso,

[00:19:22] que são sobre cooperação e evolução, e outros

[00:19:24] sobre o que é o mais famoso, que é a ajuda mútua,

[00:19:26] onde ele descreve desde as situações de insetos,

[00:19:28] animais, depois aldeias pequenas,

[00:19:30] cidades grandes, suas civilizações antigas.

[00:19:32] É bem interessante o estudo que ele tenta fazer.

[00:19:34] Isso foi, inclusive, antes do von Neumann

[00:19:36] formalizar a credibilidade.

[00:19:38] Muito antes, isso é coisa do fim do século XIX,

[00:19:40] virada do século. Então, o que eu quero dizer com isso é assim,

[00:19:42] uma coisa conflui, digamos, um dos livros

[00:19:44] que tenta mostrar a influência disso na biologia

[00:19:46] é esse clássico do Robert Auxelrod,

[00:19:48] a evolução da cooperação, onde precisamente

[00:19:50] ele usa o genoma do prisioneiro, a labora.

[00:19:52] E esse livro acabou levando a uma crítica

[00:19:54] interessante, uma das mais fáceis

[00:19:56] de achar essa, desse tal Gellman,

[00:19:58] que tenta analisar o aspecto ideológico

[00:20:00] da metodologia, tentando mostrar,

[00:20:02] exatamente, a limitação dos pressupostos

[00:20:04] embutidos que tem no modelo, que talvez

[00:20:06] limite o alcance das conclusões que possa levar.

[00:20:08] Mas aí, uma coisa que ele destaca

[00:20:10] no livro, e o Auxelrod deixa claro

[00:20:12] isso, é que ele tenta mostrar,

[00:20:14] usando jogos como o dilema do prisioneiro,

[00:20:16] tem uma natureza, assim, inescapável

[00:20:18] que cooperação é a melhor solução

[00:20:20] no ponto de vista social de qualquer solução.

[00:20:22] O que, obviamente, provoca um arrepio de alguns pensadores

[00:20:24] mais, tipo, ultraliberais,

[00:20:26] ou coisas desse tipo, porque, não, tem que ser

[00:20:28] todo mundo egoísta e individualista com uma economia.

[00:20:30] Se bem que, na economia, essas regrações

[00:20:32] são uma coisa, nas relações, ou em

[00:20:34] sociedade, ou no ambiente cultural,

[00:20:36] são outras, dependendo do tamanho do

[00:20:38] grupo, enfim, para mostrar que, na verdade,

[00:20:40] esse é um debate que está de pé, e

[00:20:42] a cooperação, na verdade, esse é, tem um

[00:20:44] outro autor bem recente, que é o Novak,

[00:20:46] que é bem interessante, que fez uma classificação, inclusive,

[00:20:48] dos cinco tipos de cooperação, a cooperação

[00:20:50] direta, reciprocidade direta, indireta,

[00:20:52] de espacial, que ele chama

[00:20:54] reciprocidade de rede, seleção de grupo,

[00:20:56] seleção de parentesco, que, né, são

[00:20:58] cinco, na verdade, ele elaborou a teoria

[00:21:00] e ele escreveu esse livro, que é

[00:21:02] super cooperação, são os humanos,

[00:21:04] são os únicos animais que usam todos esses tipos.

[00:21:06] Super cooperação é um livro de divulgação

[00:21:08] científica, que o Martin Novak

[00:21:10] escreveu, ele tem um livro anterior, onde ele

[00:21:12] coloca um pouco mais, ele tem

[00:21:14] um review na SAIS, de uns anos

[00:21:16] atrás, onde ele, não é que

[00:21:18] ele tenha montado uma teoria, esses são

[00:21:20] os mecanismos básicos

[00:21:22] que as pessoas, nos últimos 30

[00:21:24] anos, identificaram, através

[00:21:26] desses modelos simples, não é uma teoria do

[00:21:28] novo. Mas é a única integração

[00:21:30] sintética que tem lá. Não, não, não,

[00:21:32] se fala, se fala desde o início,

[00:21:34] o primeiro livro de teoria de jogos

[00:21:36] aplicada a biologia, é o do

[00:21:38] Martin Smith, naquela época se falava muito

[00:21:40] em seleção de parentesco, então esse foi o primeiro

[00:21:42] mecanismo identificado, bom,

[00:21:44] e se identificou, depois as pessoas identificaram

[00:21:46] o segundo mecanismo, que é reciprocidade

[00:21:48] direta, que é eu te ajudo, tu me ajuda,

[00:21:50] mas foi identificado nesses modelos,

[00:21:52] depois se identificou o terceiro, que é reciprocidade

[00:21:54] indireta, que é eu ajudo o

[00:21:56] Roberto, porque eu sei que ele ajudou

[00:21:58] Jorge. Boia não tenha feito nenhuma

[00:22:00] interação direta com

[00:22:02] Jorge, e mais recentemente

[00:22:04] que é a reciprocidade espacial,

[00:22:06] que é simplesmente o fato dos

[00:22:08] indivíduos, sem nenhuma relação entre

[00:22:10] si, de eles permanecerem próximos

[00:22:12] espacialmente, e a gente tem exemplos

[00:22:14] que vão, morcegos que compartilham

[00:22:16] sangue, eles quando voltam para as

[00:22:18] cavernas, eles ficam sempre na mesma

[00:22:20] posição, então se o vizinho aquela noite não

[00:22:22] conseguiu sangue, o morcego regurgita

[00:22:24] e compartilha, porque ele sabe que

[00:22:26] um dia no futuro ele vai receber,

[00:22:28] tem o segundo exemplo famoso, que foi a

[00:22:30] guerra de trincheira, durante a primeira guerra

[00:22:32] mundial, que o fato dos batalhões permanecerem

[00:22:34] próximos, sem combinação

[00:22:36] nenhuma, eles criavam regras do

[00:22:38] tipo, eu te deixo viver,

[00:22:40] tu me deixa viver, então os

[00:22:42] generais eles eram obrigados

[00:22:44] a cada dois meses,

[00:22:46] eles eram obrigados a

[00:22:48] quebrar essas combinações e

[00:22:50] continuar a guerra, porque senão eles

[00:22:52] moviam os batalhões de lugar, porque

[00:22:54] novos batalhões se encontravam,

[00:22:56] não tinha nenhuma relação, e aí

[00:22:58] por algum tempo, mas naturalmente essas

[00:23:00] regras, e depois

[00:23:02] o quinto

[00:23:04] mecanismo, que ainda

[00:23:06] é muito controverso, que é a seleção

[00:23:08] de grupo, é realmente controverso,

[00:23:10] então os quatro primeiros são bem

[00:23:12] consensuais,

[00:23:14] o novo é que coloca

[00:23:16] os cinco pontos de fato, no livro dele

[00:23:18] ele coloca assim, que ele não coloca quatro

[00:23:20] os quatro primeiros

[00:23:22] são bem estabelecidos,

[00:23:24] o quinto que é

[00:23:26] controverso, porque ainda tem gente que diz

[00:23:28] que não há seleção de grupo,

[00:23:30] é que é uma seleção individual, mas que aparece assim

[00:23:32] vocês podem exemplificar algum

[00:23:34] caso onde se pode dizer assim, a teoria de jogos

[00:23:36] foi bem sucedida na

[00:23:38] explicação de tal fenômeno,

[00:23:40] fez um bom fitting pelo menos, a teoria

[00:23:42] de jogos nesse momento,

[00:23:44] ela serve pra nos mostrar

[00:23:46] o tamanho da dificuldade de

[00:23:48] abordar esses problemas

[00:23:50] o próprio exemplo da guerra das trincheiras,

[00:23:52] o comportamento que esses

[00:23:54] batalhões apresentam, o tipo de

[00:23:56] regra que eles usam, intuitivamente

[00:23:58] sem combinação,

[00:24:00] é uma regra que foi introduzida pelo Rappelpot

[00:24:02] num dos combates, num dos torneios

[00:24:04] organizados pelo Axelrod,

[00:24:06] que é o tit for tat, que é o olho por olho,

[00:24:08] dente por dente, que é uma regra

[00:24:10] extremamente simples, que apareceu

[00:24:12] entre as várias regras

[00:24:14] propostas pro torneio, foi a que ganhou

[00:24:16] as duas realizações do torneio

[00:24:18] mas só se o jogo for iterado

[00:24:20] porque não é um jogo de uma razão, é um jogo populacional

[00:24:22] são muitos agentes interagindo

[00:24:24] com muitos agentes, não é uma única

[00:24:26] rodada

[00:24:28] e essa regra

[00:24:30] é muito simples, pelo fato de ser simples

[00:24:32] ela é clara, ela começa cooperando

[00:24:34] e ela repete o que o

[00:24:36] oponente faz, então se tu

[00:24:38] me sacaneia, eu te sacaneio na próxima vez

[00:24:40] então ela retalia, e ela é boa, ela perdoa

[00:24:42] se tu voltar a cooperar, a regra volta a cooperar

[00:24:44] e é exatamente isso que

[00:24:46] acontecia nas guerras de Trincher

[00:24:48] se os caras não respeitassem o acordo tácito

[00:24:50] tinha a retaliação, se eles voltassem

[00:24:52] a colaborar, o outro lado

[00:24:54] voltava a colaborar

[00:24:56] o torneio que o Axelrod organizou

[00:24:58] ele depois se reproduziu na vida real

[00:25:00] numa situação super complexa que é o

[00:25:02] combate numa guerra

[00:25:04] em escala muito grande

[00:25:06] tu pode ir pro outro extremo e aplicar

[00:25:08] por exemplo o dilema do prisioneiro que a gente

[00:25:10] estava comentando, no que acontece

[00:25:12] com vírus que ocupam

[00:25:14] uma mesma célula e que estão competindo

[00:25:16] por matéria prima pra se reproduzir

[00:25:18] então tu pode ter o vírus do tipo A

[00:25:20] que tem um gen que codifica

[00:25:22] uma proteína que vai ser usada

[00:25:24] depois pra formar aquela casquinha

[00:25:26] nesses casos não há dúvida que o modelo é imbatível

[00:25:28] porque não temos agentes pensantes

[00:25:30] o modelo é aplicado e o modelo é testado

[00:25:32] existem instrumentos feitos pelo

[00:25:34] Turner e pelo Chao

[00:25:36] uns anos atrás, então tem uma variante

[00:25:38] do vírus que tem o gen que codifica essa proteína

[00:25:40] então ele tem todo o custo energético

[00:25:42] de produzir a proteína

[00:25:44] e tem uma segunda variante que embora

[00:25:46] precise da mesma proteína pra montar

[00:25:48] o capsídeo ali dele

[00:25:50] não tem o gen, então não gasta nenhuma energia

[00:25:52] então o que produz a proteína é o cooperador

[00:25:54] e o outro é o não cooperador

[00:25:56] exatamente pra enfatizar

[00:25:58] que é um modelo importante

[00:26:00] e não tenho dúvida que tenha aplicações inclusive do social

[00:26:02] mas por exemplo enfatizando um pouco

[00:26:04] essas limitações do uso social, por exemplo esse

[00:26:06] é um exemplo que o J.G.Gelman que faz a crítica do trabalho do Axel Rodd lá

[00:26:08] ele mostra assim por exemplo que

[00:26:10] não foi levado em conta pra interpretar o exemplo das trincheiras

[00:26:12] aplicando o J.G.Gelman no prisioneiro

[00:26:14] modificado por titular tetan, não sei o que

[00:26:16] porque existem outras alternativas mais simples

[00:26:18] ele considera inclusive que essa interpretação

[00:26:20] das trincheiras da primeira guerra é errada

[00:26:22] é erronea, porque não considera esse é o exemplo

[00:26:24] real de J.G.Gelman no prisioneiro

[00:26:26] porque por exemplo o comportamento cooperativo

[00:26:28] pode ser explicado por meio de uma redução imediata

[00:26:30] de riscos, seja o coopere, o cara não tira em mim

[00:26:32] o pare tira e não tira em mim e eu fico

[00:26:34] de olho nos meus agentes, nos meus generais

[00:26:36] pra ver o que eles estão cobrando, se eles não estão cobrando

[00:26:38] eu fico assim, isso é uma decisão que

[00:26:40] independe do desenho de um supor

[00:26:42] o que o outro está fazendo, eu decido baseado apenas

[00:26:44] no que tem do lado de cá, enfim, ou seja

[00:26:46] como qualquer coisa vai explicado pra fazer uma teoria

[00:26:48] tu vai ter várias teorias competitivas explicando

[00:26:50] não quer dizer que não haja situações reais, sociais

[00:26:52] onde tu possa aplicar, mas nesse caso por exemplo

[00:26:54] essa é uma crítica relevante, por isso é pra

[00:26:56] fazer assim, é aquela coisa do que tu

[00:26:58] pressupõe que estão se passando na cabeça das pessoas

[00:27:00] tomando decisões, ou seja, vai haver situações em que

[00:27:02] essa simbificação passa a ser simples demais

[00:27:04] na minha opinião, pra ser

[00:27:06] mas enfim, isso é um debate

[00:27:08] eu acho que também tem assim, a pergunta

[00:27:10] quando a gente traz o modelo

[00:27:12] pra uma resposta que a gente já conhece

[00:27:14] ou a gente inventa o modelo

[00:27:16] então por exemplo, no Ultimatum Game

[00:27:18] geralmente é normal

[00:27:20] a gente fala assim

[00:27:22] você sabe que deixar vários jogadores

[00:27:24] jogando ali, eles vão chegar

[00:27:26] na equidivisão, eu proponho

[00:27:28] o que acontece, eu sou punido, eu faço

[00:27:30] eu faço uma divisão, o jogador não concorda

[00:27:32] ele me pula

[00:27:34] eu sou ganancioso, eu vou lá e vou controlando

[00:27:36] então por exemplo, existem vários experimentos

[00:27:38] inclusive trabalhos até nossos

[00:27:40] que a gente faz o que, a gente vai lá e coloca

[00:27:42] ah, o cara é paviloviano, o cara é

[00:27:44] darwiniano, e aí você claro, você vai

[00:27:46] enxergar que ele vai pra aquela

[00:27:48] 50-50, mas no fundo a gente monta

[00:27:50] um modelo sabendo que o experimento

[00:27:52] dá aquilo, digamos assim

[00:27:54] a gente nunca enxergou, eu não

[00:27:56] conheço outro experimento do Ultimatum Game

[00:27:58] que conduz a outra coisa

[00:28:00] porque se eu conhecer eu vou lá e vou tentar

[00:28:02] fazer um modelo que cubra aquela situação

[00:28:04] então essa história do 50-50

[00:28:06] a gente consegue, é facilmente, você coloca

[00:28:08] um conjunto de jogadores

[00:28:10] jogando Ultimatum e que vão

[00:28:12] mudando a sua proposta de acordo

[00:28:14] com se eles fecham ou não

[00:28:16] um negócio, isso converge

[00:28:18] pro meio a meio, agora se existem outras

[00:28:20] situações, tem elementos externos

[00:28:22] exatamente, é isso que o cara diz

[00:28:24] tem elementos externos que influem ali

[00:28:26] só pra concluir eu quero só enfatizar

[00:28:28] de novo, quando a gente faz um modelo

[00:28:30] que a gente quer evidenciar mecanismos

[00:28:32] e independente das

[00:28:34] complicações que vão aparecer depois na

[00:28:36] hora de aplicar, então isso é uma complicação

[00:28:38] mas o modelo ele é feito pra evidenciar

[00:28:40] os mecanismos envolvidos

[00:28:42] depois a gente pode tentar montar

[00:28:44] experimentos com pessoas, não numa situação

[00:28:46] de guerra mas num laboratório mais controlado

[00:28:48] e tentar reproduzir exatamente

[00:28:50] a situação do torneio do Axel

[00:28:52] isso foi feito e a regra que sai

[00:28:54] se foi explicado esse torneio

[00:28:56] em resumo o Axel Ford ele fez uma chamada

[00:28:58] dizendo eu vou fazer uma competição

[00:29:00] de Dilema do Prisioneiro

[00:29:02] enviem as suas regras, então as pessoas enviavam

[00:29:04] sub rotinas, foi um campeonato

[00:29:06] final de 70, início dos 80

[00:29:08] o livro ele escreveu já pra

[00:29:10] publicar, então o livro

[00:29:12] foi a síntese dos dois torneios

[00:29:14] ele fez a chamada do primeiro

[00:29:16] recebeu da ordem de 50

[00:29:18] propostas

[00:29:20] ele fez competições

[00:29:22] duas a duas e foi acumulando

[00:29:24] os pre-offs e disse, bom, Tit for Tet é a mais

[00:29:26] bem-sedida, publicou um artigo

[00:29:28] com esses resultados dizendo, olha, essas foram as regras

[00:29:30] submetidas, a que ganhou foi a do Rapoporto

[00:29:32] que é o Tit for Tet, sabendo disso mandem

[00:29:34] novas regras, ele fez um segundo torneio

[00:29:36] o Rapoporto mandou de novo o Tit for Tet

[00:29:38] e ganhou de novo, o torneio foi reproduzido

[00:29:40] há uns anos atrás, uma comemoração

[00:29:42] dos 20, 30 anos do torneio original

[00:29:44] ganhou outra regra, mas essa regra

[00:29:46] violava o espírito

[00:29:48] inicial porque eles tinham vários agentes

[00:29:50] com regras diferentes, mas que se reconheciam

[00:29:52] então, ah, se tu é do meu time, então

[00:29:54] eu colaboro contigo, então isso violava

[00:29:56] tu mandou regras pro jogo?

[00:29:58] oi?

[00:30:00] então esse foi o programa Fronteiras da Ciência

[00:30:02] a gente discutiu a teoria dos jogos

[00:30:04] a teoria de jogos, não ficamos sabendo

[00:30:06] porque que o Brasil perdeu de 7 a 1 da Alemanha

[00:30:08] talvez nunca saibamos

[00:30:10] o pessoal é teórico demais, os convidados foram

[00:30:12] o Roberto da Silva e o Jefferson Aranzon

[00:30:14] do Departamento de Física da URI

[00:30:16] que são especialistas em teoria de jogos

[00:30:18] o Marco de Arte da Física

[00:30:20] e o Jorge Kufel da Biofísica da URI

[00:30:22] o programa Fronteiras da Ciência

[00:30:24] é um projeto do Instituto de Física da URI

[00:30:26] técnica de Gilson de César

[00:30:28] e direção técnica

[00:30:30] de Francisco Guazelli

Vox

Explorador