Claude Code
Uma revolução na pesquisa empírica em ciências sociais?
O economista Scott Cunnigham escreveu no começo de Dezembro de 2025 como Claude Code mudou sua forma de fazer pesquisa. Recomendo a leitura para uma introdução ao Claude Code. Eu fiquei bastante impressionado com o que ele falou, mas tudo me soou um pouco abstrato. Não me pareceu tangível os benefícios do Claude Code em relação ao meu uso de gen AI (basicamente, interface web do chatGPT) ou o que colegas reportam com copilot ou IDE integradas com IA como VS Code.
Eis que, já em 2026, vi uma postagem no antigo twitter do cientista político Andy Hall que me convenceu definitivamente de que eu tinha que testar o Claude Code. Eu já tinha ouvido falar antes dos benefícios para quem é programador profissional, mas esses dois casos falavam da academia.
Então, eu resolver pagar os 117 reais por mês e ver por conta própria como funciona esse tal Claude Code. Esse post é minha documentação da minha experiência inicial. Ao final faço uma reflexão sobre as consequências potenciais desse tipo de ferramenta para a pesquisa empírica em ciências sociais, mas adianto que estou no time que acha que a transformação vai ser gigante, com riscos para nós da academia.
Inspirado pelo Andy Hall, eu coloquei como objetivo inicial estruturar uma replicação de um artigo meu que está 80% pronto. O problema principal dele é que os scripts estão uma bagunça, tudo mal documentado, e não consigo submeter o artigo assim para uma boa revista quando pedirem os arquivos de replicação. O outro problema é que preciso ajustar a revisão da literatura e fazer alguns testes de robustez adicional para o paper ficar bom, mas que poderia deixar para depois, quando pareceristas pedissem. Enfim, algo perto de publicar, mas que está atrasado em minha lista de papers para submeter para publicação. Então, se o Claude Code pudesse organizar todo o pacote de replicação, com scripts novos, modulares e bem documentados, seria um baita ganho de tempo que faria eu submeter o artigo agora em janeiro. De outro modo, eu não teria a energia necessária para fazer isso agora. É muito trabalho, chato e preciso de mais motivação do que tenho disponível.
A primeira tarefa foi, então, instalar o Claude Code. Pedi ao próprio Claude (chat) ajuda para isso, e no Mac só precisei rodar:
curl -fsSL https://claude.ai/install.sh | bash
Claude foi instalado e depois foi só adicionar ao PATH do sistema, que o Claude também ajudou. E já estava instalado.
Aqui é importante enfatizar que a primeira diferença do Claude Code para outras interfaces é que ele é utilizado na linha de comando. Não sei como seria no Windows, imagino que em algum aplicativo que abre linha de comando, mas é por lá que a interação com o Claude Code se dá. Basicamente, você escolhe uma pasta onde o Claude vai rodar, isto é, você vai dar acesso ao Claude, nessa pasta, para fazer tudo (ler arquivos, gravar, copiar etc.). Há relatos não confirmados que o Claude Code escreveu um comando errado que apagou tudo de um computador, inclusive o Sistema Operacional. Então, cuidado com o que você vai pedir ao Claude Code. Em suma, vá até o caminho da sua pasta e simplesmente rode Claude (código abaixo)
cd /caminho/do/seu/projeto
claude
Será preciso autenticar na web, para garantir que você tem assinatura pro (pelo menos), e pronto. O que você vai ver é algo assim:
Ignorem por enquanto os primeiros comandos, que já vou explicá-los.
O modo típico de rodar o Claude Code é criar um arquivo markdwon (.md) com instruções sobre como o agente irá operar no seu computador, chamado CLAUDE.md. O Andy Hall compartilhou o CLAUDE.md dele, e eu adaptei (com ajuda do chat Claude) para criar o meu próprio, que você pode acessar na pasta no GitHub que criei para esse projeto. Você vai ver que são cerca de 800 linhas de código, ou seja, as instruções são bem detalhadas sobre o que é para fazer, o que pode ser feito, o que não pode e como deve ser feito.
Eu quero chamar a atenção aqui para algumas coisas desse arquivo. Em primeiro lugar, ele introduz o objetivo do projeto, depois temos as regras de segurança. Isso é super importante para evitar que o agente faça coisas indesejáveis como apagar ou modificar arquivos. Em segundo lugar, há os checkpoints, ou seja, pontos de parada em que o agente irá precisar de minha autorização para realizar algumas tarefas. Isso é importante para revisar o que será feito.
Depois disso, você escreve o prompt inicial, que no meu caso é também um arquivo em Markdown, mas não precisaria ser, e é o prompt inicial que fará o agente iniciar suas tarefas.
A cada checkpoint, o agente resume o que foi feito e pede sua autorização para continuar. Se você achar que é necessário fazer alguma coisa antes ou modificar o plano traçado, é o momento de dizer, escrevendo instruções na linha de comando. Mas na maior parte do tempo o agente faz perguntas e dá opções numeradas, e você simplesmente escolhe do menu a resposta mais adequada.
Nesse projeto, uma tarefa importante era garantir que todos os dados batiam com o que eu já tinha feito e que os scripts rodavam adequadamente, sem erros. Então o agente, quando identificava um erro, corrigia e rodava tudo de novo.
Algo que eu temia, mas que não é tão grave para essa tarefa, é atingir o limite de tokens. E, de fato, no meio do processo eu atingi o limite e o agente parou. Eu fui tirar dúvidas na interface web, mas o limite vale para lá também, e não consegui interagir por lá. Felizmente, cerca de 6 horas depois o limite tinha sido zerado e eu pude retomar de onde havia parado. Nessa segunda etapa, o processo foi concluído e eu consegui boa parte do que eu tinha colocado como objetivo inicial. Porém, gastei 20% de todo o limite semanal nesse único projeto. Isso me fez entender porque o Cunnigham falou que decidiu pagar 200 dólares por mês, pois o limite do Claude Pro era muito baixo para as necessidades dele.
Uma das coisas que o Claude Code concluiu no processo foi que um dos arquivos não era facilmente replicável (instruir que assumisse que estava correto), e uma das análises iniciais que nem entraram no paper (uma Matching com regressão Bayesiana usando Stan) era muito pesado para ele. Então eu decidi pular essas duas tarefas, de modo que não consegui tudo que queria inicialmente, mas agora tenho tudo bem organizado, documentado e só preciso replicar um único arquivo para ter tudo 100% replicável. Além disso, agora sei que não há erros (exceto por esse arquivo pendente), o que me deixa tranquilo para submeter o artigo para publicação. E posso, claro, usar Claude Code para replicar esse arquivo pendente, dando mais alguns dados que acho que eram necessários para que a tarefa seja feita a contento.
Reflexões sobre o Claude Code
Eu decidi usar o Claude Code em algo que sei 100% qual deve ser o resultado final, para poder avaliar sua utilidade e confiabilidade (embora isso seja n=1). E não poderia ter ficado mais impressionado. Eu provavelmente gastaria algo como uma semana ou duas de trabalho, e isso foi feito em duas ou três horas pelo Claude Code. É um ganho de produtividade absurdo. Eu posso, por exemplo, pedir para ele fazer coletas de dados adicionais, para ampliar a amostra, fazer testes adicionais de robustez usando funções específicas (eu preciso apenas instruir qual o teste estatístico adequado, especialmente com técnicas de fronteira) e pedir para gerar tabelas e gráficos para incluir no paper. Como hoje eu escrevo todos os meus artigos em RMarkdown (Quarto será algo similar), é muito simples integrar um pipeline desses produzido pelo Claude aos meus artigos. Posso instruir sobre como nomear os arquivos, a estrutura de pasta a usar (como fiz no CLAUDE.MD) e posso escrever o artigo e inserir gráficos e tabelas a partir dos outputs do agente. Então, basicamente, ficou muito mais fácil fazer artigos e pesquisa empírica com dados observacionais que dependam de coleta de dados na web.
Eu explicitamente não quis que o Claude Code fizesse a parte de interpretação dos resultados, ou revisão da literatura, porque isso é algo que quero controlar. Mas, como o exemplo do Andy Hall mostra, a real é que tudo pode ser automatizado e você terá um rascunho de artigo pronto para submissão. Obviamente seria importante ler tudo que foi escrito, checar se as análises estão corretas e que as referências fazem sentido. Mas a verdade é que, mesmo com esse trabalho de checagem, é possível fazer um artigo completo talvez em uma semana, se não houver erros grosseiros ou grandes que o próprio Claude Code não consegue corrigir?
Pior ainda, é possível imaginar um equilíbrio (sugerido pelo twitter do Andy Hall), em que você pede para o Claude Code escrever um artigo completo, você não checa nada, pede para dizer qual o journal adequado e submete, deixando a cargo de editores e pareceristas identificarem problemas que impeçam a públicação. Isso significa que você pode mandar uns 100 artigos por ano. Se 10 passarem do filtro e forem publicados, será mais que a larga maioria dos cientistas políticos brasileiros, e quase sem fazer esforço.
E, adicionando insulto à injúria, se todo mundo se mover para esse equilíbrio, o sistema será inundando com slop papers e será impossível avaliar e referenciar todos os artigos submetidos. Não é difícil imaginar que o próprio Claude Code vá fazer o trabalho de revisar os artigos submetidos, de modo que teremos gen IA escrevendo artigos para serem lidos por gen IA. Dizem que o campo da ciência da computação está experimentando algo parecido e o sistema está quebrado. Mas realmente não tenho uma posição informada para dizer se e o quanto isso é verdade. Alguns escândalos são sugestivos.
É possível também que as melhores pesquisadoras aprendam a fazer bom uso desses agentes e aumentem sua produtividade para fazer artigos ainda melhores e mais rápido. Se acharmos um jeito de navegar nesse oceano de paper ruins e identificar o que realmente se sobressai, o que veremos é aumentar o impacto e prestígio dessas pesquisadoras, enquanto o resto fica para trás. Em outras palavras, aumentar a desigualdade entre cientistas.
Algo importante a se refletir é sobre a importância do dinheiro. Para utilizar no máximo de seu potencial, é preciso pagar os 200 dólares por mês do Claude ou ter um orçamento grande para gastar na API. Isso significa que, ao mesmo tempo em que se democratiza o acesso a ferramentas que prometem igualar a capacidade de pesquisa (não é preciso mais um exército de assistentes de pesquisa para fazer certos trabalhos), ainda assim é preciso um volume de recursos não facilmente acessível para a maioria das pesquisadoras do Brasil. Eu estou pagando com dinheiro do meu salário, e fiquei com a impressão que o Scott Cunnigham também. A USP fornece gratuitamente a assinatura Pro (ou equivalente) do Gemini para todo seu corpo discente e docente. Sei que o Gemini tem algo similar ao Claude Code (assim como o ChatGPT), mas todo mundo concorda que, hoje, Claude Code é o melhor. Por enquanto esse melhor pode ser a diferença entre ser usável ou imprestável para fins acadêmicos, mas é de se esperar que todas as principais plataformas de IA generativa atinjam padrões mínimos de qualidade em um tempo não muito longo.
De todo modo, os limites de consumo devem ser estritos, então acho que a diferença de recursos ainda deve aparecer. O que significa que o investimento na ciência pode magnificar as diferenças que existem hoje. Também é possível que ao final as diferenças de recursos sejam pequenas e fiquem menores do que as de hoje. Acho um pouco mais provável esse cenário, mas não estou seguro. Só espero que não recaia sobre os nossos salários, como acontece às vezes quando temos de pagar para publicar artigos em revistas de acesso aberto.
Por fim, um amigo cientista político, Umberto Mignozetti, já havia me falado, em 2023, que achava que a pesquisa com dados observacionais não seria mais diferencial, e dados experimentais seria algo ainda não substituível pela IA generativa. Acho que ele tem razão, embora parece-me, por hora, que fazer boas perguntas de pesquisa e estabelecer um desenho robusto de pesquisa se tornaram mais valiosos do que antes.
Conclusão
Meu experimento com Claude Code foi um grande sucesso, no sentido de chegar muito próximo do que eu precisava na primeira tentativa, e provavelmente vou atingir 100% do meu objetivo após novas interações.
Eu vejo um futuro próximo em que todo mundo que não usar algo desse tipo vai ficar para trás. Simplesmente estamos falando em ser 10x ou 20x mais produtivos. Isso significa que uma pesquisadora que publicava 5 artigos em 5 anos irá publicar 50, ou dez por ano. Como isso custa dinheiro, precisamos pensar em políticas públicas sobre isso, para não sair do bolso dos cientistas.
Estou documentando aqui o que aprendi para compartilhar a potencial boa nova, embora saiba que ela embute riscos de piorar o sistema de produção e divulgação de conhecimento nas ciências sociais empíricas. Mas isso vai chegar para todo mundo, uma hora ou outra.
Eu não falei da pesquisa qualitativa empírica, porque não foi objeto do meu estudo de caso. Contudo, acho que também será afetada, especialmente com metodologias mais positivistas como Process Tracing Bayesiano. Escreverei sobre isso em outro texto.
Por fim, quero dizer que não usei nada de gen AI para escrever este texto. É 100% humano. Nem mesmo para revisão1.
Não tenho problema em suar LLMs para revisão de texto, fazer sugestões ou mesmo reorganizar o texto. Faço isso com frequência. Mas, neste caso, pareceu-me bom usar o método antigo de escrever, sem ajuda de LLM. O único uso que fiz foi perguntar pra ChatGPT e Gemini sobre seus equivalentes ao Claude Code, para não falar besteira, e achar um hyperlink de um texto que tinha lido aqui no substack, para colocar aqui no texto.







Estou bem curioso pra ver o impacto disso no médio prazo na nossa área. Vi vários comentários animados, mas outros nem tanto, sugerindo que essa animação inicial, nas próximas semanas, evoluiria para um monte de pesquisadores com milhares de protótipos sem saber exatamente no que trabalhar. Eu, pessoalmente, fiquei bem animado. Minha única questão, a princípio, é um certo receio de que a gente perca a propriedade sobre os códigos que criamos, estratégias que utilizamos para construir bancos de dados, enfim. Essa me parece uma parte importante da produção de conhecimento e que se perde um pouco na medida em que confiamos demais nessas ferramentas. Dito isso, lá vou eu pagar os 117 reais.