Segurança Digital

Claude Desktop e o risco de agentes: por que sua máquina pode estar vulnerável

Pesquisadores demonstraram como o Claude Desktop pode ser transformado em um agente malicioso através de preferências sincronizadas. Entenda como proteger sua operação.

Por Orqueza 01 de julho de 2026 3 min de leitura

Claude Desktop e o risco de agentes: por que sua máquina pode estar vulnerável

0:00 / 0:00

A ilusão da confiança em assistentes de IA

A confiança em ferramentas de IA generativa atingiu um ponto onde, muitas vezes, ignoramos a superfície de ataque que esses assistentes criam. Recentemente, pesquisadores da Pentera Labs demonstraram como o aplicativo Claude Desktop pode ser convertido em um agente duplo, permitindo execução remota de código (RCE) na máquina do desenvolvedor.

O ataque, detalhado em julho de 2026, explora o comportamento de sincronização de preferências do Claude. Ao manipular os prompts de sistema que definem como o modelo deve agir, um invasor consegue injetar instruções que rodam silenciosamente em segundo plano, transformando o assistente em um vetor de persistência e exfiltração de dados.

Como a exploração funciona na prática

A vulnerabilidade não reside em uma falha de código tradicional, mas na lógica de design do app. O Claude Desktop sincroniza preferências, skills e conexões de MCP (Model Context Protocol) entre dispositivos. Se um atacante obtiver acesso à conta do usuário — algo viabilizado através de inboxes comprometidas ou phishing — ele pode:

Injetar instruções persistentes: O atacante insere um prompt codificado em base64 nas preferências do usuário.
Enumerar ferramentas locais: O Claude verifica quais ferramentas de linha de comando ou conectores o desenvolvedor possui instalados.
Executar comandos via shell: Se o ambiente permitir, o modelo é induzido a rodar comandos maliciosos, criando um reverse shell ou extraindo chaves de API e tokens de autenticação.

Mesmo na ausência de ferramentas pré-instaladas, o Claude atua como uma camada de phishing altamente convincente, apresentando erros falsos que levam o usuário a baixar scripts maliciosos, acreditando tratar-se de uma correção legítima da Anthropic.

A posição da Anthropic

Ao ser notificada pela equipe de pesquisa em novembro de 2025, a Anthropic classificou o comportamento como uma funcionalidade, não um bug. A empresa argumenta que as preferências do usuário, skills e conectores MCP são projetados para permitir que o Claude interaja com o sistema operacional e execute código. Portanto, a manipulação desses recursos para executar comandos arbitrários é considerada um comportamento esperado dentro do modelo de ameaças atual.

O que muda na sua rotina de segurança

Para quem utiliza agentes de IA no fluxo de desenvolvimento, a lição é clara: o nível de acesso que você concede ao seu assistente é o nível de risco que você assume. A segurança superou a funcionalidade como prioridade, conforme discutido em governança de IA.

Auditoria de Conectores: Revise constantemente quais ferramentas e MCPs possuem permissão de execução na sua máquina.
Paranoia produtiva: Como sugerido pelos pesquisadores, não permita a execução de nenhum comando sugerido pelo modelo sem uma verificação dupla manual.
Segregação de ambiente: Evite que o Claude ou outros agentes tenham acesso direto a chaves de produção ou tokens sensíveis.

O uso de ferramentas de automação é essencial, mas a ilusão de humanidade pode esconder riscos operacionais graves, como detalhamos em riscos de agentes como colegas. Para times que precisam manter a operação fluida sem abrir mão do controle centralizado, plataformas como o Orqueza ajudam a manter a governança dos processos sem expor o core da sua infraestrutura a riscos desnecessários.

Fonte: theregister.com