Resposta rápida

O OpenClaw é seguro por padrão no desenho (comandos sensíveis desligados, aprovação manual de dispositivos, câmera só em foreground, ws limitado à rede local, segredos com escopo de turno) — mas a segurança real depende do operador. Riscos de verdade: skills/plugins maliciosos, porta 18789 exposta e permissões largas demais. As 7 defesas: Tailscale+wss, allowlist mínima, auditar skills (verify), plugins pinados com allowlist, sandbox, credencial dedicada por integração e aprovação humana no irreversível.

Segurança do OpenClaw é prática do operador, não propriedade do software.
Vetor nº 1: skills/plugins de terceiros — a doc oficial manda tratar como código não confiável.
Nunca exponha a porta 18789: acesso remoto = Tailscale + wss:// (TLS).
Comandos sensíveis (câmera, tela) nascem desligados e exigem allowlist explícita; deny vence allow.
ClawHub escaneia (VirusTotal + estática) e verifica publicador — mas leia o SKILL.md antes de ativar.
Aprovação humana em ação irreversível é a defesa que salva de prompt malicioso.
Bem operado, é mais auditável que assistente de nuvem: código aberto + dados na sua máquina.

Porta do Gateway18789 — nunca expor; remoto via Tailscale/wss

Padrão de fábricacomandos sensíveis OFF + aprovação manual de devices

Vetor nº 1skills/plugins de terceiros não auditados

Verificaçãoopenclaw skills verify + scans do ClawHub

Defesa decisivaaprovação humana em ações irreversíveis

É a pergunta que trava a maioria das pessoas antes de instalar: dar a um agente de IA acesso ao seu e-mail, agenda, arquivos e servidor é seguro? A resposta honesta não é “sim” nem “não” — é “depende de quem opera”. O OpenClaw traz um desenho de segurança sério por padrão, mas é uma ferramenta de poder: mal configurada, vira exatamente o risco que os alarmistas descrevem. Este guia separa o que o projeto já protege, onde moram os riscos reais e as defesas que aplicamos na nossa própria operação.

O que o OpenClaw já protege por padrão?

O desenho de fábrica é mais conservador do que a fama de “agente que faz tudo” sugere:

Comandos sensíveis nascem desligados. Tirar foto, gravar a tela, capturar localização — nada disso funciona até você liberar comando por comando numa allowlist; e a deny list sempre vence a allow.
Nenhum dispositivo entra sem aprovação manual. Parear um celular exige aprovação explícita no Gateway — e um node pareado tem papel fixo: não existe “promoção” de um periférico a controlador.
Câmera e tela só em primeiro plano. Chamada em background retorna erro — não existe espionagem silenciosa pelo app.
Tráfego sem criptografia é confinado à rede local. Pra acesso remoto, o caminho oficial é túnel TLS (wss://) via Tailscale — não abrir porta pro mundo.
Segredos com escopo de turno. Chaves de API injetadas por configuração valem só durante o turno do agente e não vazam pro sandbox.

Onde moram os riscos de verdade?

Três lugares — e nenhum deles é “a IA ficou maligna”:

1. Skills e plugins de terceiros. É o vetor nº 1, e a própria documentação oficial é dura: trate como código não confiável. Fornecedores de segurança já alertaram sobre extensões maliciosas no ecossistema de agentes — um “plugin de produtividade” que exfiltra credenciais é o golpe clássico. O registro oficial (ClawHub) responde com escaneamento por pacote (VirusTotal + análise estática) e verificação de publicador, mas o botão de instalar continua sendo seu.

2. A porta do Gateway exposta. O Gateway escuta na porta 18789. Exposta à internet sem TLS e sem necessidade, é um convite: qualquer scanner acha, e um agente com acesso à sua vida atrás de uma porta aberta é o pior cenário possível.

3. O operador generoso. O risco mais subestimado é humano: liberar camera.snap, screen.record e acesso a arquivos “pra testar” e nunca mais revisar. Agente não precisa de más intenções pra causar estrago com permissões demais — basta um prompt malicioso numa página que ele leia.

Como blindar: as 7 defesas que usamos em produção

Nunca exponha a 18789. Acesso remoto = Tailscale + wss://. Custo: 10 minutos. Elimina o pior cenário inteiro.
Allowlist mínima e revisada. Libere só os comandos que sua rotina usa de verdade; revisite a lista por mês.
Skill de terceiro: leia antes de ativar. É Markdown — 2 minutos de leitura. Rode openclaw skills verify e prefira publicador identificado.
Plugins: allowlist explícita + versão pinada. Sem plugins.allow configurada, plugin descoberto no workspace pode carregar sozinho — o próprio startup avisa. Em produção, nada de @latest.
Sandbox pra tudo que executa comando. O OpenClaw suporta execução isolada — use pra qualquer skill/ferramenta que toque em shell.
Credencial dedicada por integração. O agente publica no seu site? Usuário próprio com papel mínimo e senha de aplicação revogável — nunca a credencial-mestre (detalhamos no guia de WordPress da série).
Aprovação humana no que é irreversível. Publicar, enviar, apagar, pagar: o agente propõe, você aprova. É a nossa regra de produção e a razão de dormirmos tranquilos.

Veredito: seguro pra quem?

Com as defesas acima, o OpenClaw é mais auditável que qualquer assistente de nuvem — código aberto, dados na sua máquina, cada permissão visível num arquivo de config. Sem elas, é um superusuário da sua vida rodando com as portas abertas. A segurança do OpenClaw não é uma propriedade do software: é uma prática do operador. A boa notícia: a prática inteira cabe numa tarde — e nos próximos guias da série destrinchamos o hardening passo a passo e a anatomia dos golpes de skill maliciosa.

Fontes: docs oficiais (skills/segurança) · docs (plugins) · nossa cobertura do modelo de segurança dos apps · prática da nossa operação self-hosted

Perguntas frequentes

O OpenClaw pode ser hackeado?

Como qualquer software exposto: o risco real está na porta 18789 aberta à internet sem TLS e em skills/plugins maliciosos instalados sem auditoria. Com túnel wss://Tailscale, allowlist mínima e verificação do que instala, a superfície de ataque fica menor que a de muitos SaaS.

O agente pode agir sozinho contra mim?

O agente só faz o que as permissões dele deixam. O cenário real de dano é um prompt malicioso (numa página ou e-mail que ele leia) abusando de permissões largas demais — por isso allowlist mínima e aprovação humana em ação irreversível são as duas defesas mais importantes.

Skills do ClawHub são confiáveis?

O ClawHub escaneia pacotes (VirusTotal + análise estática) e verifica publicadores, mas a doc oficial manda tratar skill de terceiro como código não confiável. Leia o SKILL.md antes de ativar — é Markdown, leva 2 minutos — e rode openclaw skills verify.

É mais seguro que ChatGPT ou Gemini?

É mais auditável: código aberto, dados na sua infraestrutura, permissões visíveis em config. Mas transfere a responsabilidade de operação pra você — assistente de nuvem mal usado vaza contexto; agente self-hosted mal configurado expõe sua vida inteira. Segurança aqui é prática, não propriedade.

Qual o erro de segurança mais comum de iniciante?

Dois empatados: expor a porta do Gateway na internet pra 'acessar de fora' (o certo é Tailscale + wss://) e liberar permissões de câmera/tela/arquivos 'pra testar' sem nunca revisar depois.