Os publishers enfrentam uma nova economia do scraping impulsionada pela IA
Uma nova economia de scrapers de terceiros está a crescer em torno do conteúdo editorial. Para além das grandes empresas de IA, dezenas de fornecedores rastreiam a web, extraem conteúdos de publishers e revendem-nos a clientes empresariais — muitas vezes sem que os meios saibam quem está efetivamente a aceder aos seus conteúdos nem como estes são monetizados.
Segundo a análise citada pela Digiday, esta indústria poderá movimentar cerca de mil milhões de dólares, com fornecedores como a Firecrawl, Exa, Tavily, Brave, You.com, Perplexity (Sonar) ou a Bright Data. O problema para os publishers é evidente: o seu conteúdo gera valor para terceiros, mas estes não participam economicamente nessas relações.
A pressão intensifica-se com o forte crescimento da atividade de bots de IA. A Akamai registou um aumento de 300% neste tipo de tráfego em 2025, sendo os publishers o segundo setor mais afetado. Além disso, não se trata apenas de crawlers de treino: estão também a crescer os bots que extraem páginas em tempo real para responder a consultas em assistentes de IA, reduzindo ainda mais a probabilidade de o utilizador visitar a fonte original.
O retorno para os publishers continua a ser mínimo. Segundo a Raptive, o ChatGPT gera menos de 0,2% do tráfego para a sua rede de 6.000 publishers independentes. Ou seja, as plataformas de IA consomem conteúdo e infraestrutura, mas devolvem muito pouca audiência. Esta assimetria está a alimentar uma tensão crescente: os meios fornecem o conteúdo que permite melhorar respostas, produtos e experiências de IA, mas não recebem uma compensação proporcional por essa utilização.
Perante este cenário, alguns publishers estão a adotar estratégias mais agressivas de bloqueio de bots. No entanto, bloquear não é simples: muitas ferramentas de scraping são concebidas para contornar restrições, e cerca de 30% das extrações realizadas por bots de IA violam instruções explícitas do robots.txt. Por isso, o debate começa a deslocar-se da mera defesa técnica para modelos mais estruturados de licenciamento, permissões e acordos comerciais.
A questão já não é apenas tecnológica, mas também económica e estratégica. Se o conteúdo editorial alimenta produtos de IA, os publishers querem ter capacidade para decidir quem acede, em que condições e com que compensação. Neste contexto, o controlo do acesso ao conteúdo poderá tornar-se uma nova alavanca de negociação para os meios.

