Os novos intermediários da IA: quando os publishers perdem 100% do valor do seu conteúdo
Os publishers digitais enfrentam há anos vários problemas estruturais do ecossistema publicitário — desde o “imposto AdTech” até às cadeias de supply pouco transparentes — mas enfrentam agora uma nova ameaça: o scraping de conteúdos por terceiros impulsionados por inteligência artificial.
Segundo a Digiday, este fenómeno está a gerar crescente preocupação na indústria, uma vez que já não se trata apenas de partilhar receitas, mas de perdê-las por completo. Alguns executivos do setor comparam estes novos players — conhecidos como brokers de dados para IA — a intermediários publicitários do tipo DSP, mas com uma diferença fundamental: apropriam-se de 100% do valor gerado. Ao contrário do ecossistema publicitário tradicional, onde os publishers recebiam pelo menos uma parte da receita, o scraping implica uma extração total do conteúdo sem qualquer compensação.
Chris Dicker, CEO da Candr Media, descreve o fenómeno na Digiday como uma “aquisição hostil” financiada pela propriedade intelectual dos próprios publishers. Em muitos casos, esse conteúdo é ainda utilizado para desenvolver produtos concorrentes que removem diretamente o publisher da equação.
O problema agrava-se devido a práticas consideradas de má-fé. Algumas empresas utilizam crawlers disfarçados ou ignoram deliberadamente as diretivas “no-crawl” dos websites, dificultando ainda mais a capacidade de defesa dos publishers. Para Dicker, a mensagem deveria ser simples: “se um site diz para não rastrear, então não se rastreia”.
Este contexto deu origem ao que analistas como Matthew Scott Goldstein chamam de “economia do scraping”, um mercado que já movimenta mil milhões de dólares, segundo dados da Mordor Intelligence. Ainda assim, os publishers continuam excluídos dessa receita. Além disso, muitas destas empresas estarão a reformular a sua narrativa, deixando de se apresentar como simples scrapers para se posicionarem como fornecedores de “infraestrutura agentic”, sem que o modelo económico subjacente se altere.
Entre os players identificados neste ecossistema encontram-se empresas como Firecrawl, Exa, Tavily, Brave, You.com, Perplexity Sonar e Bright Data, entre outras. No total, estima-se que existam pelo menos 21 fornecedores ativos, embora algumas fontes apontem para um número próximo dos 40.
Para alguns executivos, a situação faz lembrar o impacto do Napster na indústria musical: uma disrupção que permitiu o consumo massivo de conteúdo sem compensar adequadamente os seus criadores. A diferença, sublinham, é que ainda não existe um equivalente ao iTunes ou ao Spotify capaz de organizar este novo mercado.
Além disso, para os publishers que distribuem os seus conteúdos em múltiplas plataformas, bloquear estes rastreadores tornou-se um jogo interminável. Mesmo protegendo os seus próprios domínios, os conteúdos podem reaparecer em portais de terceiros, de onde são novamente extraídos, diluindo ainda mais o controlo e a capacidade de monetização.
Neste cenário, a grande questão continua sem resposta: quem paga pelo conteúdo na era da IA — e segundo que regras? Por enquanto, o mercado ainda não encontrou uma solução.

