A TollBit quer ser um mercado para empresas e editores de IA.

TollBit

Os fundadores da TollBit, de 28 anos, uma startup sediada em Nova York com seis meses de existência, acham que estamos vivendo nos “dias do Napster” da IA. Tal como as pessoas de uma determinada geração descarregaram música digital, as empresas estão a roubar vastas áreas da Internet sem pagar aos detentores dos direitos. Eles querem que o TollBit seja o iTunes do mundo da IA.

“É uma espécie de Velho Oeste agora”, disse Olivia Joslin, cofundadora e diretora de operações da empresa, ao Engadget em entrevista. “Queremos tornar mais fácil para as empresas de IA pagar pelos dados de que necessitam.” A ideia deles é simples: criar um mercado que conecte empresas de IA que precisam de acesso a dados novos e de alta qualidade aos editores que realmente gastam dinheiro para criá-los.

Na verdade, as empresas de IA só recentemente começaram a pagar por (alguns dos) dados de que necessitam dos editores de notícias. A OpenAI deu início a uma corrida armamentista no final de 2022, mas foi há apenas um ano que a empresa assinou o primeiro de seus muitos acordos de licenciamento com a Associated Press. Mais tarde naquele ano, a OpenAI anunciou uma parceria com a editora alemã Axel Springer, que opera Insider de negócios e Político nos EUA. Vários editores, incluindo Voxo Tempos FinanceirosNews Corp e TEMPOdesde então, assinaram acordos com OpenAI e Google.

Mas isso ainda deixa inúmeros outros editores e criadores de fora – sem a opção de fechar este acordo faustiano, mesmo que queiram. Esta é a “cauda longa” de editores que a TollBit deseja atingir.

“Já existem modelos poderosos de IA e eles já foram treinados”, disse Toshit Panigrahi, cofundador e CEO da TollBit ao Engadget. “E neste momento, existem milhares de aplicações que apenas retiram estes modelos existentes das prateleiras. O que eles precisam é de conteúdo novo. Mas neste momento, não há infraestrutura – nem para eles comprarem, nem para os criadores de conteúdo venderem de uma forma que seja perfeita.”

Tanto Joslin quanto Panigrahi não tinham muito conhecimento sobre a indústria da mídia. Mas ambos sabiam como funcionavam os mercados e plataformas online – eram colegas na Toast, uma plataforma que permite aos restaurantes gerir faturas e reservas. Panigrahi observou os negócios – e as ações judiciais – acumularem-se no setor de IA e depois recorreu a Joslin.

Suas primeiras conversas foram sobre RAG, que significa Retrieval-Augmented Generation no mundo da IA. Com o RAG, os modelos de IA primeiro procuram informações em bancos de dados específicos (como partes da Internet que podem ser descartadas) e usam essas informações para sintetizar uma resposta, em vez de simplesmente confiar em dados de treinamento. Serviços como o ChatGPT não sabem os preços atuais das casas ou as últimas notícias. Em vez disso, eles buscam esses dados, normalmente consultando sites. Essa ausência de dados novos é a razão pela qual os chatbots de IA são frequentemente perplexo por meio de consultas sobre notícias de última hora — se não coletarem os dados mais recentes, simplesmente não conseguirão acompanhar.

“Achávamos que usar conteúdo para RAG era algo fundamentalmente diferente de usá-lo para treinamento”, disse Panigrahi.

Olivia Joslin é cofundadora da TollBitOlivia Joslin é cofundadora da TollBit

TollBit

Segundo algumas estimativas, RAG é o futuro dos motores de busca. Cada vez mais, as pessoas fazem perguntas na Internet e esperam em troca respostas completas, em vez de uma lista de links azuis. Em pouco mais de um ano, startups como a Perplexity, apoiada por Jess Bezos e NVIDIA, entre outros, entraram em cena com ambições de enfrentar o Google. Até OpenAI tem planos para algum dia deixe o ChatGPT se tornar seu mecanismo de busca. Em resposta, o Google entrou em ação – agora seleciona informações relevantes dos resultados de pesquisa e as apresenta como uma resposta coerente no topo da página de resultados, um recurso que chama de Visão Geral de IA. (Isto nem sempre funciona bemmas aparentemente veio para ficar).

A ascensão dos mecanismos de busca baseados em RAG fez os editores tremerem. Afinal, quem ganharia dinheiro se a IA ler a internet para nós? Depois que o Google lançou Visão geral de IA no início deste ano, pelo menos um relatório estimou que os editores perderiam mais de US$ 2 bilhões em receita publicitária porque menos pessoas teriam um motivo para visitar seus sites. “As empresas de IA também precisam de acesso contínuo a conteúdos e dados de alta qualidade”, disse Joslin, “mas se não descobrirmos algum modelo económico aqui, não haverá incentivo para ninguém criar conteúdo, e isso será o fim”. de aplicações de IA também.”

Em vez de cortar cheques únicos, o modelo da TollBit visa compensar os editores de forma contínua. Hipoteticamente, se o conteúdo de alguém fosse usado em mil respostas geradas por IA, essa pessoa seria paga mil vezes a um preço que ela definiu e que pode alterar na hora.

Cada vez que uma empresa de IA acessa novos dados de um editor por meio do TollBit, ela pode pagar uma pequena taxa definida pelo editor que Panigrahi e Joslin acham que deveria ser aproximadamente equivalente ao que uma visualização de página tradicional teria gerado para o editor. E a plataforma também pode impedir que empresas de IA que não se inscreveram acessem os dados dos editores.

Até agora, os fundadores afirmam ter integrado cem editores e estão em pilotos com três empresas de IA desde o lançamento do TollBit em fevereiro. Eles se recusaram a revelar quais editores ou empresas de IA haviam assinado até agora, citando cláusulas de confidencialidade, mas não negaram ter conversado com OpenAI, Anthropic, Google e Meta. Até agora, eles dizem que nenhum dinheiro mudou de mãos entre empresas de IA e editores em sua plataforma.

Toshit Panigrahi é cofundador da TollBitToshit Panigrahi é cofundador da TollBit

TollBit

Até que isso aconteça, o seu modelo ainda é uma hipótese gigantesca – embora seja uma hipótese em que os investidores até agora investiram 7 milhões de dólares. Os investidores da TollBit incluem Sunflower Capital, Lerer Hippeau, Operator Collective, AIX e Liquid 2 Ventures, e mais investidores estão atualmente “batendo à porta”, afirmou Joslin. Em abril, a TollBit também provocado Campbell Brown como consultor sênior, um ex-âncora de televisão que anteriormente atuou como chefe de parcerias de notícias da Meta por quase uma década.

Apesar de alguns processos judiciais de grande repercussão, as empresas de IA estão ainda raspando a internet de graça e em grande parte fugindo com isso. Por que eles teriam algum incentivo para realmente pagar aos editores por esses dados? Há três grandes razões, dizem os fundadores: mais sites estão tomando medidas para evitar que seu conteúdo seja copiado desde que a IA generativa se tornou popular, o que significa que a raspagem da web é ficando mais difícil e mais caro; ninguém quer lidar com processos judiciais de direitos autorais em andamento; e, o que é mais importante, poder pagar facilmente pelo conteúdo conforme a necessidade permite que as empresas de IA acessem publicações menores e de mais nichos, porque não é possível fechar acordos de licenciamento individuais com cada site. Joslin também destacou que vários investidores da TollBit também investiram em empresas de IA que temem que possam enfrentar litígios por usar conteúdo sem permissão.

Fazer com que as empresas de IA paguem pelo conteúdo poderia proporcionar um fluxo de receita recorrente não apenas para grandes editores, mas potencialmente para qualquer pessoa que publique algo online. No mês passado, a Perplexity – que foi acusada de copiar ilegalmente conteúdo de Forbes, Com fio e Condé Nast — lançou um Programa para Editores sob o qual planeja compartilhar uma parte de qualquer receita obtida com os editores se usarem seu conteúdo para gerar respostas com IA. O sucesso do programa, no entanto, depende de quanto dinheiro a Perplexity ganhará quando introduzir anúncios no aplicativo ainda este ano. Assim como o Tollbit, é outra hipótese completa.

“Nossa tese com a TollBit é que se você perder uma visualização de página hoje, você deve ser compensado imediatamente, e não alguns anos depois, quando uma empresa de tecnologia descobrir seu programa de anúncios”, disse Panigrahi sobre a iniciativa da Perplexity.

Apesar de todos os acordos de licenciamento e avanços técnicos existentes, os chatbots alimentados por IA ainda são fontes de notícias terríveis. Eles ainda inventam fatos e evocam com confiança links inteiros para histórias que na verdade não existem. Mas as empresas de tecnologia estão agora a colocar chatbots de IA em todas as fendas que podem, o que significa que muitas pessoas ainda receberão notícias de um destes produtos num futuro não tão distante.

Uma abordagem mais cínica da premissa da TollBit é que a startup está efetivamente oferecendo dinheiro secreto para editores cujo trabalho tem maior probabilidade de ser transformado em desinformação. Os seus fundadores, naturalmente, não concordam com a caracterização. “Temos cuidado com os parceiros de IA que integramos”, disse Panigrahi. “Essas empresas estão muito atentas à qualidade do material de entrada e à correção das respostas. Estamos vendo que pagar pelo conteúdo – mesmo em valores nominais – cria incentivos para respeitar os insumos brutos em seus sistemas, em vez de tratá-los como uma mercadoria gratuita e substituível.”

Fuente