Se sua IA parece mais inteligente, é graças a treinadores humanos mais inteligentes


Estocolmo/São Francisco:

Nos primeiros anos, fazer com que modelos de IA, como o ChatGPT ou o seu rival Cohere, produzissem respostas semelhantes às humanas, exigiam vastas equipas de trabalhadores de baixo custo que ajudassem os modelos a distinguir factos básicos, como se uma imagem fosse de um carro ou de uma cenoura.

Mas actualizações mais sofisticadas dos modelos de IA na arena ferozmente competitiva exigem agora uma rede em rápida expansão de formadores humanos com conhecimentos especializados – desde historiadores a cientistas, alguns com doutoramento.

“Há um ano, poderíamos contratar estudantes de graduação, apenas para ensinar IA sobre como melhorar”, disse o cofundador da Cohere, Ivan Zhang, falando sobre seus treinadores humanos internos.

“Agora temos médicos licenciados ensinando aos modelos como se comportar em ambientes médicos, ou analistas financeiros ou contadores”.

Para mais treinamento, Cohere, que foi avaliado pela última vez em mais de US$ 5 bilhões, trabalha com uma startup chamada Invisible Tech. Cohere é um dos principais rivais da OpenAI e é especializado em IA para empresas.

A startup Invisible Tech emprega milhares de treinadores, trabalhando remotamente, e tornou-se um dos principais parceiros de empresas de IA, desde a AI21 até a Microsoft, para treinar seus modelos de IA para reduzir erros, conhecidos no mundo da IA ​​como alucinações.

“Temos 5.000 pessoas em mais de 100 países ao redor do mundo que são PhDs, titulares de mestrado e especialistas em trabalho de conhecimento”, disse o fundador da Invisible, Francis Pedraza.

A Invisible paga até US$ 40 por hora, dependendo da localização do trabalhador e da complexidade do trabalho. Algumas empresas como a Outlier pagam até US$ 50 por hora, enquanto outra empresa chamada Labelbox disse que paga até US$ 200 por hora para assuntos de “alta especialização”, como física quântica, mas começa com US$ 15 para tópicos básicos.

A Invisible foi fundada em 2015 como uma empresa de automação de fluxo de trabalho que atende empresas como a empresa de entrega de alimentos DoorDash para digitalizar seu menu de entrega. Mas as coisas mudaram quando uma empresa de pesquisa relativamente desconhecida chamada OpenAI os contatou na primavera de 2022, antes do lançamento público do ChatGPT.

“A OpenAI veio até nós com um problema: quando você fazia uma pergunta a uma versão inicial do ChatGPT, ela tinha alucinações. Você não podia confiar na resposta”, disse Pedraza à Reuters.

“Eles precisavam de um parceiro de treinamento avançado em IA para fornecer aprendizado reforçado com feedback humano.”

OpenAI não respondeu ao pedido de comentário.

A IA generativa produz novos conteúdos com base em dados anteriores usados ​​para treiná-los. No entanto, às vezes não consegue distinguir entre informações verdadeiras e falsas e gera resultados falsos conhecidos como alucinações. Num exemplo notável, em 2023, um chatbot do Google partilhou informações imprecisas sobre qual satélite tirou pela primeira vez fotografias de um planeta fora do sistema solar da Terra num vídeo promocional.

As empresas de IA estão cientes de que as alucinações podem inviabilizar a atractividade da GenAI para as empresas e estão a tentar várias formas de a reduzir, incluindo a utilização de formadores humanos para ensinar o conceito de facto e ficção.

Desde que ingressou na OpenAI, a Invisible afirma que se tornou parceira de treinamento em IA da maioria das empresas GenAI, incluindo Cohere, AI21 e Microsoft. Cohere e AI21 confirmaram que são clientes. A Microsoft não confirmou que é um cliente do Invisible.

“Todas essas são empresas que enfrentaram desafios de treinamento, onde o custo número um era o poder computacional, e o custo número dois era o treinamento de qualidade”, disse Pedraza.

COMO FUNCIONA?

OpenAI, que deu início ao frenesi em torno do GenAI, tem uma equipe de pesquisadores apropriadamente chamada de “Equipe de Dados Humanos” que trabalha com treinadores de IA para coletar dados especializados para treinar seus modelos como o ChatGPT.

Os pesquisadores da OpenAI apresentam vários experimentos, como reduzir alucinações ou melhorar o estilo de escrita e trabalhar com treinadores de IA da Invisible e de outros fornecedores, disse uma fonte familiarizada com os processos da empresa.

A qualquer momento, dezenas de experimentos estão sendo realizados, alguns com ferramentas desenvolvidas pela OpenAI e outros por ferramentas de fornecedores, disse a pessoa.

Com base no que as empresas de IA pretendem – desde melhorar a história sueca ou fazer modelos financeiros – a Invisible contrata trabalhadores com diplomas relevantes para esses projetos, reduzindo a carga de gestão de centenas de formadores pelas empresas de IA.

“A OpenAI tem alguns dos cientistas da computação mais incríveis do mundo, mas eles não são necessariamente especialistas em história sueca ou questões de química ou biologia ou qualquer coisa que você possa perguntar”, disse Pedraza, acrescentando que mais de 1.000 trabalhadores contratados atendem à OpenAI. sozinho.

Zhang, da Cohere, disse que usou pessoalmente os treinadores da Invisible para encontrar uma maneira de ensinar seu modelo GenAI a encontrar informações relevantes em um grande conjunto de dados.

CONCORRÊNCIA

Entre os concorrentes neste espaço está a Scale AI, uma start-up privada avaliada em 14 mil milhões de dólares que fornece às empresas de IA conjuntos de dados de formação. Ela também se aventurou na área de fornecimento de instrutores de IA e conta com a OpenAI como cliente. A Scale AI não respondeu aos pedidos de entrevista para esta história.

A Invisible, que é lucrativa desde 2021, levantou apenas US$ 8 milhões em capital primário,

“70% somos propriedade da equipe e apenas 30% propriedade de investidores”, disse Pedraza. “Nós facilitamos as rodadas secundárias, e o preço negociado mais recente foi avaliado em meio bilhão de dólares.” A Reuters não conseguiu confirmar essa avaliação.

Os formadores humanos iniciaram a formação em IA através de um trabalho de rotulagem de dados que exigia menos qualificação e também recebia menos, por vezes tão baixo quanto 2 dólares, realizado principalmente por pessoas em países africanos e asiáticos.

À medida que as empresas de IA lançam modelos mais avançados, a procura de formadores especializados e em dezenas de línguas aumenta, criando um nicho bem remunerado onde trabalhadores de diversas áreas podem tornar-se formadores de IA sem sequer saberem programar.

A procura por parte das empresas de IA está a levar à criação de mais empresas que oferecem serviços semelhantes.

“Minha caixa de entrada está basicamente inundada com novas empresas que surgem aqui e ali. Vejo isso como um novo espaço onde as empresas contratam humanos apenas para criar dados para laboratórios de IA como o nosso”, disse Zhang.

(Exceto a manchete, esta história não foi editada pela equipe da NDTV e é publicada a partir de um feed distribuído.)


Fuente