OpenAI, que conquistou o mundo da IA com Chat-GPT e seu gerador de texto para imagem DALL-E, está aumentando a aposta com uma nova plataforma de texto para vídeo.
A gigante da tecnologia revelou o Sora na quinta-feira (15 de fevereiro). É um gerador de texto para vídeo baseado em IA que permite aos usuários criar um vídeo de até um minuto usando apenas prompts de texto. Sora é alimentado por uma caixa de texto simples que permite aos usuários inserir qualquer texto que desejarem. Em seguida, ele retorna um vídeo que corresponde ao solicitado, independentemente de quão detalhado seja o pedido.
Depois que a OpenAI anunciou a notícia, o CEO Sam Altman foi ao X (antigo Twitter), onde solicitou sugestões dos seguidores. Ele então retweetou vídeos com base nesses pedidos, incluindo um dos dois podcasting de golden retrievers no topo de uma montanha. Sora gerou o vídeo com facilidade
Também há muitos exemplos de Sora em ação no site da OpenAI, incluindo um vídeo gerado por um prompt de texto pedindo “uma ninhada de filhotes de golden retriever brincando na neve”. A filmagem resultante parece bastante realista, mesmo que a física de parte da neve espalhada possa precisar de alguns ajustes.
Os prompts de texto podem ser bastante específicos, ainda produzindo alguns resultados impressionantes. Aqui está um clipe do que foi produzido a partir deste prompt detalhado: “Um trailer de filme apresentando as aventuras do homem do espaço de 30 anos usando um capacete de motocicleta tricotado de lã vermelha, céu azul, deserto de sal, estilo cinematográfico, filmado em filme 35mm, cores vivas.“
Apesar de sua aparente promessa, Sora não está disponível para uso público, e a empresa deixou claro em uma postagem no blog que o está disponibilizando apenas para um conjunto de testadores e pessoas da comunidade criativa para experimentá-lo com o objetivo de fazer melhorias. A OpenAI não chegou a dizer quando o Sora estaria disponível publicamente, embora a empresa tenha dito à NBC News que não estaria “amplamente disponível em nossos produtos em breve”.
Ainda assim, parece provável que Sora seja disponibilizado em algum momento, considerando que existem outras empresas no espaço, incluindo a Runway, com sede nos EUA, e a Synthesia, com sede no Reino Unido.
Embora os vídeos iniciais do OpenAI sejam divertidos e a tecnologia pareça empolgante para aqueles que investem totalmente em IA, isso levanta questões sobre as limitações do que pode ser criado com a plataforma. Com um número cada vez maior de deepfakes chegando à Internet, Sora poderia facilmente ser usado para fins nefastos. E dado o quão detalhado alguém pode ser ao solicitar um vídeo, não está fora da possibilidade que os usuários criem vídeos falsos, compartilhados nas redes sociais, que outros acreditam serem realistas.
Para combater isso, a OpenAI disse que planeja incorporar metadados e outros artefatos em seus vídeos para que os usuários da Internet possam determinar rapidamente se um vídeo foi criado com Sora. A empresa também espera que a sua equipa de testadores e especialistas identifique áreas onde a desinformação ou outro conteúdo prejudicial possa ser gerado por maus atores e elimine-os antes que Sora se torne público.
Ainda assim, a OpenAI reconheceu que pode não abordar todas as possibilidades.
“Apesar de extensas pesquisas e testes, não podemos prever todas as maneiras benéficas pelas quais as pessoas usarão nossa tecnologia, nem todas as maneiras pelas quais as pessoas irão abusar dela”, disse OpenAI em uma postagem no blog. “É por isso que acreditamos que aprender com o uso no mundo real é um componente crítico para criar e lançar sistemas de IA cada vez mais seguros ao longo do tempo.”
À primeira vista, os vídeos de Sora parecem interessantes, mas alguns são claramente falsos e não possuem o tipo de resolução e realismo que você esperaria de um vídeo do mundo real. Ainda assim, com muito tempo para testar e melhorar, deve ser fascinante ver o que Sora pode oferecer se e quando for disponibilizado ao público.