O modelo de vídeo de inteligência artificial da OpenAI, Sora, continua a exibir uma capacidade impressionante de capturar o mundo real a partir de nada mais do que um prompt de texto.
A empresa afirma que estará disponível ao público em algum momento deste ano, mas até então a única forma de experimentar suas capacidades é por meio das postagens do Sora Sunday nas redes sociais.
O último lançamento ocorre em meio à crescente pressão sobre a OpenAI para divulgar a fonte dos dados usados para treinar Sora. Isto foi desencadeado pela recusa da CTO Mira Murati em confirmar durante uma entrevista ao Wall Street Journal se vídeos públicos de criadores do YouTube estavam no conjunto de dados.
Enquanto isso, ainda podemos aproveitar suas criações, incluindo uma incrível capacidade de mesclar diferentes vídeos, seguir instruções simples e ter várias cenas em um único prompt de texto.
Novos clipes incríveis de Sora
Esta semana vimos um vídeo de um elefante verde coberto de folhas para marcar o Dia de São Patrício, uma cachoeira de arco-íris e a valsa da abelha.
A OpenAI acrescenta a cada vídeo que compartilha: “Estamos compartilhando o progresso de nossa pesquisa antecipadamente para aprender com o feedback e dar ao público uma noção de quais capacidades de IA estão no horizonte”.
Um elefante frondoso
Um dos recursos mais impressionantes de ferramentas de vídeo de IA como o Sora é a capacidade de criar algo que não poderia existir – e a partir de um prompt de texto.
Ao contrário de outros modelos, Sora traz consistência de movimento. Por exemplo, neste vídeo de elefante compartilhado no Instagram, as folhas deste elefante se movem de forma independente.
Dica: “Um elefante feito de folhas correndo na selva.”
Gatinho no vácuo
Sora também faz realismo muito bem. Este é o vídeo de um gatinho pirata andando em um aspirador de robô e tive que olhar duas vezes para perceber que não era apenas um vídeo filmado em um smartphone.
Um dos recursos divertidos do Sora é sua capacidade de mesclar um par de vídeos e uma ferramenta futura construída no modelo poderia ver alguém mesclar um vídeo de seu próprio animal de estimação com outro vídeo como o de um aspirador de robô para criar uma nova geração de clipes sociais divertidos para compartilhar.
Prompt: “Um adorável gatinho pirata andando em um robô aspirador pela casa.” Compartilhado no Instagram por OpenAI.
Cachoeira arco-íris
Mais balde de tinta do que arco-íris, mas isso mostra uma versão bizarra das Cataratas do Niágara parecendo ter sido substituída por um comercial de uma empresa de tintas.
Compartilhado no Instagram e feito usando o prompt “cataratas do Niágara com tinta colorida em vez de água”.
Camaleão em movimento
Esta imagem foi compartilhada no Instagram da OpenAI mostrando um camaleão se movendo e mostrando suas capacidades de mudança de cor. É impressionante o quão realista parece e pode sugerir o futuro dos documentários sobre a vida selvagem.
Foi compartilhado com a descrição: “este close-up de um camaleão mostra suas impressionantes capacidades de mudança de cor. o fundo fica desfocado, chamando a atenção para a aparência marcante do animal.”
Abelha em voo
Este é um dos meus favoritos e me faz torcer pela abelhinha enquanto ela voa em busca de pólen em uma variedade de plantas e origens.
OpenAI compartilhou no Instagram com a mensagem: “Vídeo POV de uma abelha mergulhando em um lindo campo de flores”.