Imagens de IA criadas com o modelo Imagen 3 do Google. Raposas e balões.

As ferramentas generativas de IA do Google estão recebendo alguns dos impulsos previstos pela empresa E/S do Google. A partir desta semana, a empresa está lançando o versão de última geração de seu gerador de imagens Imagenque reintroduz a capacidade de gerar pessoas de IA (depois de um controvérsia embaraçosa no início deste ano). O chatbot Gemini do Google também adiciona Gems, a versão da empresa sobre bots com instruções personalizadas, semelhantes a GPTs personalizados do ChatGPT.

O Imagen 3 do Google é a versão atualizada de seu gerador de imagens, chegando ao Gemini. A empresa afirma que o modelo de IA de próxima geração “estabelece um novo padrão de qualidade de imagem” e é construído com grades de proteção para evitar a correção excessiva da diversidade, como as bizarras imagens históricas de IA que se tornou viral no início deste ano.

“Em uma ampla gama de benchmarks, o Imagen 3 tem um desempenho favorável em comparação com outros modelos de geração de imagens disponíveis”, escreveu Dave Citron, gerente de produto da Gemini, em um comunicado à imprensa. A ferramenta permite que você oriente a geração da imagem com instruções adicionais, caso você não goste do que ela mostra na primeira vez.

Citron diz que o Imagen 3 tem um desempenho “favorável” em comparação com a concorrência. Também inclui o Google Ferramenta SynthID para marcar imagens com marca d’águadeixando claro que eles são feitos de IA e não o artigo genuíno.

Imagens de IA criadas com o modelo Imagen 3 do Google. Raposas e balões.

Google

Citron diz que a capacidade de gerar pessoas retornará nos próximos dias para usuários pagos, meses depois do Google arrancou o recurso. Ele diz que novas proteções impedirão a geração de “indivíduos fotorrealistas e identificáveis” – muito longe dos problemáticos deepfakes gerado por Grok de Elon Musk. Também estão fora dos limites crianças e (como acontece com outros geradores de imagens) quaisquer cenas sangrentas, violentas ou sexuais. O gerente de produto fundamenta as expectativas dizendo que as imagens da Gemini não serão perfeitas, mas promete que a empresa continuará a ouvir o feedback dos usuários e a refinar de acordo.

A partir desta semana, o modelo Imagen 3 estará disponível para todos os usuários, mas a reintrodução de imagens com pessoas começará com usuários pagos. Os usuários do Gemini Advanced, Business e Enterprise que falam inglês podem esperar que a geração de imagens humanas retorne “nos próximos dias”.

Um bot personalizado do Google AI Gem, projetado para selecionar obstáculos.Um bot personalizado do Google AI Gem, projetado para selecionar obstáculos.

Google

Inicialmente visualizado no Google I/O 2024Gems são chatbots personalizados do Google com instruções criadas pelo usuário. É essencialmente a resposta de Gêmeos para GPTs da OpenAIque o concorrente do Google lançou no final do ano passado. As joias começarão a ser lançadas nos próximos dias.

“Com o Gems, você pode criar uma equipe de especialistas para ajudá-lo a pensar em um projeto desafiador, debater ideias para um próximo evento ou escrever a legenda perfeita para uma postagem nas redes sociais”, escreveu Citron. “Sua Gem também pode se lembrar de um conjunto detalhado de instruções para ajudá-lo a economizar tempo em tarefas tediosas, repetitivas ou difíceis.”

Além da folha em branco de joias personalizadas, o Gemini incluirá joias pré-fabricadas “para ajudá-lo a começar” e inspirar novas ideias. As joias pré-construídas incluem:

  • Treinador de aprendizagem – para ajudá-lo a entender tópicos complexos

  • Brainstormer – para inspirar novas ideias

  • Guia de carreira – orientar você nas atualizações de habilidades, decisões e metas

  • Editor de redação – fornecer feedback construtivo sobre gramática, tom e estrutura

  • Parceiro de codificação – atualize as habilidades de codificação para desenvolvedores e inspire novos projetos

Gems começa a ser lançado hoje em desktops e dispositivos móveis. No entanto, eles estão disponíveis apenas para assinantes Gemini Advanced, Business e Enterprise, portanto, você precisará de um plano pago para verificá-los.

Fuente