Nova Delhi:
Uma empresa de pesquisa de IA com sede em Nova York que se concentra em biotecnologia gerou uma nova proteína usando um Protein Language Model (ProLLMs) que funciona em uma arquitetura de transformador semelhante à do ChatGPT.
A EvolutionaryScale revelou a primeira molécula de proteína gerada por IA que brilha – imitando a bioluminescência de uma molécula de água-viva chamada proteína verde fluorescente – em 25 de junho. A nova sequência de proteína é significativamente diferente (menos de 60 por cento de semelhança) da proteína natural: uma diferença considerada possível “mais de 500 milhões de anos de evolução (natural)” pela empresa.
A empresa usou seu modelo de linguagem de IA de ponta chamado EvolutionaryScale Model-3 (ESM3) para alcançar esse feito e garantiu 142 milhões de dólares em uma rodada de financiamento inicial para o mesmo, incluindo investimentos de gigantes da indústria como Nvidia e Amazon.
Estamos entusiasmados com a parceria com a AWS e a NVIDIA para ampliar a fronteira da IA nas ciências biológicas.
– EvolutionaryScale (@EvoscaleAI) 25 de junho de 2024
O ESM3 difere do ChatGPT porque é treinado em parâmetros (variáveis internas) de três propriedades biológicas fundamentais das proteínas – sequência, estrutura e funções. O modelo foi treinado em 98 bilhões de parâmetros, tornando-o o maior modelo biológico de IA até hoje.
EvolutionaryScale chama isso de “modelo treinado em toda a evolução”. O conjunto de treinamento incluiu 2,78 bilhões de proteínas naturais, que vão desde “a floresta amazônica até as profundezas do oceano, ambientes extremos como fontes hidrotermais e micróbios em um punhado de solo”.
O ESM3 permite que os usuários gerem proteínas, usando prompts com informações parciais (sequência, estrutura e palavras-chave de função) e iterando o modelo para fazer previsões até que toda a sequência seja concluída. O modelo destina-se principalmente a cientistas e dá-lhes um controle sem precedentes sobre o processo de geração de proteínas.
Treinamos o ESM3 e estamos entusiasmados em apresentar o EvolutionaryScale.
ESM3 é um modelo de linguagem generativa para biologia de programação. Em experimentos, descobrimos que o ESM3 pode simular 500 milhões de anos de evolução para gerar novas proteínas fluorescentes.
Consulte Mais informação: https://t.co/iAC3lkj0iVpic.twitter.com/AhWtC4vxlF
-Alex Rives (@alexrives) 25 de junho de 2024
EvolutionaryScale afirma que seu objetivo é tornar a biologia programável. “ESM3 dá um passo em direção ao futuro, onde a IA é uma ferramenta para projetar a biologia a partir dos primeiros princípios, da mesma forma que projetamos estruturas, máquinas e microchips, e escrevemos programas de computador”, afirma o site da empresa.
A aplicação desta tecnologia pode levar a avanços em vários campos, como descoberta e desenvolvimento de medicamentos, investigação biomédica, bem como sustentabilidade – um exemplo disso já foi demonstrado pela EvolutionaryScale ao apresentar um protótipo de proteína que é capaz de degradar resíduos plásticos.
As possibilidades são infinitas, com cada célula de cada organismo contendo ribossomos (complexos proteicos responsáveis pela síntese protéica). No entanto, também tem havido preocupações de que a IA possa ser utilizada indevidamente para a criação de armas biológicas.
Os cientistas adotaram uma abordagem proativa e estabeleceram “Valores comunitários, princípios orientadores e compromissos para o desenvolvimento responsável de IA para design de proteínas” em março, buscando orientar os desenvolvimentos neste domínio para a melhoria da humanidade.
Estamos promovendo um novo acordo global assinado por mais de 100 cientistas líderes para garantir que as tecnologias de IA para design de proteínas sejam desenvolvidas de forma responsável. Este campo pode fornecer medicamentos, vacinas e outras inovações que beneficiem a todos. https://t.co/pTlFtBWHNhhttps://t.co/XYn986dEAt
– Instituto de Design de Proteínas (@UWproteindesign) 8 de março de 2024
EvolutionaryScale também foi elogiado por especialistas por lançar uma versão menor de código aberto para outros usarem livremente. O modelo completo em larga escala não foi divulgado, embora o processo de treinamento do mesmo tenha sido divulgado, na tentativa de manter a transparência e compartilhar a tecnologia livremente.