Novo modelo de IA permite evoluções na criação de novas proteínas — e vai muito para além das que se encontram na natureza.
Cientistas dos EUA utilizaram o EvolutionaryScale Model 3 (ESM3) para sintetizar uma nova proteína chamada esmGFP (proteína verde fluorescente), que partilha apenas 58% do seu material com o seu parente natural mais próximo tagRFP, conta a Science Alert.
As proteínas fluorescentes dão a alguns organismos oceânicos o seu brilho, e a sua utilização como marcadores tem enorme importância na medicina e na biotecnologia.
Agora, “mais de três mil milhões de anos de evolução produziram uma imagem da biologia codificada no espaço das proteínas naturais”, escrevem os autores do estudo publicado este mês na Science.
“Aqui mostramos que os modelos de linguagem treinados em grande escala em dados evolutivos podem gerar proteínas funcionais que estão muito longe das proteínas conhecidas“, acrescentam.
O ESM3 foi treinado com 3,15 mil milhões de sequências, 236 milhões de estruturas e 539 milhões de anotações de proteína.
Na verdade, a base que faz atuar esta IA é semelhante à do nosso conhecido ChatGPT: tal como este consegue criar um texto novo com base em informação prévia a que tem acesso, também a nova tecnologia é capaz de reconhecer com base no seu treino as proteínas que vão ou não funcionar.
“As proteínas podem ser vistas como existindo num espaço organizado onde cada proteína é vizinha de todas as outras que estão a um evento mutacional de distância”, comentam os autores. “A estrutura da evolução aparece como uma rede dentro deste espaço, ligando todas as proteínas pelos caminhos que a evolução pode tomar entre elas.”
“Escolhemos a funcionalidade da fluorescência porque é difícil de obter, fácil de medir e um dos mecanismos mais bonitos da natureza”, justificam ainda os cientistas.
Ainda é necessário submeter este método a testes, mas os cientistas esperam em breve começar a produzir proteínas para diversas áreas da ciência.
“Os modelos de linguagem proteica não funcionam explicitamente dentro das restrições físicas da evolução, mas podem construir implicitamente um modelo da multiplicidade de caminhos potenciais que a evolução poderia ter seguido”, concluem os investigadores.