Ciência

A IA combina parceiros de interação de proteínas

Comparando a estratégia de pareamento do transformador MSA padrão do AFM com o DiffPALM para uma estrutura de proteína.

Cientistas da EPFL revelam o DiffPALM, um método inovador de IA que melhora a previsão de interações de proteínas e nossa compreensão de processos biológicos potencialmente relevantes para aplicações médicas.

Proteínas são os blocos de construção da vida, envolvidas em praticamente todos os processos biológicos. Entender como as proteínas interagem umas com as outras é crucial para decifrar as complexidades das funções celulares e tem implicações significativas para o desenvolvimento de medicamentos e o tratamento de doenças.

No entanto, prever quais proteínas se ligam tem sido um aspecto desafiador da biologia computacional, principalmente devido à vasta diversidade e complexidade das estruturas de proteínas. Mas um novo estudo do grupo de Anne-Florence Bitbol na EPFL pode agora mudar tudo isso.

A equipe de cientistas, incluindo Umberto Lupo, Damiano Sgarbossa e Bitbol, ​​desenvolveu o DiffPALM (Differentiable Pairing using Alignment-based Language Models), uma abordagem baseada em IA que pode avançar significativamente a previsão de sequências de proteínas interativas. O estudo é publicado em PNAS.

O DiffPALM alavanca o poder dos modelos de linguagem de proteínas, um conceito avançado de aprendizado de máquina emprestado do processamento de linguagem natural, para analisar e prever interações de proteínas entre os membros de duas famílias de proteínas com precisão sem precedentes. Ele usa essas técnicas de aprendizado de máquina para prever pares de proteínas interagindo. Isso leva a uma melhoria significativa em relação a outros métodos que geralmente exigem conjuntos de dados grandes e diversos e lutam com a complexidade dos complexos de proteínas eucarióticas.

Outra vantagem do DiffPALM é sua versatilidade, pois ele pode trabalhar até mesmo com conjuntos de dados de sequências menores e, portanto, abordar proteínas raras que têm poucos homólogos – proteínas de espécies diferentes que compartilham ancestralidade evolutiva comum. Ele se baseia em modelos de linguagem de proteínas treinados em alinhamentos de sequências múltiplas (MSAs), como o MSA Transformer e o módulo EvoFormer do AlphaFold, o que permite entender e prever as interações complexas entre proteínas com um alto grau de precisão. Ainda mais, usar o DiffPALM mostra-se altamente promissor quando se trata de prever a estrutura de complexos de proteínas, que são estruturas intrincadas formadas pela ligação de múltiplas proteínas e são essenciais para muitos dos processos da célula.

No estudo, a equipe comparou o DiffPALM com métodos tradicionais de pareamento baseados em coevolução, que estudam como as sequências de proteínas evoluem juntas ao longo do tempo quando interagem intimamente – mudanças em uma proteína podem levar a mudanças em seu parceiro de interação. Este é um aspecto extremamente importante da biologia molecular e celular, que é bem capturado por modelos de linguagem de proteínas treinados em MSAs. O DiffPALM demonstrou superar os métodos tradicionais Top of Formon desafiando benchmarks, demonstrando sua robustez e eficiência.

A aplicação do DiffPALM é óbvia no campo da biologia básica de proteínas, mas se estende além dela, pois tem o potencial de se tornar uma ferramenta poderosa em pesquisa médica e desenvolvimento de medicamentos. Por exemplo, prever com precisão as interações de proteínas pode ajudar a entender os mecanismos da doença e desenvolver terapias direcionadas.

Os pesquisadores disponibilizaram o DiffPALM gratuitamente, esperando que a comunidade científica o adote amplamente para promover avanços na biologia computacional e permitir que os pesquisadores explorem as complexidades das interações entre proteínas.

Ao combinar técnicas avançadas de aprendizado de máquina e manuseio eficiente de dados biológicos complexos, o DiffPALM marca um salto significativo na biologia computacional. Ele não apenas aprimora nossa compreensão das interações de proteínas, mas também abre novos caminhos na pesquisa médica, potencialmente levando a avanços no tratamento de doenças e no desenvolvimento de medicamentos.

Referências

Umberto Lupo, Damiano Sgarbossa, Anne-Florence Bitbol. Emparelhamento de sequências de proteínas interativas usando modelagem de linguagem mascarada. PNAS 24 de junho de 2024. DOI: 10.1073/pnas.2311887121

Source

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button