Os modelos de inteligência artificial que dominam nosso dia a dia — de assistentes virtuais a sistemas de recomendação — aprendem a partir de grandes conjuntos de dados. No entanto, eles ainda enfrentam limitações quando precisam reconhecer padrões que mantêm sua essência sob transformações, como a rotação de uma molécula ou a mudança de posição de um objeto em uma foto. Para um ser humano, olhar uma estrutura química de diferentes ângulos não altera sua identidade; para uma IA tradicional, cada rotação pode parecer um elemento totalmente novo. Essa incapacidade de perceber simetrias prejudica a precisão e exige grandes volumes de dados para treinar os algoritmos. Um estudo do Instituto de Tecnologia de Massachusetts (MIT), publicado em 30 de julho de 2025, propõe uma solução inovadora ao demonstrar que é possível treinar algoritmos de aprendizado de máquina de forma eficiente, levando em conta essas simetrias.
Por que as simetrias importam
A pesquisa parte da observação de que muitos dados de interesse científico e industrial são simétricos. Imagens de estruturas moleculares, por exemplo, mantêm suas propriedades ao serem rotacionadas; na física, eventos permanecem equivalentes quando observados de diferentes pontos de referência. Quando um modelo não compreende essa propriedade, ele precisa ver inúmeras variações de um mesmo objeto para aprender a reconhecê‑lo em diferentes posições. A abordagem tradicional é duplicar manualmente os dados (data augmentation), girando ou refletindo cada exemplo para que a IA aprenda a generalizar. Embora útil, essa técnica multiplica o custo computacional e não garante que o modelo respeite a simetria de maneira rigorosa.
Outra estratégia é incorporar a simetria diretamente na arquitetura, como nos grafos neurais (GNNs), que conseguem manipular estruturas que não dependem da ordem dos elementos. Embora eficientes, esses modelos ainda são em grande parte “caixas‑pretas”; sabe‑se que funcionam bem, mas não se entende exatamente o porquê. A equipe do MIT, liderada pelos doutorandos Behrooz Tahmasebi e Ashkan Soleymani sob a supervisão da professora Stefanie Jegelka e do professor Patrick Jaillet, buscou abordar a questão de forma mais fundamental: seria possível provar matematicamente que existe um método eficiente para aprender com dados simétricos?
Da teoria à prática: combinando álgebra e geometria
Os pesquisadores começaram com uma análise teórica do chamado “trade‑off estatístico‑computacional”. Em aprendizagem de máquina, métodos que exigem menos dados costumam ser mais caros do ponto de vista de processamento, obrigando cientistas a encontrar um equilíbrio entre velocidade e volume de informações. A equipe avaliou como esse trade‑off se comporta quando os dados possuem simetrias e, a partir dessa avaliação, desenvolveu um novo algoritmo que aproveita essas propriedades de forma otimizada.
A solução proposta reúne ferramentas de dois ramos da matemática. Da álgebra, eles tomaram emprestado o conceito de decompor problemas complexos em partes menores; da geometria, a ideia de representar as simetrias de forma que fiquem “embutidas” na formulação do problema. Ao combinar essas duas abordagens, reescreveram o desafio de aprender com dados simétricos como um problema de otimização mais simples. Esse método reduz significativamente a quantidade de exemplos necessária para o treinamento e, ao mesmo tempo, diminui o custo computacional, algo essencial para aplicações de grande escala.
Os autores mostram que, ao contrário das técnicas de data augmentation, que apenas replicam dados, o novo algoritmo incorpora as simetrias de maneira estrutural. Ele trata diferentes rotações ou permutações de um objeto como manifestações de uma mesma entidade, dispensando a necessidade de duplicar o conjunto de treinamento. O resultado é um modelo que aprende mais rápido, com menos dados e menor consumo de recursos computacionais, além de manter maior robustez quando exposto a novas variações do mesmo padrão.
Impactos para a ciência e a indústria
A descoberta tem implicações diretas em diversas áreas. Na pesquisa de novos medicamentos, modelos que preveem propriedades de moléculas poderiam se beneficiar imediatamente. Ao reconhecer que uma molécula rotacionada é a mesma substância, a IA evita conclusões equivocadas sobre sua estabilidade ou eficácia. Da mesma forma, na descoberta de novos materiais, algoritmos capazes de entender simetrias podem acelerar a busca por compostos com propriedades específicas, reduzindo o número de experimentos laboratoriais necessários. Os autores também citam aplicações em astronomia, onde padrões no espaço podem aparecer sob diferentes orientações, e na climatologia, em que simetrias em dados atmosféricos ajudam a identificar anomalias em padrões complexos.
Além dos benefícios práticos, a abordagem abre uma janela para estudar arquiteturas como GNNs de forma mais transparente. Entender como esses modelos lidam com simetria pode levar ao desenvolvimento de redes neurais mais interpretáveis e menos propensas a erros inesperados. “Assim que compreenderemos melhor como funciona o nosso algoritmo, poderemos desenhar arquiteturas neurais mais robustas e eficientes”, explica Soleymani.
Perspectivas e próximos passos
A pesquisa do MIT demonstra que os obstáculos para treinar modelos de IA com dados simétricos podem ser superados sem sacrificar eficiência. No entanto, ainda há desafios a serem explorados. Os cientistas pretendem estender o algoritmo para lidar com outros tipos de invariâncias, como translações e reflexões em espaços de alta dimensão. Outro caminho será integrar essa abordagem a arquiteturas existentes, como GNNs, para criar modelos híbridos que combinem o melhor de ambos os mundos: a capacidade interpretativa do novo método e a flexibilidade dos grafos neurais.
Também é necessário investigar como o algoritmo se comporta em cenários do mundo real, onde os dados podem apresentar ruído ou simetrias imperfeitas. Experimentos com dados de química quântica, imagens médicas ou observações astronômicas poderão revelar limites e oportunidades de melhoria. Finalmente, há o desafio de transformar a teoria em aplicações industriais robustas. Para empresas de biotecnologia, farmácia e materiais avançados, a incorporação de modelos simetricamente conscientes poderia reduzir custos e acelerar a inovação.
Conclusão
O trabalho dos pesquisadores do MIT mostra que respeitar as simetrias naturais dos dados não é apenas uma elegância matemática, mas também uma estratégia prática para construir modelos de inteligência artificial mais eficientes e confiáveis. Ao combinar ideias de álgebra e geometria para criar um algoritmo que aprende com menos exemplos e menor gasto computacional, eles apontam um caminho promissor para a próxima geração de tecnologias de IA. Se implementada em larga escala, essa abordagem pode revolucionar áreas que dependem de análise de dados complexos, do design de medicamentos à exploração espacial, tornando a IA não apenas mais poderosa, mas também mais alinhada às regularidades do mundo real.