Os ingredientes ocultos por trás da criatividade da IA

agosto 24, 2025

A versão original de esta história apareceu em Quanta revista.

Uma vez nos prometemos carros autônomos e empregadas de robôs. Em vez disso, vimos a ascensão de inteligência artificial Sistemas que podem nos vencer no xadrez, analisar enormes resmas de texto e compõem sonetos. Essa tem sido uma das grandes surpresas da era moderna: tarefas físicas que são fáceis para os seres humanos acabam sendo muito difíceis para os robôs, enquanto os algoritmos são cada vez mais capazes de imitar nosso intelecto.

Outra surpresa que há muito tempo os pesquisadores perplexos são os talentos dos algoritmos para o seu próprio tipo de criatividade estranha.

Os modelos de difusão, a espinha dorsal das ferramentas de geração de imagens, como Dall · E, Imagen e difusão estável, são projetados para gerar cópias de carbono das imagens nas quais foram treinados. Na prática, no entanto, eles parecem improvisar, misturando elementos dentro das imagens para criar algo novo – não apenas bolhas de cor, mas imagens coerentes com significado semântico. Este é o “paradoxo” por trás dos modelos de difusão, disse Giulio Birolium pesquisador e físico da IA da École Normale Supérrieure em Paris: “Se eles funcionassem perfeitamente, deveriam apenas memorizar”, disse ele. “Mas eles não – eles são realmente capazes de produzir novas amostras.”

Para gerar imagens, Os modelos de difusão usam um processo conhecido como denoishing. Eles convertem uma imagem em ruído digital (uma coleção incoerente de pixels) e depois a remonta. É como colocar repetidamente uma pintura através de um triturador até que tudo o que você tenha deixado é uma pilha de poeira fina e remendando as peças novamente. Durante anos, os pesquisadores se perguntam: se os modelos estão apenas remontando, como a novidade entra em cena? É como remontar sua pintura ralada em uma obra de arte completamente nova.

Agora, dois físicos fizeram uma afirmação surpreendente: são as imperfeições técnicas no próprio processo de denoising que leva à criatividade dos modelos de difusão. Em um papel Apresentado na Conferência Internacional sobre Aprendizagem de Machine 2025, a dupla desenvolveu um modelo matemático de modelos de difusão treinados para mostrar que sua chamada criatividade é de fato um processo determinístico-uma conseqüência direta e inevitável de sua arquitetura.

Ao iluminar a caixa preta de modelos de difusão, a nova pesquisa pode ter grandes implicações para futuras pesquisas de IA – e talvez até para nossa compreensão da criatividade humana. “A verdadeira força do artigo é que ele faz previsões muito precisas de algo muito não trivial”, disse Luca Ambrogionium cientista da computação na Universidade de Radboud, na Holanda.

Bottoms up

Mason Kambum estudante de pós-graduação que estuda física aplicada na Universidade de Stanford e o principal autor do novo artigo, há muito é fascinado pela morfogênese: os processos pelos quais os sistemas vivos se auto-montam.

Uma maneira de entender o desenvolvimento de embriões em humanos e outros animais é através do que é conhecido como um Padrão de Turingnomeado após o matemático do século XX Alan Turing. Os padrões de Turing explicam como os grupos de células podem se organizar em órgãos e membros distintos. Fundamentalmente, tudo essa coordenação ocorre em nível local. Não há CEO supervisionando os trilhões de células para garantir que todos eles se conformem a um plano final do corpo. As células individuais, em outras palavras, não têm algum plano acabado de um corpo no qual basear seu trabalho. Eles estão apenas agindo e fazendo correções em resposta a sinais de seus vizinhos. Esse sistema de baixo para cima geralmente funciona sem problemas, mas de vez em quando dá errado-produzindo mãos com dedos extras, por exemplo.

Ver artigo original (Em Inglês)