
Stanford e Nvidia Otimizam GPUs 2x mais Rápido com TTT-Discover
TL;DR
Pesquisadores de Stanford, Nvidia e Together AI desenvolveram uma técnica inovadora chamada TTT-Discover que melhora a otimização de códigos em GPUs, executando algoritmos duas vezes mais rápidos do que os criados por humanos.
Pesquisadores otimizam desempenho de GPUs utilizando TTT-Discover
Pesquisadores de Stanford, Nvidia e Together AI desenvolveram uma técnica inovadora chamada TTT-Discover (Test-Time Training to Discover) que aprimora a otimização de códigos em GPUs, conseguindo executar algoritmos duas vezes mais rápidos do que os escritos por especialistas humanos, durante o processo de inferência.
A técnica desafia o paradigma atual de modelos "congelados", que são incapazes de aprender após o treinamento. Com o TTT-Discover, o modelo continua a treinar e ajustar seus pesos enquanto tenta resolver um problema específico.
O limite dos modelos 'congelados'
Modelos de IA empresariais frequentemente utilizam abordagens onde os parâmetros permanecem estáticos. Mesmo que esses modelos sejam eficazes em problemas conhecidos, eles falham em situações que exigem soluções inovadoras, como a formulação de algoritmos inéditos.
Como Mert Yuksekgonul, um dos autores do estudo e doutorando em Stanford, mencionou: "Modelos que pensam não conseguiriam provar P != NP sem o treinamento durante a inferência, assim como Andrew Wiles não teria provado o Último Teorema de Fermat sem anos de esforço".
Uma nova abordagem para o aprendizado de reforço
O TTT-Discover propõe um avanço significativo no treinamento de modelos de raciocínio. Diferentemente do aprendizado padrão, que busca um desempenho médio em diversas tarefas, essa técnica foca em encontrar a solução ideal para um problema específico.
Os pesquisadores implementaram dois componentes-chave que diferenciam o TTT-Discover:
- Objetivo entropico: Este componente faz com que o modelo ignore soluções médias e busque ativamente por resultados excepcionais, potencialmente mais recompensadores.
- Busca PUCT: Uma nova estratégia de busca em árvore inspirada no AlphaZero, que explora diferentes caminhos de solução.
Essa técnica é mais eficaz em problemas que apresentam um sinal de recompensa contínuo, permitindo o acompanhamento de melhorias graduais.
Considerações econômicas sobre a inferência pesada
Empresas que pagam por chamadas de API podem precisar mudar sua abordagem, já que um único uso do TTT-Discover pode custar cerca de $500. Essa técnica se mostra mais vantajosa para ativos estáticos e de alto valor.
Por exemplo, otimizar um código crucial em uma empresa que processa grandes volumes de dados pode gerar economias significativas. Yuksekgonul afirma que isso é ideal para decisões de alto impacto, onde a melhoria pode proporcionar um retorno sobre o investimento imediatamente visível.
Considerações sobre a implementação
Uma vantagem do TTT-Discover é que não requer um modelo proprietário. Os pesquisadores utilizaram o gpt-oss-120b, um modelo de código aberto, disponibilizando o código para a comunidade.
Essa flexibilidade permite que as empresas realizem suas otimizações dentro de ambientes seguros, sem a necessidade de enviar dados a servidores externos. "Se uma empresa já utiliza aprendizado por reforço, não há necessidade de infraestrutura adicional", afirma Yuksekgonul.
Casos de uso no mundo real
O TTT-Discover foi aplicado em quatro domínios técnicos e estabeleceu novos padrões de desempenho em muitos casos. Em uma experiência, a otimização de kernels de GPU para multiplicação de matrizes alcançou velocidades até duas vezes mais rápidas do que as melhores opções anteriores.
A técnica é mais adequada para áreas que requerem sinais de progresso verificáveis, como logística e gerenciamento de recursos, onde é fundamental medir o desempenho de maneira objetiva.
Perspectivas futuras e implicações
O futuro da adoção da IA empresarial pode exigir a evolução dos sistemas para suportar aprendizado por problema. "As empresas devem aprender a especificar problemas e a fornecer dados de feedback internos para que o aprendizado no tempo de teste seja eficaz", conclui Yuksekgonul.
A identificação de problemas que possam se beneficiar do TTT-Discover representa uma nova oportunidade para transformar a inferência em um laboratório automatizado de P&D.
Conteudo selecionado e editado com assistencia de IA. Fontes originais referenciadas acima.


