DeepSeek propõe novo método de treinamento de IA e reacende debate sobre eficiência e custos
A startup chinesa DeepSeek publicou recentemente um paper técnico que apresenta um novo método de treinamento para grandes modelos de inteligência artificial, chamado Manifold-Constrained Hyper-Connections (mHC). À primeira vista, trata-se de uma contribuição acadêmica sobre arquitetura de redes neurais. Na prática, porém, o trabalho vai além: ele toca diretamente em um dos maiores gargalos da […]
English 

