Mensagem do Gate News, 29 de abril — Os investigadores da OpenAI, Sébastien Bubeck e Ernest Ryu, afirmam que os sistemas de IA poderiam executar a maior parte do trabalho de investigação humana no prazo de dois anos, apresentando a matemática como uma medida clara do progresso da IA. Ao contrário de testes de desempenho pouco concretos, os problemas matemáticos oferecem uma verificação precisa: as respostas são ou correctas ou incorrectas, sem espaço para ambiguidades.
Bubeck salientou que o verdadeiro raciocínio por IA exige resistir a longas cadeias de raciocínio. Um único erro num argumento multi-etapas colapsa toda a prova, tornando a detecção e correcção de erros no meio do processo o objectivo final para modelos avançados. Os laboratórios internos da OpenAI já geraram mais de dez teoremas completamente novos, publicáveis em revistas de combinatória de topo, demonstrando que a IA já produz trabalho genuinamente original e inovador, para além de simplesmente recombinar artigos existentes.
No entanto, avanços científicos sustentados exigem foco constante ao longo de semanas de testes. Os sistemas actuais ainda requerem supervisão humana rigorosa para orientar e verificar cada mudança de direcção. Bubeck usa “tempo de AGI” para medir durante quanto tempo um modelo consegue imitar autonomamente o pensamento humano; os sistemas actuais operam a cerca de dias a uma semana, com a meta da indústria a ser de semanas ou meses para permitir trabalho autónomo em áreas como a biologia.
A memória de longo prazo é crucial para este futuro. As janelas de chat padrão limitam a profundidade — as provas matemáticas complexas muitas vezes excedem 50 páginas — enquanto os repositórios de código demonstram como sessões de trabalho prolongadas permitem uma resolução mais profunda de problemas. À medida que a IA ganha independência e memória, a perícia humana torna-se mais valiosa, não menos. Os trabalhadores têm de reter o conhecimento profundo e de base para desafiar e verificar as respostas da máquina, e as organizações terão de criar novos filtros automatizados e sistemas de reputação para manter a confiança perante um dilúvio de investigação assistida por IA.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Public adquire a plataforma de investimento em IA Treasury App para expandir o trading de cripto
De acordo com a ChainCatcher, a Public anunciou a aquisição da plataforma de serviços de investimento em IA Treasury App para reforçar o seu negócio de corretagem orientado por IA. O montante da aquisição não foi divulgado. Atualmente, a Public apoia a negociação de ações, obrigações e criptomoedas, incluindo Bitcoin, Ethereum, a
GateNews47m atrás
A Blitzy concluiu $200M ronda de financiamento liderada pela Northzone
De acordo com a ChainCatcher, a Blitzy, uma empresa de codificação com IA cofundada pelo antigo arquitecto da Nvidia Sid Pardeshi, concluiu uma ronda de financiamento de 200 milhões de dólares liderada pela Northzone. Battery Ventures, Jump Capital e Morgan Creek Digital participaram na ronda. A plataforma consegue analisar sistemas complexos com
GateNews1h atrás
A UE proíbe pornografia deepfake gerada por IA a 7 de maio
De acordo com a agência noticiosa Xinhua, a 7 de maio, os membros do Parlamento Europeu e os Estados-Membros chegaram a um consenso para proibir os sistemas de inteligência artificial de gerarem conteúdos pornográficos deepfake. A proibição será incorporada em alterações ao Regulamento de Inteligência Artificial de 2024. Parlamento Europeu
GateNews1h atrás
A Tether lança o modelo de IA médica MedPsy QVAC, atingindo uma pontuação de 62,62 na versão com 17 mil milhões de parâmetros
De acordo com a Odaily, o Tether AI Research Group lançou o QVAC MedPsy, um modelo de IA médica concebido para funcionar localmente em smartphones e dispositivos vestíveis, sem dependência de nuvem. A versão com 1,7 mil milhões de parâmetros obteve 62,62 em sete benchmarks médicos, superando o MedGemma-1.5-4B da Google em 11,42 poi
GateNews2h atrás
A API da B.AI lança quatro novos modelos, incluindo o GPT-5.5 Instant, no espaço de 48 horas após o lançamento da OpenAI
A API da B.AI lançou quatro novos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 e GLM-5.1. O GPT-5.5 Instant concluiu a adaptação subjacente e a integração da interface no prazo de 48 horas após o lançamento da OpenAI, permitindo acesso sem atraso a
GateNews2h atrás
O modelo de IA médica da Tether, no valor de 1,7 mil milhões, supera hoje um concorrente 16 vezes maior
De acordo com a equipa de investigação em IA da Tether, a empresa lançou hoje a série de modelos de linguagem médica QVAC MedPsy, concebida para implementação local em smartphones e dispositivos vestíveis, sem dependência da nuvem. A versão com 1,7 mil milhões de parâmetros obteve 62,62 em sete benchmarks médicos, superando o Google MedGemma-4B
GateNews2h atrás