Alibaba lanza el modelo de código abierto AgenticQwen de PAI: la versión 8B se acerca al rendimiento de 235B mediante volantes de doble dato

GateNews

Mensaje de Gate News, 27 de abril — El equipo de PAI de Alibaba ha lanzado y ha publicado como código abierto AgenticQwen, un modelo lingüístico agentico de pequeña escala diseñado para aplicaciones industriales de llamadas a herramientas. El modelo viene en dos versiones: 8B y 30B-A3B. Entrenado mediante un innovador marco de aprendizaje por refuerzo de “doble volante de datos”, AgenticQwen logra capacidades agenticas a nivel de modelo cercanas a las de un modelo de varios billones de parámetros, al tiempo que reduce significativamente los costos de inferencia.

El mecanismo del doble volante de datos aborda el problema de homogenización en los datos sintéticos tradicionales. El volante de razonamiento genera automáticamente variantes más difíciles a partir de errores del modelo, mientras que el volante agentico amplía flujos de trabajo lineales simples (como procesos de reserva individual) en árboles de comportamiento de múltiples ramas con restricciones, rechazos y condiciones adversarias, simulando escenarios reales de decisiones complejas. Los benchmarks muestran que AgenticQwen-8B obtuvo 47.4 en benchmarks de entorno de herramientas reales (TAU-2 y BFCL-V4), superando muy por encima a Qwen3-8B base (23.8) y acercándose a Qwen3-235B (52.0). AgenticQwen-30B-A3B (con solo 3B parámetros activados) logró 50.2.

El modelo se ha desplegado en sistemas de producción internos similares a Manus, reduciendo de manera significativa la brecha con los modelos de 235B en el tiempo de inferencia de extremo a extremo. Sin embargo, el modelo está limitado por una longitud de contexto nativa de 40K tokens, lo que restringe su rendimiento en tareas de búsqueda profunda.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

AWS, Coinbase, Stripe lanzan pagos con USDC para agentes de IA

Amazon Web Services anunció el jueves el lanzamiento de «Amazon Bedrock AgentCore Payments», un nuevo conjunto de funciones que permite a los agentes de IA ejecutar transacciones usando stablecoins en colaboración con Coinbase y Stripe. La plataforma permite a los agentes de IA acceder y pagar al instante por servicios, incluidos la web c

CryptoFrontierhace2h

CZ dice que YZi Labs asigna el 70% a blockchain y el 20% a IA en Consensus Miami 2026

Según ChainCatcher, en Consensus Miami 2026, Zhao Changpeng (CZ) afirmó que YZi Labs asigna el 70% de la financiación a blockchain, el 20% a IA y el 10% a biotecnología. CZ añadió que BNB debería posicionarse como una moneda nativa para agentes de IA, y que todas las blockchains deben estar “listas para la IA” para respaldar

GateNewshace3h

Zypher Network integra AIDEN para mejorar la accesibilidad del conocimiento sobre blockchain

Según el anuncio oficial de IQ AI del 6 de mayo, Zypher Network integró AIDEN, un agente de inteligencia artificial desarrollado por IQ AI, para mejorar la accesibilidad del conocimiento sobre blockchain y reforzar la auditabilidad dentro de ecosistemas impulsados por IA. La colaboración presenta una página wiki dedicada

GateNewshace3h

Virtuals Protocol lanza el airdrop OpenGradient Titan, distribuye 500K OPG hoy

Según el anuncio oficial de Virtuals Protocol, el lanzamiento del airdrop OpenGradient Titan ya está en marcha a partir del 7 de mayo. Los usuarios elegibles pueden reclamar tokens OPG directamente desde sus cuentas de Virtuals. Hoy se distribuyen un total de 500.000 tokens OPG para recompensar a los contribuidores de Virtuals

GateNewshace7h

NVIDIA lanza Nemotron 3 Nano Omni, código abierto multimodal

NVIDIA publica el modelo multimodal de código abierto Nemotron 3 Nano Omni, que integra visión, voz y lenguaje en un único modelo, como capa de percepción para agentes de IA. Su núcleo es 30B-A3B MoE, con contexto de 256K y un rendimiento de 9x; admite entradas de texto, imágenes, audio y video, y genera salidas en forma de texto. En colaboración con Nemotron 3 Super/Ultra, es aplicable a escenarios como operación de computadoras, inteligencia de documentos y comprensión audio-visual, y publica los pesos y los datos de entrenamiento, con despliegue que abarca local, NIM y plataformas de terceros.

ChainNewsAbmediahace8h

NeoSoul y AllScale anuncian una asociación estratégica sobre créditos para agentes y liquidación de stablecoin hoy

Según ChainCatcher, el proyecto de economía de agentes de IA NeoSoul anunció hoy (7 de mayo) una asociación estratégica con AllScale para explorar mecanismos de formación de crédito y liquidación con stablecoins para la colaboración autónoma de agentes. La asociación se centrará en automatizar los flujos de pagos entre agentes—tal

GateNewshace8h
Comentar
0/400
Sin comentarios