Mensaje de Gate News, 29 de abril — Los pesos del modelo flash Ling-2.6 de Ant Group ahora se han publicado como código abierto, después de haber estado disponibles previamente solo vía API. El modelo cuenta con 104 mil millones de parámetros totales, con 7.4 mil millones activados por inferencia, una ventana de contexto de 256K y licencia MIT. Hay versiones de precisión BF16, FP8 e INT4 disponibles en HuggingFace y ModelScope.
Ling-2.6-flash introduce mejoras en la atención lineal híbrida sobre Ling 2.0, actualizando el GQA original a una arquitectura híbrida 1:7 MLA plus Lightning Linear combinada con MoE altamente disperso. La eficiencia de inferencia supera significativamente a la de modelos comparables: la velocidad máxima de generación alcanza 340 tokens/s en 4 GPUs H20, con un rendimiento de prefill y decode aproximadamente 4 veces mayor que el de modelos comparables de código abierto. Los puntos de referencia relacionados con agentes muestran un rendimiento sólido: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval y PinchBench logran o se acercan a niveles SOTA. En toda la suite de benchmarks de Artificial Analysis, el consumo total de tokens es de solo 15 millones. En AIME 2026, el modelo obtuvo 73.85%.
El sitio web oficial de Ant Group también lista las versiones insignia Ling-2.6-1T (de cientos de miles de millones de parámetros) y Ling-2.6-mini (de versión ligera), aunque a la fecha de publicación, sus pesos aún no se han lanzado en HuggingFace, con solo la serie flash disponible para descarga.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
DeepSeek recauda financiación con una valoración de $45B en medio de la competencia de la IA
El laboratorio de IA chino DeepSeek está en conversaciones para recaudar su primera ronda de financiación con una valoración reportada de 45 mil millones de dólares, según TechCrunch. Esta valoración supone un aumento significativo frente a una valoración estimada de 20 mil millones de dólares solo unas semanas antes, después de que se prestara atención a los modelos de IA de la empresa por
CryptoFrontierHace1m
Huawei y Cambricon integran DeepSeek V4 en chips nacionales; se planean 750.000 unidades Ascend 950PR para 2026
Según el South China Morning Post, Huawei y Cambricon han comenzado a integrar DeepSeek V4 con plataformas de chips nacionales en 2026. Huawei dijo que V4 ya se ejecuta en su Ascend 950PR y otros procesadores Ascend, con planes para producir aproximadamente 750.000 chips 950PR este año tras la producción en masa st
GateNewsHace22m
Microsoft podría retrasar el objetivo de energía con cero emisiones de carbono para 2030, ya que la expansión de centros de datos de IA impulsa las necesidades energéticas
Según Bloomberg, Microsoft podría retrasar o cancelar su objetivo de 2030 para hacer coincidir todo el consumo de electricidad de cada hora con energía de cero emisiones, ya que la expansión de centros de datos de IA incrementa las necesidades de energía y los costos. El objetivo 100/100/0, anunciado en 2021, es más estricto que el objetivo anual de la empresa de igualar la energía renovable correspondiente a la demanda
GateNewsHace22m
Google DeepMind para entrenar IA en Eve Online, adquiere una participación minoritaria en Fenris Creations
Según Bloomberg, el 6 de mayo, Google DeepMind anunció que entrenará sistemas de IA en Eve Online y tomará una participación minoritaria en Fenris Creations, la compañía detrás del juego espacial multijugador. La inversión es de varios millones de dólares. El ejecutivo de DeepMind, Adrian Bolton, dijo que Eve Online pone a prueba la IA
GateNewsHace22m
Apple eleva la I+D al máximo de 30 años con un impulso de inversión en IA
Apple destinó el 10,3% de sus ingresos a investigación y desarrollo en su trimestre de marzo, lo que marca la mayor proporción de I+D en al menos 30 años, mientras la empresa intensifica el desarrollo de IA, según CNBC. El gasto en I+D aumentó casi un 34% interanual, mientras que los ingresos crecieron 17%, según la empresa. La empresa
CryptoFrontierHace31m
Anthropic firma el Colossus 1 de SpaceX para computación de IA
Anthropic anunció el miércoles que utilizaría toda la capacidad de cómputo en el centro de datos Colossus 1 de SpaceX, marcando la asociación más reciente en la expansión de la infraestructura de IA del fabricante de Claude.
El acuerdo subraya la estrategia de Anthropic de asegurar recursos de cómputo dedicados a medida que escala su IA
CryptoFrontierHace49m