نتائج البحث عن "GPT"
اليوم
01:46

أطلقت OpenAI GPT-5.5، المصممة لمهام الوكلاء وسير العمل المعقدة

رسالة أخبار جيت، 24 أبريل — قامت OpenAI رسميًا بإصدار GPT-5.5، وهو نموذج ذكاء اصطناعي من الجيل التالي مصمم للتعامل مع الأهداف المعقدة، وتكامل الأدوات، والتحقق الذاتي، وإكمال المهام متعددة الخطوات. يتفوق النموذج في كتابة التعليمات البرمجية وتصحيح الأخطاء، والبحث عبر الإنترنت، وتحليل البيانات، وإنشاء المستندات
المزيد
04:54

Perplexity 揭示网页搜索代理的后训练方法;基于 Qwen3.5 的模型在准确率与成本方面优于 GPT-5.4

Perplexity 使用带有 Qwen3.5 模型的 SFT,随后采用 RL,并结合多跳问答数据集与评分细则校验来提升搜索的准确性与效率,实现同类最佳的 FRAMES 表现。 摘要:Perplexity 面向网页搜索代理的后训练流程,将监督微调 (SFT) 与通过 GRPO 算法进行的在线强化学习 (RL) 结合。该流程通过在线强化学习来确保指令遵循与语言一致性。RL 阶段使用专有的多跳可验证问答数据集以及基于评分细则的对话数据,以防止 SFT 漂移,并采用奖励门控与组内效率惩罚。评估显示,Qwen3.5-397B-SFT-RL 在 FRAMES 上取得顶级表现:单次工具调用准确率为 57.3%,四次调用为 73.9%,单次查询成本为 $0.02;在这些指标上优于 GPT-5.4 与 Claude Sonnet 4.6。定价基于 API,并且不包含缓存。
المزيد
12:05

Kimi K2.6 登顶 OpenRouter 编程基准,超越 Claude 与 GPT 系列

Kimi K2.6 登顶 OpenRouter 榜单,超越 Claude、GPT 以及开源对手,表明国内 AI 取得进展,并缩小与全球领先者的差距。 摘要:Kimi.ai 宣布其最新模型 Kimi K2.6 在 OpenRouter 编程能力排行榜中排名第一,在开发者评估中领先。基准测试表明,K2.6 相较于 Claude、GPT 系列以及其他开源模型,在编程任务上提供了更出色的表现,凸显其在代码生成和开发任务处理方面的提升,并传递出国内 AI 向国际领先水平迈进的信号。
المزيد
07:05

إزالة Claude Code لدى Anthropic تُشعل موجة غضب لدى المطورين؛ OpenAI تحظى بدعم المجتمع

أعلنت شركة Anthropic عن إسقاط Claude Code من خطة Pro، ما أثار انتقادات مع انتقال المطورين إلى OpenAI؛ يظل Codex مجانيًا/أساسيًا، وتُحسّن GPT-5.4 وImage 2.0 الأداء، ما يدفع إلى انتقال واسع للمستخدمين. ملخص: تستعرض المقالة إزالة Anthropic لـ Claude Code من خطة $20 Pro، وهو ما يؤدي إلى رد فعل عنيف من المطورين الذين يصفونه بزيادة أسعار خفية وخطرًا على الاعتمادية. وتقارن هذا القرار بسياسة OpenAI المتمثلة في إبقاء Codex ضمن الفئات المجانية والأساسية، مع إبراز الأداء القوي للنماذج من GPT-5.4 وChatGPT Images 2.0، وتشير إلى انتقال سريع للمستخدمين إلى OpenAI، حيث يُقال إن Codex تجاوز 4 ملايين مستخدم نشط أسبوعيًا.
المزيد
04:09

يظهر GPT-5.5 في مُحدد OpenAI Codex لكنه يُرجع خطأ 400، وهو غير متاح حاليًا

بوابة الأخبار — رسالة 22 أبريل: ظهر GPT-5.5 في قائمة اختيار النماذج الخاصة بـ OpenAI Codex، معروضًا في أعلى القائمة. ومع ذلك، عندما يختار المستخدمون GPT-5.5 ويقدمون طلبًا، يُرجع Codex خطأ 400 مع الرسالة "لا يتم دعم نموذج 'gpt-5.5' عند استخدام Codex مع حساب ChatGPT." النموذج غير متاح حاليًا. لم تُصدر OpenAI أي إعلان رسمي أو وثائق تتعلق بـ GPT-5.5 حتى الآن.
المزيد
09:03

أطلقت OpenAI GPT-4.5 بقدرات محسّنة على الاستدلال، مع تسعير $75 لكل مليون من رموز الإدخال

أطلقت OpenAI GPT-4.5، مما يحسّن الأداء والقدرات، لكنّه لا يزال يتأخر في الاستدلال المتقدم مقارنةً بالمنافسين. تختلف إمكانية الوصول حسب الاشتراك، ويُتوقع ظهور نماذج مستقبلية مثل GPT-5.
المزيد
01:39

Microsoft تعمل على إطلاق ميزتي Critique و Council في Copilot Researcher، وتُظهر نتائج اختبار DRACO درجة 57.4 متقدمة على الصناعة

أعلنت Microsoft عن ميزة جديدة لـ Copilot Researcher باسم Critique وCouncil، بالاستفادة من GPT من OpenAI وClaude من Anthropic، لتحسين جودة مهام البحث. في 100 مهمة معقدة، حقق نمط Critique درجة 57.4، متقدّمًا بشكل ملحوظ على النماذج الأخرى.
المزيد
05:07

20B نموذج صغير يبحث عن القدرة على المنافسة مع GPT-5 وOpus: قاعدة بيانات المتجهات Chroma تفتح نموذج البحث Agent Context-1

قاعدة البيانات المفتوحة المصدر Chroma أصدرت Context-1، وهو نموذج بحث ذكي مكون من 20 مليار معلمة للبحث متعدد الجولات. يعتمد هذا النموذج على تقنية تحرير السياق الذاتي، ويتدرب على مهام متعددة من خلال التعلم المعزز وآلية الدورات، حيث أظهر أداءً ممتازًا، خاصة في مجالات الويب والمالية والقانون، وقد أظهر أيضًا قدرة على البحث عبر المجالات في مجال البريد الإلكتروني.
المزيد
04:22

هل اقتربت "لحظة GPT" للذكاء المجسد؟ تعلن Axis Robotics عن إنهاء الاختبار، والاستعداد للعمل قريباً على سلسلة Base

> مصدر المقالة: Axis Axis Robotics تعيد تشكيل تنوع البيانات والإنتاج على نطاق واسع للذكاء المُجسد من خلال استراتيجية تركز على المحاكاة أولاً (Simulation-First). في عام 2025، تتقارب عدة مسارات تقنية في صناعة الروبوتات بسرعة: الترقية التجارية لسلاسل التوريد للأجهزة المجسدة، مما يمنح النماذج الأولية الباهظة الثمن التي كانت في الماضي احتمالية واقعية للنشر على نطاق واسع للمرة الأولى؛ نماذج رؤية-لغة-إجراء (VLA) التي تجلب للروبوتات "دماغًا" قادرًا على فهم الدلالات والاستدلال والتخطيط؛ وهرم البيانات المتعدد الطبقات الذي يتكون من المقدمات المرئية إلى التوليف المحاكى، الذي يزود أيضًا الذكاء المجسد بتطور مستمر بوقود لا ينضب. ومع ذلك، لا تزال الصناعة تواجه الاختناق الأساسي الأكثر حدة: البيانات. وبالمقارنة مع نماذج اللغة الكبيرة والقيادة الذاتية، لا يزال الذكاء المجسد يعاني من فجوة بيانات ضخمة في مرحلة التدريب المسبق.
المزيد