ゲートニュース速報、4月24日—DeepSeekは、MITライセンスのもとでオープンソースのV4シリーズモデルをリリースしました。重みは現在Hugging FaceおよびModelScopeで利用可能です。このシリーズには2つのモーダル・エキスパート (MoE)モデルが含まれています。V4-Proは総パラメータ1.6兆で、1トークンあたり490億が有効化され、V4-Flashは総パラメータ2840億で、1トークンあたり130億が有効化されます。両方とも1,000,000トークンのコンテキストウィンドウをサポートします。
アーキテクチャには3つの重要なアップグレードがあります。圧縮されたスパース注意 (CSA) と大幅に圧縮された注意 (HCA) を組み合わせたハイブリッド注意メカニズムにより、ロングコンテキストのオーバーヘッドを大幅に削減—V4-Proの1Mコンテキストにおける推論FLOPsはV3.2のわずか27%であり、推論中に歴史情報を格納するためのKVキャッシュ (VRAM) はV3.2の10%にとどまります。従来の残差接続に代わり、層間の信号伝播の安定性を高めるマニフォールド制約付きハイパーコネクション (mHC)。そして、より速い学習収束のためのMuonオプティマイザです。事前学習では32兆トークン以上のデータを使用しました。
事後学習は2段階のアプローチを採用します。まず、教師あり微調整 (SFT) とGRPO強化学習によりドメイン固有のエキスパートを訓練し、その後オンライン蒸留によってそれらを単一モデルに統合します。V4-Pro-Max (最高推論モード)は、トップクラスのコーディングベンチマークを備え、推論およびエージェントタスクにおけるクローズドソースのフロンティアモデルとのギャップを大幅に縮めた、最強のオープンソースモデルであると主張しています。V4-Flash-Maxは、十分な計算予算がある場合にProレベルの推論性能を実現しますが、純粋な知識および複雑なエージェントタスクにおいてはパラメータ規模によって制約を受けます。重みは混合精度のFP4+FP8で保存されます。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
CZ氏は、Consensus Miami 2026で、YZi Labsがブロックチェーンに70%、AIに20%を割り当てると述べた
ChainCatcherによると、Consensus Miami 2026において、趙長鵬(CZ)は、YZi Labsが資金の70%をブロックチェーンに、20%をAIに、そして10%をバイオテクノロジーに割り当てていると述べた。CZはさらに、BNBはAIエージェントのためのネイティブ通貨として位置づけるべきだとし、すべてのブロックチェーンは「AI ready」である必要があると付け加えた
GateNews2時間前
パブリックは暗号取引を拡大するためにAI投資プラットフォームのTreasuryアプリを買収
ChainCatcherによると、PublicはAI投資サービス・プラットフォームのTreasury Appを買収し、AI主導のブローカレッジ事業を強化すると発表した。買収額は明らかにされていない。Publicは現在、Bitcoin、Ethereumを含む株式、債券、暗号資産の取引をサポートしている。
GateNews3時間前
Blitzy、Northzoneが主導する$200M 資金調達ラウンドを完了
ChainCatcherによると、元Nvidiaの建築家であるSid Pardeshiが共同設立したAIコーディング企業Blitzyは、Northzoneが主導した2億ドル規模の資金調達ラウンドを完了した。Battery Ventures、Jump Capital、Morgan Creek Digitalもこのラウンドに参加した。プラットフォームは複雑なシステムを解析でき、
GateNews4時間前
EUは5月7日にAI生成ディープフェイクのポルノを禁止
新華社によると、5月7日、EU議会の議員と加盟国は、人工知能システムがディープフェイクのポルノコンテンツを生成することを禁止することで合意に達した。この禁止は、2024年の人工知能法の改正案に盛り込まれる予定だ。欧州議会
GateNews5時間前
テザーがQVAC MedPsyの医療AIモデルをリリースし、17Bパラメータ版で62.62のスコアを達成
Odailyによると、Tether AI Research Groupは、クラウドに依存せずにスマートフォンやウェアラブル端末上でローカル実行することを目的とした医療AIモデル「QVAC MedPsy」をリリースした。17億パラメータ版は7つの医療ベンチマークで62.62を獲得し、GoogleのMedGemma-1.5-4Bを11.42 poi上回った。
GateNews5時間前
B.AI API、OpenAIのリリースから48時間以内にGPT-5.5 Instantを含む4つの新モデルを発表
B.AI APIは、新しい4つのモデルを発表しました。GPT-5.5 Instant、DeepSeek-v3.2、MiniMax-M2.7、そしてGLM-5.1です。GPT-5.5 Instantは、OpenAIのリリースから48時間以内に基盤となる適応とインターフェース統合を完了し、遅延ゼロでのアクセスを可能にしました。
GateNews5時間前