Arcee Meluncurkan Trinity Large Thinking Open Source dengan Biaya 4% dari Opus 4.6

robot
Pembuatan abstrak sedang berlangsung

Menurut 1M AI News, perusahaan model AI asal Amerika, Arcee, telah merilis Trinity-Large-Thinking, sebuah model reasoning open-source yang dirancang untuk tugas Agent berdurasi panjang. Model ini menggunakan arsitektur sparse mixture of experts (MoE), dengan total 400 miliar parameter dan hanya 13 miliar parameter aktif, tersedia untuk diunduh di bawah lisensi Apache 2.0 di Hugging Face. Berbeda dari pendahulunya Trinity-Large-Preview (murni instruksi fine-tuning), Trinity-Large-Thinking melakukan reasoning sebelum menjawab, menunjukkan peningkatan dalam pemanggilan tool multi-babak, koherensi konteks panjang, dan kemampuan mengikuti instruksi, dengan tujuan desain inti untuk menjaga output yang stabil selama siklus Agent berdurasi panjang. Model ini memperoleh skor 91,9 pada benchmark kemampuan Agent PinchBench, menempati peringkat kedua, tepat di belakang skor Opus 4.6 sebesar 93,3; pada benchmark tugas Agent Tau2-Airline, model ini meraih skor 88,0, tertinggi di antara semua model pembanding. Namun, kinerjanya pada benchmark reasoning umum tergolong rata-rata: ia memperoleh 76,3 pada GPQA-D, lebih rendah daripada Kimi-K2.5 (86,9) dan Opus 4.6 (89,2); dan 83,4 pada MMLU-Pro, juga menempati peringkat terakhir. Menurut Arcee, model ini adalah “model open-source terkuat di luar China pada banyak dimensi.” API Arcee dibanderol $0,90 per satu juta token, yang diklaim Arcee sekitar 96% lebih murah daripada Opus 4.6. Model ini juga tersedia di platform routing model AI OpenRouter, di mana ia dapat digunakan secara gratis di OpenClaw untuk lima hari pertama. Sejak dirilis pada akhir Januari, Preview sebelumnya telah melayani lebih dari 33,7 triliun token di OpenRouter, menjadikannya model open-source yang paling banyak digunakan di AS dan peringkat keempat secara global, sementara Preview terus ditawarkan gratis di OpenRouter.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan