OpenAI Triển Khai ChatGPT Images 2.0 Với Khả Năng Tư Duy

Tin nhắn Gate News, ngày 22 tháng 4 — OpenAI bắt đầu triển khai ChatGPT Images 2.0 vào ngày 21 tháng 4 cho tất cả người dùng ChatGPT và Codex, với người dùng trả phí có thể tạo ra các đầu ra tiên tiến hơn. Công ty đã ra mắt API gpt-image-2, với mức giá dựa trên chất lượng đầu ra và độ phân giải.

Mô hình mới cải thiện khả năng hiển thị văn bản nhỏ và các thành phần giao diện người dùng, hỗ trợ các hệ chữ bao gồm tiếng Nhật, tiếng Hàn, tiếng Hindi và tiếng Bengali, đồng thời tuân thủ chi tiết các hướng dẫn chính xác hơn. Images 2.0 giới thiệu khả năng “tư duy”, cho phép mô hình tìm kiếm trên web để lấy thông tin thời gian thực, tạo nhiều hình ảnh riêng biệt từ một yêu cầu duy nhất và tinh chỉnh đầu ra để đảm bảo độ chính xác và tính nhất quán. Các tác vụ tạo phức tạp có thể mất vài phút; mô hình có ngưỡng kiến thức cập nhật đến tháng 12 năm 2025.

OpenAI không công bố kiến trúc của mô hình. Để tham khảo về giá, Imagen 4 của Google có giá từ $0.02 đến $0.06 cho mỗi hình ảnh, trong khi tạo 10,000 hình ảnh với GPT Image 1 Mini ở chế độ chất lượng thấp tốn khoảng $50, so với khoảng $1,670 cho đầu ra chất lượng cao.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

B.AI ra mắt 4 mô hình mới, bao gồm GPT-5.5 Instant, trong vòng 48 giờ sau khi OpenAI phát hành

API B.AI đã ra mắt 4 mẫu mới: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 và GLM-5.1. GPT-5.5 Instant đã hoàn tất việc thích ứng nền tảng và tích hợp giao diện trong vòng 48 giờ sau khi OpenAI ra mắt, cho phép truy cập không độ trễ đến

GateNews10phút trước

Mô hình AI Y tế trị giá 1,7 tỷ USD của Tether vượt trội đối thủ lớn hơn 16 lần vào hôm nay

Theo nhóm nghiên cứu AI của Tether, hôm nay công ty đã ra mắt dòng mô hình ngôn ngữ y tế QVAC MedPsy, được thiết kế để triển khai cục bộ trên điện thoại thông minh và thiết bị đeo mà không cần phụ thuộc đám mây. Phiên bản 1,7B tham số đạt 62,62 trên bảy bộ đánh giá y tế, vượt qua Google MedGemma-4B

GateNews21phút trước

Định giá trước IPO của Anthropic đạt 1,2 nghìn tỷ USD, vượt OpenAI 20%

Theo Odaily, định giá ngụ ý của Anthropic trên thị trường tiền IPO theo blockchain đạt 1,2 nghìn tỷ USD, vượt OpenAI khoảng 20%. Nếu công ty lên sàn theo mức định giá này, công ty sẽ xếp thứ 11 trong số các công ty niêm yết công khai lớn nhất trên toàn cầu tính theo vốn hóa thị trường, sau Apple,

GateNews25phút trước

Sàn chứng khoán Hàn Quốc tăng tốc nhanh hơn các thị trường toàn cầu nhờ làn sóng AI

Thị trường chứng khoán Hàn Quốc đang ghi nhận mức tăng kỷ lục nhờ các cổ phiếu bán dẫn liên quan đến trí tuệ nhân tạo, với chỉ số KOSPI tăng 78% trong năm nay, vượt trội so với mọi thị trường lớn khác trên toàn cầu, theo dữ liệu Financial Modeling Prep được trích dẫn trong một phân tích của Axios. AI

CryptoFrontier33phút trước

DeepL cắt giảm 25% nhân sự (khoảng 250 nhân viên) để tái cơ cấu mảng kinh doanh AI

Theo Bloomberg, công ty phát triển công cụ dịch thuật DeepL đã công bố hôm nay, ngày 7/5, rằng họ sẽ sa thải khoảng 25% nhân sự, tương đương 250 nhân viên, để thích ứng với những thay đổi mang tính cơ cấu do trí tuệ nhân tạo thúc đẩy. CEO Jarek Kutylowski cho biết trên LinkedIn rằng công ty sẽ giảm bớt khâu quản lý

GateNews1giờ trước

NVIDIA công bố Nemotron 3 Nano Omni mã nguồn mở đa phương thức

NVIDIA công bố mô hình đa phương thức mã nguồn mở Nemotron 3 Nano Omni, tích hợp thị giác, giọng nói và ngôn ngữ trong một mô hình, đóng vai trò lớp cảm nhận cho các AI agent. Cốt lõi là 30B-A3B MoE, context 256K, thông lượng 9x, hỗ trợ đầu vào dạng văn bản, hình ảnh, âm thanh, video… và đầu ra là văn bản. Kết hợp với Nemotron 3 Super/Ultra, phù hợp cho các kịch bản như thao tác trên máy tính, trí tuệ tài liệu và hiểu biết đa phương tiện, đồng thời công khai trọng số và dữ liệu huấn luyện, triển khai trên nền tảng cục bộ, NIM và các nền tảng bên thứ ba.

ChainNewsAbmedia1giờ trước
Bình luận
0/400
Không có bình luận