NVIDIA tham gia vào lĩnh vực mô hình AI lớn

robot
Đang tạo bản tóm tắt

Nếu có ai hỏi AI thời đại lớn nhất ai là người chiến thắng, thì câu trả lời gần như không cần bàn cãi—NVIDIA. Nhờ từng tấm H100 khan hiếm như cơn sốt vàng bán cuốc, nó giống như người bán xẻng trong thời kỳ đào vàng: nhìn khắp thế giới các công ty AI đánh nhau đến nát đầu chảy máu, còn mình thì lặng lẽ làm giàu, vốn hóa cứ thế vọt lên bầu trời. Các tài liệu tài chính mới nhất cho thấy, NVIDIA trong 5 năm tới sẽ tích lũy đầu tư 50Bỷ USD, một khoản tiền khổng lồ, để dốc toàn lực thúc đẩy nghiên cứu phát triển các mô hình AI mã nguồn mở. Điều này đồng nghĩa với việc NVIDIA không còn thỏa mãn khi chỉ bán cuốc nữa, mà muốn tự mình xuống hố đào vàng.

ĐẦU TƯ BẰNG MỘT KHOẢN LỚN

Ngày 12 tháng 3, theo các tài liệu tài chính mà NVIDIA nộp lên Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC), NVIDIA sẽ trong 5 năm tới tích lũy đầu tư 128Bỷ USD (khoảng 178.8B nhân dân tệ) để dốc toàn lực thúc đẩy nghiên cứu phát triển các mô hình AI mã nguồn mở. NVIDIA cũng chính thức bắt đầu chuyển đổi chiến lược từ “nhà sản xuất chip” sang “phòng thí nghiệm AI đỉnh cao theo mô hình full-stack”.

Theo kế hoạch, khoản đầu tư 26B USD lần này của NVIDIA không chỉ tập trung vào nghiên cứu một mô hình đơn lẻ, mà bao phủ toàn bộ chuỗi công nghiệp của các mô hình AI mã nguồn mở. Kinh phí sẽ được triển khai dần trong 18 đến 24 tháng tới; các mẫu AI mã nguồn mở tự nghiên cứu đầu tiên nhanh nhất có thể sẽ chính thức ra mắt vào cuối năm 2026 đến đầu năm 2027.

Để so sánh, quy mô đầu tư này vượt xa mức 550Bỷ USD mà OpenAI đã tiêu tốn khi huấn luyện GPT-4. Về lộ trình công nghệ, NVIDIA chọn một “đường giữa” theo mô hình “trọng số mở” (Open-weight). Mô hình này nằm giữa giữa “mã nguồn hoàn toàn đóng” của OpenAI và “mã nguồn hoàn toàn mở” của dòng Llama thuộc Meta.

Cụ thể, NVIDIA sẽ công khai các tham số then chốt (trọng số) của mô hình, cho phép doanh nghiệp và nhà phát triển tải xuống miễn phí, rồi chạy và tinh chỉnh trên thiết bị của mình hoặc trên hạ tầng cloud riêng, nhằm đáp ứng nhu cầu của doanh nghiệp về quyền riêng tư dữ liệu, tùy biến và kiểm soát chi phí. Tuy nhiên, dữ liệu huấn luyện và mã nguồn của mô hình có thể không được công khai hoàn toàn.

Nhà sáng lập Laude Institute, một tổ chức phi lợi nhuận tập trung thúc đẩy tính mở của AI, và nhà khoa học máy tính Andy Konwinski, lại định tính khoản đầu tư của NVIDIA là một tín hiệu mang tính mốc. “Họ đang ở điểm giao thoa tuyến đầu giữa nhiều dự án AI mở và đóng,” Konwinski nói, “đây là một tuyên bố chưa từng có tiền lệ của họ đối với niềm tin vào tính mở.”

Ngoài ra, các nhà phân tích trong ngành cho rằng, chiến lược mã nguồn mở còn mang ý nghĩa thương mại dài hạn hơn đối với NVIDIA. Khi công bố mô hình, NVIDIA sẽ công khai trọng số và chi tiết kỹ thuật, giúp các công ty khởi nghiệp và nhà nghiên cứu có thể chỉnh sửa và đổi mới dựa trên nền tảng công nghệ đó; điều này có lợi cho việc hình thành một mạng lưới nhà phát triển xoay quanh hệ sinh thái phần cứng của NVIDIA, từ đó càng củng cố độ “dính” của chip trên thị trường.

SÁNH NGANG OPENAI

Từ khi NVIDIA phát hành mô hình Nemotron đầu tiên vào tháng 11/2023, công ty đã lần lượt giới thiệu các mô hình chuyên dụng cho các lĩnh vực dọc như robot, mô hình hóa khí hậu và gấp nếp protein. Phó chủ tịch nghiên cứu học sâu ứng dụng của NVIDIA Bryan Catanzaro cũng cho biết, gần đây NVIDIA đã hoàn tất việc huấn luyện trước một mô hình với 12Bỷ tham số. Trong nghiên cứu phát triển mô hình lõi, NVIDIA sẽ tập trung phát triển các mô hình lớn đa phương thức (multimodal), đa lĩnh vực tiên tiến, bao phủ nhiều hướng như ngôn ngữ, mã nguồn, tính toán khoa học, và tác nhân (intelligent agents).

Gần đây, NVIDIA cũng ra mắt Nemotron 3 Super—một thế hệ mô hình ngôn ngữ lớn mã nguồn mở mới được thiết kế riêng cho hệ thống đa tác nhân cấp doanh nghiệp. Tổng số tham số của mô hình đạt 26Bỷ (chỉ kích hoạt 128Bỷ khi suy luận), hỗ trợ sẵn cửa sổ ngữ cảnh siêu dài 1 triệu token. Khác với cách truy cập API phổ biến, lần này NVIDIA đã mở trọng số mô hình, bộ dữ liệu huấn luyện trước/sau huấn luyện và toàn bộ phương án huấn luyện.

26Bỷ tham số, quy mô về cơ bản tương đương với phiên bản lớn nhất của OpenAI GPT-OSS. NVIDIA tuyên bố rằng trong bảng chấm điểm tổng hợp về trí tuệ nhân tạo, Nemotron 3 Super đạt 37 điểm, còn GPT-OSS chỉ đạt 33 điểm.

Đáng chú ý là NVIDIA đồng thời thừa nhận rằng điểm của một số mô hình Trung Quốc cao hơn mức này. Ngoài ra, NVIDIA cho biết Nemotron 3 Super tham gia bài kiểm tra chuẩn mới có tên PinchBench, bài đo này được thiết kế riêng để đánh giá năng lực điều khiển của mô hình đối với OpenClaw; Nemotron 3 Super xếp vị trí đầu tiên trong bài kiểm tra này.

Về mặt kỹ thuật, NVIDIA đã công khai nhiều phương pháp đổi mới được sử dụng để huấn luyện mô hình này, bao gồm kiến trúc và kỹ thuật huấn luyện nhằm nâng cao năng lực suy luận của mô hình, năng lực xử lý ngữ cảnh dài và năng lực phản hồi thông qua học tăng cường.

Catanzaro cho biết: “NVIDIA đang đặt mức độ quan tâm cao hơn rất nhiều so với trước đây vào việc phát triển các mô hình mã nguồn mở, và chúng tôi đang đạt được rất nhiều tiến triển.”

Về hệ sinh thái, NVIDIA đã hợp tác với các nhà cung cấp dịch vụ cloud và phần cứng hàng đầu như Google Cloud Vertex AI, cơ sở hạ tầng của Oracle Cloud, Dell Technologies, HPE, v.v. Việc tích hợp với Amazon AWS Bedrock và Microsoft Azure cũng đang được chuẩn bị. Các công ty phần mềm phát triển tác nhân như CodeRabbit, Factory, Greptile, cùng với các tổ chức khoa học đời sống Edison Scientific và Lila Sciences, cũng đã công bố rằng họ sẽ tích hợp mô hình này vào luồng công việc của các tác nhân.

ĐỊNH NGHĨA LẠI LỘ TRÌNH

Trong thời gian dài, lợi thế cốt lõi của NVIDIA tập trung ở mảng phần cứng chip, thị phần chip AI toàn cầu vượt 80%, nhưng tiếng nói ở tầng lớp mô hình AI lại tương đối yếu; trước đây, các tiêu chuẩn kỹ thuật và các mô thức huấn luyện của các mô hình lớn chủ yếu do các nhà sản xuất như OpenAI, Meta định nghĩa.

Lần này NVIDIA trực tiếp bước xuống tự nghiên cứu mô hình mã nguồn mở đỉnh cao, mục tiêu cốt lõi chính là định nghĩa từ tầng nền lộ trình kỹ thuật của mô hình AI, để kiến trúc phần cứng và ngăn xếp phần mềm của chính mình trở thành tiêu chuẩn thực tế của toàn ngành AI; đồng thời kéo nhu cầu về năng lực tính toán thông qua các mô hình mã nguồn mở. Nếu Nemotron trở thành mô hình nền tảng chủ đạo cho AI của tác nhân doanh nghiệp, thì cơ sở hạ tầng GPU cần để vận hành quy mô lớn mô hình này vẫn sẽ dựa vào NVIDIA—trong khi thúc đẩy tính mở ở tầng mô hình, NVIDIA đồng thời củng cố sự khóa chặt nhu cầu ở tầng phần cứng.

Các nhà phân tích tài chính dự đoán rằng nếu NVIDIA vừa củng cố vị thế “ông trùm” phần cứng vừa có thể giành được thành công 10% thị phần ở mảng mô hình nền tảng, thì động thái này có thể mang lại thêm doanh thu cho công ty lên tới 26Bỷ USD mỗi năm trong vòng ba năm. Bryan Catanzaro cho biết, việc thúc đẩy sự phát triển của hệ sinh thái mã nguồn mở hoàn toàn phù hợp với lợi ích cốt lõi của NVIDIA; khoản đầu tư khổng lồ lần này không phải là mù quáng chạy theo xu hướng, mà là lựa chọn chiến lược được đưa ra sau khi thẩm định ngành trong thời gian dài.

Vào ngày thứ Ba theo giờ địa phương, CEO NVIDIA Hoàng Nhân Huấn (Jensen Huang) cũng đã đăng một bài blog dài hiếm có về trí tuệ nhân tạo. Đây là bài viết công khai dài thứ bảy của ông kể từ năm 2016. Bài viết giải thích một cách hệ thống logic tầng nền của ngành AI; trong bài, Hoàng Nhân Huấn định nghĩa “kiến trúc năm lớp” của AI. Ông cho biết hiện tại ngành AI vẫn đang ở giai đoạn phát triển rất sớm; dù ngành đã đầu tư hàng nghìn tỷ USD, tiềm năng thật sự của AI vẫn chưa được khai thác đầy đủ, và trong tương lai vẫn cần hàng chục nghìn tỷ USD đầu tư liên tục để hoàn thiện cơ sở hạ tầng tầng nền.

Hoàng Nhân Huấn chỉ ra rằng AI đã trở thành một trong những lực lượng mạnh nhất định hình thế giới ngày nay. Nó không phải chỉ là một ứng dụng thông minh đơn lẻ hay một mô hình, mà là một cơ sở hạ tầng quan trọng như điện lực và internet: hoạt động trên nền tảng phần cứng, năng lượng và kinh tế thực tế, có thể hấp thụ nguyên liệu và chuyển hóa thành trí tuệ quy mô hóa. Trong tương lai, mọi công ty đều sẽ sử dụng AI, và mọi quốc gia đều sẽ xây dựng cơ sở hạ tầng AI.

Liên quan đến nỗi lo về việc làm phát sinh từ sự phát triển của AI, Hoàng Nhân Huấn cho rằng AI không những không cắt giảm việc làm, mà ngược lại còn tạo ra nhiều cơ hội việc làm mới, đặc biệt trong các lĩnh vực cơ sở hạ tầng và các công việc kỹ thuật lành nghề. Lực lượng lao động cần thiết để hỗ trợ xây dựng cơ sở hạ tầng AI là cực kỳ lớn: các “nhà máy AI” cần thợ điện, thợ ống nước, công nhân thép, nhân viên kỹ thuật mạng, thợ lắp đặt và người vận hành v.v.; đây đều là các vị trí trình độ cao, lương cao, và hiện đang thiếu hụt. AI đang lấp đầy khoảng trống thiếu hụt lao động lớn trên phạm vi toàn cầu đối với các vị trí như tài xế xe tải, y tá, kế toán… chứ không phải tạo ra thất nghiệp hàng loạt.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.49KNgười nắm giữ:3
    1.98%
  • Vốn hóa:$2.21KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:2
    0.15%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Ghim