Alibaba dẫn đầu đầu tư 290 triệu USD xây dựng mô hình AI thế giới mới • Tin Tức

Alibaba Cloud vừa dẫn đầu khoản đầu tư lớn nhằm phát triển một loại trí tuệ nhân tạo thế hệ mới, được thiết kế để mô phỏng thế giới thực một cách toàn diện, vượt qua giới hạn của các mô hình ngôn ngữ lớn (LLMs) truyền thống. Sự chuyển dịch này đánh dấu xu hướng mới trong lĩnh vực AI, tập trung vào dữ liệu đa phương thức và các kịch bản vật lý phức tạp.

Sự dịch chuyển từ LLM sang Mô hình Thế giới (World Model)

Các mô hình ngôn ngữ lớn (LLMs) như ChatGPT, mặc dù rất mạnh mẽ, nhưng chỉ được huấn luyện chủ yếu bằng văn bản. Nhận thức được những giới hạn này, các nhà phát triển AI đang chuyển hướng sang xây dựng các “mô hình thế giới” (world models). Những mô hình này được xây dựng dựa trên dữ liệu đa phương thức (multimodal data) từ video, hình ảnh và các kịch bản vật lý thực tế, giúp AI hiểu cách thế giới vật lý vận hành một cách tự nhiên hơn.

Alibaba đầu tư vào ShengShu

Để nắm bắt xu hướng này, Alibaba Cloud đã dẫn đầu khoản đầu tư trị giá 2 tỷ nhân dân tệ (khoảng 290 triệu USD) vào ShengShu – công ty khởi nghiệp nổi tiếng với công cụ tạo video AI Vidu. Vòng gọi vốn Series B này cũng có sự tham gia của TAL Education và Baidu Ventures.

ShengShu cho biết, nguồn vốn mới này sẽ được sử dụng để xây dựng một “mô hình thế giới chung” (general world model) tiên tiến.

Mục tiêu của Mô hình Thế giới Chung

Mô hình này được thiết kế để kết nối hai lĩnh vực hiện đang tách biệt: thế giới kỹ thuật số và thế giới vật lý. Theo tuyên bố của công ty, mô hình sẽ sử dụng AI để bắc cầu giữa:

Thế giới kỹ thuật số: Các trò chơi điện tử và video được tạo bằng AI.
Thế giới vật lý: Các ứng dụng như xe tự hành và robot.

ShengShu tin rằng việc xây dựng mô hình thế giới chung dựa trên dữ liệu đa phương thức (như thị giác, âm thanh và xúc giác) sẽ nắm bắt được cách thế giới vật lý vận hành một cách tự nhiên và toàn diện hơn so với các mô hình ngôn ngữ lớn.

Thông tin này được đưa tin tại Bắc Kinh, Trung Quốc, vào ngày 13 tháng 8 năm 2025.