Alibaba Cloud vừa dẫn đầu khoản đầu tư lớn nhằm phát triển một loại trí tuệ nhân tạo thế hệ mới, được thiết kế để mô phỏng thế giới thực một cách toàn diện, vượt qua giới hạn của các mô hình ngôn ngữ lớn (LLMs) truyền thống. Sự chuyển dịch này đánh dấu xu hướng mới trong lĩnh vực AI, tập trung vào dữ liệu đa phương thức và các kịch bản vật lý phức tạp.
Sự dịch chuyển từ LLM sang Mô hình Thế giới (World Model)
Các mô hình ngôn ngữ lớn (LLMs) như ChatGPT, mặc dù rất mạnh mẽ, nhưng chỉ được huấn luyện chủ yếu bằng văn bản. Nhận thức được những giới hạn này, các nhà phát triển AI đang chuyển hướng sang xây dựng các “mô hình thế giới” (world models). Những mô hình này được xây dựng dựa trên dữ liệu đa phương thức (multimodal data) từ video, hình ảnh và các kịch bản vật lý thực tế, giúp AI hiểu cách thế giới vật lý vận hành một cách tự nhiên hơn.
Alibaba đầu tư vào ShengShu
Để nắm bắt xu hướng này, Alibaba Cloud đã dẫn đầu khoản đầu tư trị giá 2 tỷ nhân dân tệ (khoảng 290 triệu USD) vào ShengShu – công ty khởi nghiệp nổi tiếng với công cụ tạo video AI Vidu. Vòng gọi vốn Series B này cũng có sự tham gia của TAL Education và Baidu Ventures.
