Runway ra mắt mô hình mới, bổ sung âm thanh cho AI video

Admin / December 13, 2025

Cuộc đua phát triển các mô hình thế giới đang nóng lên từng ngày, và Runway – công ty tiên phong trong lĩnh vực tạo hình ảnh và video bằng AI – đã chính thức gia nhập bằng việc ra mắt mô hình đầu tiên của mình. Với tên gọi GWM-1, mô hình này đánh dấu một bước tiến quan trọng, cho phép AI không chỉ tạo ra nội dung mà còn hiểu được cách thế giới vận hành. Đây là một hệ thống AI có khả năng xây dựng một mô phỏng nội bộ về thực tế, từ đó có thể suy luận, lập kế hoạch và hành động mà không cần được huấn luyện trên mọi kịch bản có thể xảy ra trong đời sống thực. Sự kiện này diễn ra không lâu sau khi Runway giới thiệu mô hình video Gen 4.5, vượt qua cả Google và OpenAI trên bảng xếp hạng Video Arena, cho thấy tốc độ đổi mới đáng kinh ngạc của công ty.

GWM-1: Mô hình thế giới đa năng và các ứng dụng đột phá

Mô hình thế giới GWM-1 của Runway hoạt động dựa trên nguyên lý dự đoán khung hình theo thời gian, tạo ra một mô phỏng có khả năng thấu hiểu vật lý và cách thế giới thực vận hành. Theo Runway, GWM-1 mang tính "tổng quát" hơn so với Genie-3 của Google và các đối thủ khác, được thiết kế để tạo ra các mô phỏng phục vụ việc huấn luyện các tác nhân AI trong nhiều lĩnh vực đa dạng như robot và khoa học đời sống. Anastasis Germanidis, CTO của Runway, nhấn mạnh rằng việc xây dựng một mô hình video xuất sắc là nền tảng để phát triển mô hình thế giới, tin rằng việc dạy các mô hình dự đoán trực tiếp các pixel là cách tốt nhất để đạt được khả năng mô phỏng tổng quát.
Runway đã phát hành các phiên bản chuyên biệt của mô hình thế giới mới, bao gồm GWM-WorldsGWM-Robotics và GWM-AvatarsGWM-Worlds là một ứng dụng cho phép người dùng tạo các dự án tương tác. Bạn có thể thiết lập một cảnh bằng câu lệnh hoặc hình ảnh tham chiếu, và khi bạn khám phá không gian, mô hình sẽ tự động tạo ra thế giới với sự hiểu biết về hình học, vật lý và ánh sáng. Mô phỏng này chạy ở tốc độ 24 khung hình/giây và độ phân giải 720p, hứa hẹn tiềm năng lớn cho ngành game và đặc biệt là huấn luyện các tác nhân AI điều hướng trong thế giới vật lý. GWM-Robotics tập trung vào việc sử dụng dữ liệu tổng hợp với các thông số mới như điều kiện thời tiết thay đổi hoặc chướng ngại vật, giúp phát hiện khi nào và cách thức robot có thể vi phạm các quy tắc. Cuối cùng, GWM-Avatars hướng đến việc xây dựng các hình đại diện chân thực để mô phỏng hành vi con người, một lĩnh vực mà các công ty như D-ID, Synthesia, Soul Machines và Google cũng đang đầu tư mạnh mẽ.

Cập nhật Gen 4.5: Video AI với âm thanh gốc và khả năng kể chuyện đa cảnh quay

Bên cạnh việc ra mắt mô hình thế giới mới, Runway còn công bố bản cập nhật cho mô hình nền tảng Gen 4.5 đã được giới thiệu trước đó trong tháng. Bản cập nhật này mang đến khả năng tạo âm thanh gốc và video dài, nhiều cảnh quay cho mô hình. Giờ đây, người dùng có thể tạo ra các video dài một phút với sự nhất quán nhân vậtđối thoại gốcâm thanh nền và các cảnh quay phức tạp từ nhiều góc độ khác nhau.
Không chỉ dừng lại ở việc tạo mới, Runway Gen 4.5 còn cho phép người dùng chỉnh sửa âm thanh hiện có và thêm đối thoại. Khả năng chỉnh sửa video nhiều cảnh với độ dài bất kỳ cũng là một điểm cộng lớn, giúp các nhà sáng tạo nội dung có thêm công cụ mạnh mẽ để kể chuyện. Bản cập nhật này đưa Runway tiến gần hơn đến bộ công cụ video "tất cả trong một" của đối thủ Kling, đặc biệt là về âm thanh gốc và khả năng kể chuyện đa cảnh quay. Điều này cũng báo hiệu rằng các mô hình tạo video đang chuyển mình từ giai đoạn thử nghiệm sang trở thành công cụ sẵn sàng sản xuất, mở ra kỷ nguyên mới cho việc sáng tạo nội dung hình ảnh và âm thanh chất lượng cao. Hiện tại, mô hình Gen 4.5 đã được cập nhật và sẵn sàng cho tất cả người dùng gói trả phí của Runway.
Với việc ra mắt GWM-1 và các ứng dụng chuyên biệt cùng bản cập nhật mạnh mẽ cho Gen 4.5, Runway đang khẳng định vị thế dẫn đầu trong cuộc cách mạng AI tạo sinh. Những đổi mới này không chỉ mang lại khả năng mô phỏng thế giới thực mà còn cung cấp các công cụ video AI tinh vi hơn, giúp người dùng biến ý tưởng thành hiện thực một cách dễ dàng và chân thực. Đây là thời điểm thú vị để theo dõi cách Runway và các đối thủ sẽ tiếp tục định hình tương lai của sáng tạo nội dung và tương tác với AI.