Mô hình AI mới của Stability AI biến hình ảnh thành cảnh 3D

Stability AI đã phát hành một mô hình AI mới, Camera Ảo Ảnh Ổn Định, mà công ty cho biết có thể biến hình ảnh 2D thành video 'thâm nhập' với chiều sâu và góc nhìn thực tế.

Camera ảo ảnh là công cụ thường được sử dụng trong làm phim kỹ thuật số và hoạt hình 3D để chụp và điều hướng các cảnh trong thời gian thực. Với Camera Ảo Ảnh Ổn Định, Stability đã thêm vào công nghệ AI sinh trắc học để cung cấp sự kiểm soát và tùy chỉnh lớn hơn, công ty cho biết trong một bài đăng trên blog.

Camera Ảo Ảnh Ổn Định tạo ra 'góc nhìn mới' của một cảnh từ một hoặc nhiều hình ảnh (tối đa 32 hình ảnh) ở các góc nhìn mà người dùng chỉ định. Mô hình có thể tạo ra video di chuyển dọc theo các đường dẫn hoặc cài đặt camera 'động', bao gồm 'Quay Tròn', 'Zoom Dolly', 'Di Chuyển' và 'Pan'.

Ảnh: Stability AI

Phiên bản hiện tại của Camera Ảo Ảnh Ổn Định, một bản xem trước nghiên cứu, có thể tạo ra video ở tỷ lệ khung hình vuông (1:1), chế độ dọc (9:16) và chế độ ngang (16:9) lên đến 1.000 khung hình. Stability cảnh báo rằng mô hình có thể tạo ra kết quả chất lượng thấp trong một số tình huống, đặc biệt là với hình ảnh có con người, động vật hoặc 'vật liệu động' như nước.

'Cảnh không rõ ràng, đường dẫn camera phức tạp giao nhau với các vật thể hoặc bề mặt, và các vật thể không đều hình dạng có thể gây ra hiện tượng nháy,” Stability lưu ý trong bài đăng trên blog của mình, 'đặc biệt là khi các góc nhìn mục tiêu khác nhau đáng kể so với hình ảnh đầu vào.'

Camera Ảo Ảnh Ổn Định có sẵn để sử dụng trong nghiên cứu dưới một giấy phép phi thương mại. Nó có thể được tải xuống từ nền tảng phát triển AI Hugging Face.

Stability, công ty đứng sau mô hình tạo hình ảnh phổ biến Stable Diffusion, đã gây ra nhiều lo lắng mới năm ngoái khi các nhà đầu tư bao gồm Eric Schmidt và người sáng lập Napster Sean Parker cố gắng cải thiện tình hình kinh doanh. Emad Mostaque, cộng sự sáng lập và cựu CEO của Stability, được cho là đã quản lý Stability vào tình trạng phá sản tài chính, dẫn đến việc nhân viên từ chức, mối quan hệ đối tác với Canva đổ vỡ, và nhà đầu tư lo lắng về triển vọng của công ty.

Trong vài tháng qua, Stability đã tuyển dụng một CEO mới, bổ nhiệm đạo diễn 'Titanic' James Cameron vào hội đồng quản trị của mình, và phát hành một số mô hình tạo hình ảnh mới. Đầu tháng 3, công ty đã hợp tác với nhà sản xuất chip Arm để mang một mô hình AI có thể tạo ra âm thanh, bao gồm âm thanh hiệu ứng, đến các thiết bị di động chạy chip Arm.