
OpenAI thông báo rằng họ đang triển khai Chế độ Giọng nói Tiên tiến (AVM) cho một tập khách hàng trả phí mở rộng hơn của ChatGPT vào thứ Ba. Tính năng âm thanh này, giúp ChatGPT trở nên tự nhiên hơn khi nói chuyện, sẽ ban đầu triển khai cho khách hàng ở các đối tượng Plus và Teams của ChatGPT. Khách hàng Doanh nghiệp và Edu sẽ bắt đầu nhận quyền truy cập vào tuần sau.
Trong quá trình triển khai, AVM đang nhận được một thiết kế mới. Tính năng hiện được đại diện bởi một quả cầu màu xanh lam, thay vì các chấm đen đại diện mà OpenAI đã trình bày trong buổi trình diễn công nghệ vào tháng 5.
Người dùng sẽ nhận được một cửa sổ pop-up trong ứng dụng ChatGPT, bên cạnh biểu tượng giọng nói, khi AVM đã sẵn sàng dành cho họ.
Chế độ Giọng nói Tiên tiến đang được triển khai đến tất cả người dùng Plus và Team trong ứng dụng ChatGPT trong suốt tuần này.
Trong thời gian chờ đợi, chúng tôi đã thêm Hướng dẫn Tùy chỉnh, Bộ nhớ, năm giọng nói mới và cải thiện âm giọng.
Nó cũng có thể nói 'Xin lỗi vì tôi đã muộn' trong hơn 50 ngôn ngữ. pic.twitter.com/APOqqhXtDg
- OpenAI (@OpenAI) 24 tháng 9 năm 2024
ChatGPT cũng đang nhận thêm năm giọng mới mà người dùng có thể thử: Arbor, Maple, Sol, Spruce và Vale. Điều này đưa tổng số giọng nói của ChatGPT lên chín (gần bằng với Gemini Live của Google), cùng với Breeze, Juniper, Cove và Ember. Bạn có thể nhận thấy tất cả những tên này đều được lấy cảm hứng từ thiên nhiên, có thể vì mục tiêu chính của AVM là làm cho việc sử dụng ChatGPT trở nên tự nhiên hơn.
Một giọng nói thiếu trong danh sách này là Sky, giọng nói mà OpenAI trình diễn trong bản cập nhật mùa xuân của họ, dẫn đến mối đe dọa pháp lý từ Scarlett Johansson. Nữ diễn viên, người đóng vai một hệ thống AI trong bộ phim "Her," cho rằng giọng nói của Sky nghe có vẻ giống với giọng của cô. OpenAI ngay lập tức rút giọng nói của Sky xuống, nói rằng họ không bao giờ có ý định giống với giọng của Johansson, mặc dù một số nhân viên đã đề cập đến bộ phim trong các tweet vào thời điểm đó.
Một tính năng thiếu trong sự triển khai này: chia sẻ video và màn hình của ChatGPT mà OpenAI giới thiệu trong bản cập nhật mùa xuân của họ bốn tháng trước. Tính năng này được cho là cho phép GPT-4o xử lý đồng thời thông tin hình ảnh và âm thanh. Trong lúc trình diễn, một nhân viên của OpenAI đã cho thấy làm thế nào bạn có thể đặt câu hỏi cho ChatGPT về toán học trên một tờ giấy trước mặt bạn, hoặc mã code trên màn hình máy tính của bạn. Hiện tại, OpenAI không cung cấp một thời gian cụ thể cho khi nào họ sẽ triển khai các khả năng đa phương tiện này.
Tuy nhiên, OpenAI cho biết họ đã cải thiện một số điểm kể từ khi phát hành bản thử nghiệm alpha hạn chế của AVM. Tính năng giọng nói của ChatGPT được cho là tốt hơn trong việc hiểu các giọng địa phương bây giờ, và công ty cho biết cuộc trò chuyện của họ giờ đây trở nên mượt mà và nhanh hơn. Trong những bài kiểm tra của chúng tôi với AVM, chúng tôi thấy rằng sự cố không phải lúc nào cũng hiếm, nhưng công ty cho biết điều đó đã được cải thiện.
OpenAI cũng đang mở rộng một số tính năng tùy biến của ChatGPT cho AVM: Hướng dẫn Tùy chỉnh, cho phép người dùng cá nhân hóa cách ChatGPT phản ứng với họ, và Bộ nhớ, cho phép ChatGPT ghi nhớ cuộc trò chuyện để tham khảo sau này.
Một người phát ngôn của OpenAI nói rằng AVM hiện chưa được triển khai ở một số khu vực, bao gồm EU, Vương quốc Anh, Thụy Sĩ, Iceland, Na Uy và Liechtenstein.