
Đa số tập trung của AI tạo ra đã được đặt vào các giao diện dựa trên văn bản sử dụng để tạo ra văn bản, hình ảnh và nhiều hơn nữa. Xu hướng tiếp theo dường như sẽ là giọng nói, và nó đang tiếp tục nhanh chóng. Trong sự phát triển mới nhất, Google hôm nay thông báo rằng họ sẽ thêm Chirp 3 - các mô hình chuyển đổi giọng nói thành văn bản và văn bản thành giọng nói chất lượng cao - vào nền tảng phát triển AI Vertex của mình bắt đầu từ tuần tới.
Tuần trước, Google đã một cách rất kín lặn thông báo rằng Chirp 3 sẽ đưa ra 8 giọng nói mới cho 31 ngôn ngữ. Các trường hợp sử dụng cho nền tảng bao gồm việc xây dựng trợ lý giọng nói, tạo sách nói, phát triển các trợ lý hỗ trợ và giọng đọc cho video. Tin tức được thông báo tại một sự kiện tại văn phòng DeepMind của Google tại London.
Nỗ lực của họ đang diễn ra vào thời điểm mà những người khác cũng đang bước tiến với công việc AI giọng nói của họ. Tuần trước, Sesame - startup đứng sau các ứng dụng AI "Maya" và "Miles" rất thực tế và lan truyền - thông báo ra mắt mô hình của họ cho các nhà phát triển xây dựng các ứng dụng và dịch vụ tùy chỉnh trên nền công nghệ của họ.