OpenAI ra mắt 'trợ lý' giọng nói được nâng cấp và có giao diện mới
(DNTO) - OpenAI vào ngày 24/9 cho biết ChatGPT hiện đã nâng cấp tính năng giọng nói dành cho những người dùng trả tiền cho dịch vụ cao cấp. Được biết, công cụ này sẽ giúp cho các cuộc trò chuyện trở nên trôi chảy hơn.
Bản phát hành này sẽ tiếp tục được ra mắt trong tuần này. Công ty cho biết nâng cấp này hiện vẫn chưa có tại các nước EU như Iceland, Liechtenstein, Na Uy, Thụy Sỹ hoặc Vương quốc Anh.
Khả năng mới này đã được OpenAI công bốp vào tháng 5 vừa qua. Việc ra mắt này đã nhận được nhiều ý kiến cho rằng giọng nói của AI – được đặt tên là Sky, giống với giọng của nữ diễn viên Scarlett Johansson trong bộ phim “Her” năm 2013. Cố vấn pháp lý của nữ diễn viên đã gửi thư cho OpenAI, tuyên bố rằng công ty không có quyền sử dụng giọng nói đó và OpenAI đã tạm dừng sử dụng giọng nói này trong các sản phẩm của mình.
Kể từ đó, người dùng đã có thể nói chuyện với OpenAI với những giọng nói khác nhau thông qua phiên bản miễn phí. Phiên bản cao cấp hơn giúp cho việc phản hồi trở nên nhanh hơn và khi bị ngắt lời thì nó sẽ dừng lại và nghe người dùng nói. Hiện có sẵn 9 giọng nói để lựa chọn và người dùng có thể truy cập hướng dẫn cho cuộc trò chuyện bằng giọng nói trong phần "Tùy chỉnh của cài đặt ứng dụng".
“Hy vọng các bạn thấy việc chờ đợi là xứng đáng”, Sam Altman, đồng sáng lập kiêm CEO của OpenAI cho biết trên trong một bài đăng trên X.
Vào những tuần vừa qua, Google đã phát hành tính năng giọng nói Gemini Live của riêng mình bằng tiếng Anh trên các thiết bị Android. Vào ngày 23/9, Meta cho biết họ sẽ giới thiệu chatbot AI có nói giọng của người nổi tiếng vào cuối tuần này. Người dùng có thể truy cập thông qua Facebook, Instagram và WhatsApp.
OpenAI đã có bước khởi đầu thuận lợi trên thị trường chatbot AI tạo sinh khi ra mắt ChatGPT vào cuối năm 2022. Vào tháng 8 vừa qua, OpenAI đã chia sẻ với các phương tiện truyền thông rằng ChatGPT hiện có hơn 200 triệu người dùng hoạt động mỗi tuần.
Chế độ nâng cấp này chỉ khả dụng cho những người đã đăng ký gói Plus, Team hoặc Enterprise của OpenAI. Hiện giá của gói Plus đang là 20 USD/tháng.
Cách để truy cập tính năng giọng nói mới của ChatGPT
Nếu như người dùng sử dụng bản trả phí, họ có thể sử dụng được tính năng giọng nói mới, miễn là OpenAI đã cấp quyền truy cập vào thiết bị của họ.
Trước hết là người dùng phải có phiên bản mới nhất của ứng dụng. Sau khi hoàn tất truy cập , người dùng sẽ nhận được thông báo trong ứng dụng khi họ truy cập vào tính năng mới. Việc mà người dùng cần làm là nhấn nút “tiếp tục” để bắt đầu.
Người dùng sẽ tạo cuộc trò chuyện mới bằng cách vuốt sang phải hoặc chạm vào biểu tượng có hai dòng ở góc trên cùng bên trái, và chọn ChatGPT ở phía trên cùng. Bên phải chữ “Message” và biểu tượng micro, người dùng sẽ thấy biểu tượng sóng âm thanh. Sau khi chạm vào đó (đảm bảo rằng âm thanh đã được bật), chỉ sau vài giây sẽ nghe được tiếng ‘bump” nhỏ, và vòng tròn ở giữa màn hình sẽ biến thành một hình ảnh động màu xanh và trắng giống như bầu trời. Khi bắt đầu nói, người dùng sẽ nhận được phản hồi nhanh chóng, mặc dù âm thanh sẽ bị ngắt quãng một chút.
OpenAI cho biết họ đã cải thiện giọng nói ở một số ngôn ngữ nước ngoài và tăng tốc độ trò chuyện. Nếu người dùng không thích âm thanh hiện tại, họ có thể yêu cầu ChatGPT nói theo cách khác. Ví dụ, người dùng có thể yêu cầu nó nói nhanh hơn hoặc kết hợp giọng miền Nam.
Với chế độ giọng nói nâng cao, người dùng có thể nghe ChatGPT kể chuyện trước khi đi ngủ, giúp chuẩn bị cho buổi phỏng vấn xin việc hoặc thậm chí rèn luyện kỹ năng ngoại ngữ.
Tuy nhiên, ngay cả khi trả phí, người dùng vẫn không có quyền truy cập không giới hạn vào chế độ giọng nói nâng cao. Sau khi sử dụng khoảng nửa tiếng vào thứ Ba, người dùng có thể sẽ bắt đầu thấy “còn 15 phút” ở cuối màn hình.
Hiện OpenAI vẫn chưa có phản hồi chi tiết về việc giới hạn thời gian.