Nvidia giới thiệu công nghệ AI mới có thể sửa đổi giọng nói
(DNTO) - Nvidia vừa giới thiệu một AI mới có về âm thanh có khả năng sửa đổi giọng nói và tạo ra những âm thanh mới lạ. Công nghệ sẽ này nhắm tới các nhà sản xuất âm nhạc, phim ảnh và trò chơi điện tử.
Theo Nvidia, công nghệ mới có tên là Fugatto, viết tắt của Foundational Generative Audio Transformer Opus 1. Tuy nhiên, công ty hiện vẫn chưa có kế hoạch phát hành công nghệ này ngay lập tức.
Nvidia đã kết hợp các công nghệ từ phía các startup khác như Runway hay từ các công ty lớn hơn như Meta Platforms để có thể tạo ra video và âm thanh từ những văn bản.
Điểm khác biệt của công nghệ này so với các công nghệ AI khác là khả năng tiếp nhận và chỉnh sửa âm thanh hiện có, ví dụ như lấy một đoạn nhạc được chơi trên đàn piano và biến nó thành giọng hát của con người, hoặc lấy bản ghi âm lời nói và thay đổi giọng nói cũng như tâm trạng một cách khác biệt.
Phó Chủ tịch nghiên cứu học sâu ứng dụng tại Nvidia, Bryan Catanzaro, cho biết AI tạo sinh sẽ mang lại khả năng mới cho âm nhạc, trò chơi điện tử và những người bình thường muốn sáng tạo ra mọi thứ.
Trong khi đó, các công ty như OpenAI đang đàm phán với các hãng phim Hollywood về việc làm thế nào và liệu AI có thể được sử dụng trong ngành giải trí hay không. Mối quan hệ giữa công nghệ AI và Hollywood đã dần trở nên căng thẳng hơn, đặc biệt là khi nữ ngôi sao Hollywood Scarlett Johansson cáo buộc OpenAI bắt chước giọng nói của cô.
Mô hình AI mới của Nvidia được đào tạo trên dữ liệu nguồn mở, và công ty cho biết họ vẫn đang cân nhắc xem có nên công bố công khai hay không và sẽ công bố như thế nào.
“Bất kỳ công nghệ tạo sinh nào cũng luôn có một số rủi ro, và chúng tôi cần phải cẩn thận về điều này, đó là lý do tại sao chúng tôi không có kế hoạch phát hành ngay lập tức”, Catanzaro cho biết.