Meta cho ra mắt AI mới có khả năng dịch văn bản và lời nói gần 100 ngôn ngữ
(DNTO) - Meta, công ty mẹ của Facebook, vừa mới cho ra mắt mô hình AI có khả năng dịch và phiên âm lời nói ra thành gần 100 ngôn ngữ.
Công ty cho biết trong một bài đăng, họ đang phát triển mẫu AI-SeamlessM4T, với khả năng hỗ trợ dịch các văn bản viết và văn bản nói ra gần 100 ngôn ngữ, ngoài ra nó có thể dịch toàn bộ “lời nói sang lời nói” với 35 ngôn ngữ khác nhau. Đây là sự kết hợp công nghệ mà trước đây chỉ có trong các mô hình riêng biệt.
Đối với mẫu SeamlessM4T, các nhà phân tích của Meta cho biết họ đã thu nhập dữ liệu đào tạo âm thanh từ 4 triệu giờ “âm thanh gốc từ kho lưu trữ dữ liệu web có sẵn công khai”. Nhưng họ không nói rõ là kho lưu trữ nào.
Đại diện của Meta không trả lời câu hỏi về nguồn gốc của dữ liệu âm thanh này.
Theo tài liệu nghiên cứu, dữ liệu văn bản được là từ các bộ dữ liệu được tạo ra vào năm ngoái, lấy nội dung từ Wikipedia và các trang web liên kết.
CEO Mark Zuckerberg cho biết, ông hình dung ra những công cụ như vậy nhằm tạo điều kiện thuận lợi cho sự tương tác giữa mọi người dùng từ khắp nơi trên thế giới trong vũ trụ ảo, một tập hợp các thế giới ảo được kết nối với nhau mà ông đang đặt cược toàn bộ tương lai của công ty vào đó.
Được biết, Meta đang cung cấp mô hình này cho công chúng sử dụng với mục đích phi thương mại.
Công ty truyền thông xã hội đã phát hành một loạt các mẫu AI miễn phí trong năm nay, trong đó bao gồm mô hình ngôn ngữ lớn có tên là Llama, đặt ra các thách thức đối với các mẫu AI độc quyền của OpenAI do Microsoft hậu thuẫn hay Google của Alphabet.
Ông Zuckerberg cho biết một hệ sinh thái AI mở sẽ có lợi đối với Meta, khi mà công ty có thể thu về nhiều lợi ích hơn bằng cách huy động được nguồn lực một cách hiệu quả từ cộng đồng nhằm tạo ra các công cụ hướng tới người tiêu dùng cho nền tảng mạng xã hội của mình hơn là tính phí truy cập vào các mô hình.
Tuy nhiên, Meta hiện đang phải đối mặt với các câu hỏi pháp lý xung quanh vấn đề dữ liệu đào tạo được sử dụng để tạo ra các mô hình của mình.
Vào tháng 7 vừa qua, diễn viên hài Sarah Silverman và hai tác giả khác đã đệ đơn kiện Meta và OpenAI vì vi phạm bản quyền, cáo buộc hai công ty sử dụng sách của họ làm dữ liệu đào tạo mà không có sự cho phép.