Bùng nổ cuộc đua AI tạo sinh Việt Nam
(DNTO) - Các công cụ AI tạo sinh do các nhà phát triển trong nước đang bước vào giai đoạn nước rút để chiếm thế ưu tiên tại thị trường nội địa và tỏ ra không hề kém cạnh với thế giới.
Khi các “ông lớn” nhập cuộc
Sự bùng nổ của công cụ tạo sinh như ChatGPT hay DALL-E đã tạo ra làn sóng công nghệ mới thu hút nhiều quốc gia nhập cuộc, trong đó có Việt Nam. Bởi đây là những công nghệ không thể thiếu trong chiến lược dữ liệu, nhằm đảm bảo chất lượng, nguồn gốc, độ tin cậy của dữ liệu, phục vụ trong quá trình phát triển kinh tế số đất nước.
Hồi tháng 9, Bộ trưởng Bộ Thông tin và Truyền thông cũng phát đi thông điệp về tầm quan trọng của việc xây dựng các mô hình ngôn ngữ lớn (LLM) và công cụ AI tạo sinh của người Việt, phục vụ người Việt.
Bộ này đặt mục tiêu đến năm 2025, Việt Nam có ít nhất một nền tảng công nghệ LLM tiếng Việt, có khả năng cung cấp dịch vụ cho nền tảng AI khác. Ngoài ra, 100% cơ quan Nhà nước có trợ lý ảo hỗ trợ công việc cho các công chức, viên chức.
Đáp lại lời kêu gọi từ phía lãnh đạo Bộ Thông tin Truyền thông, nhiều nhà phát triển trong nước bước đầu xây dựng, đưa ra thị trường công cụ AI tạo sinh “Made in Việt Nam”.
Hồi tháng 10, FPT tung ra thị trường nền tảng tạo sinh cho doanh nghiệp GenAI. Theo giới thiệu từ tập đoàn, sản phẩm này có thể dự trên số liệu để “bắt bệnh” sức khỏe doanh nghiệp, giúp chủ doanh nghiệp có quyết định hiệu quả hơn. Ngoài ra, nền tảng cũng tăng cường trải nghiệm khách hàng khi kết hợp AI với chatbot thế hệ mới.
Đầu tháng 12, VinAI công bố dự án PhởGPT. Dữ liệu huấn luyện được kết hợp từ nhiều nguồn khác nhau, gồm cả từ ngữ, lời nói và cảm xúc để trả lời câu hỏi dựa trên ngữ cảnh. Khác với ChatGPT, PhởGPT là dự án mã nguồn mở về LLM. Người dùng có thể tự phát triển ứng dụng AI tùy chỉnh, đặc biệt những ứng dụng đòi hỏi bảo mật cao, không phụ thuộc vào các mô hình đóng.
Cũng trong tháng 12, VinBigdata trình làng ViGPT với khả năng tổng hợp thông tin, giải đáp câu hỏi, sáng tạo nội dung… tương tự như ChatGPT. Nhưng chúng có lợi thế hơn là có thể đưa ra thông tin đặc thù của Việt Nam như văn bản pháp luật, lịch sử, văn hóa, danh nhân, đặc trưng vùng miền... những yếu tố mà công cụ AI tạo sinh khác còn thiếu sót.
Cùng dịp, Zalo đã tung ra thị trường mô hình ngôn ngữ lớn KiLM, được huấn luyện với 7 tỷ tham số, dựa trên kho dữ liệu tiếng Việt chất lượng cao. Khi được tích hợp tham gia thi đấu kiến thức trên Kahoot, công cụ này có thể trả lời tốt các câu hỏi thường thức và kiến thức chung trong nhiều lĩnh vực bằng tiếng Việt.
Có thể thấy các “ông lớn” công nghệ trong nước đã không tỏ ra chậm chạm trước xu hướng công nghệ mới của thế giới. Việc họ đua nhau trình làng các ứng dụng AI tạo sinh cũng chứng minh các nhà phát triển trong nước có đủ khả năng tạo ra các mô hình công nghệ “Made in Việt Nam” phục vụ người Việt và quá trình chuyển đổi số trong nước.
Làm phải chắc từ móng
Một khảo sát của IBM cho thấy Việt Nam đang dẫn đầu về sự quan tâm đến AI tạo sinh. Cụ thể, 91% người tham gia khảo sát bày tỏ sự hứng thú với công nghệ này.
Thế nhưng, theo các chuyên gia, trước khi doanh nghiệp mơ ước thành công với AI tạo sinh, thì việc cần làm bây giờ là phải đầu tư vào chất lượng dữ liệu. Bởi chỉ cần một dữ liệu đầu vào sai lệch, hoặc chưa đủ, thì sẽ kéo theo rất nhiều kết quả đầu ra bị sai lệch. Triển khai các dự án AI nếu không có dữ liệu đủ lớn, đủ bao quát, đủ chất lượng thì cũng như xây toà nhà trên nền cát lún.
Ông Andrew Ng, chuyên gia trí tuệ nhân tạo, nhà sáng lập và CEO tại Landing AI cho biết phát triển các mô hình trí tuệ nhân tạo là vấn đề lâu dài. Thường với các công ty lớn như Google, Baidu họ tạo lập ra nguồn thu khổng lồ từ internet, sau đó mới vươn ra các ngành khác như tiêu dùng. Trên thế giới có khoảng 6 triệu dự án như vậy đã được xây dựng.
“Giống như người làm bánh pizza, làm sao cho từng sản phẩm được chuẩn chỉ. Những dự án như vậy, để thành công phải có công thức giống như làm bánh. Có như vậy mới có hệ thống trí tuệ nhân tạo để đội ngũ công nghệ tham gia vào xây dựng”, ông Andrew Ng nói.
Cũng theo vị này, thế giới mỗi ngày tạo ra hàng tỷ byte dữ liệu. Các thông tin này có kho dữ liệu vô cùng lớn. Trong khi mọi người đều có dữ liệu riêng và nó được dự trữ, đưa vào hệ thống khối. Từ 2017 các công ty trên thế giới đã sử dụng rất nhiều hình thức lưu trữ dữ liệu.
“Thông thường chúng ta sẽ có những bộ dữ liệu AI nhỏ nhỏ, đó là khoa học để tạo nên một bộ AI để có hệ AI thành công. Điều này rất quan trọng vì tất cả các ví dụ đều có giá trị như nhau và phải có nguyên tắc để tạo ra bộ dữ liệu. Có hàng tỷ bức ảnh có thể tạo ra và có thể xử lý bằng công nghệ AI như vậy”, ông Andrew Ng nhấn mạnh.
Ông Christopher Cường Nguyễn, Nhà sáng lập và Chủ tịch AI Automatic, cho biết công tác chuẩn bị dữ liệu rất quan trọng như việc hiểu vấn đề thực tế: “Ví dụ như khi tôi tìm kiếm trên Google, nếu tôi cần 100.000 datapoint (điểm dữ liệu) thì tôi sẽ có được tất cả các dữ liệu tôi cần qua học máy đó”.