Amazon công bố công cụ AI cùng với máy chủ AI mới
(DNTO) - Bộ phận điện toán đám mây của Amazon - Amazon Web Services (AWS), vừa công bố công cụ AI mới và các máy chủ trung tâm dữ liệu mới được tích hợp chip AI của công ty.
Tại hội nghị re:Invent 2024 của AWS ở Las Vegas (Mỹ), công ty đã cho ra mắt một công cụ mới để chống lại các “ảo giác” - các tình huống mà mô hình AI hoạt động thiếu chính xác. Công cụ này có tên là ‘Automated Reasoning checking’, giúp xác thực phản hồi của mô hình AI bằng cách tham chiếu chéo thông tin do khách hàng cung cấp để đảm bảo tính chính xác. AWS tuyên bố rằng công cụ này là biện pháp bảo vệ “đầu tiên” và “duy nhất” đối với vấn đề ảo giác này.
Automated Reasoning checks hiện đang có sẵn thông qua dịch vụ lưu trữ mô hình Bedrock của AWS. Trong mọi trường hợp, công cụ này sẽ tạo ra các quy tắc từ dữ liệu người dùng để xác thực câu trả lời của AI. Khi một mô hình AI tạo ra câu trả lời, Automated Reasoning checks sẽ xác minh chúng và nếu phát hiện các trường hợp có khả năng “ảo giác”, công cụ này sẽ hiển thị câu trả lời đúng cùng với lỗi có thể xảy ra để khách hàng thấy được sự khác biệt.
Hiện công ty kiểm toán PwC đang sử dụng công cụ này để xây dựng trợ lý AI cho khách hàng của mình.
Cũng tại sự kiện, CEO Amazon - Andy Jassy, đã công bố mô hình AI tạo sinh mới có tên là Nova, với 4 phiên bản là: Micro, Lite, Pro và Premier.
Các mô hình này đều có thể xử lý văn bản, hình ảnh và video, và tạo ra các văn bản phức tạp. Hiện Nova Micro, Lite và Pro đang có sẵn để phục vụ cho khách hàng, mô hình Nova Premier dự kiến sẽ được ra mắt vào quý đầu tiên của năm 2025.
Bên cạnh Nova Micro, Lite, Pro và Premier, AWS còn giới thiệu hai mẫu Nova dành cho các nhà sáng tạo nội dung: Nova Canvas để tạo hình ảnh và Nova Reel để tạo video.
Ông Jassy cho biết các mô hình Nova rẻ hơn khoảng 75% so với các mô hình cạnh tranh, điều này khiến chúng trở thành sự lựa chọn dễ tiếp cận hơn đối với các nhà phát triển. Ông cũng nhấn mạnh về tốc độ của các mô hình này, tuyên bố rằng các mô hình Nova hiện đang có độ trễ thấp nhất.
Ngoài ra, máy chủ mới của AWS sẽ dựa trên chip Trainium2. Cùng với sự hỗ trợ từ Anthropic, máy chủ này sẽ được kết nối với nhau thông qua một cụm máy tính AI khổng lồ sử dụng hàng trăm ngàn con chip. Giám đốc điều hành AWS, Matt Garman cho biết Trainium3 là thế hệ chip AI tiếp theo của công ty và nó sẽ được ra mắt vào năm sau.
Ông Garman cho biết thêm: “Các sản phẩm mới này được tạo ra với mục đích đáp ứng khối lượng công việc có sự yêu cầu cao về đào tạo và suy luận của AI tạo sinh tiên tiến”.
Các máy chủ mới được AWS gọi tên là Trn2 UltraServers sẽ cạnh tranh với máy chủ hàng đầu của Nvidia, có chứa những con chip Blackwell mới nhất của hãng. Cả hai công ty đều cung cấp công nghệ độc quyền để có thể kết nối với các chip, tuy nhiên, Gadi Hutt, người đứng đầu bộ phận phát triển kinh doanh chip AI tại AWS, cho biết AWS có thể kết nối với nhiều chip khác nhau hơn so với Nvidia.
“Chúng tôi nghĩ rằng với Trainium2, khách hàng sẽ có được khả năng tính toán tốt hơn so với những gì Nvidia hiện có và khách hàng hoàn toàn có thể tiết kiệm được nhiều chi phí”, Hutt cho biết, đồng thời ông nói thêm một số mô hình AI có thể được đào tạo với chi phí thấp hơn 40% so với chip Nvidia.
Các giám đốc điều hành của AWS cho biết các máy chủ mới và siêu máy tính khổng lồ sẽ được đưa vào hoạt động vào năm tới nhưng không đưa ra ngày cụ thể.