Những sản phẩm AI được giới thiệu tại sự kiện Google I/O 2024
(DNTO) - Tại sự kiện dành cho các nhà phát triển I/O 2024 được diễn ra vào rạng sáng 15/5 theo giờ Việt Nam, Google thông báo việc nâng cấp chatbot Gemini cũng như lần đầu giới thiệu về những AI mới.
Trong sự kiện, công ty đã giới thiệu về Gemini 1.5 Flash, phiên bản bổ sung cho chatbot Gemini. Theo Google chia sẻ trên blog, phiên bản mới này có khả năng tóm tắt các cuộc hội thoại, chú thích hình ảnh và video cũng như trích xuất dữ liệu từ các tài liệu lớn.
Demis Hassabis, CEO của Google DeepMind, cho biết trong một cuộc họp báo: “Chúng tôi đã nghe được từ các nhà phát triển rằng họ muốn thứ gì đó nhanh hơn, thậm chí là tiết kiệm chi phí hơn”.
Đợt ra mắt này diễn ra khi các công ty công nghệ đang ngày càng tập trung lại vào việc phát triển sản phẩm và triển khai AI tạo sinh, vốn có tầm quan trọng đặc biệt đối với Google vì các công cụ mới này cung cấp cho người dùng những cách thức sáng tạo và tiên tiến hơn để truy cập thông tin trực tuyến.
Trước đó vào ngày 13/5, OpenAI đã cho ra mắt mô hình AI mới và phiên bản ChatGPT cho máy tính để bàn, cùng với cả giao diện người dùng mới. Công ty cho biết mẫu AI mới có tên là GPT-4o, nhanh gấp đôi GPT-4 Turbo và giá thành chỉ bằng một nửa.
Theo Google, công ty gần đây đã công bố mẫu Gemini 1.5 Pro cải tiến, có thể xử lý được nhiều tài liệu lớn, lên tới 1.500 trang hoặc tóm tắt 100 email.
Sissie Hsiao, phó chủ tịch Google cho biết, Gemini 1.5 Pro sẽ sớm có thể xử lý những nội dung video lên tới một giờ hoặc hơn 30.000 dòng code.
“Bạn có thể nhanh chóng nhận được câu trả lời và thông tin chi tiết về các tài liệu dày đặc, chẳng hạn như tìm hiểu chi tiết về các chính sách trong hợp đồng thuê nhà hoặc so sánh các lập luận chính của của nhiều tài liệu nghiên cứu dài”, bà Hsiao cho biết.
Gemini 1.5 Pro ban đầu sẽ có sẵn để thử nghiệm trong Workspace Labs. trong khi đó Gemini 1.5 Flash sẽ có sẵn để thử nghiệm trong Vertex AI, nền tảng máy học của Google cho phép các nhà phát triển đào tạo và triển khai các ứng dụng AI.
Cũng trong sự kiện I/O 2024, Google đã lần đầu giới thiệu AI mới có tên là Veo, có khả năng tạo ra video có thời lượng hơn một phút với độ phân giải 1080p “chất lượng cao” kết hợp nhiều phong cách hình ảnh và điện ảnh khác nhau.
AI này được ra mắt sau ba tháng kể từ lúc Sora, AI chuyển văn bản thành video của OpenAI xuất hiện.
Theo đại diện của Google, Veo có sự “hiểu biết nâng cao về ngôn ngữ tự nhiên”, cho phép mô hình này hiểu được các thuật ngữ điện ảnh như “timelapse (tua nhanh thời gian)” hay “ảnh phong cảnh từ trên không”. Người dùng có thể điều chỉnh kết quả mong muốn của mình bằng cách sử dụng lời nhắc dựa trên văn bản, hình ảnh hoặc video và từ đó thu được cảnh quay “nhất quán và mạch lạc hơn”, mô tả chuyển động của con người, động vật và đồ vật trong suốt các cảnh quay một cách thực tế hơn.
Theo ông Hassabis, kết quả video có thể được tinh chỉnh bằng cách sử dụng các lời nhắc bổ sung và Google đang khám phá những tính năng mới nhằm cho phép Veo tạo ra được những phân cảnh dài hơn.
Theo Google, Veo được xây dựng dựa trên năm mô hình tạo video, bao gồm Generative Query Network (GQN), DVD-GAN , Imagen-Video, Phenaki, WALT, VideoPoet và Lumiere, kết hợp với những kỹ thuật khác để cải thiện chất lượng và độ phân giải đầu ra.
Công ty cũng đã cải tiến các kỹ thuật về cách mà mô hình học cách để hiểu được nội dung trong video, hiển thị hình ảnh có độ phân giải cao, mô phỏng tính chất vật lý của thế giới và hơn cả thế nữa.
“Những kiến thức này sẽ thúc đẩy những tiến bộ trong nghiên cứu AI của chúng tôi và cho phép chúng tôi xây dựng nhiều sản phẩm hữu ích hơn nữa để giúp mọi người tương tác và giao tiếp theo những cách mới", Google cho biết.
Tại sự kiện, Google cũng giới thiệu về một AI tạo hình ảnh có tên là Imagen 3. Theo gã khổng lồ công nghệ, mô hình này có khả năng tạo ra bức hình với độ chi tiết đến đáng kinh ngạc, hình ảnh chân thực, sống động như thật và có ít chi tiết gây mất tập trung trong ảnh hơn so với những mô hình trước đây.
Imagen 3 cũng hiểu rõ hơn ngôn ngữ tự nhiên, và dự đoán được mục đích đằng sau lời nhắc của dùng, đồng thời sự hiểu biết nâng cao của mô hình này giúp nó tạo ra được nhiều phong cách khác nhau.
Hiện tại cả Veo và Imagen 3 chưa được phát hành rộng rãi và chỉ mới có sẵn cho các nhà sáng tạo nội dung dùng thử. Nếu quan tâm, người dùng cần phải đăng ký vào danh sách chờ. Hãng cũng dự kiến đưa một số tính năng của Veo vào YouTube Shorts và các sản phẩm khác.