Tóm tắt Google I/O 2025: Xem nhanh 6 quy trình chính của Gemini

Sau các sự kiện lớn như Microsoft Build và COMPUTEX, hội nghị công nghệ thứ ba trong tuần này là Google I/O 2025 chính thức khai mạc. Giám đốc điều hành Sundar Pichai đã chủ trì và giới thiệu nhiều sản phẩm cũng như dịch vụ cập nhật, hãy cùng chúng tôi nhanh chóng tìm hiểu tất cả điểm nhấn của hội nghị phát triển Google lần này.

Đội ngũ của Pichai đã công bố nhiều dữ liệu và chỉ số quan trọng về Google trong năm qua tại hội nghị dành cho các nhà phát triển:

Vào thời điểm này năm ngoái, tổng khối lượng từ (token) mà các sản phẩm và API của Google xử lý mỗi tháng là 9,7 triệu; hiện nay đã vượt qua 480 triệu, tương ứng với mức tăng 50 lần.

Trên toàn cầu, có hơn 7 triệu nhà phát triển sử dụng mô hình Gemini để phát triển, tăng 5 lần so với cùng kỳ năm trước, trong khi mức sử dụng Gemini trên nền tảng Vertex AI cũng đã tăng 40 lần.

Số lượng người dùng hoạt động hàng tháng của Gemini App đã vượt 400 triệu, Google ghi nhận động lực tăng trưởng và mức độ tham gia của người dùng mạnh mẽ, đặc biệt là trên các mô hình series Gemini 2.5. Trong số các người dùng sử dụng Gemini 2.5 Pro, mức sử dụng đã tăng 45%.

Mô hình Gemini

Hiện tại, mô hình đã tiến triển đến series Gemini 2.5, trong đó hai tuần trước đã phát hành bản xem trước Gemini 2.5 Pro và Gemini 2.5 Flash dự kiến sẽ được cung cấp rộng rãi vào đầu tháng 6.

Gemini Diffusion hoàn toàn mới và Gemini 2.5 Pro đã tích hợp tính năng Deep Think, tăng cường khả năng suy luận và tạo ra giải pháp trong lĩnh vực toán học và lập trình. Công cụ lập trình AI Jules cũng đã vào giai đoạn thử nghiệm công khai.

Gemini App

Đây là một chatbot AI sử dụng mô hình Gemini, sẽ có thêm tính năng trả phí Agent Mode, giúp người dùng hoàn thành các nhiệm vụ phức tạp và tốn thời gian.

Ngoài ra, Deep Research của Gemini có thể tích hợp dữ liệu từ Google Drive và Gmail để phân tích. Canvas có thể chuyển đổi nội dung phản hồi của Gemini thành biểu đồ hoặc tóm tắt âm thanh dưới dạng hội thoại. Gemini Live sẽ kết nối với các ứng dụng Google khác, chẳng hạn như chụp thông tin sự kiện và thêm vào lịch Google. Gemini cũng sẽ được tích hợp trong Chrome, thuận tiện cho việc sử dụng khi duyệt web, và người dùng tại Mỹ sẽ là những người đầu tiên sử dụng.

Google thông báo rằng Gemini sẽ kết hợp với công cụ chuyển văn bản thành hình ảnh thế hệ tiếp theo, Imagen 4, với sự chú trọng vào chi tiết hình ảnh, văn bản và bố cục, có thể tạo ra hình ảnh quảng cáo chất lượng như áp phích. Ngoài ra, còn có công cụ chuyển văn bản thành hình ảnh Veo 3, với chất lượng hình ảnh tốt hơn và khả năng hiểu được cách hoạt động vật lý, quan trọng nhất là có thể tạo ra âm thanh nền và lồng ghép. Đặc biệt là công cụ chuyển văn bản thành nhạc Lyria 2 cũng được ra mắt, được sử dụng trong Music AI Sandbox, Vertex AI và YouTube Shorts.

Kết hợp các tính năng tạo ra hình ảnh, hình ảnh động và nhạc ở trên, Google đã ra mắt công cụ mới “FLOW”, tích hợp lại để tạo ra video.

Google AI Pro / Ultra

Người dùng có thể sử dụng gói đăng ký trả phí mới Google AI Pro / Ultra, ưu tiên cho người dùng tại Mỹ.

Gói Google AI Pro có giá 19,99 USD mỗi tháng và hiện có 1 tháng dùng thử miễn phí. Gói Google AI Ultra có giá lên tới 249,99 USD mỗi tháng, hiện tại đang có ưu đãi giảm 50% cho 3 tháng đầu tiên, tất cả các tính năng cao cấp của Gemini sẽ được cung cấp ưu tiên, ngoài ra còn có YouTube Premium và 30TB dung lượng lưu trữ đám mây.

Dự án Starline / Astra / Mariner

Dự án Starline là một công nghệ video 3D đột phá, phát triển thành nền tảng mới “Google Beam”, sử dụng các mô hình video tiên tiến, chuyển đổi video 2D thành trải nghiệm 3D chân thực thông qua một bộ camera gồm 6 chiếc, kết hợp với công nghệ AI để đồng bộ hóa video streaming, và hiển thị hình ảnh 3D trên màn hình ánh sáng 3D. Đặc biệt, Google Meet cung cấp tiếng dịch giọng nói theo thời gian thực hai chiều bằng tiếng Anh và Tây Ban Nha, trong vài tuần tới sẽ hỗ trợ thêm nhiều ngôn ngữ hơn.

Gemini Live tích hợp công nghệ từ Dự án Astra, nay đã có sẵn miễn phí tính năng chia sẻ camera và màn hình trên phiên bản Gemini cho Android và iOS.

Dự án Mariner, một công cụ AI có thể thay thế con người hành động, theo dõi đồng thời 10 nhiệm vụ và sẽ được cung cấp cho các nhà phát triển thông qua API của Geminin.

Google Search

Gemini 2.5 hỗ trợ chức năng AI Overviews và AI Mode, giúp người dùng có thể đặt câu hỏi dài hơn và khó hơn trên Google Search. AI Overviews đã thúc đẩy 10% lưu lượng tìm kiếm tại các thị trường chính như Mỹ và Ấn Độ, và chế độ AI mới được chính thức cung cấp cho người dùng tại Mỹ ngay hôm nay.

Nhờ công nghệ từ Dự án Astra, chế độ AI bổ sung chức năng “Search Live”, sử dụng camera điện thoại và chia sẻ màn hình để tìm kiếm thông tin hữu ích.

Chế độ AI cũng áp dụng cho việc mua sắm trực tuyến, Google đã thêm tính năng thử đồ ảo để kết hợp những bộ quần áo tìm thấy trên mạng với hình ảnh cơ thể của người dùng, tạo ra hình ảnh thử đồ mới. Đồng thời, có thể thiết lập theo dõi giá và thanh toán tự động, khi giá xuống mức ưu đãi nhất định, AI sẽ tự động mua và yêu cầu người dùng hoàn tất thanh toán, tất cả các chức năng này sẽ được ưu tiên cung cấp cho người dùng tại Mỹ.

Android XR

Đối với các thiết bị đeo đầu và kính thông minh, Android XR sử dụng Gemini làm cốt lõi sản phẩm. Tại sự kiện đã trình diễn kính thông minh tích hợp Android XR và dự báo sản phẩm đeo đầu Android XR đầu tiên của Samsung, Project Moohan sẽ được ra mắt trong năm nay.

▲ Toàn bộ nội dung bài thuyết trình chủ đề trong ngày đầu của Google I/O 2025.

Đọc thêm:

Mô hình Gemini 2.5 Pro được các nhà phát triển yêu thích, thêm tính năng Deep Think mới. Gemini trở thành trợ lý trình duyệt Chrome, tóm tắt thông tin trên web, sắp tới có thể nhận diện video và hình ảnh qua nhiều trang mà công cụ AI của Google tạo ra? SynthID Detector được thử nghiệm. Brin trở lại Google, tập trung phát triển AI và kính AR. Android XR hợp tác với Warby Parker và Gentle Monster để tạo ra kính thông minh thời trang. Google I/O 2025 tập trung vào AI, vấn đề ảo giác không được đề cập.