Cập nhật quan trọng của Gemini, phát hành phiên bản ổn định 2.5 Pro và phiên bản tiết kiệm chi phí 2.5 Flash-Lite.

Sau vài tháng điều chỉnh và tối ưu hóa, mô hình hiệu suất cao Gemini 2.5 Pro cuối cùng đã thoát khỏi giai đoạn xem trước, sẵn sàng để các nhà phát triển áp dụng. Đồng thời, Google công bố phiên bản xem trước Gemini 2.5 Flash-Lite nhanh hơn và tiết kiệm chi phí hơn.

Tiến bộ của Google trong lĩnh vực AI được chú ý nhờ sự ra mắt của mô hình Gemini 2.5, loạt mô hình này có sự cải thiện rõ rệt so với các phiên bản trước, giúp Google trở nên cạnh tranh hơn trong cuộc đua AI, so với OpenAI GPT, Anthropic Claude và các đối thủ khác.

Trước khi đạt giai đoạn khả dụng chung (GA), các nhà phát triển và người dùng đã trải nghiệm nhiều phiên bản thử nghiệm và xem trước của Gemini. Hiện nay, Gemini 2.5 Flash đã vào giai đoạn GA với phiên bản 04-17, và Gemini 2.5 Pro cũng đã thoát khỏi giai đoạn xem trước để đạt GA, với phiên bản 06-05 đã được cải thiện gần đây, sửa một số vấn đề từ phiên bản Gemini 2.5 Pro được phát hành tại Google I/O. Cả hai phiên bản đều có mặt trên ứng dụng Gemini, người dùng có thể lựa chọn sử dụng.

Người dùng miễn phí trong ứng dụng Gemini sẽ gặp một số hạn chế khi sử dụng Gemini 2.5 Pro, người dùng đăng ký Google AI Pro trả phí có thể sử dụng 100 lần mỗi ngày, trong khi người dùng Google AI Ultra cấp cao nhất sẽ được hưởng quyền truy cập tối ưu nhất vào Gemini 2.5 Pro.

Tất cả các mô hình Gemini 2.5 có thiết kế kiểm soát ngân sách linh hoạt, cho phép các nhà phát triển kiểm soát chi phí một cách linh hoạt. Đối với các nhà phát triển quan tâm đến chi phí, phiên bản thử nghiệm Gemini 2.5 Flash-Lite, trước đây mang tính thử nghiệm, giờ đây đã vào giai đoạn xem trước, cung cấp giải pháp vẫn giữ chi phí thấp dưới tải trọng AI cao.

Gemini 2.5 Flash-Lite đã vượt trội hơn Gemini 2.0 Flash-Lite trong việc mã hóa, toán học, khoa học, suy luận và các bài kiểm tra chuẩn đa phương tiện. So với Gemini 2.5 Flash, nó chỉ cần một phần ba chi phí cho đầu vào văn bản, hình ảnh và video, và không quá một phần sáu cho đầu ra.

Gemini Flash và Gemini Flash-Lite cũng sẽ triển khai dịch vụ tìm kiếm, các phiên bản tùy chỉnh của những mô hình này đã được đưa vào tổng quan và chế độ AI. Google thường áp dụng mô hình phù hợp nhất dựa trên độ khó của truy vấn, sử dụng Gemini 2.5 Pro cho các truy vấn phức tạp, còn các truy vấn đơn giản hơn thì sử dụng Gemini Flash hoặc thậm chí Gemini Flash-Lite.

Gemini 2.5 Flash-Lite được cung cấp cho các nhà phát triển thông qua Google AI Studio và Vertex AI, cùng với Gemini 2.5 Flash và Gemini 2.5 Pro hoạt động ổn định.

▲ Cách tính phí và hiệu suất kiểm tra chuẩn của gia đình Gemini 2.5.

(Hình ảnh nguồn: Google Blog)