Google giới thiệu Gemini 2.5 với hiệu suất cải thiện, khả năng xử lý đa phương thức và mô hình “lý luận” giúp AI giải quyết các tác vụ phức tạp một cách chính xác và hiệu quả hơn.
Sau khi ra mắt mô hình AI “mở” với hiệu suất cải thiện trên một GPU duy nhất, Google tiếp tục nâng cấp dòng sản phẩm AI của mình với Gemini 2.5. Phiên bản này kết hợp mô hình cơ sở nâng cấp đáng kể cùng với quy trình huấn luyện sau cải tiến, giúp tăng cường hiệu suất tổng thể. Google tuyên bố rằng Gemini 2.5 Pro vượt trội so với các đối thủ như OpenAI, Anthropic, xAI và DeepSeek trong các bài kiểm tra AI phổ biến về khả năng hiểu ngôn ngữ, toán học, lập trình và các lĩnh vực khác. Người dùng có thể trải nghiệm mô hình này thông qua Google AI Studio hoặc chọn Gemini 2.5 Pro trong menu mô hình của ứng dụng Gemini Advanced.

Nâng cao khả năng xử lý đa phương thức và mở rộng ngữ cảnh
Một điểm nổi bật của Gemini 2.5 là khả năng xử lý đa phương thức mạnh mẽ, cho phép mô hình không chỉ phân tích văn bản mà còn nhận diện âm thanh, hình ảnh tĩnh, video và mã nguồn. Google cũng tiết lộ rằng cửa sổ ngữ cảnh 2 triệu token sẽ sớm được triển khai, giúp AI xử lý lượng dữ liệu lớn hơn đáng kể. Theo Demis Hassabis, CEO của Google DeepMind, Gemini 2.5 Pro đạt vị trí số một trên bảng xếp hạng LMArena với mức tăng 39 điểm ELO, cùng những cải tiến vượt bậc trong lý luận đa phương thức, lập trình và các lĩnh vực STEM.
Bước tiến lớn nhờ khả năng “lý luận” có hệ thống
Google nhấn mạnh rằng sự cải thiện đáng kể của Gemini đến từ việc ứng dụng mô hình “lý luận” tiên tiến, giúp AI xử lý tác vụ theo từng bước và đưa ra quyết định chính xác hơn. Theo bài đăng trên blog của công ty, các mô hình Gemini mới đang được tích hợp khả năng tư duy trực tiếp, giúp AI giải quyết các vấn đề phức tạp hơn và hỗ trợ các tác vụ thông minh, nhận biết ngữ cảnh tốt hơn.
Một đoạn video demo cũng minh họa khả năng này, khi Gemini 2.5 Pro có thể lập trình một trò chơi điện tử chỉ từ một đoạn yêu cầu đơn giản.