Google mới đây đã trình làng Gemini 3, mô hình trí tuệ nhân tạo thế hệ tiếp theo với nhiều cải tiến.
Phiên bản Gemini 3 được thiết kế dựa trên nền tảng kế thừa từ các mô hình trước đó, đồng thời tăng cường khả năng hiểu ngữ cảnh, nhận diện các lớp nghĩa tinh tế và xử lý hiệu quả các tác vụ phức tạp với lượng câu lệnh tối giản.
Gemini 3 gây ấn tượng với khả năng lập luận được nâng cấp mạnh mẽ. Thay vì chỉ xử lý dữ liệu, mô hình có thể suy luận, phân tích vấn đề phức tạp và hiểu ngữ cảnh sâu hơn. Bên cạnh đó, tính năng tác nhân (agent) được tối ưu giúp Gemini 3 thực hiện các chuỗi hành động đa bước, mở ra kỷ nguyên mới cho những ứng dụng AI thông minh và tự động hóa quy trình.
Google Gemini 3 ra mắt.
Không chỉ mạnh về lập luận, Gemini 3 còn nổi bật ở khả năng tổng hợp thông tin từ nhiều loại dữ liệu khác nhau như văn bản, hình ảnh, video hay mã nguồn. Điều này cho phép người dùng tiếp cận và xử lý dữ liệu phức tạp một cách toàn diện hơn. Đặc biệt trong Google Search, Gemini 3 mang đến cách tìm kiếm thế hệ mới với giao diện tương tác trực quan, giúp người dùng hình dung các chủ đề khó và tiếp nhận thông tin nhanh hơn.
Mô hình này xuất sắc trong việc hỗ trợ tổng hợp thông tin từ đa dạng nguồn đầu vào, bao gồm văn bản, hình ảnh, video và mã nguồn, cho phép người dùng xử lý và hiểu dữ liệu phức tạp một cách toàn diện.
Gemini 3 có thể dễ dàng giải mã và dịch các tài liệu viết tay, chẳng hạn như những công thức nấu ăn gia đình cũ kỹ bằng nhiều ngôn ngữ khác nhau, sau đó chuyển đổi chúng thành một cuốn sách dạy nấu ăn kỹ thuật số có thể chia sẻ ngay lập tức.
Khi cần tiếp cận một chủ đề mới, người dùng chỉ việc cung cấp cho hệ thống những nguồn dữ liệu đa dạng. Từ đó, Gemini 3 sẽ tự động phân tích, chọn lọc và tái cấu trúc thông tin để tạo ra bộ tài liệu học tập tối ưu, giúp người học nhanh chóng nắm bắt và hiểu sâu kiến thức cốt lõi.
Kết quả thử nghiệm cho thấy mô hình đạt hiệu suất ấn tượng trên nhiều bộ đánh giá khả năng tổng hợp và hiểu dữ liệu đa nguồn. Cụ thể, Gemini 3 Pro ghi nhận 81% trên bài kiểm tra MMMU-Pro và 87,6% ở phiên bản video MMMU, khẳng định năng lực xử lý thông tin phức tạp từ cả hình ảnh và video. Mô hình cũng đạt 72,1% trên SimpleQA Verified, thể hiện mức độ chính xác cao hơn trong việc trả lời các câu hỏi dựa trên kiến thức nền tảng.
Ngoài phiên bản tiêu chuẩn, Google còn ra mắt Gemini 3 Deep Think – chế độ suy luận nâng cao giúp mở rộng đáng kể năng lực của mô hình. Trong các thử nghiệm, Gemini 3 Deep Think đạt kết quả vượt trội so với cả Gemini 3 Pro, với 41% trên Humanity's Last Exam và 93,8% ở GPQA Diamond, cho thấy khả năng phân tích chuyên sâu và lập luận mạnh mẽ hơn.