
Với việc ra mắt dòng Pixel 10 mới, Google đang chạy trước Apple trong cuộc đua đưa smartphone tích hợp AI đến tay người dùng. Những thiết bị này được công bố trong buổi livestream “Made by Google” hôm thứ Tư, chỉ vài tuần trước khi Apple dự kiến trình làng iPhone 17 — vốn hứa hẹn vẫn theo mô típ quen thuộc: camera tốt hơn, thiết kế có thể mỏng hơn và thêm một vài màu sắc mới.
Năm ngoái, dòng Pixel 9 đã bổ sung hàng loạt tính năng AI như Gemini Live (chế độ thoại của Gemini), công cụ tạo ảnh, ghi chú cuộc gọi, tìm kiếm ảnh chụp màn hình, và nhiều hơn nữa. Từ đó đến nay, Google cho biết các cuộc trò chuyện bằng Gemini Live dài gấp 5 lần so với hội thoại văn bản.
Năm nay, gã khổng lồ công nghệ tung thêm nhiều nâng cấp AI với Pixel 10, bao gồm: Visual Overlays cho camera, tính năng chủ động Magic Cue, Camera Coach, Voice Translate cho cuộc gọi, trợ lý Take a Message, Pixel Journal, và nhiều hơn thế.
Tất cả được hỗ trợ bởi Tensor G5, con chip tuỳ chỉnh mới nhất của Google được thiết kế cho trải nghiệm AI, đồng thời là bộ xử lý đầu tiên chạy mô hình Gemini Nano.
Google cũng cho biết Gemini Live sẽ sớm có mô hình âm thanh mới, giúp nhận diện cảm xúc trong giọng nói (ví dụ: vui mừng hay lo lắng) và điều chỉnh phản hồi cho phù hợp.
Với Visual Overlays, Gemini Live có thể “nhìn” qua ống kính camera và đưa ra hướng dẫn bằng cách đánh dấu trực tiếp trên màn hình. Ví dụ: khi đi du lịch nước ngoài, bạn có thể giơ điện thoại để kiểm tra bảng hiệu đường phố xem có thông tin đậu xe hay không.
Magic Cue lại cho phép AI chủ động hơn, đưa ra gợi ý theo ngữ cảnh theo thời gian thực trong Gmail, Calendar, Messages, Screenshots và nhiều ứng dụng khác.
Ý tưởng về sự tương tác chủ động giữa người dùng và công nghệ của Google vốn đã manh nha từ lâu, trước cả thời kỳ AI. Đầu những năm 2010, Google từng ra mắt Google Now trên Android — hiển thị thẻ thông tin theo thời gian thực như nhà hàng gần đó vào giờ ăn trưa, lịch họp sắp tới, hoặc thông tin chuyến bay.
Giờ đây, Magic Cue chính là sự tái sinh của Google Now với sức mạnh AI, nhưng thay vì là một ứng dụng riêng, nó xuất hiện trực tiếp trong các app người dùng. Google trình diễn cách Magic Cue gợi ý một nhà hàng, cho phép bạn nhanh chóng gọi điện đặt bàn, đề xuất tin nhắn trả lời bạn bè với thông tin đặt chỗ, hoặc kiểm tra lịch rảnh trong Calendar.
Các gợi ý của Magic Cue sẽ hiển thị ngay trong ứng dụng bạn dùng (có viền cầu vồng để dễ phân biệt), cũng như trong Daily Hub — bảng tin cá nhân trong Discover. Người dùng có thể chạm vào gợi ý để thực hiện hành động.
Một bổ sung thú vị khác của Pixel 10 là Camera Coach, trợ lý AI giúp chụp ảnh đẹp hơn. Tính năng này (ra mắt dưới dạng thử nghiệm) dùng mô hình Gemini để gợi ý cách căn chỉnh, bố cục, thậm chí có chế độ “get inspired” gợi ý những cảnh bạn có thể chưa nghĩ đến.
Khi chụp ảnh nhóm, Pixel 10 sẽ tự động kích hoạt Auto Best Take, phân tích đến 150 khung hình trong vài giây để chọn ảnh đẹp nhất — hoặc thậm chí ghép nhiều ảnh lại bằng AI.
Ngoài ra, công cụ Ask Photos cho phép chỉnh sửa ảnh bằng giọng nói hoặc văn bản — từ chỉnh sáng, thay đổi khung hình, đến xóa vật thể.
Liên quan đến AI trong nhiếp ảnh, Pixel 10 cũng là smartphone đầu tiên áp dụng chuẩn C2PA — giúp xác định nguồn gốc và chỉnh sửa của nội dung số, hỗ trợ phát hiện ảnh bị chỉnh sửa bằng AI.
Một tính năng AI khác, Voice Translate, dùng AI trên thiết bị để dịch cuộc gọi theo thời gian thực, đồng thời giữ nguyên giọng nói tự nhiên của mỗi người. Đây có thể là bước đột phá lớn, nhất là cho doanh nhân và khách du lịch. Tính năng này hỗ trợ dịch sang/ từ: tiếng Anh, Tây Ban Nha, Đức, Nhật, Pháp, Hindi, Ý, Bồ Đào Nha, Thụy Điển, Nga và Indonesia.
Ngoài ra, trong ứng dụng Điện thoại, tính năng mới Take a Message cung cấp bản ghi lại theo thời gian thực cho các cuộc gọi nhỡ hoặc bị từ chối, sau đó dùng AI để đề xuất hành động tiếp theo dựa trên voicemail của người gọi.
Gemini Live sẽ sớm có mô hình âm thanh mới, giúp nhận diện cảm xúc trong giọng nói như vui mừng hay lo lắng, và điều chỉnh phản hồi cho phù hợp. Ảnh: TechCrunch