Google hôm thứ Hai đã âm thầm phát hành ứng dụng chuyển giọng nói thành văn bản ưu tiên hoạt động ngoại tuyến mang tên “Google AI Edge Eloquent” trên iOS, nhằm cạnh tranh với các đối thủ như Wispr Flow, SuperWhisper, Willow và nhiều ứng dụng khác.
Ứng dụng được tải miễn phí. Sau khi cài đặt các mô hình nhận dạng giọng nói tự động dựa trên Gemma, người dùng có thể bắt đầu đọc để điện thoại ghi âm và chuyển thành văn bản. Nội dung được hiển thị theo thời gian thực; khi tạm dừng, ứng dụng sẽ tự động loại bỏ các từ đệm như “ừm”, “à” và chỉnh sửa câu chữ cho mạch lạc hơn.
Bên dưới bản ghi là các tùy chọn như “Ý chính”, “Trang trọng”, “Ngắn” và “Dài”, cho phép biến đổi nội dung văn bản theo nhu cầu.
Người dùng cũng có thể tắt chế độ đám mây để chỉ sử dụng xử lý cục bộ. Khi bật chế độ này, ứng dụng sẽ dùng các mô hình Gemini trên đám mây để làm sạch và tối ưu văn bản.
Google AI Edge Eloquent có thể nhập một số từ khóa, tên riêng và thuật ngữ từ tài khoản Gmail của người dùng (nếu được cho phép). Ngoài ra, người dùng cũng có thể bổ sung các từ tùy chỉnh.
Ứng dụng lưu lại lịch sử các phiên ghi âm, cho phép tìm kiếm nội dung, đồng thời cung cấp các thống kê như số từ đã nói trong phiên gần nhất, tốc độ nói (từ/phút) và tổng số từ đã ghi nhận.
Theo mô tả trên App Store, đây là ứng dụng được thiết kế nhằm thu hẹp khoảng cách giữa lời nói tự nhiên và văn bản chuyên nghiệp. Thay vì ghi lại nguyên văn cả lỗi nói và từ đệm, Eloquent sử dụng AI để nắm bắt ý định người nói, tự động loại bỏ các yếu tố thừa và tạo ra văn bản rõ ràng, chính xác.
Hiện ứng dụng mới chỉ có trên iOS, nhưng phần mô tả cũng đề cập đến phiên bản Android trong tương lai. Theo đó, Eloquent có thể được tích hợp sâu vào hệ điều hành, cho phép đặt làm bàn phím mặc định để sử dụng trên toàn hệ thống, cùng với tính năng nút nổi giúp truy cập nhanh chức năng chuyển giọng nói thành văn bản.
Các ứng dụng chuyển giọng nói thành văn bản bằng AI đang ngày càng phổ biến khi công nghệ nhận dạng giọng nói được cải thiện. Với Eloquent, Google đang tham gia xu hướng này. Nếu thử nghiệm thành công, nhiều khả năng các tính năng tương tự sẽ sớm được mở rộng trên Android.

Màn hình hiển thị ứng dụng chuyển giọng nói thành văn bản mang tên “Google AI Edge Eloquent”. Ảnh: Google

