
Gã khổng lồ viễn thông Pháp Orange vừa công bố hợp tác với OpenAI và Meta (công ty mẹ của Facebook) để xây dựng các mô hình trí tuệ nhân tạo tùy chỉnh (custom artificial intelligence models), nhằm hiểu rõ hơn các ngôn ngữ khu vực tại châu Phi.
Orange cho biết đang làm việc với OpenAI và Meta để phát triển các mô hình AI tùy chỉnh dựa trên Whisper và Llama — các mô hình mã nguồn mở có thể được điều chỉnh để đáp ứng các nhu cầu cụ thể — nhằm hiểu được các ngôn ngữ Tây Phi mà hầu hết các hệ thống hội thoại (conversational systems) hiện nay không hỗ trợ.
Hiện tại, phần lớn dữ liệu mà các công ty AI lớn dùng để huấn luyện thuật toán của họ có nguồn gốc từ Mỹ. Điều này dẫn đến việc các mô hình AI có thể mất đi những ngữ cảnh quan trọng về văn hóa và ngôn ngữ khi áp dụng cho các khu vực khác như châu Âu, Trung Đông và châu Phi. Điều này khiến các mô hình AI khó hiểu được các giao tiếp qua văn bản và giọng nói bằng những ngôn ngữ ít được đại diện, theo Steve Jarrett, Giám đốc AI của Orange.
“Với một mô hình mở, bạn có thể thực hiện cái gọi là tinh chỉnh (fine tuning), tức là bổ sung thêm thông tin vào mô hình mà trước đó không được đưa vào khi nó được huấn luyện ban đầu,” Jarrett chia sẻ. “Chúng tôi đang bổ sung khả năng nhận diện các ngôn ngữ khu vực Tây Phi vốn chưa được bất kỳ AI nào hiện nay hiểu.”
Orange dự kiến bắt đầu triển khai các mô hình AI tích hợp hai ngôn ngữ khu vực Tây Phi là Wolof và Pulaar vào đầu năm 2025. Hai ngôn ngữ này lần lượt được khoảng 16 triệu và 6 triệu người sử dụng.
Wolof là ngôn ngữ được sử dụng tại Senegal, Gambia và miền nam Mauritania, trong khi Pulaar chủ yếu được nói ở Senegal.
Các mô hình AI mã nguồn mở sẽ được Orange cung cấp với giấy phép miễn phí cho các mục đích phi thương mại, bao gồm y tế công cộng và giáo dục. Orange cũng lên kế hoạch mở rộng sáng kiến mô hình AI tùy chỉnh của mình để cuối cùng bao phủ toàn bộ 18 quốc gia Tây Phi.
“Chúng tôi hoạt động tại các quốc gia Tây Phi, nơi nhiều ngôn ngữ khu vực được sử dụng tại các trung tâm hỗ trợ khách hàng của chúng tôi. Tuy nhiên, các mô hình AI hiện tại không hiểu được người dân ở đây đang gõ hoặc nói những gì,” Jarrett nói.
Hướng đi ‘AI có chủ quyền’
Động thái này khai thác một khái niệm đang ngày càng được chú ý (gaining traction) toàn cầu, gọi là “AI có chủ quyền” (Sovereign AI). Thuật ngữ này ám chỉ ý tưởng rằng các quốc gia và khu vực nên tăng cường kiểm soát cơ sở hạ tầng công nghệ cốt lõi mà các hệ thống AI dựa vào, bằng cách bản địa hóa lưu trữ và xử lý dữ liệu để đảm bảo chúng phản ánh đúng ngôn ngữ, văn hóa và lịch sử riêng biệt.
Orange cũng đang tìm cách bản địa hóa xử lý dữ liệu và lưu trữ các mô hình của OpenAI tại các trung tâm dữ liệu ở châu Âu. Điều này, theo Orange, sẽ giúp họ tiếp cận sớm với các mô hình AI tiên tiến nhất của OpenAI và hỗ trợ phát triển các ứng dụng mới như hệ thống giọng nói AI cho dịch vụ khách hàng.
Jarrett nhấn mạnh Orange cam kết sử dụng AI “một cách có trách nhiệm” và “không phải lúc nào cũng sử dụng các mô hình ngôn ngữ lớn (LLM) khổng lồ cho mọi vấn đề,” do lo ngại về lượng năng lượng khổng lồ mà công nghệ này tiêu tốn.
Ngoài việc sử dụng hệ thống AI để cải thiện dịch vụ khách hàng, Orange còn áp dụng công nghệ này để cải thiện một phần cốt lõi trong hoạt động kinh doanh của họ là mạng di động.
“Trong lĩnh vực mạng, chúng tôi sử dụng AI không chỉ để tối ưu hóa cách lập kế hoạch phát triển mạng mà còn để vận hành mạng một cách hiệu quả hơn,” Jarrett chia sẻ.
“Khối lượng dữ liệu từ toàn bộ thiết bị mạng là rất lớn, và với các hệ thống AI, chúng tôi có thể nhận diện các mẫu dữ liệu giúp dự đoán sự cố ngay cả trước khi khách hàng nhận ra.”
Logo của hãng viễn thông Pháp Orange tại sự kiện Mobile World Congress 2024 ở Barcelona, Tây Ban Nha. Ảnh: CNBC