
Yeshi Wangmo has spent years mastering correctly identifying weeds and debris in images of vast fields of corn and cotton. Photographer: Saritha Rai/Bloomberg
Tại vương quốc nhỏ bé Bhutan, hàng chục chuyên gia dữ liệu đang hoàn thiện các mô hình trí tuệ nhân tạo (AI) từ những văn phòng được bao quanh bởi đỉnh núi hùng vĩ của dãy Himalaya. Các nhân viên tại iMerit không chỉ đào tạo AI thực hiện những nhiệm vụ đơn giản như nhận diện “mèo nâu trên bậu cửa sổ” trong ảnh. Thay vào đó, họ dạy các thuật toán về giải phẫu của mắt người hoặc cách phát hiện những thay đổi trên bản đồ không gian địa lý.
Được hậu thuẫn bởi ba tỷ phú tại Thung lũng Silicon, iMerit là một phần trong nhóm các công ty đang xây dựng một phiên bản AI tinh vi hơn, có khả năng sinh lợi và đáng tin cậy hơn, một lĩnh vực dự kiến sẽ đóng góp gần 20 nghìn tỷ USD vào nền kinh tế toàn cầu vào năm 2030.
Khi các mô hình AI trở nên thông minh hơn, các doanh nghiệp lớn ngày càng tìm cách tận dụng sức mạnh của chúng cho những nhiệm vụ chuyên biệt, thúc đẩy sự ra đời của hàng loạt công ty khởi nghiệp cung cấp dịch vụ gắn nhãn dữ liệu (gắn thẻ hoặc chú thích dữ liệu) nhằm tùy chỉnh ứng dụng cho các ngành như tài chính, y tế và quốc phòng.
Gắn nhãn dữ liệu phải đảm bảo các nhãn được gắn chính xác, nhất quán, và phù hợp cho việc huấn luyện mô hình AI. Điều này thường bao gồm các quy trình kiểm tra nhiều lớp hoặc sử dụng thuật toán để xác thực dữ liệu.
Đây là một cuộc chơi lớn. Mặc dù AI đang tạo nên cơn sốt tại Thung lũng Silicon, vẫn còn nhiều câu hỏi dai dẳng về việc liệu công nghệ này có thực sự hữu ích đủ để các doanh nghiệp trên thế giới sẵn sàng chi trả và giúp các nhà phát triển mô hình AI thu được lợi nhuận hay không. Tất nhiên, Nvidia đã trở thành một trong những công ty có giá trị lớn nhất thế giới nhờ bán chip AI. Nhưng các khách hàng lớn nhất của hãng, bao gồm Microsoft và Alphabet, vẫn đang thua lỗ vì chi phí khổng lồ để xây dựng các hệ thống AI tiên tiến hơn.
Radha Basu, nhà sáng lập kiêm giám đốc điều hành của iMerit, so sánh công việc hiện tại với các lập trình viên từng xây dựng internet, điện thoại di động và các nền tảng công nghệ hiện đại khác. “Chúng tôi là những lập trình viên của cuộc cách mạng AI,” bà nói.
Đưa AI đạt đến trình độ cao trong các ngành không liên quan, nhạy cảm và đôi khi nguy hiểm là một thách thức lớn. Điều này đòi hỏi một đội ngũ chuyên gia giàu kinh nghiệm sẵn sàng làm thêm công việc đào tạo và cải tiến các mô hình trong những lĩnh vực kỹ thuật.
Tại Kenya, một startup đang phát triển công nghệ quét các khu rừng để phát hiện dấu hiệu của những kẻ săn trộm. Ở Kazakhstan, các chuyên gia y tế đang dạy mô hình AI nhận diện giai đoạn đầu của ung thư phổi. Tại Ấn Độ, Hàn Quốc, Việt Nam và nhiều nơi khác, các nhà ngôn ngữ học với mức thu nhập 65 USD/giờ đang giúp AI thành thạo các ngôn ngữ khác ngoài tiếng Anh.
Tại iMerit, công ty có 5.000 nhân viên ở Bhutan, Ấn Độ và New Orleans, Yeshi Wangmo, 23 tuổi, xuất thân từ một gia đình nông dân, đã dành nhiều năm để thành thạo một nhiệm vụ duy nhất: phân biệt chính xác cỏ dại từ hình ảnh của những cánh đồng ngô và bông khổng lồ. Wangmo và các đồng nghiệp của cô, mặc trang phục truyền thống đầy màu sắc của Bhutan, giúp các công ty như Blue River Technology, một công ty con của Deere & Co., xây dựng thuật toán cải thiện độ chính xác khi phun thuốc trừ sâu và phân bón, giảm sử dụng lên đến 90%.
“Chúng tôi đang chứng kiến các công ty giải quyết các vấn đề ngày càng phức tạp nhưng cũng rất chuyên biệt,” Ivan Lee, nhà sáng lập kiêm CEO của công ty giải pháp gắn nhãn dữ liệu Datasaur, cho biết. Khách hàng của ông bao gồm Netflix và FBI.
Độ chính xác của dữ liệu là kim chỉ nam cho công việc này. Khi ChatGPT ra mắt cách đây hai năm, các nhà phê bình nhanh chóng chỉ ra các sai sót và thiếu sót của nền tảng. Kể từ đó, hàng loạt chuyên gia đã được tuyển dụng để kiểm soát chất lượng. Công việc này đòi hỏi sự tỉ mỉ. Những người gắn nhãn dữ liệu như Wangmo cẩn thận xem xét các bản quét, ảnh, video và văn bản để chuẩn bị cho các mô hình AI. Mục tiêu là cải thiện các hệ thống AI tạo sinh được đào tạo trên các tập dữ liệu khổng lồ để phân tích hoặc tạo ra nội dung mới. Việc hoàn thiện chúng sẽ loại bỏ sự chênh lệch giữa khả năng tiềm năng của AI và hiệu suất thực tế của nó trong thế giới thực.
Chuyên môn hóa ngày càng trở nên quan trọng trong các lĩnh vực có tính rủi ro cao như tình báo quân sự, theo Kathleen Walch, giám đốc tại công ty nghiên cứu PMI Cognilytica.
Các phiên bản cấp thấp của công việc này không phải là mới. Ngành dịch vụ dữ liệu bắt đầu khoảng hai thập kỷ trước. Khi đó, những người gắn nhãn dữ liệu ở các nơi như Philippines và Ấn Độ chủ yếu gắn nhãn cho các tập dữ liệu nhỏ phục vụ nhận diện giọng nói cho trợ lý ảo hoặc công cụ tìm kiếm trên các trang web mua sắm. Nhưng theo thời gian, khi AI ngày càng cải tiến, nhu cầu đã chuyển sang tuyển dụng các chuyên gia và trả lương cao hơn, mặc dù vẫn thấp hơn nhiều so với các nhà khoa học dữ liệu ở Thung lũng Silicon.
Tại Ấn Độ, một bác sĩ X-quang tham gia đào tạo các mô hình AI có thể kiếm được khoảng 1.200 USD chỉ trong vài giờ làm việc, theo lời Hardik Dave, nhà sáng lập kiêm giám đốc điều hành của Indika AI, một công ty gắn nhãn dữ liệu nổi tiếng. Ông cho biết, thu nhập trung bình hàng tháng của một nhân viên chuyên môn thường chỉ bằng khoảng một phần ba số tiền đó.
Ngày nay, các công ty khởi nghiệp cung cấp dịch vụ gắn nhãn dữ liệu đang thu hút các nhà đầu tư danh tiếng. Mùa hè năm nay, công ty lớn nhất trong lĩnh vực này, Scale AI, đã huy động vốn từ Meta Platforms và Amazon.com. Với mức định giá gần 14 tỷ USD, Scale AI đã vượt qua giá trị của các nhà phát triển mô hình AI hàng đầu như Mistral và Cohere.
Năm 2023, danh sách 50 công ty AI hàng đầu của Sequoia đã bao gồm bốn công ty gắn nhãn dữ liệu, tăng từ chỉ một công ty vào năm trước. Một trong số đó, Snorkel AI, được tài trợ bởi chi nhánh đầu tư mạo hiểm của Alphabet với mức định giá 1 tỷ USD.
Nhìn chung, thị trường gắn nhãn dữ liệu, trị giá gần 20 tỷ USD vào năm 2024, được dự báo sẽ tăng trưởng khoảng 20% hàng năm cho đến năm 2030, theo Grand View Research, một công ty nghiên cứu thị trường có trụ sở tại San Francisco.
Hậu quả của một sai sót cũng trở nên nghiêm trọng hơn. Một khung dữ liệu bị gắn nhãn sai có thể khiến doanh nghiệp thiệt hại hàng triệu USD, kéo theo các vụ kiện hoặc thậm chí gây tử vong. Các công cụ AI quét ung thư hoặc xe tự lái là hai lĩnh vực nhạy cảm.
“AI kém chính xác có thể đi chệch hướng,” Wendy Gonzalez, giám đốc điều hành của Sama, một công ty có trụ sở tại Los Gatos với các khách hàng bao gồm Ford Motor và Walmart, cho biết. “Các doanh nghiệp không thể chấp nhận điều đó.”
Ví dụ sự hợp tác giữa Bệnh viện Đa khoa Massachusetts và Centaur Labs, một công ty gắn nhãn dữ liệu khởi nghiệp với 50.000 nhân viên làm việc tự do ở các quốc gia bao gồm Mỹ, Kazakhstan và Việt Nam.
Trong những năm gần đây, Centaur Labs, có trụ sở tại Boston, đã cải thiện các sản phẩm sử dụng tại bệnh viện này, từng bước sử dụng các chuyên gia dữ liệu có kỹ năng cao hơn. Một số liên quan đến các bệnh thông thường hàng ngày. Những lĩnh vực khác lại đi sâu vào các vấn đề nặng nề hơn, chẳng hạn như phát triển AI có thể xác định chính xác hơn các nốt phổi trong các bản quét CT. Tháng trước, công ty đã công bố nhận được một khoản đầu tư từ Accel, Y Combinator và những nhà đầu tư khác.
Polina Pilius, một bác sĩ X-quang ở Kazakhstan, người giám sát các nhóm làm việc cho một nhà thầu của Centaur Labs, cho biết công việc ngày càng trở nên chuyên biệt hơn. Hiện nay, bà nói, việc chỉ phát hiện các nốt phổi là không đủ. Khách hàng ngày càng yêu cầu các tính năng chuyên biệt hơn, giúp giảm số lượng dương tính giả và theo dõi sự phát triển của các nốt phổi theo thời gian.
“Gắn nhãn dữ liệu y tế là một quá trình phức tạp, không thể chấp nhận sự vội vàng, thiếu năng lực, bất cẩn hoặc cắt giảm chi phí quá mức,” Pilius nói.
Dù có nhiều rủi ro, những người ủng hộ AI lập luận rằng việc đào tạo các mô hình để giải quyết các vấn đề phức tạp trong các lĩnh vực nguy hiểm vẫn tốt hơn là không làm gì cả. Trong nhiều trường hợp, họ cho rằng chỉ có lợi ích mang lại.
Labelbox, công ty khởi nghiệp có trụ sở tại San Francisco, đang làm việc với một khách hàng cung cấp phân tích camera hành trình cho các công ty quản lý hàng trăm nghìn xe tải. Trong năm qua, các chuyên gia dữ liệu của Labelbox đã đào tạo các bot AI để trở nên tinh thông hơn trong việc giám sát xem tài xế có buồn ngủ hoặc say rượu hay không. Khi phát hiện được, các nhà điều hành đội xe sẽ nhận được cảnh báo và liên lạc với tài xế.
Manu Sharma, giám đốc điều hành của Labelbox, cho biết đây chỉ là một ví dụ cho thấy các mô hình AI không chỉ cắt giảm chi phí hoặc nâng cao hiệu suất mà còn cứu mạng sống. Công nghệ tốt nhất là công nghệ có thể cứu người, ông nói, và những người gắn nhãn dữ liệu đang ở tuyến đầu trong việc thúc đẩy khả năng của AI.
“Họ đang tạo ra một thế giới trong đó chuyên môn của mình trở nên dễ tiếp cận hơn và có thể được áp dụng để mang lại lợi ích cho xã hội,” ông nói.
Yeshi Wangmo đã mất nhiều năm để có thể xác định chính xác cỏ dại từ hình ảnh các cánh đồng ngô và bông. Ảnh: Bloomberg
Văn phòng iMerit ở Thimphu, Bhutan. Ảnh: Bloomberg