Chúng ta đang ở ngưỡng cửa của việc giải mã cách loài vật giao tiếp. Dưới đây là những gì giới khoa học đã tìm hiểu được — và cách trí tuệ nhân tạo (AI) có thể giúp con người cuối cùng hiểu được “ngôn ngữ” của chúng.
Waffles là một chú chó nhỏ với cá tính lớn. Chú chó giống Yorkshire Terrier này, có hơn một triệu người theo dõi trên TikTok, là một trong số ngày càng nhiều những chú chó có thể “giao tiếp” với chủ của mình bằng cách nhấn các nút điện tử.
Những thiết bị có kích cỡ bằng bàn chân chó này có thể được lập trình để phát ra các từ như “đi dạo” hay “đói bụng” — thậm chí cả những từ ngữ… chửi thề.
Vì thế, khi Mr. Waffles “nói” rằng mình đói còn chủ lại không đồng ý, chú liền bấm nút “that’s bullshit!” (tạm dịch: “thật là chết tiệt!”). Tiếng cười vang lên và Waffles lại có thêm hàng nghìn lượt thích mới.
Những nút “nói chuyện” này giúp các chú chó như Waffles dễ d àng diễn đạt nhu cầu, nhưng cùng lắm đó cũng chỉ là chó “nói tiếng người” — chứ không phải ngược lại.
Đừng xem nhẹ điều này. Việc bấm nút là chuyện nghiêm túc. Ngoại trừ Waffles, các nghiên cứu cho thấy nhiều chú chó thực sự phản ứng đúng với từ ngữ mà nút phát ra.
Khi nghe “ra ngoài”, chúng nhìn về phía cửa. Khi nghe “chơi”, đuôi chúng vẫy liên hồi. Quan trọng hơn, phản ứng này không phụ thuộc vào ai bấm nút — chủ hay người lạ — hay người chủ có nói từ đó hay không. Con chó dường như vẫn “hiểu được.”
Theo Tiến sĩ Federico Rossano từ Đại học California San Diego (Mỹ), người dẫn đầu nghiên cứu, kết quả này “cho thấy từ ngữ thực sự có ý nghĩa với chó, và chúng phản ứng với bản thân từ đó chứ không chỉ với tín hiệu đi kèm.”
Đây là kết quả đáng nể, nhưng dù chứng minh được rằng chó có thể nhận biết và phản ứng với tín hiệu bằng lời, các nhà phê bình vẫn cho rằng nghiên cứu chưa cho biết những từ đó thực sự mang ý nghĩa gì với con chó.
Nếu con người thật sự muốn giao tiếp với loài vật, chúng ta phải hiểu chúng theo cách của chúng. Từ tiếng rít của dơi đến tiếng huýt sáo của cá heo, điều đó có nghĩa là phải tìm cách giải mã hệ thống giao tiếp đa dạng của các loài động vật.
May mắn thay, giới khoa học đã theo đuổi mục tiêu này suốt nhiều thập kỷ, nghiên cứu hành vi và âm thanh của động vật hoang dã. Giờ đây, với sự hỗ trợ của công nghệ ngày càng phát triển, những khám phá đầy hứa hẹn đang dần xuất hiện.
Thậm chí còn có một giải thưởng hằng năm mang tên Coller-Dolittle Prize, được trao cho những bước tiến đáng kể trong giao tiếp giữa các loài. Nhờ vậy, chúng ta đang tiến gần đến khả năng không chỉ giải mã mà còn giao tiếp có ý nghĩa với các loài vật.
Dưới đây là một số điều thú vị mà giới khoa học đã đạt được cho đến nay:
Huýt sáo khi làm việc
Cũng như con người có giọng địa phương, nhiều loài vật cũng có “phương ngữ vùng miền.”
Cá voi sát thủ, cá voi lưng gù, vượn, chuột hyrax và nhiều loài chim hót đều có bài hát riêng của vùng, giúp chúng nhận ra đồng loại trong nhóm và đôi khi giúp thu hút bạn tình.
Các nhà khoa học còn phát hiện một số loài dùng “tên riêng.” Voi sử dụng tiếng kêu trầm, giàu hòa âm để gọi các thành viên chủ chốt trong bầy. Khỉ marmoset dùng tiếng kêu “phee” riêng biệt để liên lạc với từng cá thể, còn cá heo mũi chai gọi nhau bằng “tiếng huýt đặc trưng” (signature whistle) — được tạo ra từ khi còn nhỏ và ghi nhớ suốt hàng chục năm.
Điều tưởng chừng chỉ con người mới làm được hóa ra không hề độc quyền. Những loài này đều là động vật xã hội, cùng nhau tìm thức ăn, nuôi con và sinh tồn mỗi ngày. Việc có thể giao tiếp với từng cá thể giúp chúng phối hợp hiệu quả hơn — nhưng đó mới chỉ là phần nổi của tảng băng ngôn ngữ động vật.
Tiến sĩ Laela Sayigh thuộc Viện Hải dương học Woods Hole (Massachusetts, Mỹ) là thành viên nhóm nghiên cứu cá heo mũi chai ở vịnh Sarasota, bang Florida, suốt hàng chục năm qua. Đôi khi, các con cá heo được bắt lại để kiểm tra sức khỏe nhanh. Khi đó, các nhà khoa học gắn micro thủy âm (hydrophone) lên trán chúng để ghi lại tiếng phát ra. Nhờ vậy, nhóm đã ghi nhận hơn 250 “tiếng huýt đặc trưng” khác nhau.
Cá heo sử dụng những âm thanh này để truyền đi danh tính và gọi nhau trong nhóm. Đặc biệt cảm động, khi cá heo mẹ gọi con, chúng biến đổi tiếng huýt của mình, mở rộng dải tần — âm cao cao hơn và âm thấp thấp hơn.
Điều này tương tự như cách các bà mẹ loài người nói chuyện với em bé. “Đó là phiên bản ‘ngôn ngữ mẹ’ của loài cá heo,” Sayigh giải thích. Việc này được cho là giúp các con non học dần những âm thanh cần thiết cho cuộc sống trưởng thành.
Tiếng huýt đặc trưng rất quan trọng, nhưng trong vài năm gần đây, Sayigh đã phát hiện ra rằng cá heo còn làm được nhiều điều hơn là chỉ “gọi tên nhau.”
Sau khi phân tích hơn một nghìn giờ ghi âm tiếng kêu, nhóm của Sayigh nhận thấy khoảng một nửa số tiếng huýt của cá heo tự do bơi lội không phải là tiếng huýt đặc trưng.
Họ xác định được 20 kiểu huýt mới, mỗi kiểu được sử dụng bởi nhiều con cá heo khác nhau. Điều này cho thấy những tiếng huýt này được dùng để giao tiếp — nhưng chúng đang truyền đạt điều gì?
Để tìm hiểu, Sayigh áp dụng một phương pháp quen thuộc trong việc giải mã ngôn ngữ động vật.
Thực tế, các nhà nghiên cứu đã “trò chuyện” với động vật suốt nhiều thập kỷ qua bằng thí nghiệm phát lại âm thanh — tức là phát lại các bản ghi tiếng kêu cho động vật nghe để quan sát phản ứng của chúng.
Trong nghiên cứu này, các âm thanh được phát lại dưới nước, trong khi máy bay không người lái theo dõi hành vi của cá heo từ trên cao.
Một trong những tiếng huýt, được gọi là Type A, khiến cá heo bơi đi xa, trong khi một tiếng khác, Type B, lại khiến chúng bơi lại gần để tìm hiểu. “Chúng tôi cho rằng tiếng thứ nhất hoạt động như một tín hiệu báo động, còn tiếng thứ hai giống như một câu hỏi ‘cái gì vậy?’” Sayigh cho biết.
Những phát hiện này cho thấy khả năng giao tiếp của cá heo phong phú hơn nhiều so với suy nghĩ trước đây. Chúng có thể sở hữu một hệ thống giao tiếp giống ngôn ngữ, với các đơn vị âm thanh mang ý nghĩa chung và phụ thuộc vào ngữ cảnh.
“Công trình của chúng tôi cho thấy những tiếng huýt này có thể hoạt động tương tự như các từ trong ngôn ngữ,” Sayigh nói.
Biến dữ liệu thành đối thoại
Vào tháng 5 năm 2025, nhóm của Sayigh đã giành Giải thưởng Coller-Dolittle đầu tiên vì góp phần thúc đẩy tiến bộ trong giao tiếp hai chiều giữa con người và các loài khác.
Những người về nhì gồm một nhóm ở Paris, phát hiện rằng mực nang giao tiếp bằng cách vẫy tua theo những kiểu hình biểu cảm, và một nhóm ở Đức phát triển mô hình trí tuệ nhân tạo (AI) có thể tạo và phân tích các bản nhạc của chim sơn ca.
Nhóm của Sayigh nhận được 100.000 USD để tiếp tục công việc của họ, nhưng còn có giải thưởng lớn trị giá 500.000 USD dành cho bất kỳ ai có thể tạo ra một thuật toán cho phép con người và động vật giao tiếp trực tiếp — mà con vật không nhận ra rằng nó đang nói chuyện với con người.
Thử thách này lấy cảm hứng từ Bài kiểm tra Turing, trong đó một máy tính có thể trò chuyện tự nhiên đến mức khiến con người tưởng rằng mình đang nói chuyện với người thật.
Hiện nay, các mô hình và thuật toán AI đã trở thành công cụ mới nhất trong cuộc đua giải mã giao tiếp của động vật.
Giống như phiến đá Rosetta — hiện vật giúp các nhà ngôn ngữ học hiểu được chữ tượng hình Ai Cập vì chứa cùng một văn bản bằng ba ngôn ngữ — các nhà khoa học máy tính tin rằng AI có thể giúp con người hiểu và thậm chí tạo ra ngôn ngữ của động vật.
Một vấn đề lớn đối với các nhà sinh học là mặc dù họ có tập dữ liệu khổng lồ về tiếng kêu động vật, nhưng họ thiếu công cụ hoặc thời gian để phân tích.
Ngoài ra, rất dễ bỏ lỡ các tín hiệu giao tiếp tiềm năng nếu không biết cần tìm gì — và còn khó hơn để xác định ý nghĩa của các tín hiệu đó. Đây chính là lúc AI phát huy tác dụng.
AI sử dụng các thuật toán để xử lý dữ liệu và nhận diện các mẫu lặp. Chính công nghệ này giúp ChatGPT có thể đối thoại tự nhiên như con người và vượt qua bài kiểm tra Turing. “AI chắc chắn giúp mọi thứ trở nên dễ dàng hơn,” chuyên gia giao tiếp động vật Yossi Yovel nhận xét.
Yovel đã sử dụng AI để giải mã tiếng kêu chít chít của dơi ăn quả Ai Cập — một loài dơi hoạt động xã hội và “nhiều chuyện.” Chúng sống thành bầy từ vài chục đến vài nghìn con.
Một trong số các đàn này sống tại Đại học Tel Aviv (Israel), nơi Yovel làm việc. Ban ngày, chúng treo mình trong “hang” — thực chất là một căn phòng tối có đường hầm thông ra ngoài — còn khi hoàng hôn buông xuống, chúng bay ra bầu trời đêm.
“Lũ dơi hoàn toàn tự do ra vào,” Yovel nói. Tại bất kỳ thời điểm nào cũng có khoảng 30–60 con, mỗi con được gắn thiết bị ghi âm nhỏ như vòng cổ.
Lũ dơi cãi nhau suốt
Phần lớn tiếng kêu của chúng là những cuộc tranh cãi về thức ăn, chỗ đậu tốt nhất, hoặc việc có hay không muốn giao phối. Các thiết bị ghi lại từng tiếng kêu, trong khi camera ghi hình khi chúng ở trong “hang.”
Những tiếng kêu của dơi ăn quả Ai Cập có thể hé lộ ý thức về vị thế xã hội của từng con trong đàn.
Trong vòng hai tháng rưỡi, Yovel thu được 15.000 mẫu ghi âm, sau đó cho toàn bộ dữ liệu âm thanh và hình ảnh vào một phần mềm học máy để xem AI có thể làm được gì.
Trí tuệ nhân tạo đã không làm các nhà khoa học thất vọng. Nó có thể phát hiện ra những âm thanh cụ thể và dự đoán loại “cuộc cãi vã” mà lũ dơi đang tham gia khi phát ra những âm thanh đó.
Điều này cho thấy tiếng kêu của dơi không hề ngẫu nhiên — chúng phụ thuộc vào ngữ cảnh, gợi ý rằng chúng có ý nghĩa. Hơn nữa, các tiếng kêu này còn mang thông tin về con dơi phát ra âm thanh.
“Chúng tôi không nghĩ rằng đây là những cái tên,” Yovel nói, “nhưng chúng tôi tin rằng những âm thanh này có thể mã hóa thông tin về địa vị xã hội.”
AI đã nhận ra các mẫu âm thanh mà con người không phát hiện được, giúp lọc bỏ nhiễu và nhận ra những tín hiệu có ý nghĩa.
Lạc trong bản dịch?
Cách đó hàng nghìn dặm, ở vùng Caribbean, một dự án khác có sự hỗ trợ của AI cũng đang gây phấn khích. Các nhà nghiên cứu trong Dự án CETI (Cetacean Translation Initiative) đang sử dụng công nghệ để dịch tiếng kêu của cá nhà táng.
Cá nhà táng sống thành nhóm nhỏ gắn bó, do con cái dẫn đầu, mỗi nhóm gồm 7–8 cá thể. Chúng giao tiếp bằng chuỗi từ 3 đến 40 tiếng “click”, được gọi là coda.
Mỗi nhóm thuộc về một “thị tộc âm thanh” (vocal clan) lớn hơn, trong đó mỗi thị tộc có kiểu coda riêng biệt.
Các nhà nghiên cứu đã xác định được 21 kiểu coda mà thị tộc Caribbean sử dụng. Nhưng gần đây, họ đã đưa cùng bộ dữ liệu đó vào một mô hình AI mạnh mẽ, và chỉ trong nháy mắt, công nghệ này phát hiện ra những mẫu mà con người đã bỏ lỡ — như sự khác biệt về khoảng cách giữa các tiếng click, và những tiếng click phụ xuất hiện bất thường.
Mượn thuật ngữ từ âm nhạc, họ gọi những đặc điểm này là “rubato” (thay đổi nhịp linh hoạt) và “ornamentation” (trang âm). Tổng cộng, họ xác định được 156 kiểu coda riêng biệt.
“Điều này khiến hệ thống giao tiếp trở nên phức tạp hơn,” Shane Gero, Trưởng nhóm sinh học của Dự án CETI, cho biết. Ông ví sự đa dạng này giống như “bảng chữ cái ngữ âm của cá nhà táng”, có thể được dùng để truyền đạt thông tin phức tạp.
Ở những nơi khác, các nhà nghiên cứu đang đưa ngôn ngữ con người và thậm chí cả âm nhạc vào các mô hình AI dùng để giải mã tiếng động vật. Họ hy vọng rằng những mẫu cấu trúc trong các phương tiện ngôn ngữ của con người sẽ giúp AI dễ dàng nhận ra mẫu tương tự trong âm thanh của các loài khác.
Một ví dụ là NatureLM-Audio, mô hình AI chủ lực của Earth Species Project — một tổ chức phi lợi nhuận sử dụng học máy để thúc đẩy hiểu biết giữa các loài.
“Việc huấn luyện mô hình trước tiên bằng ngôn ngữ và âm nhạc của con người giúp nó hiểu hơn về giao tiếp của động vật,” theo Aza Raskin, đồng sáng lập kiêm chủ tịch dự án.
“Hiện tại, mô hình đã có thể xác định tên loài chính xác, ngay cả khi nó chưa từng nghe âm thanh của loài đó trước đây.”
Với đủ dữ liệu, Raskin tin rằng các mô hình máy tính mạnh mẽ của dự án sẽ không chỉ giải mã được ngôn ngữ động vật, mà còn có thể dự đoán điều chúng sắp nói, thậm chí tạo phản hồi cho chúng.
“Nếu không có quy mô dữ liệu lớn, việc dịch ngôn ngữ động vật là bất khả thi,” Raskin nói. “Nhưng với dữ liệu đủ lớn, điều đó là không thể tránh khỏi.” Khối lượng dữ liệu khổng lồ ngày nay có thể giúp nhân loại đạt được “phiến đá Rosetta kỹ thuật số” dành cho ngôn ngữ động vật.
Vậy câu hỏi đặt ra là: chúng ta nên nói gì?
Ở đây, con người phải hết sức thận trọng. Nếu nói sai điều gì, chúng ta có thể gây căng thẳng hoặc tổn hại. Những nỗ lực giao tiếp của con người có thể làm xáo trộn các mối quan hệ xã hội, truyền thống văn hóa, và hệ sinh thái đã tiến hóa hàng triệu năm.
Nhưng chúng cũng có thể mang lại điều tốt đẹp. “Mục tiêu cuối cùng là thay đổi mối quan hệ giữa con người và tự nhiên, để sự đa dạng sinh học có thể phát triển mạnh mẽ,” Raskin nói.
Vào những năm 1970, nhà sinh vật biển Roger Payne đã thu âm tiếng hát của cá voi và lần đầu tiên phát nó ra cho thế giới nghe. Những giai điệu ấy đã lay động trái tim con người, dẫn đến phong trào “Cứu cá voi”, và cuối cùng là lệnh cấm săn bắt cá voi thương mại.
Ngày nay, những người đang dùng công nghệ hiện đại để giải mã ngôn ngữ động vật hy vọng nỗ lực của họ cũng sẽ thúc đẩy công tác bảo tồn sự sống trên Trái đất.
Biết đâu, trong mười năm nữa, nếu một tàu đánh cá công nghiệp thả máy thủy âm xuống biển và, nhờ AI, nghe thấy một con cá voi kêu cứu, thì ngư dân, chính trị gia và người tiêu dùng sẽ phản ứng thế nào?
Dù chúng ta có thể sắp giao tiếp được với động vật, câu hỏi lớn hơn vẫn là: Liệu chúng ta đã sẵn sàng lắng nghe chưa?

Waffles, chú chó giống Yorkshire Terrier

Dự án của TS Laela Sayigh dùng thủy âm và máy bay không người lái để giải mã tiếng cá heo — Giải thưởng Coller-Dolittle 2025. Ảnh: Laela Sayigh

Phiến đá Rosetta khắc chiếu chỉ của Pharaoh Ptolemy V bằng ba loại chữ (Hy Lạp, tượng hình và bình dân), giúp các nhà Ai Cập học giải mã chữ tượng hình. Ảnh: Getty Images

Tiếng kêu của dơi ăn quả Ai Cập có thể tiết lộ ý thức của chúng về vị thế xã hội.

Hệ thống giao tiếp của cá voi rất phức tạp, đã tồn tại hàng nghìn năm. Ảnh: Alamy

Mực nang, bậc thầy ngụy trang, có thể dùng ngôn ngữ cơ thể như ngôn ngữ ký hiệu để giao tiếp. Ảnh: Getty Images

