Trung Quốc đang tăng tốc xây dựng một hệ thống ngân hàng sinh học quy mô quốc gia, với tham vọng biến dữ liệu y sinh thành nền tảng cho đổi mới công nghệ và cạnh tranh trực tiếp với Mỹ cùng phương Tây trong lĩnh vực dược phẩm và công nghệ sinh học.
Ở trung tâm của chiến lược này là Ngân hàng sinh học quốc gia – dự án chủ lực ra mắt tại Thâm Quyến năm 2016, hiện đã trở thành một trong những kho dữ liệu sinh học lớn nhất thế giới. Bắc Kinh đang thúc đẩy để đưa hệ thống này lên vị trí dẫn đầu toàn cầu, coi đây như “hạ tầng cốt lõi” của nền kinh tế sinh học tương lai.
Được truyền thông trong nước ví như “Con tàu Noah của Trung Quốc”, ngân hàng này lưu trữ khoảng 10 triệu mẫu sinh học – từ máu, tế bào người đến động vật, thực vật và sinh vật biển – đồng thời đang tích hợp thêm nhiều cơ sở dữ liệu trên toàn quốc. Song song đó, Trung tâm Dữ liệu Gen quốc gia cũng mở rộng nhanh chóng, gấp đôi quy mô dữ liệu và hợp nhất nhiều hệ thống lớn chỉ trong vài năm gần đây.
“Trong kỷ nguyên khoa học sự sống, ai sở hữu nguồn tài nguyên di truyền và biết cách khai thác chúng sẽ nắm lợi thế,” ông Mei Yonghong, cựu lãnh đạo dự án, từng nhận định, so sánh dữ liệu sinh học với đất đai trong thời nông nghiệp và năng lượng trong thời công nghiệp.
Từ phân mảnh đến tích hợp: xây dựng “động cơ dữ liệu” quốc gia
Dù có lợi thế dân số 1,4 tỷ người, Trung Quốc trong nhiều năm lại thiếu một hệ thống dữ liệu sinh học thống nhất. Các bệnh viện, trường đại học và viện nghiên cứu vận hành theo những tiêu chuẩn khác nhau, khiến dữ liệu bị phân tán và khó khai thác.
Hiện nay, nước này đang triển khai một quá trình quy mô lớn nhằm thu thập, chuẩn hóa, số hóa và hợp nhất hàng triệu mẫu sinh học, với mục tiêu tạo ra một “động cơ dữ liệu” phục vụ nghiên cứu và phát triển thuốc.
Một ví dụ là dự án do nhà khoa học Zhang Li tham gia tại Bắc Kinh: xây dựng cơ sở dữ liệu quốc gia thu thập mẫu máu và ADN của 33.000 trẻ em để nghiên cứu bệnh não. Dự án kéo dài 15 năm, với sự tham gia của hơn 70 bệnh viện và viện nghiên cứu, có thể trở thành ngân hàng sinh học lớn nhất thế giới về sức khỏe tâm thần trẻ em.
“Dữ liệu y sinh có giá trị rất lớn và là nền tảng để tìm ra giải pháp điều trị bệnh cũng như làm chậm quá trình lão hóa,” Zhang nói bên trong phòng thí nghiệm, nơi các cánh tay robot xung quanh ông đang sắp xếp mẫu máu.
Động lực địa chính trị: dữ liệu trở thành “tài nguyên chiến lược”
Phòng thí nghiệm của Zhang là một phần trong mạng lưới ngân hàng sinh học đang phát triển nhanh chóng tại Trung Quốc — các kho lưu trữ dữ liệu và mẫu sinh học như máu, nước bọt và tế bào, đóng vai trò cốt lõi trong nghiên cứu dược. Lĩnh vực này đang trở thành một mặt trận mới của cạnh tranh địa chính trị, khi Bắc Kinh tìm cách thách thức sự thống trị của phương Tây trong nền kinh tế sinh học toàn cầu, được dự báo trị giá hàng nghìn tỷ USD.
Trong những năm gần đây, Mỹ và châu Âu đã siết chặt quyền truy cập của các nhà khoa học Trung Quốc vào các cơ sở dữ liệu y sinh nhạy cảm, đồng thời hạn chế hợp tác nghiên cứu. Washington thậm chí chặn truy cập vào hàng chục bộ dữ liệu lớn, bao gồm các kho thông tin di truyền và ung thư quy mô quốc gia.
Dữ liệu y sinh – từng được chia sẻ tương đối cởi mở – nay ngày càng được coi là tài sản chiến lược, tương tự bán dẫn hay trí tuệ nhân tạo.
“Khái niệm dữ liệu sinh học như một nguồn lực chiến lược đang gia tăng, đặc biệt trong cạnh tranh Mỹ–Trung,” một nhà phân tích tại Đại học Georgetown nhận định.
Năm ngoái, Washington đã chặn các nhà nghiên cứu từ Trung Quốc và năm quốc gia khác truy cập 21 bộ dữ liệu y sinh do Viện Y tế Quốc gia Mỹ quản lý, đồng thời hạn chế một số công ty công nghệ sinh học Trung Quốc tham gia các hợp đồng do chính phủ tài trợ. Giới chức Mỹ lo ngại dữ liệu di truyền tiên tiến có thể bị khai thác cho mục đích gây tổn hại an ninh quốc gia hoặc mang lại lợi thế quân sự.
Đáp lại, Trung Quốc cũng tăng cường kiểm soát nội bộ. Luật an ninh sinh học ban hành năm 2020 siết chặt việc thu thập, lưu trữ và chuyển dữ liệu di truyền ra nước ngoài.
Mục tiêu dài hạn là tự chủ dữ liệu y sinh – một phần trong chiến lược “an ninh toàn diện” mà Bắc Kinh theo đuổi.
Lợi thế lớn – nhưng không dễ đạt được
Dữ liệu trong các ngân hàng sinh học là nền tảng cho những lĩnh vực then chốt như y học chính xác – nơi bác sĩ sử dụng thông tin di truyền để lựa chọn phương pháp điều trị phù hợp cho từng bệnh nhân.
Tuy nhiên, Trung Quốc vẫn đang trong giai đoạn “rượt đuổi”. Theo một số nhà khoa học, khoảng 80% nghiên cứu khoa học sự sống của nước này vẫn phụ thuộc vào cơ sở dữ liệu tại Mỹ. Việc xây dựng một hệ thống độc lập có thể mất từ 5 đến 10 năm.
Trong ngắn hạn, các hạn chế từ phương Tây đã bắt đầu làm gián đoạn một số nghiên cứu, buộc các nhà khoa học Trung Quốc tìm cách hợp tác gián tiếp thông qua các quốc gia khác.
Cơ hội toàn cầu và những lo ngại đi kèm
Về lý thuyết, những tiến bộ của Trung Quốc trong nghiên cứu y sinh và đầu tư vào hạ tầng kỹ thuật có thể mang lại lợi ích toàn cầu. Đáng chú ý, chúng có thể bổ sung tính đa dạng sắc tộc cho kho dữ liệu khoa học vốn lâu nay thiên lệch về người châu Âu. Các biến thể di truyền, biểu hiện gen và cơ chế bệnh có thể khác nhau theo nguồn gốc và môi trường sống, đồng thời phản ứng với thuốc cũng khác nhau giữa các nhóm dân tộc.
Tuy nhiên, vẫn còn nhiều câu hỏi về mức độ chia sẻ dữ liệu, khi quyền truy cập được phân tầng theo mức độ nhạy cảm và điều kiện hợp tác.
Ngoài ra, các vấn đề đạo đức cũng được đặt ra, liên quan đến việc thu thập và sử dụng dữ liệu di truyền quy mô lớn.
Một “cuộc đua hạ tầng” dài hạn
Đối với Trung Quốc, xây dựng ngân hàng sinh học không chỉ là một dự án khoa học, mà là một phần của chiến lược công nghiệp dài hạn – tương tự cách nước này đầu tư vào chip bán dẫn hay trí tuệ nhân tạo.
Đối với các nhà khoa học như Zhang Li, ưu tiên trước mắt mang tính thực tiễn: xây dựng hạ tầng dữ liệu y tế để chuẩn bị cho tương lai, khi trí tuệ nhân tạo mở ra những khả năng mới.
“Cũng như chip, Trung Quốc phát triển lĩnh vực này trước hết vì nó quan trọng,” Zhang Li nói.
Trong một thế giới nơi dữ liệu ngày càng quyết định năng lực đổi mới, ai kiểm soát được dữ liệu sinh học có thể định hình tương lai của y học – và cả cán cân công nghệ toàn cầu.

Ngân hàng sinh học lưu trữ khối lượng lớn dữ liệu y sinh như hồ sơ lâm sàng, trình tự bộ gen và các chỉ số sức khỏe dài hạn — nền tảng cho nghiên cứu và phát triển dược phẩm. Ảnh: Bloomberg

