Google tuần này đã công bố một công cụ trí tuệ nhân tạo mới mà theo các nhà khoa học của hãng, có thể giúp giải mã những bí ẩn của bộ gene người — và trong tương lai mở ra khả năng phát triển các phương pháp điều trị bệnh mới.
Công cụ mang tên AlphaGenome, một mô hình học sâu, được nhiều nhà nghiên cứu độc lập đánh giá là một “đột phá”, cho phép giới khoa học nghiên cứu và thậm chí mô phỏng nguồn gốc của các bệnh di truyền khó điều trị.
Theo ông Pushmeet Kohli, Phó Chủ tịch phụ trách nghiên cứu tại Google DeepMind, việc hoàn thiện bản đồ gene người đầu tiên vào năm 2003 “giống như trao cho nhân loại cuốn sách của sự sống, nhưng việc đọc hiểu cuốn sách đó vẫn là một thách thức lớn”.
“Chúng ta có văn bản,” ông nói, ám chỉ chuỗi khoảng ba tỷ cặp nucleotide — được ký hiệu bằng bốn chữ cái A, T, C và G — cấu thành nên ADN. Tuy nhiên, “hiểu được ‘ngữ pháp’ của bộ gene này, tức những gì được mã hóa trong ADN và cách nó chi phối sự sống, mới là biên giới nghiên cứu quan trọng tiếp theo”.
Thực tế, chỉ khoảng 2% ADN của con người chứa các chỉ dẫn để tạo ra protein — những phân tử xây dựng và vận hành cơ thể. Phần 98% còn lại từng bị coi là “ADN rác” do giới khoa học chưa hiểu rõ chức năng.
Ngày nay, các nhà nghiên cứu tin rằng phần “ADN không mã hóa” này đóng vai trò như một nhạc trưởng, điều phối cách thông tin di truyền được kích hoạt trong từng tế bào. Nhiều trình tự trong số đó cũng chứa các biến thể liên quan đến bệnh tật — và đây chính là trọng tâm mà AlphaGenome hướng tới giải mã.
AlphaGenome là một phần trong chuỗi nghiên cứu khoa học ứng dụng AI của Google, bên cạnh AlphaFold — công trình từng giúp DeepMind giành Giải Nobel Hóa học năm 2024.
Mô hình này được huấn luyện từ dữ liệu của các dự án khoa học công khai, đo lường ADN không mã hóa trên hàng trăm loại tế bào và mô khác nhau ở người và chuột. AlphaGenome có khả năng phân tích các chuỗi ADN rất dài, sau đó dự đoán tác động của từng cặp nucleotide lên các quá trình sinh học trong tế bào, như thời điểm gene được kích hoạt hoặc ngừng hoạt động, hay lượng ARN được tạo ra.
Trước đây, các mô hình tương tự thường phải đánh đổi giữa việc phân tích chuỗi ADN ngắn hoặc giảm độ chi tiết của dự đoán. Theo ông Ziga Avsec, nhà khoa học DeepMind và là tác giả chính của nghiên cứu, các chuỗi dài — lên tới một triệu ký tự ADN — là điều kiện cần để hiểu đầy đủ môi trường điều hòa của một gene đơn lẻ.
Độ phân giải cao của AlphaGenome cũng cho phép các nhà khoa học đánh giá tác động của các biến thể di truyền bằng cách so sánh chuỗi ADN bị đột biến và không bị đột biến.
“AlphaGenome có thể đẩy nhanh hiểu biết của chúng ta về bộ gene, giúp xác định các yếu tố chức năng nằm ở đâu và vai trò của chúng ở cấp độ phân tử,” bà Natasha Latysheva, đồng tác giả nghiên cứu, cho biết.
Theo Google, công cụ này đã được khoảng 3.000 nhà khoa học tại 160 quốc gia thử nghiệm và hiện được mở cho cộng đồng sử dụng vì mục đích phi thương mại.
Nhà nghiên cứu Ben Lehner (Đại học Cambridge), người không tham gia phát triển mô hình nhưng đã thử nghiệm AlphaGenome, nhận xét công cụ này “hoạt động rất hiệu quả”. Ông cho rằng việc xác định chính xác những khác biệt di truyền làm tăng hoặc giảm nguy cơ mắc hàng nghìn căn bệnh là bước then chốt để phát triển các liệu pháp điều trị tốt hơn.
Dù vậy, các chuyên gia cũng cảnh báo về những giới hạn của công cụ. Ông Lehner lưu ý rằng AlphaGenome “vẫn còn xa mới hoàn hảo”, bởi các mô hình AI phụ thuộc rất lớn vào chất lượng dữ liệu huấn luyện. Trong khi đó, ông Robert Goldstone, Trưởng bộ phận gene học tại Viện Francis Crick (Anh), cho rằng AlphaGenome “không phải là lời giải cho mọi câu hỏi sinh học”, do biểu hiện gene còn chịu tác động của nhiều yếu tố môi trường mà mô hình không thể quan sát.
Tuy nhiên, ông Goldstone vẫn đánh giá AlphaGenome là một “đột phá quan trọng”, giúp các nhà khoa học có thêm công cụ để nghiên cứu và mô phỏng nguồn gốc di truyền của các bệnh phức tạp.

AlphaGenome của Google hướng tới việc hiểu “ngữ pháp” của bộ gene người nhằm làm sáng tỏ các bệnh di truyền. Ảnh: AFP

