Một mô hình trí tuệ nhân tạo (AI) được huấn luyện trên dữ liệu phức tạp từ tế bào người có thể mở ra lối tắt trong cuộc đua phát triển các loại thuốc mới.
Cách tiếp cận này, được công bố ngày 23/10 trên tạp chí Science, dựa trên xu hướng đang lan rộng trong lĩnh vực khám phá thuốc: sử dụng AI để đẩy nhanh quá trình rà soát khối lượng khổng lồ các hợp chất hóa học nhằm tìm ra những ứng viên tiềm năng cho các liệu pháp điều trị mới.
“Đây là một bản thiết kế mạnh mẽ cho tương lai,” nhà sinh học tế bào Hongkui Deng tại Đại học Bắc Kinh, người không tham gia nghiên cứu, nhận định. “Nó tạo ra một hệ thống sàng lọc ‘thông minh’ có khả năng tự học từ chính các thí nghiệm của mình.”
Phương pháp cũ tốn công sức
Trong nhiều thập kỷ, các nhà nghiên cứu tìm kiếm thuốc bằng cách thử nghiệm hàng loạt hợp chất trong thư viện hóa chất, xem chúng ảnh hưởng ra sao đến các tế bào nuôi cấy trong phòng thí nghiệm. Cách làm này từng đem lại thành công, chẳng hạn giúp phát hiện thuốc tiêu diệt tế bào ung thư.
Tuy nhiên, ngày càng nhiều nhà khoa học hướng tới những phương pháp sàng lọc phức tạp hơn, tận dụng kho dữ liệu gen khổng lồ thu thập từ tế bào người trong thập niên qua. Về lý thuyết, các phương pháp này có thể đánh giá cách hợp chất tác động đến toàn bộ mạng lưới hoạt động gen — từ đó mở ra hướng đi mới cho khám phá thuốc.
Tuy vậy, việc sàng lọc hàng chục nghìn hợp chất để tìm thuốc là cực kỳ tốn kém và mất công, theo kỹ sư y sinh Alex Shalek của Viện Công nghệ Massachusetts (MIT). Kết hợp quy mô thử nghiệm lớn như vậy với các phép đo phức tạp của dữ liệu gen là điều gần như không khả thi, ông nói.
Để giải bài toán này, Shalek hợp tác với các nhà nghiên cứu khác và Công ty công nghệ sinh học Cellarity. Họ cùng nhau huấn luyện một mô hình học sâu mang tên DrugReflector bằng dữ liệu công khai cho thấy gần 9.600 hợp chất hóa học ảnh hưởng ra sao đến hoạt động gen trong hơn 50 loại tế bào khác nhau.
Sau đó, nhóm nghiên cứu sử dụng DrugReflector để tìm các hóa chất có thể tác động đến quá trình tạo tiểu cầu và hồng cầu — đặc tính có thể hữu ích trong điều trị một số bệnh về máu. Họ chọn ra 107 hợp chất để thử nghiệm nhằm xác định hiệu quả thực tế.
Kết quả cho thấy DrugReflector hiệu quả gấp 17 lần so với phương pháp sàng lọc ngẫu nhiên truyền thống. Khi nhóm bổ sung dữ liệu của vòng thử nghiệm đầu tiên vào mô hình, tỷ lệ thành công của nó còn tăng gấp đôi.
Tiết kiệm công sức
Phương pháp này có thể giúp giảm mạnh khối lượng công việc cần thiết để sàng lọc thuốc mới, theo nhà khoa học dữ liệu ung thư Bissan Al-Lazikani của Trung tâm Ung thư MD Anderson (Texas). “Bạn có thể chỉ cần sàng lọc vài trăm hợp chất thay vì cả triệu,” bà nói.
Ông Deng cho biết, những phương pháp như vậy có thể hỗ trợ phòng thí nghiệm của ông trong việc tìm ra các hợp chất có khả năng tái lập trình tế bào — buộc chúng mang những đặc tính mới. Phòng thí nghiệm của ông đã dành nhiều năm để tìm kiếm các hóa chất giúp biến tế bào gốc thành tế bào sản sinh insulin, phục vụ điều trị tiểu đường.
Tuy nhiên, hiện tại DrugReflector vẫn bị giới hạn trong phạm vi 9.600 hợp chất đã được huấn luyện, nên chưa thể phát hiện ra những phân tử hoàn toàn mới, ông lưu ý.
Mục tiêu cuối cùng là tạo ra một hệ thống có thể dự đoán trực tiếp tác động sinh học của một phân tử dựa trên cấu trúc hóa học của nó. “Các công nghệ hiện nay rất hứa hẹn,” ông Deng nói. “Nhưng độ chính xác và khả năng khái quát hóa của chúng vẫn cần được cải thiện đáng kể.”

Một phương pháp trí tuệ nhân tạo kết hợp dữ liệu biểu hiện gen có thể giúp tăng tốc quá trình khám phá thuốc mới. Ảnh: Bloomberg

