Theo SCMP, dựa trên thông tin có sẵn trong các cơ sở dữ liệu, một công cụ trí tuệ nhân tạo (AI) của Trung Quốc giúp các nhà khoa học phát hiện gần 162.000 loài virus RNA chưa từng biết đến với tốc độ chưa từng có - một loài mỗi giây.
Nghiên cứu chung do các nhà khoa học tại Trung Quốc đại lục, Hong Kong và Australia thực hiện.
Các nhà khoa học phát hiện gần 162.000 loài virus RNA mới nhờ công cụ AI Trung Quốc. (Ảnh: SCMP)
Nhóm nghiên cứu cho biết gần 162.000 loài virus RNA mới được phát hiện trong các môi trường khác nhau - bao gồm khí quyển, suối nước nóng và lỗ thông thủy nhiệt - làm nổi bật tính đa dạng và khả năng phục hồi của chúng trong điều kiện khắc nghiệt, đồng thời có thể cung cấp manh mối về cách các virus và các dạng sống cơ bản khác xuất hiện.
Bằng cách phân tích dữ liệu trình tự gene chưa được nhận diện trong các cơ sở dữ liệu công cộng, công cụ AI xác định virus dựa trên trình tự và thông tin cấu trúc protein ẩn mà virus RNA sử dụng để sao chép.
Công cụ này sử dụng thuật toán do nhóm Alibaba Cloud Intelligence phát triển dưới sự tư vấn của các nhà virus học.
Nhóm nghiên cứu viết trong bài báo đăng tải trên tạp chí Cell ngày 10/10: "Chúng tôi đã phát triển một mô hình học sâu dựa trên dữ liệu, vượt trội hơn các phương pháp thông thường về độ chính xác, hiệu quả và quan trọng nhất là sự đa dạng virus được phát hiện".
Nhóm cho biết đây là nghiên cứu phát hiện virus mới lớn nhất từng được công bố xét về số lượng loài trong một báo cáo.
Trưởng nhóm nghiên cứu Shi Mang, chuyên gia virus học và giáo sư tại Học viện Y khoa Đại học Trung Sơn (Quảng Đông, Trung Quốc) cho biết công cụ AI này không chỉ đẩy nhanh quá trình phát hiện virus vốn rất tốn thời gian khi sử dụng các phương pháp truyền thống, mà còn cho phép các nhà khoa học khám phá lĩnh vực virus chưa từng được biết đến trước đây.
“Tất cả các loại virus được phát hiện trong nghiên cứu này đều tồn tại trong môi trường và đã được giải trình tự. Các phương pháp trước đây của chúng tôi không thể nhận diện chúng, khiến chúng trở thành 'vật chất tối' đối với các nhà khoa học”, ông Shi nói, ám chỉ đến các trình tự không thể phân lập trước đây hoặc được phát hiện có liên quan đến các loại virus đã biết.
Vị giáo sư nói thêm: “Công cụ AI giải quyết vấn đề này cho chúng tôi với độ chính xác cao tương đương với các phương pháp sinh học tin học thông thường. Nó có thể khám phá các chuỗi 'vật chất tối', cùng với những trình tự gần hơn với các nhóm virus đã được xác lập”.
Ông Shi cho biết phát hiện này thúc đẩy các nghiên cứu trong tương lai bằng cách đặt nền tảng cho sự đa dạng của virus. "Ví dụ, nghiên cứu này cho chúng ta biết về sự tồn tại của virus trong điều kiện khắc nghiệt, chẳng hạn như suối nước nóng. Kiến thức này cho phép các nhà khoa học phát triển các mô tả toàn diện hơn về sinh thái trong các hệ sinh thái khác nhau”.
Nhà virus học chia sẻ thêm: "Về khả năng gây bệnh của virus, chúng ta sẽ có thể nghiên cứu sâu hơn về cách virus tương tác với vật chủ, cũng như xác định các nhóm virus có thể lây nhiễm cho một vật chủ cụ thể”.
Đồng tác giả Li Zhaorong, chuyên gia nghiên cứu sinh học tính toán tại Phòng thí nghiệm Apsara của Alibaba Cloud Intelligence, cho biết nghiên cứu chứng minh rằng thuật toán học sâu có thể thực hiện hiệu quả các nhiệm vụ trong khám phá sinh học.
Ông Li tuyên bố nhóm nghiên cứu sẽ tiếp tục cập nhật công cụ bằng các công nghệ AI tiên tiến như các mô hình đào tạo mới để phân tích nucleotide và protein.
“Chúng tôi cũng đang xem xét lại các vấn đề kinh điển trong virus học bằng tư duy AI và dữ liệu mới, chẳng hạn như cấu trúc và chức năng của virus, hay mối quan hệ giữa virus với con người và động vật”, ông Li nói.
Nhóm nghiên cứu kỳ vọng các phương pháp tương tự có thể được áp dụng để xác định vi khuẩn và ký sinh trùng.