Đây là cuộc thi có quy mô dữ liệu đặc trưng người Việt lớn nhất thế giới, thu hút 1.277 đội thi đến từ hơn 60 quốc gia và vùng lãnh thổ.
Cuộc thi “Ứng dụng AI phát hiện điểm bất thường trên ảnh X-quang lồng ngực” do Viện Nghiên cứu Dữ liệu lớn VinBigdata tổ chức, được triển khai toàn cầu trên Kaggle (sân chơi uy tín dành cho cộng đồng khoa học dữ liệu) từ 31/12/2020 đến ngày 31/3/2021.
Sau 3 tháng tranh tài, cuộc thi đã tìm ra chủ nhân của ba vị trí Nhất, Nhì, Ba và giải thưởng đặc biệt dành cho đội Việt Nam có thành tích cao nhất trên tổng số 1.277 đội thi.
Cuộc thi “Ứng dụng AI phát hiện điểm bất thường trên ảnh X-quang lồng ngực” do Viện Nghiên cứu Dữ liệu lớn VinBigdata - Tập đoàn Vingroup tổ chức trên Kaggle, sân chơi uy tín dành cho cộng đồng khoa học dữ liệu.
Đứng thứ nhất cuộc thi nhận giải thưởng trị giá 20.000 USD là đội ℳS²Ƒ gồm các thành viên đến từ Ủy ban Năng lượng Nguyên tử Quốc gia Argentina, công ty công nghệ y tế Ấn Độ HealthGenYZ, Tập đoàn Intel và H2O.ai (Google). SZI – đứng thứ hai với ba thành viên đến từ Nga. Đội đứng thứ ba là Scumed, sự kết hợp của năm thành viên đến từ Trung Quốc và Malaysia. ℳS²Ƒ, SZI và Scumed cũng là 3 đội luôn dẫn đầu trong suốt quá trình huấn luyện mô hình trên dữ liệu thử nghiệm.
Giải Đặc biệt của cuộc thi dành cho đội Việt Nam có thành tích tốt nhất được trao cho Chu Tấn Kiệt, Khoa Khoa học máy tính, Đại học Drexel, Philadelphia, Pennsylvania (Mỹ), xếp hạng thứ 10 chung cuộc với giải thưởng trị giá 8.000 USD.
Chu Tấn Kiệt cho biết: “Cuộc thi xử lý ảnh y tế do VinBigdata tổ chức có độ thực tiễn cao hơn so với hầu hết các cuộc thi về xử lý ảnh y tế hiện nay trên Kaggle (*) khi đồng thời phải phân loại bất thường và khoanh vùng điểm bất thường cho 14 nhóm bệnh. Ngoài ra, với phần thưởng đặc biệt cho các đội thi đến từ Việt Nam, cuộc thi cũng thúc đẩy người Việt tham gia tìm hiểu và tiếp cận các bài toán y tế thực tiễn”.
Cuộc thi thu hút 1277 đội đến từ hơn hơn 60 quốc gia và vùng lãnh thổ - Hình ảnh Bảng xếp hạng top 10 cuộc thi.
Với thử thách xây dựng thuật toán học máy để phát hiện và khoanh vùng 14 loại bất thường tim – phổi phổ biến, cuộc thi Phát hiện bất thường trên ảnh X-quang lồng ngực cung cấp bộ dữ liệu gồm 18.000 ảnh y khoa đặc trưng của người Việt. Dữ liệu được thu thập và chú giải bởi các bác sĩ giàu kinh nghiệm của Bệnh viện Vinmec, Bệnh viện Trung ương Quân đội 108 và Bệnh viện Đại học Y Hà Nội.
Bài toán mô phỏng công việc của các bác sĩ chẩn đoán ảnh y tế tại bệnh viện, với nguồn dữ liệu thực tế được chuẩn hóa, giúp người yêu công nghệ tiếp cận vấn đề thực tiễn. Kết quả chung cuộc được hệ thống tự động đánh giá dựa trên độ chính xác của thuật toán mà các đội thi gửi về, thông qua so sánh trực tiếp với kết quả mẫu của bác sĩ.
TS. Nguyễn Quý Hà, Trưởng phòng Xử lý ảnh y tế, Viện Nghiên cứu Dữ liệu lớn VinBigdata (Tập đoàn Vingroup) cho biết: “Với bộ dữ liệu chất lượng và quy mô lớn, cuộc thi của chúng tôi đã thu hút hàng nghìn thành viên tham dự, trong đó hơn 10% là Kaggle Master hoặc Grandmaster - các Đại kiện tướng trên Kaggle về Khoa học dữ liệu và các chuyên gia đến từ các công ty công nghệ lớn trên thế giới như Google, NVIDIA, Intel, ABBYY, Oracle, Preferred Networks... Ba đội thi xuất sắc dẫn đầu đã có những cách tiếp cận hiệu quả, từ đó có thể phát triển những giải pháp có ý nghĩa thực tiễn. Đặc biệt với 103 đội thi Việt Nam tham dự, đây là cuộc thi về Khoa học Dữ liệu quy mô toàn cầu có nhiều đội Việt Nam tham gia nhất từ trước đến nay”.
Kết thúc cuộc thi, 18.000 ảnh X-quang được Tập đoàn Vingroup chia sẻ tới cộng đồng Khoa học dữ liệu.
Kết thúc cuộc thi, bộ dữ liệu 18.000 ảnh X-quang được thu thập và gán nhãn bởi các bác sĩ chẩn đoán hình ảnh uy tín sẽ tiếp tục được VinBigdata chia sẻ trên Kaggle. Cuộc thi hướng tới mở rộng cơ hội tiếp cận cho cộng đồng Khoa học Dữ liệu trong và ngoài nước đối với dữ liệu y tế đặc trưng của người Việt, trên cơ sở đó, cộng hưởng trí tuệ để cùng phát triển các giải pháp giải quyết bài toán y tế của Việt Nam.
“Mục tiêu của Tập đoàn Vingroup là tạo ra những thay đổi tích cực trong cuộc sống người dân bằng việc thúc đẩy nghiên cứu khoa học và đổi mới công nghệ. Thông qua cuộc thi này, VinBigdata hy vọng sẽ tạo cơ hội để người yêu công nghệ trong nước và quốc tế cọ xát, tiếp cận với bài toán thật và dữ liệu thật, từ đó giải quyết những bài toán y tế. Chúng tôi cũng mong muốn truyền cảm hứng cho các doanh nghiệp khác, tổ chức chia sẻ những bộ dữ liệu đa dạng hơn, đa lĩnh vực hơn cho cộng đồng”, Giáo sư Vũ Hà Văn, Giám đốc Khoa học Viện Nghiên cứu Dữ liệu lớn VinBigdata (Tập đoàn Vingroup) chia sẻ.
Từ 1/4/2021, VinBigdata mở VinDr Lab, phần mềm gán nhãn được sử dụng để xây dựng bộ dữ liệu trên cho cộng đồng, nhằm chia sẻ dữ liệu để thúc đẩy nghiên cứu và phát triển ngành Khoa học dữ liệu và AI tại Việt Nam./.
Kaggle.com (phát triển bởi Google) là nền tảng nổi tiếng nhất thế giới trong lĩnh vực Khoa học dữ liệu và AI, với cộng đồng hơn 5 triệu thành viên. Các cuộc thi trên Kaggle đều được đánh giá nghiêm ngặt về tính ảnh hưởng của bài toán và chất lượng của dữ liệu. Amazon, Facebook, Microsoft, GE, Intel… là một số công ty công nghệ lớn đã tổ chức cuộc thi trên nền tảng này. Là đơn vị đầu tiên tại Việt Nam tổ chức cuộc thi trên Kaggle, giải thưởng của VinBigdata nằm trong top 10 mức thưởng cao nhất hiện tại.