Đấu trường "Học tăng cường" (Reinforcement Learning Competition) là cuộc thi dành cho sinh viên, kỹ sư công nghệ người Việt đam mê công nghệ trí tuệ nhân tạo (AI) tại Việt Nam và Nhật Bản.
Cuộc thi diễn ra trong vòng hai tháng, bắt đầu từ 15/7-19/9/2020 với ba vòng thi đấu chính. Nội dung bài thi được mô phỏng dưới dạng trò chơi đào vàng, với tổng giá trị giải thưởng 500 triệu đồng.
Thuật toán "Học tăng cường" là một trong ba nhánh của học máy (Machine Learning). Thuật toán này lấy cảm hứng từ quá trình học hỏi theo cơ chế thưởng phạt ở con người.
Reinforcement Learning học và tích lũy kinh nghiệm để đưa ra hành động tương tác với môi trường. Hành động đúng được máy lưu lại, sai hoặc không mang lại kết quả bị loại bỏ. Một trong những điều ấn tượng của thuật toán này là khả năng chơi game tự động sử dụng chiến thuật phức tạp, ví dụ năm 2015 Reinforcement Learning thiết kế bởi Google chiến thắng nhà vô địch thế giới Lee Sedol môn Cờ vây.
Đại diện ban tổ chức cuộc thi chia sẻ, đây là sân chơi quy mô lớn về Học tăng cường đầu tiên tại Việt Nam. FPT Software kỳ vọng tạo dựng được cộng đồng về "Học tăng cường" rộng khắp toàn quốc cũng như góp phần xây dựng nguồn nhân lực cho thị trường công nghệ AI Việt.
Cuộc thi sẽ mang tới cho giới công nghệ và người trẻ cơ hội học tập, nghiên cứu sâu và học hỏi kinh nghiệm từ các chuyên gia hàng đầu trong lĩnh vực này tại Việt Nam.
Các đội thi đăng ký theo nhóm từ 1-3 thành viên tại https://rlcomp.codelearn.io/ từ ngày 15/7 đến hết ngày 5/8. Tại vòng đấu bảng với tên gọi “Đón đầu thách thức”, diễn ra từ 8/8 đến 3/9, mỗi đội sẽ giải đề bài do ban tổ chức đưa ra theo hình thức thi online trên nền tảng lập trình CodeLearn.
Tổng giá trị giải thưởng của cuộc thi lên đến 500 triệu đồng
Lượt thi đấu thứ 2, Vòng giao hữu - Stepping Stone: từ 5/9 đến 17/9. Các đội vượt qua Vòng Đón đầu thách thức được ban tổ chức chia ngẫu nhiên vào các bảng, mỗi bảng có số lượng đội thi là bội số của 4.
Vòng Chung kết mang tên “Đảo giấu vàng” dự kiến diễn ra ngày 19/9, sẽ có Vòng loại số 1: Sudden Death - Cái chết bất ngờ, Vòng loại số 2: Moving Forward - Không lùi bước, Vòng Tứ kết: The True Heir - Người xứng đáng và Trận Chung kết: Mysterious Treasure - Báu vật huyền bí. Tổng thời lượng thi đấu tối đa 3 tiếng đồng hồ.
Đội chiến thắng chung cuộc nhận giải thưởng 100 triệu đồng và được đài thọ chi phí tham dự buổi thuyết trình về giải pháp cho cộng đồng AI tại FPT Software trị giá 20 triệu đồng.
Giải Nhì trị giá 50 triệu đồng, giải Ba trị giá 20 triệu đồng và giải Khuyến khích trị giá 5 triệu đồng. Ban tổ chức cũng trao giải Tài năng trị giá 20 triệu đồng và giải Triển vọng 10 triệu đồng cho các thí sinh là sinh viên.
Cuộc thi quy tụ dàn cố vấn chuyên môn, giám khảo uy tín trong lĩnh vực công nghệ như: Nhà sáng lập Đại học trực tuyến FUNiX, Nguyễn Thành Nam ; Chuyên gia AI quốc tế, cộng tác tại Viện nghiên cứu Trí tuệ nhân tạo hàng đầu thế giới – Mila, Nguyễn Xuân Phong; Người sáng lập nền tảng lập trình CodeLearn, Cao Văn Việt; Kỹ sư về Học máy tại Tập đoàn Google, Vũ Hữu Tiệp….