Trung Quốc ra mắt AI chuyên toán, mục tiêu vượt ChatGPT và Gemini

(VTC News) -

Mô hình ngôn ngữ lớn Qwen2-Math được phát triển bởi Alibaba dự kiến giúp giải quyết các bài toán phức tạp.

Alibaba đang hướng đến mục tiêu nâng cao tiêu chuẩn trong phát triển AI bằng cách ra mắt nhóm các mô hình ngôn ngữ lớn (LLM) dành riêng cho lĩnh vực toán học có tên là Qwen2-Math. Theo gã khổng lồ thương mại điện tử, mô hình này có thể vượt trội khả năng của GPT-4o.

"Trong năm qua, chúng tôi đã dành nhiều nỗ lực đáng kể để nghiên cứu và nâng cao khả năng lập luận của các mô hình ngôn ngữ lớn, đặc biệt tập trung vào khả năng giải quyết các bài toán số học", nhóm Qwen, chia sẻ trên nền tảng dành cho nhà phát triển GitHub mới đây.

Các mô hình ngôn ngữ lớn của Alibaba được phát hành vào tháng 6. Các mô hình này có 3 phiên bản, khác nhau về số lượng tham số mà chúng sử dụng. Tham số là các biến giúp AI học cách tạo ra đầu ra chính xác từ dữ liệu đã cho.

Công cụ AI chuyên giải toán của Alibaba đã vượt qua GPT-4o, Claude 3.5 Sonnet hay Gemini. (Ảnh minh họa: Shutterstock)

Theo bài đăng của nhóm Qwen, mô hình có số lượng tham số lớn nhất, Qwen2-Math-72B-Instruct đã vượt trội hơn các LLM độc quyền do Mỹ phát triển trong các bài đo năng lực toán học. Những LLM đó bao gồm GPT-4o, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama-3.1-405B của Meta Platforms.

Nhóm phát triển cho biết "Chúng tôi hy vọng rằng Qwen2-Math có thể đóng góp cho cộng đồng trong việc giải quyết các vấn đề toán học phức tạp".

Theo bài đăng, các mô hình AI Qwen2-Math đã được thử nghiệm trên cả chuẩn toán tiếng Anh và tiếng Trung. Trong đó bao gồm GSM8K - một tập dữ liệu gồm 8.500 bài toán tiểu học đa dạng về mặt ngôn ngữ nâng cao; OlympiadBench - một chuẩn khoa học đa phương thức song ngữ cấp cao; và cao khảo, kỳ thi tuyển sinh đại học khó nhằn của Trung Quốc.

Vào tháng 7, Qwen2-72B-Instruct chỉ đứng sau GPT-4o và Claude 3.5 Sonnet trong bảng xếp hạng LLM từ SuperClue, một nền tảng đánh giá mô hình dựa trên các tham số như năng lực tính toán, suy luận logic, mã hóa và hiểu văn bản, cùng nhiều tham số khác.

Theo SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Hoa Kỳ dường như đang thu hẹp lại, và cho biết Trung Quốc đã đạt được tiến bộ đáng kể trong việc phát triển LLM nội địa nửa đầu năm nay.

Một bài kiểm tra riêng được công bố vào tháng 7 bởi LMSYS - một tổ chức nghiên cứu mô hình AI được hỗ trợ bởi Đại học California, Berkeley - cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

Thạch Anh (Nguồn: SCMP)

Trung Quốc ra mắt AI chuyên toán, mục tiêu vượt ChatGPT và Gemini

Mô hình ngôn ngữ lớn Qwen2-Math được phát triển bởi Alibaba dự kiến giúp giải quyết các bài toán phức tạp.

Tin mới

Tòa án Tối cao Mỹ bác chính sách thuế quan toàn cầu của Tổng thống Trump

Ukraine và Moldova phá âm mưu ám sát nhà báo, sĩ quan tình báo

Na Uy rút bớt quân khỏi Trung Đông sau cảnh báo 'nóng' của ông Trump với Iran

Nga: Xe chìm xuống hồ sâu nhất thế giới, du khách Trung Quốc nghi thiệt mạng

Chống đối đo nồng độ cồn, tài xế kéo lê CSGT rồi tăng ga bỏ chạy

'15 phút mới nhích được một bước' tại hội chùa Hương

Cháy lớn tại đền thờ ở Nhật Bản, 5 người thiệt mạng

Podcast: Đi tìm lời giải cho bí ẩn hình tượng ngựa trong văn hóa nhân loại

Điện mừng Đảng Lao động Triều Tiên tổ chức Đại hội đại biểu toàn quốc lần thứ IX

NASA bóc trần sai sót khiến hai phi hành gia kẹt trong không gian suốt 9 tháng

Du khách đổ lên Tuyên Quang, xe nối dài nhích từng mét chiều mùng 4 Tết

Thủ tướng: Phát động chiến dịch 85 ngày đêm hoàn thành 2 tuyến cao tốc

Phẫn nộ clip con đánh mẹ già gãy tay tối mùng 3 Tết

Truyền thông Mỹ đánh giá cao việc Việt Nam chủ động đóng góp cho hòa bình và ổn định toàn cầu

10 ngôi nhà đắt nhất thế giới được rao bán

Khám phá kiến trúc độc đáo, thâm nghiêm của Văn miếu Mao Điền ở Hải Phòng

Cái kết đẹp như mơ của đội trưởng khúc côn cầu trên băng Mỹ tại Olympic 2026

So sánh iPhone 17 Pro Max và 16 Pro Max: Nên mua phiên bản nào?

Phân khúc xe hạng A đầu năm 2026: Hyundai Grand i10 chiếm lĩnh thị phần

Món chuối chiên 'mix' cốt dừa và hạt khô giải cứu chuối sau Tết

Gần 3.500 tài xế vi phạm nồng độ cồn trong mùng 4 Tết

Triệu tập 9 nghi phạm hành hung dã man công an viên ở Hải Phòng

Hơn 222.000 lượt khách đi Metro Bến Thành - Suối Tiên trong 3 ngày Tết

Giám đốc người Hàn quỳ lạy khán giả gây tranh cãi, đạo diễn Minh Beta nói gì?

Mùng 10 Tết, hơn 4.000 cử tri TP.HCM bầu cử sớm

Sân bay Tân Sơn Nhất đón lượng khách kỷ lục 10 năm qua

Trai tráng rước 'ông pháo' qua biển người ngày mùng 4 Tết

Từ bao giờ mừng tuổi 10 nghìn đồng lại khiến người mừng phải run run giải thích?

Bảng tổng sắp huy chương Thế vận hội Mùa đông 2026 mới nhất: Na Uy dẫn đầu, Nhật Bản vào top 10

Lý do nhiều người cảm giác 'lâng lâng' chỉ sau vài ly rượu

Mô hình ngôn ngữ lớn Qwen2-Math được phát triển bởi Alibaba dự kiến ​​giúp giải quyết các bài toán phức tạp.

Mô hình ngôn ngữ lớn Qwen2-Math được phát triển bởi Alibaba dự kiến giúp giải quyết các bài toán phức tạp.