Loading...

Tin tức

Các mô hình AI nước ngoài vượt trội hơn các đối thủ Hàn Quốc trong bài kiểm tra toán CSAT.

페이지 정보

작성자 triss
작성일 2025.12.17 10:57
분류 Hàn Quốc
191 조회

본문

Kết quả thử nghiệm đặt ra nghi ngờ về chiến lược trí tuệ nhân tạo của Hàn Quốc, dẫn đến việc xem xét lại mục tiêu xếp hạng toàn cầu đầy tham vọng này.

 

Các mô hình trí tuệ nhân tạo (AI) của Hàn Quốc đang được phát triển theo nỗ lực của chính phủ nhằm khẳng định chủ quyền công nghệ đã bị tụt hậu so với các hệ thống hàng đầu nước ngoài trong các bài kiểm tra mô phỏng theo bài kiểm tra năng lực học thuật đại học (College Scholastic Ability Test) và trong các câu hỏi toán học nâng cao dạng bài luận.

Việc so sánh được thực hiện bởi một nhóm nghiên cứu do Kim Jon-lark, giáo sư toán học tại Đại học Sogang dẫn đầu, đã yêu cầu 10 mô hình ngôn ngữ lớn giải quyết tổng cộng 50 câu hỏi.

Bộ đề gồm 20 bài toán CSAT nâng cao, bao gồm giải tích, xác suất và thống kê, hình học và các môn học phổ biến, cùng với 30 câu hỏi dạng bài luận được lấy từ các trường đại học hàng đầu của Hàn Quốc, các kỳ thi tuyển sinh của Ấn Độ và các bài kiểm tra trình độ sau đại học tại Đại học Tokyo.

Các mô hình trí tuệ nhân tạo nước ngoài đã chiếm giữ những vị trí hàng đầu. Gemini 3 Pro Preview của Google đứng đầu với 92 điểm, giải đúng 46 trong số 50 câu hỏi. Claude Opus 4.5 của Anthropic đứng thứ hai với 84 điểm, trong khi Grok 4.1 Fast của xAI đạt 82 điểm. GPT-5.1 của OpenAI giành được 80 điểm, và DeepSeek V3.2 của Trung Quốc đạt 76 điểm.

Ngược lại, hiệu năng của các mô hình Hàn Quốc lại xếp gần cuối bảng xếp hạng. Solar Pro 2, do Upstage phát triển, đạt 58 điểm, cao nhất trong số các hệ thống nội địa. HCX-007 của Naver đạt 26 điểm, trong khi EXAONE 4.0.1 của LG AI Research và AX 4.0 (72B) của SK Telecom đều đạt 24 điểm. Mô hình nhẹ Llama-VARCO-8B-Instruct của NC AI đứng cuối cùng với chỉ 2 điểm.

Nhóm nghiên cứu cho biết khoảng cách này vẫn tồn tại ngay cả sau khi cho phép các mô hình Hàn Quốc sử dụng các công cụ tính toán dựa trên Python để hỗ trợ giải quyết vấn đề, một biện pháp nhằm bù đắp những hạn chế trong lập luận từng bước.

Các mô hình tương tự đã xuất hiện trong các bài kiểm tra tiếp theo sử dụng EntropyMath, một bộ dữ liệu độc quyền được thiết kế để bao quát các mức độ khó từ chương trình học đại học đến toán học cấp độ nghiên cứu.

Ông Kim cho biết cuộc thử nghiệm được tiến hành sau nhiều câu hỏi về lý do tại sao không có đánh giá công khai nào về các mô hình trí tuệ nhân tạo do Hàn Quốc tự chủ sử dụng để giải quyết các bài toán cấp độ CSAT.

“Chúng tôi liên tục nghe thắc mắc tại sao chưa ai đánh giá năm mẫu điện thoại nội địa bằng các câu hỏi thi đại học, vì vậy chúng tôi quyết định tự mình tiến hành các bài kiểm tra,” ông nói. “Kết quả cho thấy các phiên bản hiện tại của các mẫu điện thoại Hàn Quốc vẫn còn tụt hậu đáng kể so với các mẫu điện thoại hàng đầu thế giới.”

Ông nhấn mạnh rằng việc đánh giá dựa trên các phiên bản được công bố công khai của các hệ thống trong nước.

“Sau khi các phiên bản dành cho đội tuyển quốc gia của những mô hình này được phát hành, chúng tôi dự định sẽ thử nghiệm lại chúng bằng cách sử dụng các bài toán do chính chúng tôi phát triển,” Kim cho biết.

Tuy nhiên, kết quả này đã làm dấy lên cuộc tranh luận về chiến lược trí tuệ nhân tạo của Hàn Quốc. Các quan chức trong ngành cho rằng nhiều nhà phát triển trong nước đã ưu tiên các ứng dụng hướng dịch vụ và doanh nghiệp hơn là khả năng suy luận toán học cao cấp.

Một giám đốc công nghệ tại một công ty khởi nghiệp về trí tuệ nhân tạo ứng dụng cho biết các nhà phát triển Hàn Quốc chủ yếu tập trung vào việc xây dựng các hệ thống trí tuệ nhân tạo công nghiệp, chẳng hạn như các tác nhân AI, khiến điểm số thấp hơn trong các bài kiểm tra toán theo dạng đề thi gần như là điều khó tránh khỏi.

Những phát hiện này cũng đặt ra câu hỏi liệu cách tiếp cận hiện tại của Hàn Quốc có đủ để đáp ứng mục tiêu của chính phủ về việc xây dựng một mô hình nền tảng trí tuệ nhân tạo nội địa nằm trong top 10 thế giới hay không.

Trả lời các câu hỏi về vấn đề này tại cuộc họp báo ở thành phố Sejong hôm thứ Hai, Bộ trưởng Khoa học và Công nghệ Thông tin Bae Kyung-hoon cho biết nhiều công ty đang phát triển các mô hình nền tảng trí tuệ nhân tạo trong nước đã tối ưu hóa hệ thống của họ cho mục đích thương mại, dẫn đến những lỗ hổng trong việc huấn luyện dữ liệu cho các lập luận tập trung vào khoa học và toán học.

“Nếu chúng ta tạo ra và huấn luyện các bộ dữ liệu chuyên biệt theo từng lĩnh vực — ví dụ, bằng cách chuyển đổi cấu trúc phân tử hóa học thành các định dạng mà hệ thống AI có thể nhận biết — thì các mô hình đó có thể đạt được khả năng cạnh tranh ở cấp độ top 10 toàn cầu,” ông nói.

Ông nói thêm rằng việc phát triển các hệ thống AI có khả năng vượt trội trong tất cả các lĩnh vực học thuật là không thực tế, và cần tập trung hơn vào các mô hình đơn giản có thể được triển khai trực tiếp trong các dịch vụ thực tế.

댓글 0
Tất cả 2,279 / 8 페이지

Mấy nay loạn về stt như thế này Người đăng thì ẩn danh, giấy tờ chứng nhận nộp phạt thì không có, làm mọi người khá hoang mang khi tết sắp đến Việt Kiều về nước đang ngày một tăng. Khai báo nói đơn gi...

[Hàn Quốc]

분류
155 조회
2026.02.04 등록

Số n:gười n:ước n:goài nhập quốc tịch Hàn Quốc năm 2025 vượt mức 11.000 người... Cơ quan XNC thuộc Bộ Tư pháp HQ ngày 4/2/2026 công bố báo cáo thống kê trong năm 2025.... Theo đó, trong số 18.623 ngườ...

[Hàn Quốc]

분류
167 조회
2026.02.04 등록

T:òa á:n thành phố 청주, tỉnh 충북 ngày 3/2/2026 đã tuyên phạt một người pnữ nhập tịch gốc Việt Nam 1 năm 6 tháng tò về tọi v:ứt b:ỏ t/hi t/hể t/hai n/hi; đồng thời t:uyên p:hạt chồng của b:ị c:áo 1 năm t...

[Hàn Quốc]

분류
155 조회
2026.02.03 등록

Seoul... sáng nay một vụ xảy ra tại căn hộ bán hầm đã khiến một pn ngoài 30 tuổi t:hiet m:ạng Vụ h:ỏa h:oạn xảy ra vào khoảng 7 giờ 31 phút sáng nay (29/1) tại một căn hộ bán hầm trong khu nhà đa hộ ở...

[Hàn Quốc]

분류
151 조회
2026.01.30 등록

Chính phủ HQ: "Đối sách ổn định dân sinh Tết Nguyên đán 2026"... nhiều mặt hàng g:iảm xuống nửa g:iá Chính phủ sẽ huy động 91tỷ won ngân sách để hỗ trợ g:iảm g:iá tối đa 50% các mặt hàng tiêu thụ mạnh...

[Hàn Quốc]

분류
147 조회
2026.01.30 등록

Cảm giác của các bạn sẽ thế nào? Mới đây một người chia sẻ rằng mình g:iật m:ình và s:ố:c... khi m:ua bánh "호떡" được đựng bằng chiếc cốc giấy dùng để "x:ét ng:hiệm n:ước t:iểu" tại bệnh viện..! Mặc dù...

[Hàn Quốc]

분류
151 조회
2026.01.30 등록

Seoul... Nhân viên tiệm v:àng b:iến m:ất cùng 4_kg v:àng mà không thể liên lạc được... hiện chủ tiệm v:àng đã báo cảnh sát Số v:àng này tính theo g,iá hiện tại vào khoảng hơn 10 ớc... Thời buổi g:iá v...

[Hàn Quốc]

분류
160 조회
2026.01.30 등록

[충북 음성군]... Chiều nay Một vụ h:ỏa h:o:ạn xảy ra tại một nhà máy sản xuất đồ gia dụng ở 음성... vào khoảng 3 giờ chiều nay... Hai công nhân n:gười n:ước n:goài vẫn chưa liên lạc được Một vụ h:ỏa h:oạn đã...

[Hàn Quốc]

분류
146 조회
2026.01.30 등록

CỰU THỦ TƯỚNG HÀN QUỐC QUA ĐỜI Ở VIỆT NAM, SẼ HỒI HƯƠNG TRONG ĐÊM Sau khi truyền thông Hàn Quốc đưa tin cựu Thủ tướng Hàn Quốc Lee Hae-chan đã qua đời ở TP HCM vào hôm 25/1, Bộ Ngoại giao Việt Nam xác...

[Hàn Quốc]

분류
155 조회
2026.01.28 등록

GIÀU KHỦNG NHỜ LỪ:A Đ:ẢO LÀ ĐÂY. Thay đổi cả khuôn mặt để bỏ trốn… cặp vợ chồng lừ:a đ:ảo “romance scam” 12 t:ỷ won ở Campuchia. Cặp vợ chồng người Hàn Quốc được xác định là đầu não của đường dây lừ:a...

[Hàn Quốc]

분류
162 조회
2026.01.28 등록

THỜI TỚI RỒI, GOM THÔI ACE ƠI. Hôm nay tin hót. Bộ muỗng.đũa Bạc trị giá 936.000won Bộ này em được nhận cách đây 4nam. Duoc bà tiến sĩ(박사) tặng,lúc đó em đi dự hội thảo "Viện Khoa học Nông nghiệp Quốc...

[Hàn Quốc]

분류
166 조회
2026.01.28 등록

KHÔNG ĐÙA ĐƯỢC ĐÂU CÂU CHUYỆN BÙN CHE MỜ BIỂN SỐ XE: THANH NIÊN LÊN ĐỒN NỘP PHẠT 23 TRIỆU ĐỒNG VÀ TRỪ 6 ĐIỂM GIẤY PHÉP LÁI XE. Hôm qua xôn xao câu chuyện thanh niên đi ô tô bùn che biển số xe, lý giải...

[Việt Nam]

분류
138 조회
2026.01.28 등록

SỐC CẢNH BÁO KHẨN CHO PHỤ NỮ VIỆT Ở HÀN. Mở cửa vì tin tưởng suýt trả giá đắt: Âm mưu h:iếp dâ:m man r:ợ bị phanh phui. Nhân viên quản lý chung cư â:m mưu hi:ếp d:âm, cướ:p tài sản phụ nữ Việt Nam tại...

[Hàn Quốc]

분류
164 조회
2026.01.28 등록

Sáng 27/1, Bộ Y tế phát đi cảnh báo về mối nguy hiểm từ virus Nipah. Theo Tổ chức Y tế thế giới (WHO), bệnh truyền nhiễm do virus này gây ra hiện đang được ghi nhận rải rác với quy mô nhỏ tại một số q...

[Việt Nam]

분류
137 조회
2026.01.27 등록

NHẶT ĐƯỢC ĐIỆN THOẠI – NỘP CẢNH SÁT VẪN BỊ GỌI ĐIỀU TRA? Một trường hợp thực tế tại Hàn Quốc: Nhặt được điện thoại rơi ngoài đường, Đã mang lên đồn cảnh sát nộp lại, Nhưng 2 tuần sau vẫn bị cảnh sát g...

[Hàn Quốc]

분류
165 조회
2026.01.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
Đăng ký
Tìm ID/ Mật khẩu