OpenAI ra mắt mô hình AI mạnh hơn, nhưng độ bịa chuyện cũng tăng theo

22.04.2025 09:50   |   Tin Công nghệ

Theo Neil Chowdhury - nhà nghiên cứu tại Transluce và cựu nhân viên OpenAI - vấn đề có thể nằm ở cách huấn luyện tăng cường (reinforcement learning) mà OpenAI áp dụng

OpenAI vừa công bố hai mô hình AI mới là o3 và o4-mini, được giới thiệu là "tối tân" về khả năng suy luận và xử lý logic. Nhưng trái với kỳ vọng, cả hai lại có một vấn đề nghiêm trọng: chúng tưởng tượng quá đà – hay nói cách khác, bịa chuyện nhiều hơn cả những mô hình cũ.

Hallucination (tạm dịch: ảo giác hay "nói bậy") là một vấn đề cố hữu của trí tuệ nhân tạo. Đây là hiện tượng AI tạo ra thông tin sai sự thật một cách tự tin, khiến người dùng dễ bị đánh lừa. Các phiên bản trước thường cải thiện được phần nào vấn đề này, nhưng với o3 và o4-mini, tình hình có vẻ đang đi ngược lại.

Theo báo cáo kỹ thuật từ chính OpenAI, o3 và o4-mini - hai mô hình thuộc dòng "reasoning models" chuyên xử lý suy luận logic - lại tạo ra thông tin sai lệch nhiều hơn cả các phiên bản cũ như o1, o1-mini và o3-mini, thậm chí cả GPT-4o. Trên bộ đánh giá nội bộ PersonQA, o3 bịa đến 33% câu trả lời, gấp đôi so với o1 và o3-mini (16% và 14,8%). Tệ hơn nữa, o4-mini đạt mức hallucination 48% – gần như tung đồng xu để phân biệt đúng sai.

Một điều đáng lo hơn: ngay cả OpenAI cũng không chắc vì sao điều này xảy ra.

Trong báo cáo, hãng thừa nhận "cần nghiên cứu thêm" để lý giải vì sao càng mở rộng mô hình suy luận thì mức độ bịa đặt lại càng cao. Dù o3 và o4-mini thể hiện tốt hơn ở các bài toán lập trình và toán học, chúng cũng "nói nhiều hơn" - tức là có xu hướng tạo ra nhiều thông tin hơn, dẫn đến cả nhiều câu trả lời đúng lẫn sai.

Một nhóm nghiên cứu độc lập từ tổ chức phi lợi nhuận Transluce cũng xác nhận điều này. Họ phát hiện o3 không chỉ bịa ra dữ kiện, mà còn… bịa cả quá trình làm ra câu trả lời. Trong một trường hợp, o3 tuyên bố đã chạy code trên MacBook Pro 2021 "ngoài ChatGPT" rồi copy kết quả vào — điều mà bản thân nó không thể thực hiện được.

Theo Neil Chowdhury - nhà nghiên cứu tại Transluce và cựu nhân viên OpenAI - vấn đề có thể nằm ở cách huấn luyện tăng cường (reinforcement learning) mà OpenAI áp dụng cho dòng o-series. Dù phương pháp này cải thiện hiệu suất ở một số tác vụ, nó có thể vô tình khuếch đại xu hướng "nói bậy".

Dù vậy, một số người dùng vẫn đánh giá cao tiềm năng của o3. Kian Katanforoosh, giảng viên Stanford và CEO startup Workera, cho biết nhóm của ông đang thử nghiệm o3 trong quy trình lập trình và thấy nó "vượt trội hơn các đối thủ". Tuy nhiên, ông cũng thừa nhận o3 thường xuyên tạo ra link web không tồn tại – một kiểu hallucination gây phiền toái nếu dùng trong các ứng dụng thực tế.

Vấn đề nằm ở chỗ: trong khi khả năng "bịa chuyện" đôi khi giúp AI sáng tạo hơn, thì nó cũng là lý do khiến các doanh nghiệp - đặc biệt trong lĩnh vực yêu cầu độ chính xác cao như luật, y tế hay tài chính - rất dè chừng trong việc triển khai AI vào công việc.

Một hướng đi tiềm năng là kết hợp AI với công cụ tìm kiếm. Chẳng hạn, GPT-4o khi có quyền truy cập web đạt độ chính xác 90% trên bộ SimpleQA. Điều này gợi ý rằng khả năng tra cứu ngoài có thể là chìa khoá để hạn chế AI bịa đặt – nếu người dùng chấp nhận đánh đổi bằng việc chia sẻ prompt cho bên thứ ba.

Về phần mình, người phát ngôn OpenAI khẳng định đây vẫn là "một lĩnh vực nghiên cứu liên tục" và họ đang nỗ lực để cải thiện độ tin cậy của tất cả các mô hình.

Trong năm qua, ngành AI đang chuyển hướng mạnh sang các mô hình suy luận logic, vì nó giúp cải thiện hiệu năng mà không cần tiêu tốn dữ liệu và tài nguyên khổng lồ. Nhưng giờ đây, giới nghiên cứu đang phải đối mặt với nghịch lý: càng thông minh, mô hình lại càng… bịa giỏi. Và tìm ra lời giải cho bài toán này có thể sẽ là thách thức lớn nhất tiếp theo của trí tuệ nhân tạo.

 Bản để in  Lưu dạng file  Gửi tin qua email
Blog
Kinh doanh
Tin Công nghệ
Bài viết thủ thuật
Hỗ trợ
Tuyển dụng
Dự án thiết kế website
Cẩm nang SEO
Thiết kế web
Câu hỏi thường gặp
Hosting là gì?
Host – Web Hosting được gọi chung là Hosting, là dịch vụ lưu trữ dữ và chia sẻ liệu trực tuyến, Khi bạn đăng ký dịch vụ Hosting, tức là bạn thuê một chỗ đặt trên server chứa tất cả các files và dữ liệu cần thiết để website của bạn chạy được.

Hiểu theo một cách đơn giản thì nếu website là một ngôi nhà, tên miền (domain) là địa chỉ ngôi nhà thì Hosting chính là mảnh đất mà ngôi nhà đó được xây dựng lên. Hosting cũng chính là nơi diễn ra tất cả các hoạt động giao dịch, trao đổi thông tin giữa người sử dụng internet với website, hỗ trợ các phần mềm internet hoạt động.
Tại sao cần phải mua Hosting?
Nếu không có Hosting thì website sẽ chỉ hoạt động trên máy tính bạn mà thôi, duy chỉ có mình bạn nhìn thấy, dữ liệu sẽ không được chia sẻ trên mạng. Cho nên rất cần thiết để có một gói Hosting.
Mua Hosting ở đâu uy tín?
Bạn có thể dùng Hosting nước ngoài hoặc Việt Nam. Nếu website bạn chủ yếu có lượt truy cập trong nước thì nên chọn mua Hosting Việt Nam là tốt nhất.
Có nhiều nhà cung cấp Hosting bạn có thể chọn, trong đó công ty VIHAN có hơn 16 năm trong lĩnh vực tên miền, Hosting. Là một trong những nhà cung cấp dịch vụ Hosting uy tín hàng đầu tại Việt Nam.
Hosting gồm những loại nào?
Có nhiều loại Hosting với đa dạng tính năng khác nhau trên thị trường. Dedicated Web Hosting và Cloud Hosting là hai loại mô hình hosting được lựa chọn sử dụng nhiều nhất.
+ Dedicated Web Hosting là hình thức lưu trữ web phổ biến nhất. Với chi phí bỏ ra hợp lý bạn đã có dịch vụ đáp ứng hầu hết các nhu cầu lưu trữ website của mình. Dịch vụ Web Hosting VIHAN cung cấp dùng trên phần cứng thật giúp tối ưu và đạt tốc độ cao nhất thay vì dùng ảo hóa. Dịch vụ Share Hosting phù hợp với một doanh nghiệp sử dụng web để bán hàng và những tổ chức vừa có lượt truy cập không quá lớn.
+ Cloud Hosting là loại hosting chạy trên nền tảng ảo hóa với Cloud Hosting, bạn có máy chủ chuyên dụng nhưng máy chủ là máy ảo chứ không phải là máy vật lý. Điều này mang đến lợi ích cho người quản lý khi tiết kiệm chi phí quản lý,bảo trì, nâng cấp phần cứng nhưng lại giảm một phần tốc độ xử lý so với dùng trực tiếp phần cứng thật. Cloud Hosting cũng phù hợp với một doanh nghiệp sử dụng web để bán hàng và những tổ chức vừa có lượt truy cập không quá lớn.
Các yếu tố đánh giá một Hosting?
Một Hosting tốt được đánh giá dựa trên các yếu tố như
+ Tốc độ: Là khoảng thời gian tính từ khi người dùng internet bắt đầu truy cập vào trang web đến khi nội dung trên web được tải về hoàn toàn. Lý tưởng từ 3 đến 5 giây.
+ Dung lượng: Là dung lượng lưu trữ (Disk space) – khoảng không gian trong ổ cứng máy chủ bạn được sử dụng để lưu trữ dữ liệu.
+ Băng thông: Là lượng dữ liệu trao đổi giữa trang web với người dùng internet trong một tháng.
+ Khả năng chịu tải: Là khả năng chấp nhận số người online trong cùng một thời điểm.
+ Dịch vụ hỗ trợ của đơn vị cung cấp Hosting.
Hosting có giới hạn số lượng khách truy cập đồng thời trên website không?
Hosting VIHAN không giới hạn về số lượng khách truy cập đồng thời đối với website của bạn.
Tuy nhiên, có những giới hạn thực tế liên quan đến CPU, RAM và Entry Process ( Tác vụ xử lý đồng thời ) được quy định tùy vào phân loại Hosting.
Mỗi website là khác nhau, được lập trình và thiết kế khác nhau, sử dụng tài nguyên khác nhau. Vì vậy không có cách nào để đảm bảo số lượng khách truy cập tối đa mà trang web của bạn có thể đáp ứng.
Một website được tối ưu tốt, sử dụng ít tài nguyên trên mỗi lượt khách truy cập sẽ cho phép số lượng lớn khách truy cập đồng thời hơn.
Ngược lại, một website không được tối ưu tốt hoặc kém hiểu quả thì chỉ có thể đáp ứng duy trì được số lượng ít khách truy cập đồng thời.
Tên Doanh Nghiệp: CÔNG TY CỔ PHẦN VIHAN

MST/ĐKKD/QĐTL: 0303885249

Điện Thoại: 0903 018626
Ms Ngân: 0909 145 026 (Đt/Zalo)

Địa chỉ: Saigon Asiana TMDV 1.12, số 336/20 Nguyễn Văn Luông, Phường 12, Quận 6, Tp.HCM

Email: info@vihan.vn, vihanvietnam@gmail.com

©2006 DESIGNED BY VIHAN, ALL RIGHTS RESERVED

Giỏ hàng

đóng
  • Giỏ hàng rỗng

Đã thêm vào giỏ hàng !

Xem giỏ hàng