Ngành AI đang đối mặt với nghịch lý lớn: Càng thông minh, càng hay... bịa, và nhiều người Việt đã lãnh đủ vì quá tin AI

09.05.2025 08:22   |   Tin Công nghệ

Theo các nghiên cứu nội bộ và độc lập, tỷ lệ “ảo giác”, tức hiện tượng AI bịa ra thông tin sai lệch, đang tăng lên đáng kể ở các thế hệ chatbot mới.

Trong khi các hệ thống trí tuệ nhân tạo đang ngày càng giỏi hơn trong việc giải toán và viết mã, thì một nghịch lý mới lại đang khiến giới công nghệ đau đầu: các chatbot AI càng "suy luận" tốt thì càng hay… bịa chuyện.

Một ví dụ điển hình vừa xảy ra với Cursor, một công cụ hỗ trợ lập trình đang nổi. Tháng trước, một chatbot AI của hãng bất ngờ thông báo đến người dùng rằng họ sẽ không còn được sử dụng phần mềm trên nhiều máy tính khác nhau. Thông tin này hoàn toàn không đúng, nhưng nó đã khiến nhiều khách hàng hoang mang, hủy đăng ký dịch vụ, và chỉ được dập tắt khi CEO Michael Truell phải đích thân lên tiếng đính chính trên Reddit: “Chúng tôi không có chính sách như vậy. Đây là phản hồi sai từ chatbot AI tuyến đầu.”

Sự cố này không phải cá biệt. Trên thực tế, theo các nghiên cứu nội bộ và độc lập, tỷ lệ “ảo giác”, tức hiện tượng AI bịa ra thông tin sai lệch, đang tăng lên đáng kể ở các thế hệ chatbot mới, đặc biệt là những mô hình “reasoning” chuyên xử lý các tác vụ suy luận đa bước như GPT-4 Turbo (o3) của OpenAI hay R1 của DeepSeek.

 

Giỏi toán, kém kiểm chứng

Khác với các chatbot cũ vốn mắc lỗi đơn giản, những hệ thống AI mới ngày nay có thể giải bài toán phức tạp, viết code dài, và “trình bày” các bước suy nghĩ như con người. Nhưng đó cũng chính là điểm yếu: càng phân tích nhiều bước, càng dễ tạo ra sai sót giữa chừng, và hệ quả là thông tin sai bị tích lũy theo từng bước một.

Trong một bài kiểm tra nội bộ của OpenAI có tên PersonQA, vốn yêu cầu AI trả lời câu hỏi về người nổi tiếng, hệ thống GPT-4 Turbo (o3) đưa ra thông tin sai lệch tới 33% số lần, gấp đôi so với phiên bản trước đó. Với phiên bản o4-mini, tỷ lệ này còn cao hơn, lên tới 48%.

Tình trạng trở nên đáng lo hơn khi áp dụng với các câu hỏi phổ thông. Trong thử nghiệm SimpleQA, o3 bịa đáp án tới 51% số lần, còn o4-mini gây sốc với mức “hallucination” 79% tức gần như 4/5 câu trả lời đều có yếu tố sai lệch.

Nguyễn Hoàng Minh, sinh viên năm cuối ngành Luật tại Đại học Kinh tế - Luật TP.HCM, từng dùng ChatGPT để hỗ trợ viết báo cáo nghiên cứu về quyền sở hữu trí tuệ. Trong phần trích dẫn, chatbot đã viện dẫn một điều khoản không hề tồn tại trong bất kỳ hiệp định nào của các tổ chức quốc tế như WIPO. Minh chỉ phát hiện ra khi bị giảng viên phản hồi rằng phần trích dẫn "không có căn cứ pháp lý", và thừa nhận: “Nếu không kiểm tra lại, tôi đã nộp bản báo cáo với một lỗi rất nghiêm trọng.”

Tương tự, Lê Thị Hải Yến, nghiên cứu sinh ngành Dược tại TP.HCM, cho biết từng nhờ AI tóm tắt các bài báo y khoa để chuẩn bị thuyết trình. Một trong các đoạn tóm tắt trích dẫn nghiên cứu từ tạp chí NEJM, nhưng khi kiểm tra lại, bài báo đó hoàn toàn không tồn tại. “Nó... tưởng tượng ra cả bài báo. Nếu tôi tin vào đoạn đó, rất có thể sẽ bị xem là cố tình ngụy tạo dữ liệu,” Yến nói.

Vì sao càng huấn luyện càng bịa?

Theo các chuyên gia, việc đào tạo chatbot bằng dữ liệu khổng lồ từ internet không còn đủ để cải thiện chất lượng. OpenAI, Google và nhiều hãng khác giờ chuyển sang mô hình huấn luyện bằng reinforcement learning, tức để AI “thử sai” rồi học từ phản hồi. Phương pháp này cải thiện rõ ở các bài toán logic, nhưng lại không giúp ích mấy trong việc kiểm soát tính xác thực thông tin.

Laura Perez-Beltrachini, nhà nghiên cứu tại Đại học Edinburgh, cho biết: “Các mô hình mới có xu hướng học tốt một nhóm nhiệm vụ nhưng đồng thời lại ‘quên’ dần các tác vụ khác. Khả năng suy luận tăng lên nhưng độ đáng tin lại giảm.”

Một vấn đề khác là những chatbot này giờ thường hiển thị cả chuỗi “bước suy nghĩ” ra cho người dùng thấy. Trớ trêu thay, theo các nhà nghiên cứu tại Anthropic, những gì chatbot nói rằng nó đang nghĩ thực ra... không phải là cách nó thật sự vận hành. Người dùng đang bị thuyết phục bởi chuỗi lý luận hợp lý trên bề mặt, dù kết luận lại sai hoàn toàn.

Các công ty như Vectara đang theo dõi sát hiện tượng này. Họ thử yêu cầu các chatbot tóm tắt các bài báo cụ thể - một nhiệm vụ đơn giản - nhưng vẫn thấy tỷ lệ bịa thông tin dao động từ 3% đến 27%, tùy vào mô hình và phiên bản. Riêng hệ reasoning R1 của DeepSeek có tỷ lệ sai đến 14,3%, trong khi GPT-4 Turbo (o3) đạt 6,8%.

Pratik Verma, CEO của công ty Okahu, nhận định: “Chúng ta đang mất quá nhiều thời gian chỉ để xác minh chatbot có đúng hay không. Nếu không xử lý triệt để vấn đề này, giá trị thật sự của AI là tiết kiệm công sức sẽ biến mất.”

 Bản để in  Lưu dạng file  Gửi tin qua email
Blog
Kinh doanh
Tin Công nghệ
Bài viết thủ thuật
Hỗ trợ
Tuyển dụng
Dự án thiết kế website
Cẩm nang SEO
Thiết kế web
Câu hỏi thường gặp
Hosting là gì?
Host – Web Hosting được gọi chung là Hosting, là dịch vụ lưu trữ dữ và chia sẻ liệu trực tuyến, Khi bạn đăng ký dịch vụ Hosting, tức là bạn thuê một chỗ đặt trên server chứa tất cả các files và dữ liệu cần thiết để website của bạn chạy được.

Hiểu theo một cách đơn giản thì nếu website là một ngôi nhà, tên miền (domain) là địa chỉ ngôi nhà thì Hosting chính là mảnh đất mà ngôi nhà đó được xây dựng lên. Hosting cũng chính là nơi diễn ra tất cả các hoạt động giao dịch, trao đổi thông tin giữa người sử dụng internet với website, hỗ trợ các phần mềm internet hoạt động.
Tại sao cần phải mua Hosting?
Nếu không có Hosting thì website sẽ chỉ hoạt động trên máy tính bạn mà thôi, duy chỉ có mình bạn nhìn thấy, dữ liệu sẽ không được chia sẻ trên mạng. Cho nên rất cần thiết để có một gói Hosting.
Mua Hosting ở đâu uy tín?
Bạn có thể dùng Hosting nước ngoài hoặc Việt Nam. Nếu website bạn chủ yếu có lượt truy cập trong nước thì nên chọn mua Hosting Việt Nam là tốt nhất.
Có nhiều nhà cung cấp Hosting bạn có thể chọn, trong đó công ty VIHAN có hơn 16 năm trong lĩnh vực tên miền, Hosting. Là một trong những nhà cung cấp dịch vụ Hosting uy tín hàng đầu tại Việt Nam.
Hosting gồm những loại nào?
Có nhiều loại Hosting với đa dạng tính năng khác nhau trên thị trường. Dedicated Web Hosting và Cloud Hosting là hai loại mô hình hosting được lựa chọn sử dụng nhiều nhất.
+ Dedicated Web Hosting là hình thức lưu trữ web phổ biến nhất. Với chi phí bỏ ra hợp lý bạn đã có dịch vụ đáp ứng hầu hết các nhu cầu lưu trữ website của mình. Dịch vụ Web Hosting VIHAN cung cấp dùng trên phần cứng thật giúp tối ưu và đạt tốc độ cao nhất thay vì dùng ảo hóa. Dịch vụ Share Hosting phù hợp với một doanh nghiệp sử dụng web để bán hàng và những tổ chức vừa có lượt truy cập không quá lớn.
+ Cloud Hosting là loại hosting chạy trên nền tảng ảo hóa với Cloud Hosting, bạn có máy chủ chuyên dụng nhưng máy chủ là máy ảo chứ không phải là máy vật lý. Điều này mang đến lợi ích cho người quản lý khi tiết kiệm chi phí quản lý,bảo trì, nâng cấp phần cứng nhưng lại giảm một phần tốc độ xử lý so với dùng trực tiếp phần cứng thật. Cloud Hosting cũng phù hợp với một doanh nghiệp sử dụng web để bán hàng và những tổ chức vừa có lượt truy cập không quá lớn.
Các yếu tố đánh giá một Hosting?
Một Hosting tốt được đánh giá dựa trên các yếu tố như
+ Tốc độ: Là khoảng thời gian tính từ khi người dùng internet bắt đầu truy cập vào trang web đến khi nội dung trên web được tải về hoàn toàn. Lý tưởng từ 3 đến 5 giây.
+ Dung lượng: Là dung lượng lưu trữ (Disk space) – khoảng không gian trong ổ cứng máy chủ bạn được sử dụng để lưu trữ dữ liệu.
+ Băng thông: Là lượng dữ liệu trao đổi giữa trang web với người dùng internet trong một tháng.
+ Khả năng chịu tải: Là khả năng chấp nhận số người online trong cùng một thời điểm.
+ Dịch vụ hỗ trợ của đơn vị cung cấp Hosting.
Hosting có giới hạn số lượng khách truy cập đồng thời trên website không?
Hosting VIHAN không giới hạn về số lượng khách truy cập đồng thời đối với website của bạn.
Tuy nhiên, có những giới hạn thực tế liên quan đến CPU, RAM và Entry Process ( Tác vụ xử lý đồng thời ) được quy định tùy vào phân loại Hosting.
Mỗi website là khác nhau, được lập trình và thiết kế khác nhau, sử dụng tài nguyên khác nhau. Vì vậy không có cách nào để đảm bảo số lượng khách truy cập tối đa mà trang web của bạn có thể đáp ứng.
Một website được tối ưu tốt, sử dụng ít tài nguyên trên mỗi lượt khách truy cập sẽ cho phép số lượng lớn khách truy cập đồng thời hơn.
Ngược lại, một website không được tối ưu tốt hoặc kém hiểu quả thì chỉ có thể đáp ứng duy trì được số lượng ít khách truy cập đồng thời.
Tên Doanh Nghiệp: CÔNG TY CỔ PHẦN VIHAN

MST/ĐKKD/QĐTL: 0303885249

Điện Thoại: 0903 018626
Ms Ngân: 0909 145 026 (Đt/Zalo)

Địa chỉ: Saigon Asiana TMDV 1.12, số 336/20 Nguyễn Văn Luông, Phường 12, Quận 6, Tp.HCM

Email: info@vihan.vn, vihanvietnam@gmail.com

©2006 DESIGNED BY VIHAN, ALL RIGHTS RESERVED

Giỏ hàng

đóng
  • Giỏ hàng rỗng

Đã thêm vào giỏ hàng !

Xem giỏ hàng