![]() |
Giải pháp đo lường độ tin cậy của mô hình ngôn ngữ lớn (LLM) trong các kịch bản rủi ro nhằm xây dựng công cụ AI đang tin cậy cho doanh nghiệp
SINGAPORE, ngày 16 tháng 3 năm 2026 /PRNewswire/ -- Hôm nay, Appier công bố nghiên cứu mới nhằm nâng cao độ tin cậy của các hệ thống Agentic AI (AI tác nhân). Từ các nỗ lực nghiên cứu và phát triển, đội ngũ nghiên cứu AI của Appier tiếp tục tập trung vào những chủ đề tiên phong trong lĩnh vực Agentic AI và Mô hình Ngôn ngữ Lớn (LLM), đồng thời khám phá các thách thức kỹ thuật và các tác động lớn, mang tính định hướng tương lai, qua đó, chúng tôi khai phá các giới hạn đổi mới trong công nghệ tiếp thị.
Trong bài nghiên cứu mới nhất mang tên "Trả lời, từ chối hay phỏng đoán? Khảo sát quá trình ra quyết định có ý thức về rủi ro trong các mô hình ngôn ngữ", nhóm nghiên cứu đã giới thiệu một khung đánh giá có hệ thống nhằm đo lường cách các mô hình ngôn ngữ đưa ra quyết định trong những điều kiện rủi ro khác nhau. Phương pháp tiếp cận này cải thiện đáng kể độ tin cậy của mô hình trong các kịch bản rủi ro cao thông qua một thiết kế phương pháp luận mới.
Nghiên cứu giải quyết một thách thức quan trọng trong việc triển khai Agentic AI trong môi trường doanh nghiệp: đảm bảo các quyết định tự chủ của AI là đáng tin cậy. Những phát hiện này tiếp tục củng cố vị thế dẫn đầu công nghệ AI của Appier, đồng thời đóng góp những hiểu biết thực tiễn cho hệ sinh thái Agentic AI rộng lớn hơn.
Khi các doanh nghiệp chuyển từ trợ lý AI sang các tác nhân AI tự chủ, độ tin cậy đã trở thành một rào cản quan trọng đối với việc ứng dụng. Theo một khảo sát của McKinsey năm 2025, 62% các tổ chức đã bắt đầu thử nghiệm các tác nhân AI, nhưng sự thiếu chính xác vẫn là rủi ro được nhắc đến nhiều nhất trong quá trình ứng dụng AI trong doanh nghiệp.
Là doanh nghiệp AI-native cung cấp Agentic AI-as-a-Service (AaaS), Appier tiếp tục đưa các nghiên cứu AI tiên tiến vào ứng dụng thực tiễn cho doanh nghiệp. Nghiên cứu mới giới thiệu Khung ra quyết định nhận diện rủi ro, giúp định lượng độ tin cậy của các quyết định từ mô hình ngôn ngữ lớn (LLM), đồng thời giải quyết hai thách thức lớn của AI hiện nay, đó là: "ảo giác" và "độ tin cậy" của quyết định do AI đưa ra.
Chuyển chiến lược nhận thức rủi ro thành các chỉ số có thể định lượng
Các đánh giá LLM truyền thống chủ yếu tập trung vào việc liệu câu trả lời có đúng hay không. Tuy nhiên, trong môi trường doanh nghiệp, chi phí của việc trả lời sai và giá trị của việc từ chối trả lời khác biệt đáng kể. Nghiên cứu này đưa ra các tham số rủi ro có cấu trúc — bao gồm phần thưởng cho câu trả lời đúng, hình phạt cho câu trả lời sai và chi phí cho việc từ chối trả lời — nhằm mô phỏng các kịch bản rủi ro khác nhau. Theo khuôn khổ này, các mô hình phải đánh giá năng lực của mình, mức độ tự tin và điều kiện rủi ro trước khi quyết định trả lời, từ chối hoặc phỏng đoán. Chất lượng quyết định sau đó được đo lường dựa trên việc liệu mô hình có tối đa hóa phần thưởng kỳ vọng hay không, qua đó cung cấp đánh giá thực tế hơn đối với việc ra quyết định mang tính chiến lược.
Phát hiện chính: Sự mất cân bằng chiến lược trong các mô hình hiện nay
Thông qua khung Ra Quyết định Nhận thức Rủi ro, nghiên cứu cho thấy nhiều LLM hàng đầu thể hiện sự mất cân bằng chiến lược trong các kịch bản rủi ro khác nhau. Trong các môi trường rủi ro cao, các mô hình thường phỏng đoán quá mức, bất chấp những hậu quả tiêu cực tiềm ẩn. Ngược lại, trong các kịch bản rủi ro thấp, chúng lại trở nên quá thận trọng và từ chối trả lời quá thường xuyên. Sự thiếu nhất quán này hạn chế cả tính tự chủ lẫn độ an toàn của các hệ thống AI trong môi trường doanh nghiệp. Nghiên cứu cho rằng vấn đề này không hoàn toàn liên quan đến kiến thức, mà bắt nguồn từ khó khăn của mô hình trong việc tích hợp nhiều năng lực khác nhau vào một chiến lược ra quyết định ổn định.
Phân tách Kỹ năng giúp đưa ra quyết định tối ưu hơn
Để giải quyết thách thức này, nghiên cứu đề xuất phương pháp Phân tách Kỹ năng (Skill Decomposition), chia quá trình ra quyết định thành ba bước:
- Thực thi nhiệm vụ — giải quyết nhiệm vụ để tạo ra câu trả lời ban đầu
- Ước lượng mức độ tự tin — đánh giá mức độ chắc chắn của câu trả lời
- Suy luận giá trị kỳ vọng — suy luận các kết quả trong những điều kiện rủi ro
Quy trình suy luận có cấu trúc này cho phép mô hình xác định liệu việc trả lời hay từ chối sẽ mang lại kết quả tốt nhất. Cách tiếp cận này giúp các mô hình tích hợp hiệu quả nhiều năng lực khác nhau và đưa ra các quyết định hợp lý và ổn định hơn trong môi trường rủi ro cao, qua đó mở ra lộ trình thực tiễn hướng tới các hệ thống AI doanh nghiệp đáng tin cậy hơn.
"Để Agentic AI vận hành trong các quy trình công việc quan trọng của doanh nghiệp, điều cốt lõi không chỉ là làm cho AI thông minh hơn, mà còn là khiến các quyết định tự chủ của AI trở nên đáng tin cậy hơn", Chih-Han Yu, Giám đốc điều hành kiêm Đồng sáng lập của Appier cho biết. "Appier đã xây dựng các sản phẩm của mình xoay quanh AI và liên tục đầu tư vào các nghiên cứu đẳng cấp thế giới. Bằng cách chuyển nhận thức rủi ro của LLM thành một phương pháp có thể định lượng, nghiên cứu này củng cố nền tảng cho AI doanh nghiệp đáng tin cậy, đồng thời giúp thúc đẩy việc ứng dụng Agentic AI trong thực tế và chuyển hóa nó thành giá trị kinh doanh có khả năng mở rộng quy mô và ROI".
Các kết quả nghiên cứu cũng đã được tích hợp sâu hơn vào các nền tảng hỗ trợ Agentic AI của Appier, bao gồm Ad Cloud, Personalization Cloud và Data Cloud, giúp các doanh nghiệp thúc đẩy quy trình làm việc tự vận hành dựa trên AI theo cách đáng tin cậy và an toàn hơn.
Looking ahead, Appier will continue leveraging its strong AI research capabilities, proprietary data assets, and deep industry expertise to advance Agentic AI innovation and support enterprises in building more efficient and trustworthy AI-driven operations.
Trong thời gian tới, Appier sẽ tiếp tục tận dụng năng lực nghiên cứu AI mạnh mẽ, tài sản dữ liệu độc quyền và chuyên môn sâu trong ngành để thúc đẩy đổi mới Agentic AI, đồng thời hỗ trợ các doanh nghiệp xây dựng những hoạt động dựa trên AI hiệu quả và đáng tin cậy hơn.
Giới thiệu về Appier
Appier (TSE: 4180) là một công ty thuần AI cung cấp Agentic AI như một dịch vụ (AaaS), hỗ trợ quá trình ra quyết định kinh doanh thông qua các giải pháp công nghệ quảng cáo (AdTech) và công nghệ tiếp thị (MarTech) tiên tiến. Được thành lập vào năm 2012 với tầm nhìn "Đơn giản hóa AI bằng cách thông minh hóa phần mềm", Appier hỗ trợ doanh nghiệp chuyển hóa AI thành ROI thông qua các giải pháp Ad Cloud, Personalization Cloud và Data Cloud. Hiện nay, Appier vận hành 17 văn phòng trên khắp khu vực Châu Á - Thái Bình Dương, Hoa Kỳ và Châu Âu, Trung Đông và Châu Phi, và được niêm yết trên trên Sàn Giao dịch Chứng khoán Tokyo. Truy cập www.appier.com để biết thêm thông tin về công ty và truy cập ir.appier.com/en/ để biết thêm thông tin về quan hệ nhà đầu tư.
For media queries, please email pr@appier.com









