当前,我国AI大模型的应用呈现迅猛增长态势。QuestMobile发(fa)布(bu)的最新数据显(xian)示,DeepSeek上线次月(2025年2月),活跃用户规模就突破(po)了1.8亿。但在AI应用大众化的同时,也有不少网友惊呼:与AI的蜜月期还没有结(jie)束(shu),就发(fa)现它在骗我!
有人用AI查(cha)资料(liao),发(fa)现AI会编造(zao)假论(lun)文,期刊名称、论(lun)文标题、编辑(zhe)、网址等信(xin)息一应俱全,可全是(shi)编的;曾(ceng)有一条“80后死亡率突破(po)5.2%”的假资讯(wen)广为流传,据辟谣者(zhe)分析(xi),最初的信(xin)源可能来自AI对话……
这其实不是(shi)新问(wen)题,而是(shi)在大模型诞生(sheng)之初就存在的老毛病——AI幻觉(jue)。甚至(zhi)有专家认为,AI幻觉(jue)是(shi)大模型的“基因病”。因为AI大模型训练依赖海量数据,但数据的真(zhen)实性却(que)无人担保。AI大模型训练过(guo)程中,是(shi)将海量数据高度压缩抽象,输入的是(shi)内容(rong)之间关系的数学表征,而不是(shi)内容(rong)本身。AI与人类对话时,模型基于统计概(gai)率生(sheng)成文本,追求流畅性而非真(zhen)实性,很容(rong)易编出看似流畅但完全不符合事实的内容(rong)。
既然AI幻觉(jue)是(shi)“基因病”,那这病能治吗?要怎么治?
首先(xian),AI幻觉(jue)也带(dai)来了AI的“超能力”,没必要根除。
AI幻觉(jue)也有好(hao)的一面。AI自主生(sheng)成内容(rong)是(shi)大语言(yan)模型的突出特点,是(shi)最具想象力的技术突破(po)。作为大模型与生(sheng)俱来的特点,AI幻觉(jue)决定(ding)了大模型的创造(zao)力,对实现通用人工智能(AGI)非常重要,并可在科研、文艺等领域发(fa)挥(hui)作用。
比(bi)如,游戏开发(fa)、动漫设(she)计、小说创作等领域欢迎奇思妙想,AI幻觉(jue)可以突破(po)思维定(ding)式,为创作提供灵感。再如,科学研究中往往也需要非常规思路来破(po)局(ju)闯关,AI不走寻常路的创造(zao)力,可以推动科研工作出现“AI幻觉(jue)—实验验证—理论(lun)重构”的新范式。
其次,AI幻觉(jue)虽不可根除,但可以控制(zhi)。
对于AI幻觉(jue),大家不能放任自流。一方面,AI幻觉(jue)产(chan)生(sheng)大量虚假信(xin)息,这些虚假信(xin)息被新一代AI系统学习,就会形成“数据污染—算法吸取—再污染”的恶性循环(huan)。另一方面,在企业生(sheng)产(chan)、医疗、法律等容(rong)错率很低的领域,AI幻觉(jue)可是(shi)“要命”的大毛病。因此,大家要从技术研发(fa)和管理机制(zhi)上双管齐下(xia),防范AI幻觉(jue)信(xin)息的泛(fan)滥。
技术层面,检索增强(qiang)生(sheng)成(RAG)技术、多模型交叉(cha)验证、动态常识更新机制(zhi)等,都已被证明是(shi)减少AI幻觉(jue)的有效手(shou)段。未来,还需要继续提升训练数据质量与清洗标准,严格检测数据的来源和真(zhen)实性,减少噪声干扰;引入强(qiang)化学习与人类反馈机制(zhi),提升AI逻辑(ji)推理能力;增强(qiang)AI大模型检测能力,用AI监管AI。
用户层面,对AI输出的答案(an)不要直接采信(xin),可以用多个AI模型分别生(sheng)成答案(an)再交叉(cha)验证、对照取优,对关键任务输出更有必要采取人工交叉(cha)验证,结(jie)合文献数据库、行业常识图谱等专业工具作出判断。
监管层面,“标注AI生(sheng)成内容(rong)”已成为我国监管部门推动的方向,这体现了对生(sheng)成式人工智能的透明度要求,将提高AI生(sheng)成内容(rong)的可追溯性和可说明性。未来,大家还应加快人工智能法立法进程,建(jian)立全周期全链条监管体系。
实现“不被AI忽悠(you)”目标,既需要算法工程师构建(jian)底层安全防线,也需要全社会共(gong)同建(jian)设(she)可信(xin)AI生(sheng)态。期待中国AI产(chan)业解决好(hao)这道AI幻觉(jue)控制(zhi)难题,在创造(zao)力与真(zhen)实性之间取得平(ping)衡。(本文来源:经济日(ri)报 编辑(zhe):佘惠敏)