2月26日,北京(jing)大学(xue)第三医(yi)院的心内科诊室里,两种治疗(liao)方案在诊台上对峙:左侧是心内科大夫(fu)汪京(jing)嘉开出的一份用(yong)于治疗(liao)高血脂的医(yi)嘱,右侧是人工智能(neng)App(jian)生(sheng)成(cheng)的处方。
这天,汪京(jing)嘉如常出诊,呼叫铃响(xiang)三声后,一位60岁老人姗姗来迟。“145/90mmHg,低密度脂蛋白(bai)3.8mmol/L,无糖尿病。”检查报告显示,老人属于轻度血脂异常,依据(ju)医(yi)疗(liao)诊断,汪京(jing)嘉医(yi)生(sheng)将口服药处方递给老人。
“汪大夫(fu),您给开的口服药太温和,AI建议注(zhu)射瑞百安,说是降脂快。”
诊室陷入短暂(zan)沉默,空气净化器的嗡鸣声逐渐清(qing)晰。汪京(jing)顺用(yong)手指点了(le)点报告:“他(ta)汀类药物对肝脏负担更小,您的报告显示转(zhuan)氨酶偏(pian)高。”他(ta)停顿了(le)两秒,告诉患者注(zhu)射剂可能(neng)加重肝脏代谢负担。
争论持续了(le)十分钟。老人从AI上得到的建议是,注(zhu)射类药物短期耐受性良好(hao),而且仅需隔(ge)周注(zhu)射一次,比每日服用(yong)药物方便许多。但(dan)在汪京(jing)嘉看来,对于老年高血脂高血压的病人,一切以维稳为主,他(ta)汀类口服药物已有超过30年的临床应用(yong)历史,副作用(yong)发生(sheng)率低,符合循证医(yi)学(xue)的“最小有效干预”原则,可避免过度医(yi)疗(liao)。
这场“争论”最终以老人的沉默落下帷幕。他(ta)扶了(le)扶眼镜,应了(le)声“哦(o)”,关掉手机(ji),把纸质处方插进(jin)口袋。走廊叫号屏(ping)显示,下一位患者已等候8分钟,这比平均问(wen)诊时间多了(le)三分之一。
不(bu)止在医(yi)疗(liao)界,类似的认知拉锯正(zheng)在全球上演。
2025年初(chu),各类大模型开放(fang),AI的兴起改变了(le)人们的日常生(sheng)活。作家借助算法优化诗句结构,养生(sheng)爱好(hao)者用(yong)AI定制健(jian)康食(shi)谱,失眠者深夜与AI对话(hua)疏(shu)解焦虑。股民们甚至乐此不(bu)疲(pi)地解读(du)着AI生(sheng)成(cheng)的各类理财(cai)建议。
在公众对生(sheng)成(cheng)式大模型日益依赖的进(jin)程中,偏(pian)差开始浮现(xian)。看似无所(suo)不(bu)能(neng)的智能(neng)助手,时常会(hui)像模像样地“编故事”。当用(yong)户查询历史细节时,AI可能(neng)会(hui)将不(bu)同朝代的典(dian)章制度混杂交错(cuo);求医(yi)者收到的诊疗(liao)方案中,藏着多年前(qian)已被世卫组织废止的药剂配比……在常识(shi)边界外,算法用(yong)看似完美的逻辑链条编织着答案。
自此,人们开始重新校准与科技的联(lian)结。
北医(yi)三院心内科诊室,汪京(jing)嘉正(zheng)在看诊。受访者供图
AI依赖症
北京(jing)望京(jing),一栋(dong)写字楼的16层,证券分析师小宋的工位上有三块(kuai)曲面显示屏(ping),上面终日流淌着数据(ju)瀑布(bu)。2023年6月开始,他(ta)使用(yong)AIApp(jian)chatGPT作为工作助手。“瞬(shun)析上百份财(cai)报、一分钟生(sheng)成(cheng)深度报告,人肯定是做不(bu)到。”小宋觉得,chatGPT能(neng)很(hen)快做出反应并处理问(wen)题,让他(ta)的报告产(chan)出效率跃升。
当其他(ta)同事还在手动整理全国(guo)几十家半导(dao)体企业财(cai)报时,AI已经帮他(ta)抓取了(le)关键参数,“某半导(dao)体集团(tuan)的资(zi)本(ben)开支数据(ju)、驱动芯片(pian)占全球市场的份额、全球半导(dao)体销售额……”小宋的手指反复在键盘上跳跃,这些复杂的数据(ju)在短短30秒内被制成(cheng)了(le)一张图表。
企业内部的一场电话(hua)会(hui)中,轮到小宋做会(hui)议纪要,chatGPT的实时语音转(zhuan)录功能(neng)不(bu)仅将领导(dao)含(han)糊的浙江普通话(hua)精准转(zhuan)换成(cheng)了(le)文字,会(hui)后小宋核对录音,连专业财(cai)务词汇和数据(ju)信息都分毫不(bu)差。
小宋沉浸在一种AI带来的时间红利中。曾经需要通宵解析的市场波动,现(xian)在只需要一杯茶的工夫(fu),就变成(cheng)了(le)电脑屏(ping)幕里跳动的概率曲线,这些由AI算法托起的轻舟,载着他(ta)穿越信息的洪流。
类似的感受,王贺也(ye)有。
他(ta)是北京(jing)一家网络安全企业的产(chan)品研(yan)发工程师,像是数字世界的“安全锁匠”,王贺每天的工作,是在电脑前(qian)设(she)计各类杀(sha)毒App(jian)和防火墙(qiang),不(bu)断模拟黑客攻击来测试这些防护系统的漏洞,直到确认没有任何非法闯入的途径。
从前(qian),王贺要像“捡豆子”一样逐行审(shen)查代码找漏洞,通宵筛(shai)查警报代码早就变成(cheng)了(le)常态,长时间的高负荷工作,让他(ta)觉得身上像是绑上了(le)时钟,永远停不(bu)下来。
这样的状态因为AI的接入,发生(sheng)了(le)微妙的迁移,密密麻麻的日程表上,突然多出了(le)一些空白(bai)格。
去(qu)年,王贺所(suo)在的团(tuan)队正(zheng)式将AI应用(yong)到工作中,在自动化渗透测试中,AI能(neng)模拟黑客攻击行为,通过自动检测工具(ju)和机(ji)器学(xue)习算法,快速发现(xian)系统中的漏洞和弱点,并提出有效的修复建议。
“就像打仗的时候,士兵不(bu)再拼刺刀,但(dan)需要更高维的战术指挥能(neng)力。”王贺觉得,他(ta)的时间不(bu)再消(xiao)耗在显微镜式的漏洞追踪上,转(zhuan)而可以聚焦于设(she)计防御算法上。
AI可以自动生(sheng)成(cheng)百万(wan)级测试用(yong)例(li),3秒定位某金融(rong)APP支付接口的越权漏洞,而同样的工作,人工测试则需4小时。他(ta)粗略地计算过,人工智能(neng)系统的接入,相(xiang)比传统运维效率提升了(le)20%。
这种信息狩猎方式的革新,也(ye)正(zheng)在重塑财(cai)经记者崔(cui)其的工作。
3月3日晚(wan)上8点,崔(cui)其正(zheng)在对DeepSeek话(hua)框(kuang)中输入第6次修改指令:“筛(shai)选近(jin)一年融(rong)资(zi)超1000万(wan)的科技企业,关联(lian)创(chuang)始人减持记录和诉讼数据(ju)。”这是他(ta)使用(yong)人工智能(neng)程序寻(xun)找选题的第32天。
崔(cui)其逐渐摸索出一套与AI协作的工作法则,“AI可通过数据(ju)分析得出近(jin)期最受关注(zhu)的话(hua)题是什么,再将热点信息与所(suo)在行业结合,一些还不(bu)错(cuo)的选题就出来了(le)。”启动AI程序,变成(cheng)他(ta)每天上班第一件(jian)要做的事,算法生(sheng)成(cheng)全网声量最高的热词,这些热点信息投(tou)射到行业常识(shi)图谱上,变成(cheng)若干选题。
AI赋予了(le)崔(cui)其一种快速的数据(ju)洞察力,他(ta)总能(neng)利用(yong)AI给出的热点词,在纷杂的信息汪洋里锚定坐(zuo)标,将大众关切的话(hua)题与专业洞见梳理成(cheng)一篇又一篇爆款文章。
chatGPT对话(hua)页(ye)面。 图源 ic photo
AI幻(huan)觉“陷阱”
这个月,小宋第四次捕捉到AI的错(cuo)误。
小宋记得,撰写行业报告前(qian),他(ta)想在AI上收集一些有效数据(ju),chatGPT为他(ta)生(sheng)成(cheng)了(le)一份《存储芯片(pian)行业Q1预测》:“SAMSUNG电子将在西安扩产(chan)”“台积电产(chan)能(neng)释放(fang)带动需求,某电子元件(jian)企业预计营收增长22.3%”……
大量的信息正(zheng)以每秒三行的速度出现(xian)在深蓝色曲面屏(ping)上,检索过一轮之后,小宋意识(shi)到,这些快速生(sheng)成(cheng)的数据(ju)和信息并不(bu)真实。“本(ben)来还觉得很(hen)有道理、很(hen)专业,AI给出的资(zi)料(liao)里甚至还附上了(le)开发区管委会(hui)的红头文件(jian)编号,但(dan)仔细一查,根(gen)本(ben)就没有这个东西。”
所(suo)谓AI幻(huan)觉,通常是指大语言(yan)模型生(sheng)成(cheng)的内容无意义、不(bu)符合事实、逻辑自相(xiang)矛盾(dun),甚至完全不(bu)准确的输出。去(qu)年8月,一家叫Arthur AI的人工智能(neng)企业发布(bu)了(le)一份报告,比较了(le)OpenAI、Meta、Anthropic以及(ji)Cohere企业开发的大语言(yan)模型出现(xian)幻(huan)觉的概率。结果显示,这些大模型都会(hui)产(chan)生(sheng)幻(huan)觉。
中国(guo)信通院人工智能(neng)研(yan)究所(suo)副所(suo)长巫彤宁在接受新京(jing)报采访时,用(yong)生(sheng)活化类比说明了(le)AI幻(huan)觉的成(cheng)因,“就像一个人虽(sui)然能(neng)流利地说话(hua),但(dan)并不(bu)一定每句话(hua)都符合事实。”他(ta)介(jie)绍,AI本(ben)质上是根(gen)据(ju)前(qian)文预测最可能(neng)出现(xian)的词语,它更像是一个沉浸在语料(liao)库海洋中学(xue)习说话(hua)的学(xue)习者,它不(bu)是在查找答案,而是在预测下一个要说的最合理的词应该是什么。
巫彤宁说明,大模型是指具(ju)有大规模参数和计算能(neng)力的机(ji)器学(xue)习模型。而大语言(yan)模型(LLMs)是指基于深度学(xue)习,拥有数十亿甚至千亿级别的参数构成(cheng),能(neng)够在多样化的自然语言(yan)处理任务中展现(xian)强大生(sheng)成(cheng)与推理能(neng)力的人工智能(neng)模型。
然而,大模型训练时吸取的海量网络数据(ju)如同未经筛(shai)选的图书馆,既藏有真知灼见,也(ye)充斥着谣言(yan)与广告。由于AI无法像人类那(na)样理解事实的逻辑,因此,当遇到需要深度推理的问(wen)题时,这种基于概率的创(chuang)作机(ji)制就容易催生(sheng)看似合理实则错(cuo)漏百出的“专业谎言(yan)”。
AI承认提供了(le)虚假文献。受访者供图
这种幻(huan)觉带来的信息污染开始侵蚀小宋的工作。
最危险(xian)的失误发生(sheng)在今年1月。一次实地调研(yan)中,某半导(dao)体企业的销售总监聊到“刻蚀机(ji)交货期从半年延长到七(qi)个半月”时,小宋突然意识(shi)到,自己上周发布(bu)的行业报告里,关于芯片(pian)设(she)备(bei)供应周期的预测数据(ju),还在使用(yong)AI系统中存储的旧参数。这意味(wei)着,所(suo)有基于该数据(ju)的投(tou)资(zi)建议都存在偏(pian)差。
在小宋所(suo)在的证券行业,这种错(cuo)误是“致命”的。他(ta)的失误被做成(cheng)案例(li),在团(tuan)队晨会(hui)上反复批评(ping)。
“AI幻(huan)觉”导(dao)致的偏(pian)差,也(ye)正(zheng)成(cheng)为自动驾驶研(yan)发的棘(ji)手难题。
上海临港的自动驾驶测试场内,某车企自动驾驶研(yan)发部的刘璐摘下AR眼镜,盯(ding)着监控屏(ping)上的异常轨迹皱起眉(mei)头,这是本(ben)周第三起误触发事件(jian)。L4级测试汽(qi)车在通过无标线道路时,突然对右侧绿化区实施紧急制动。回放(fang)测试录像发现(xian),雷达将随风摆动的塑料(liao)棚(peng)膜识(shi)别成(cheng)横穿马路的行人,而摄(she)像头因逆光未能(neng)及(ji)时修正(zheng)。
刘璐所(suo)在的研(yan)究团(tuan)队每周要分析超过2000公里的路测数据(ju)。在标注(zhu)着“光影干扰”的文件(jian)夹里,存有清(qing)晨逆光、隧道明暗交替、雪地反光等多种特殊场景(jing)。某个冬日郊外测试中,激光雷达曾将雪地里跳跃的太阳光影群误判为滚石,引(yin)发急刹(sha)。
“误触发案例(li)很(hen)多是因为大模型感知问(wen)题。”刘璐调出三个月的测试事故统计,53%的AI系统误判集中在四种场景(jing):低空飞鸟群、暴雨天剧烈(lie)摆动的雨刮器、特殊角度护栏甚至百米外飘舞的塑料(liao)袋。这些人类司机(ji)可以轻松识(shi)别的道路信息,却是AI系统无法准确理解的“视(shi)觉陷阱”。
真正(zheng)的挑战来自多传感器协同。实验场的屏(ping)幕上,摄(she)像头坚持显示着“斑马线上的行人”,而激光雷达的点云图却显示该区域空无一物。“就像人同时听到好(hao)几个不(bu)知真假的警报,要瞬(shun)间判断哪个是真实的威胁。”刘璐说,对于自动驾驶的研(yan)发人员来说,让AI系统对此类矛盾(dun)判断的响(xiang)应时间接近(jin)人类驾驶员的反应速度,是他(ta)们面临的最大挑战。
在真实的马路上,这样的“误会(hui)”可能(neng)带来严重的危险(xian)。每当算法把树影错(cuo)认成(cheng)行人,或是将雨幕解析成(cheng)车流,刘璐都又一次意识(shi)到,这些都是自动驾驶研(yan)发路上必(bi)经的“错(cuo)觉时刻”,而教(jiao)AI准确理解现(xian)实世界,远比教(jiao)它处理清(qing)晰规则更困难。
在社交媒体上,越来越多的网友开始分享自己被AI“欺骗”的经历。
论文截稿的前(qian)几天,材料(liao)专业的大四学(xue)生(sheng)静(jing)文开始发愁。生(sheng)成(cheng)式人工智能(neng)App(jian)普及(ji)后,她熟练运用(yong)着各类AI辅助工具(ju),用(yong)Kimi梳理文献综述,通过豆包(bao)生(sheng)成(cheng)实验框(kuang)架,DeepSeek上线后更成(cheng)为她整理数据(ju)的得力助手。
然而,这份“依赖”在开学(xue)初(chu)显露出隐患。2月18日,静(jing)文通过AI整理“量子点材料(liao)”研(yan)究进(jin)展,系统洋洋洒洒列出27篇参考文献。可当她逐条核实时,发现(xian)27篇的参考文献,只有3篇真实存在,而这3篇里压根(gen)没有关于“量子点材料(liao)突破”的学(xue)术信息。
人机(ji)博弈
“AI给出的虚假文献就像皇帝(di)的新衣。”
静(jing)文觉得,AI可能(neng)并非刻意造假,而是将真实存在的期刊(kan)名称、学(xue)者研(yan)究方向、实验数据(ju)进(jin)行概率性组合,最终编织出逻辑自洽却脱离(li)现(xian)实的回答。
从那(na)之后,她不(bu)再盲目地相(xiang)信AI给出的任何回答,现(xian)在,她每看到一篇被引(yin)用(yong)的文献,都会(hui)手动验证两个信息:期刊(kan)官网的当期目录和通讯编辑实验室官网的成(cheng)果列表。
3月4日,医(yi)生(sheng)值班室里,汪京(jing)嘉对着闪烁的屏(ping)幕发了(le)好(hao)一会(hui)儿呆。
汪京(jing)嘉把人工智能(neng)比作“双面镜”。他(ta)说,越来越多的年轻医(yi)生(sheng)们开始依赖AI撰写病历小结、写课题论文,那(na)些看似专业的医(yi)学(xue)名词堆(dui)砌下,偶(ou)尔也(ye)会(hui)冒(mao)出“左心室瓣膜钙化导(dao)致糖尿病”之类的荒唐逻辑。
他(ta)突然想起前(qian)段(duan)时间,有位同事的论文被国(guo)际期刊(kan)退回,审(shen)稿人用(yong)红字标注(zhu)着:“参考文献第7、12条查无此文”。这是一篇用(yong)AI辅助完成(cheng)的课题论文,虚构的文献如同混入珍珠项链的塑料(liao)珠子,逼真得连DOI编码(Digital Object Identifier,通过DOI号,可以追溯论文发表的时间、期刊(kan)信息、编辑信息等数据(ju))都自成(cheng)体系。
去(qu)年春天,一款医(yi)疗(liao)AI系统通过了(le)药监局审(shen)批,但(dan)可使用(yong)权限被严格框(kuang)定在影像识(shi)别领域。汪京(jing)嘉告诉新京(jing)报记者,AI影像辅助检测AIApp(jian)可用(yong)于结节识(shi)别、结节良恶性鉴别诊断以及(ji)智能(neng)报告生(sheng)成(cheng)。
AI的加入让医(yi)学(xue)检查更加敏锐,也(ye)让业界担心会(hui)造成(cheng)新的“过度诊疗(liao)”。事实上,AI接入CT以后,一路走高的肺结节的检出率已经让越来越多人陷入焦虑了(le)。
但(dan)最棘(ji)手的仍是数据(ju)真相(xiang)。在使用(yong)过程中,医(yi)生(sheng)们必(bi)须仔细甄(zhen)别AI系统背后的逻辑漏洞,“病理切片(pian)的光学(xue)分辨率、检查报告的措辞偏(pian)差,甚至一句模糊的主诉描述,都可能(neng)导(dao)致AI误判。”汪京(jing)嘉觉得,任何AI工具(ju)都不(bu)是无所(suo)不(bu)能(neng)的智者,而是需要被交叉验证的协编辑。
人机(ji)博弈有时也(ye)发生(sheng)在王贺身上。
有天下午(wu),他(ta)盯(ding)着屏(ping)幕上的警报记录哭笑不(bu)得,企业新上线的AI安全系统刚刚把行政部同事批量发送的会(hui)议通知,误判成(cheng)了(le)“可疑邮件(jian)轰炸”。整齐排列的会(hui)议日程,在AI眼里成(cheng)了(le)攻击代码的伪装。
作为专业的程序员,王贺给AI系统设(she)置了(le)一个准则,只允许它“学(xue)习”国(guo)家网络安全机(ji)构认证的病毒样本(ben)库,而来路不(bu)明的网络攻击案例(li),必(bi)须先经过人工审(shen)核,才能(neng)放(fang)入清(qing)单。他(ta)回忆(yi),上周有同事上传的“新型诈骗案例(li)”,后来发现(xian),其实是某部科幻(huan)小说的情节,幸好(hao)被提前(qian)拦截。
他(ta)觉得,AI的使用(yong)者不(bu)能(neng)被大模型所(suo)主导(dao),而应该主导(dao)大模型。在与大模型交流时,优化提问(wen)方式,在一定程度上能(neng)减少(shao)幻(huan)觉出现(xian),比如要求在指定范围回答,并提供信息来源链接。
那(na)次重大失误后,小宋在办公室支起了(le)双重验证系统:左侧曲面屏(ping)继续运行AI分析程序,右侧液晶屏(ping)则时刻准备(bei)验证真伪。“现(xian)在我(wo)要像法医(yi)一样剖解数据(ju)。”小宋给自己新增了(le)两条“铁律”,所(suo)有涉及(ji)政府文件(jian)的信源,必(bi)须手动查验国(guo)务院客户端,有关财(cai)务数字的信息要多次反复复核。
他(ta)演示着最新的工作流程:AI生(sheng)成(cheng)的每段(duan)内容,都要用(yong)两个独立(li)信源交叉验证,所(suo)有财(cai)务模型必(bi)须手工重算关键参数,就连企业官网信息,也(ye)要对照(zhao)纸质年报逐行校阅。
这样的操(cao)作,让他(ta)的发稿速度退回到两年前(qian),过去(qu)半小时完成(cheng)的行业简报,现(xian)在需要拆解成(cheng)多个节点验证节点。
最近(jin),刘璐和团(tuan)队像教(jiao)新手司机(ji)认路一样,给自动驾驶系统添加了(le)“辨别课”。他(ta)们让AI反复学(xue)习数万(wan)种光影类别,有时是进(jin)出隧道时忽明忽暗的强光,有时是雨天车窗上跳跃的水珠反光,还有高楼玻璃幕墙(qiang)在阳光下制造的“假红绿灯”。
“就像驾校教(jiao)练会(hui)带学(xue)员到复杂路段(duan)实地训练。”刘璐说明,他(ta)们用(yong)计算机(ji)生(sheng)成(cheng)各种逼真的光影干扰场景(jing),让系统学(xue)会(hui)做判断,当摄(she)像头看到疑似红灯的反光时,会(hui)检查雷达是否探测到实体障碍(ai)物,同时参考导(dao)航地图确认该位置是否真有交通信号灯,可以有效减少(shao)测试车辆被反光迷惑而突然刹(sha)车,就像老司机(ji)能(neng)一眼分清(qing)霓虹灯和真正(zheng)的交通信号。
上海临港自动驾驶测试厂,正(zheng)在进(jin)行自动驾驶车辆路测。受访者供图
寻(xun)找最优解
夹杂着虚构与偏(pian)差的信息,悄然走进(jin)人们的生(sheng)活,普通用(yong)户难以分辨屏(ping)幕另一端是引(yin)经据(ju)典(dian)的专业数据(ju)还是AI幻(huan)觉,这种信任危机(ji)正(zheng)在医(yi)疗(liao)咨询、法律解读(du)等专业领域形(xing)成(cheng)裂痕(hen)。
2023年6月,美国(guo)纽约(yue)南区联(lian)邦地区法院审(shen)理的Mata v. Avianca案件(jian)被认为是全球首例(li)因“AI幻(huan)觉”而受到司法处罚的案例(li)。
2023年3月1日,Mata的代理律师提交了(le)一份反对动议的声明,该声明引(yin)用(yong)并摘录了(le)据(ju)称发表在《联(lian)邦判例(li)汇编》《联(lian)邦补充判例(li)汇编》中的司法判决;然而,这些声明中引(yin)用(yong)的判例(li)并非真实存在,而是由ChatGPT生(sheng)成(cheng)的。
在被告律师指出案例(li)无法找到后,原告律师未能(neng)核实判例(li)的真实性,并在法院要求提供完整案例(li)文本(ben)后,仍然提交了(le)由ChatGPT 生(sheng)成(cheng)的“判例(li)”,法官认为原告律师的行为违反了(le)执业道德准则,浪费(fei)了(le)司法资(zi)源,并被处以5000美金的罚款。
“AI在生(sheng)成(cheng)答案时所(suo)犯的错(cuo)误,是否可以追溯到开发者设(she)计时的缺(que)陷?”“是否应赋予人工智能(neng)以法律上的人格?”最近(jin),类似这样的问(wen)题不(bu)断引(yin)发讨论。
有法律专家认为,AI的决策(ce)如果不(bu)具(ju)备(bei)情感或意识(shi),就不(bu)应该被视(shi)为“过失”。也(ye)有学(xue)者提出,人工智能(neng)具(ju)有独立(li)自主的行为能(neng)力,有资(zi)格享有法律权利并承担责任义务,应当具(ju)有法律人格,但(dan)其具(ju)有的仅是有限的法律人格,在必(bi)要时可“刺破人工智能(neng)面纱”,对其适用(yong)特殊的侵权责任规范。
北京(jing)师范大学(xue)中国(guo)社会(hui)管理研(yan)究院院长、互(hu)联(lian)网发展研(yan)究院院长李韬告诉新京(jing)报记者,传统的技术错(cuo)误或失误的责任一般(ban)由开发者或技术企业承担。这种责任分配原则已经在许多行业的产(chan)品责任法和医(yi)疗(liao)责任法等法规中有明确规定。然而,AI系统的自主性和决策(ce)能(neng)力,使得这种传统的责任界定方式愈发变得难以适用(yong)。
李韬指出,构建行之有效的AI治理体系尤为重要,而生(sheng)成(cheng)式人工智能(neng)责任认定的基本(ben)伦理,需要在技术进(jin)步和权利保护之间求得平衡状态,其伦理规制的关键在于确立(li)一个既能(neng)促进(jin)创(chuang)新和进(jin)步,又能(neng)保护个人和社会(hui)权益的伦理框(kuang)架。
新京(jing)报记者发现(xian),近(jin)期,DeepSeek和OpenAI等平台也(ye)在用(yong)户协议和平台规则中提示了(le)输出出现(xian)错(cuo)误甚至幻(huan)觉的风险(xian),并突出提示了(le)在法律、医(yi)疗(liao)以及(ji)金融(rong)等垂直领域的直接应用(yong)风险(xian)。
这些平台在用(yong)户协议中通常包(bao)含(han)以下免责声明:生(sheng)成(cheng)内容可能(neng)不(bu)准确、不(bu)完整或具(ju)有误导(dao)性,用(yong)户应自行核实;专业课的应用(yong)需谨慎,建议专业人士进(jin)行复核;平台不(bu)对生(sheng)成(cheng)内容的准确性、合法性或适用(yong)性承担责任。
面对来势汹汹的AI幻(huan)觉,一些企业也(ye)在探索“应对之策(ce)”。
美国(guo)硅谷一家名为Exa的人工智能(neng)企业发现(xian)其搜索引(yin)擎用(yong)户出现(xian)新的需求:大量企业客户苦于无法验证AI生(sheng)成(cheng)内容的真实性。他(ta)们开发了(le)AI幻(huan)觉检测器,是一款基于实时网络数据(ju)验证的核查工具(ju)。
根(gen)据(ju)其官网发布(bu)的信息,Exa的AI幻(huan)觉检测器通过实时抓取权威数据(ju)库、交叉比对多源信息,结合动态更新的产(chan)业常识(shi)图谱,逐层验证AI生(sheng)成(cheng)内容中的人物、数据(ju)、事件(jian)是否与可溯源的现(xian)实证据(ju)匹配,并为每个结论标注(zhu)可信度评(ping)级与证据(ju)链来源。
关于“AI幻(huan)觉能(neng)不(bu)能(neng)彻(che)底被消(xiao)除?”的问(wen)题,在行业专家巫彤宁那(na)里被具(ju)象化。
巫彤宁把大模型的创(chuang)造力比作一把需要精密调控的双刃剑。在他(ta)看来,平衡创(chuang)造性与真实性的关键在于构建双重防护体系:首先要提高大模型学(xue)习常识(shi)的质量,通过更严格的常识(shi)筛(shai)选,提高喂给大模型数据(ju)的质量,从而从根(gen)本(ben)上降低产(chan)生(sheng)幻(huan)觉的可能(neng)性;其次,应建立(li)用(yong)户纠错(cuo)机(ji)制:让用(yong)户在使用(yong)中实时反馈模型输出中的错(cuo)误或不(bu)准确之处,这些反馈能(neng)像错(cuo)题本(ben)一样帮AI记住(zhu)教(jiao)训,越用(yong)越准。
除此之外,巫彤宁经常呼吁,让大模型分场景(jing)工作,针对法律、医(yi)疗(liao)等低容错(cuo)率领域,强制激活“严谨模式”,要求模型检索最新权威资(zi)料(liao)并标注(zhu)来源,而面对创(chuang)意需求时则开放(fang)联(lian)想空间,允许“开脑洞”,为用(yong)户带来更多灵(ling)感。
“我(wo)们要做的,是找到人工智能(neng)和人类中间的平衡。”巫彤宁知道,彻(che)底消(xiao)除幻(huan)觉并不(bu)现(xian)实,而在AI信息爆炸时代,始终保持独立(li)思考的能(neng)力、辨别信息真伪的能(neng)力比获取信息的能(neng)力更宝贵。
新京(jing)报记者 咸运祯
编辑 陈晓(xiao)舒
校对 杨利