3月29日,在中关村论坛(tan)通用人工(gong)智能论坛(tan)上,全(quan)球首个通用智能人“通通”2.0版发布,标志着(zhe)人工(gong)智能在多(duo)模态交互与场景适应能力上迈出革命(ming)性一步。
北京青年报记者(zhe)了解到,“通通”2.0在语言(yan)、认知、动作、学习、情绪、交互等六大核心(xin)能力上实现升级。其核心(xin)亮点在于价值驱动的多(duo)轮对话机制,不同于传(chuan)统AI仅围绕用户指令被动响应,新版本(ben)构建(jian)了一个拥有独(du)立价值观与世界观的小女孩人格。例(li)如,当被要求(qiu)实行“不喜欢的任务(wu)”时,她会通过撒娇、协商甚至(zhi)“讨价还价”展现真实孩童般的交互体验,有效(xiao)避免对话逻辑断(duan)裂与“机械感”。
技术突破体现在动态场景适应与学习。通过强(qiang)化学习框(kuang)架,“通通”能实时感知三(san)维(wei)虚拟环境的变化,自主(zhu)调(diao)整任务(wu)规(gui)划(hua)。实验案例(li)中,为获取被移动位置的空调(diao)遥(yao)控器,通通展现出“脱(tuo)鞋(xie)登高(gao)、利用靠垫”的创造性行为链,并在被教导“电器需插电”后永(yong)久掌握该常识(shi),体现类人反思与成长能力。
在多(duo)智能体交互场景中,研(yan)究(jiu)人员为“通通”构建(jian)了包含家(jia)庭成员的复杂社交圈。她不仅能识(shi)别环境中其他智能体的身份、性格及相互关系,还能在合作任务(wu)中主(zhu)动寻求(qiu)帮助或调(diao)整协作策(ce)略。测试显示,该智能体已通过5至(zhi)6岁儿童级别的综合任务(wu)考核,展现出处理社交复杂性的潜(qian)力。
伴随(sui)“通通”升级,论坛(tan)同步推(tui)出三(san)维(wei)场景重建(jian)与具身智能数据构建(jian)平(ping)台“通通到我家(jia)”。该技术可瞬间将现实场景转化为高(gao)精度可交互虚拟空间,支撑家(jia)庭、商场乃至(zhi)工(gong)业(ye)环境的数字(zi)化重建(jian)。该平(ping)台拥有四大优势,包括多(duo)模态融合的三(san)维(wei)重建(jian)能力、支撑百万级语义标注的自动化数据集生成、虚实结合的人机交互接口,以及从虚拟到现实的技能迁移框(kuang)架。
未来,“通通”2.0将作为通用底座,支撑医疗、教育、养(yang)老等垂直(zhi)领域应用,与实体机器人结合后,有望在智能制造、智慧城市等场景中引(yin)发变革。“通通到我家(jia)”平(ping)台的开放将加速数字(zi)孪生、元宇(yu)宙等技术的民用化进程(cheng),让高(gao)度智能化的虚拟助手真正走进千家(jia)万户。
文(wen)/北京青年报记者(zhe) 王斌
编辑/汪浩舟(zhou)