每经AI快讯(xun),3月21日,Tencent(xun)混元公众号消息,Tencent(xun)混元正式推出自研(yan)深(shen)度(du)思考模型混元T1正式版。在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数(shu)据集(ji)MMLU-PRO中,混元T1取得87.2分,仅次于o1。在CEval、AIME、Zebra Logic等中英(ying)文常识及(ji)竞赛级数(shu)学、逻辑(ji)推理的公开基准测试中,混元T1的成绩也达到业(ye)界领先(xian)推理模型的水平。
每日经济新(xin)闻