4月15日,抖音在北京举办“安全与信任中心开(kai)放日”活动,相关业务负责人就抖音算法原理(li)、平台治(zhi)理(li)体系以及社会关切的问题(ti),展开(kai)了详细介(jie)绍。
在信息爆炸时代,推荐算法成为人类与巨量信息相处的主流解决方案。开(kai)放日上(shang),抖音算法工程师刘畅讲解了算法原理(li)和抖音算法的特点。
据他介(jie)绍,抖音基于用户行为的推荐方法包(bao)含多种技(ji)术模型,如协同过滤、双塔召(zhao)回、Wide&Deep模型等。算法可以在完全“不(bu)理(li)解内容”的情况下,找到兴趣相似的用户,把其(qi)他人感兴趣的内容推荐给该用户。
目前,抖音算法已几乎不(bu)依赖对内容和用户打标签,而(er)是通过神经网络计算,预估(gu)用户行为,计算用户观看这条内容获(huo)得的价值(zhi)总和,把排名靠前的内容推给用户。
抖音算法页面设计
刘畅提到,为引导算法打破“信息茧(jian)房”,抖音算法在多目标建(jian)模体系下,设置了专门的探索维度。
一(yi)是对用户在平台上(shang)已经表现出的兴趣,尽可能(neng)推荐更(geng)多样的内容,通过多样性打散、多兴趣召(zhao)回、扶持小众(长(chang)尾)兴趣等方法控制相似内容出现的频次(ci)。二是帮助用户探索更(geng)多新兴趣,采用随机推荐、基于用户社交关系拓展兴趣、搜索推荐联动、“不(bu)感兴趣”不(bu)再展现等多种方式,让用户的主动行为影响推荐系统,使推荐更(geng)加个性化和多样化。
不(bu)过,算法能(neng)学习和预估(gu)用户行为,但因其(qi)无法理(li)解内容语义(yi),对内容的理(li)解存在不(bu)足,可能(neng)导致违法违规(gui)、不(bu)良(liang)内容被推荐传播。因此,算法在真实使用场景(jing)中,必须(xu)由平台治(zhi)理(li)对其(qi)进行约束和规(gui)范。
对此,抖音生(sheng)态运营(ying)经理(li)陈丹(dan)丹(dan)表示,抖音的内容治(zhi)理(li)体系是“人工参与+机器学习”相结合的模式,并组建(jian)了专门的平台治(zhi)理(li)团队为算法设置“护栏”。
据悉,抖音平台治(zhi)理(li)体系包(bao)括(kuo)异常感知、标准(zhun)定义(yi)、机器识别、人工研判、风(feng)险处置等过程。治(zhi)理(li)流程秉持两大准(zhun)则:首先是所有在平台发布的内容都会经过评估(gu),流量越高(gao)的内容评估(gu)次(ci)数越多,标准(zhun)也越严格(ge)。其(qi)次(ci),抖音内容审核采用“人工+机器”相互(hu)配合的模式,“机器”负责“宽度”评估(gu)所有投稿,“人工”负责“深度”,确保专业、敏感或疑难等问题(ti)尽可能(neng)精准(zhun)研判。
创(chuang)编辑将内容上(shang)传至抖音后(hou),首先进入机器识别环节。如果内容被识别出含有高(gao)危特征,将被直接拦截;若未命中高(gao)危特征但模型判断(duan)有问题(ti),则会送至人工审核;若问题(ti)概率较低,则获(huo)得基础流量进入下一(yi)环节。视频被举报、评论(lun)区出现集中质(zhi)疑、流量激增等情况出现,均可能(neng)触发“人工+机器”审核。一(yi)旦内容在任一(yi)环节被处置,系统会立(li)即停止进一(yi)步推荐和分发。
值(zhi)得注意(yi)的是,针对社会普遍关心的、对用户造(zao)成较多困扰的焦点问题(ti),抖音成立(li)了数个专项治(zhi)理(li)团队,针对诈骗、网暴、虚假摆拍、未成年人保护、网络水军、AIGC技(ji)术滥用等一(yi)系列重大专项风(feng)险进行治(zhi)理(li)。例如,在不(bu)实信息治(zhi)理(li)方面,抖音于近日上(shang)线了辟谣卡,遏制不(bu)实信息的传播。
南都记者了解到,未来抖音将推进各项举措,让算法更(geng)透明、治(zhi)理(li)更(geng)完善(shan)、服务更(geng)到位(wei),并以安全与信任中心为依托(tuo),持续增加算法和治(zhi)理(li)透明度,回应(ying)社会关切的议题(ti),主动公示违规(gui)案例治(zhi)理(li)情况,接受公众监督(du)。
采写:南都记者黄莉玲