新华网 > > 正文

面向90后的视频聚合平台推荐逻辑

2016年04月08日 17:10:27 来源: 《中国传媒科技》杂志

    撰稿人 | 梁嘉琳 詹琦

    一月之内,视频聚合平台风云骤起。

    《中国传媒科技》从国内知名互联网安全公司360处获悉,360与北京电视台合力打造的视频聚合平台“北京时间”初定于4月上旬上线,该平台由360总裁齐向东担纲,腾讯网原副总编辑杨福、搜狐网原副总编辑魏成参与其中。据披露,团队内部将产品定位为“视频版的今日头条”,通过剪辑的视频来展示内容。

    作为对标物的今日头条,已跻身国内最大的信息聚合客户端之一。今日头条创始人张一鸣在多个场合表示,支撑这一切的是机器算法引擎。“去年底,今日头条招一个在Facebook(脸谱)、Google(谷歌)、Amazon(亚马逊)担任达到一定职位的算法工程师,许诺的是千万年薪。”一位业内人士告诉本刊。无独有偶,有投资人3月16日披露:“今日头条改版,视频从频道升级为一个架构完整的小优酷。拿优酷做对标并不准确,他是个新的视频平台。”当两大公司纷纷发力视频聚合平台,面向90后的秒拍/小咖秀早已在这方面做出尝试。作为国内入驻明星最多、对90后、95后影响最大的短视频社区,秒拍的单视频平均播放量为400次,日活跃用户3300万,累计用户数达到3.8亿。

    “我在酷6网当创始人的时候,日播放量达到1亿,需要1300多个员工;今天的秒拍/小咖秀日播放量6亿多,按照老办法需要5000多人,实际上,这就会把我们所有的钱都砸在人力成本上。如果通过机器推荐,我们今天只需要300多人。“一下科技CEO韩坤告诉本刊,人工智能+编辑人力,这是秒拍、今日头条进行内容聚合分发的技术共性。

    “受产品属性(比如娱乐、搞笑、美女)影响,整个短视频行业的主流受众都是90后、95后。”在秒拍管理层看来,与其天天开会讨论如何取悦90后、95后,不如用好数据分析工具。数据显示,获得机器推荐之后,秒拍/小咖秀视频的播放量会提升3 0%- 4 0%。秒拍如何确定推荐法则?如何确保推荐给用户的内容是用户更加喜欢的?基于播放量的机器推荐和基于用户兴趣标签推荐将如何协调?《中国传媒科技》走进出品、运营秒拍的“一下科技”,与管理层就此深度对话。

    《中国传媒科技》:如果说,今日头条实现了文字内容聚合的“千人千面”,秒拍则宣称已实现了视频内容聚合“千人千面”。你们是怎么做到的?

    韩坤(一下科技CEO):实现“千人千面”有三大个性化指标:一是导入微博的兴趣标签,二是基于用户位置的本地新闻,三是用户的朋友圈推荐。此外,占一半以上的视频是热门视频,也就是已经是被大多数用户验证过,被认为是“好看”的。

    汤力嘉(秒拍首席技术官CTO):我们通过以下方式实现:(1)设置初始值。用户注册秒拍账户时,会被要求填写兴趣,对用户进行初步画像。兴趣被分为“美女”“搞笑”“明星”“小咖秀”“创意”“时尚”“音乐”“宝宝”“萌宠”9个兴趣标签。编辑给“池子”里的视频贴上标签,进行分类,对于未分类视频则进行智能匹配,比如用户看了80%的“搞笑”标签的视频,再看了20%的未分类视频,那么系统认定后者与“搞笑”非常接近,将被视为“搞笑”视频进行推荐。

    兴趣引擎解决的是深度,而热门视频解决的是广度。完全依据用户的兴趣爱好进行推荐,会带来一个问题,就是用户观看到的视频越来越单一化。为解决兴趣标签的新鲜度下降的问题,我们会引入10%的视频,不是基于兴趣引擎得出(比如社会热点事件),如果用户有类似播放操作,就说明用户接受这类“不大一样”的内容,这类视频的推荐权重就会逐步上升;反之,这类视频的权重会逐步下降。

    (2)用户的播放行为。新用户刚刚登陆秒拍/小咖秀,我们只能对他们进行初始化推荐。由于对于“创意”“时尚”等兴趣标签理解见仁见智,而单一用户的兴趣爱好也会随着时间推移而改变,单一标签推荐的失误率比较高。随着用户播放次数越来越多,基于用户播放行为的分析,推荐精准度就会越来越高。

    比如“向量法”可以推算任意两个视频之间的“距离”,有100个用户播过A视频、B视频之后,都会播放C视频。如果第101个用户也播过A视频、B视频,系统就假设该用户对C视频也感兴趣,给他推送C视频。如果单一用户对某类视频的播放次数达到10次以上,用户的活跃度也提高了,我们就认为他对这类视频感兴趣。

    (3)与其他用户的互动行为。截至目前,秒拍/小咖秀搜集的用户数据都是“正反馈”(俗称好评),对某个标签视频的播放次数(包括单一视频多次播放)、点赞次数、留言次数。我们会根据这些指标进行一定的加权,算出他对哪类视频感兴趣。由于秒拍、小咖秀用户多为90后、00后,评论大多没有实质性内容 “嚯嚯”“23333(捶地大笑——作者注)”,我们只需分析其褒/贬义,无需用机器进行文本分析。

    需要注意的是,无论通过兴趣标签还是互动行为获取用户偏好数据,都不能过度加重用户的使用成本,不主张让用户填一份兴趣调查表,或者强制用户给每个视频点赞、打分。再比如,微博、微信可以自己平台上用户对某个视频的偏好数据,优化视频推荐算法。然而,秒拍的账号体系跟这些社交平台是相互独立的,如果秒拍要获取这些数据,必须让社交平台上的用户注册/登录秒拍,并关联其微博/微信账号,但这会提高用户的视频观看门槛,我们暂时不打算这么做。

    (4)合作方数据导入。作为新浪战略产品,秒拍天生具有很强媒体属性;秒拍与微博一脉相承,有很强的社交属性,好友关系的导入分享,粘性更强。与此同时,秒拍能够获得新浪微博的用户的兴趣标签,从而在微博文字和秒拍的视频、照片之间进行更精准的匹配。

    《中国传媒科技》:秒拍的视频来源主要有哪些?面对多样化的来源,如何对视频聚合平台的内容进行筛选?

    汤力嘉:一个是专业生产内容(PGC)渠道。(1)明星;(2)网络红人(大部分有团队或工作室,定期创作内容);( 3 )官微入驻( 如央视新闻、联合国等)。相对于UGC,PGC的可看性更高。秒拍从微博聚拢了一批优质内容生产者,包括800家以上的媒体/官方机构(如央视新闻、联合国、NBA等),1000位以上明星(如贾乃亮、TFBOYS组合、黄晓明等),以及5000位以上UGC/PGC达人。另一个是用户生产内容(PGC)渠道。所有用户上传的视频会进入一个“池子”。

    韩坤:在视频聚合平台, 编辑的职能主要是找到能产生热点的人(如网络红人、达人、明星、名粉丝),再从这些“被选中”的人,以及微博等社交网络上的人,挑选出热门视频。之所以向这些人倾斜,是因为他们比较有动力生产好内容,产生的内容受关注度高。至于普通人,如果他的视频获得越来越多的用户转发,当达到一定量级之后,也有可能登陆头条。

    只有符合某个指数,一段视频才会推到首页的“热门视频”位置。很多时候,大家都非常迷信技术,但人的洞察力同样很重要。比如,按照常理,男人喜欢看美女,如果一段视频不仅有美女,而且很有趣,喜欢的人自然就更多。但这类视频有可能被机器漏选,因为机器是效果导向的(如点播数、点赞数、转发数)。

    刘新征(秒拍高级副总裁、总编辑):视频筛选通过以下几个渠道:一是早期用户总会找到渠道,跟博客、微博的编辑进行沟通,促成编辑进行首页推荐。二是每天监控人员对大量上传视频进行监控,也承担了初审的职责,看到“好玩”的视频,也会“穷尽列举”出来。三是微博大V发现并推荐了某个不知名视频作者,或者编辑发现哪个视频流量异常增长。最近很火的自媒体人Papi酱实际上是在上传视频后,主动跟编辑沟通过的。编辑需要有判断“这视频能不能火”的眼力。

    秒拍等视频聚合平台的视频推荐逻辑是曝光/点击比,如果一个(类)视频的曝光次数过多而点击过少,这个(类)视频就自动下沉了,反之亦然。而传统视频网站、客户端(如腾讯视频、爱奇艺、乐视视频)的视频推荐逻辑则是投入/产出比,它们只会把稀缺的流量资源,导入性价比更高的视频,比如它花了2亿元买了一部电视剧的版权,一定是把最好的推荐位给这部电视剧,而不是受欢迎的UGC内容。

    《中国传媒科技》:编辑在视频筛选中的角色是什么?他们和机器如何分工?

    刘新征:我们不打算在手机上办一份报纸。

    在视频聚合平台,编辑的角色与传统媒体的文字编辑并不相同。视频编辑不需要文字编辑那样的复杂逻辑思维能力、文字加工处理能力,更多是形象思维能力,比如,他看的是一段标签为“美女”的视频上的主角够不够漂亮。

    由于传统媒体的容量是固定的,一张报纸只有一个头版,上了这个稿子就上不了那个稿子,文字编辑被赋予“把关人”的巨大权力。然而,视频编辑不是视频获得推荐的唯一渠道。视频聚合平台的容量是无限的,并且能够做到“千人千面”,就算视频编辑的判断错了,也有其他渠道给用户推荐对的视频。视频聚合平台赋予编辑的职责,更多是“初始推荐权”“优先判断权”,对机器算法进行人工协助,不需要接受专业媒体训练。

    汤力嘉:秒拍App上的绝大多数内容都是机器推荐产生的。每个手机屏下拉到底是10 - 2 0个视频,把首页、二屏、三屏统统加起来,编辑推荐内容最多也就三四个,也有可能全都是及其推进。编辑推荐包括:(1)热点话题(如冰桶挑战、左手摸到右手肘等);(2)战略合作。两会新闻和“央视新闻”“人民日报”两个机构大号合作,我们也会推荐经过审核的受欢迎视频(如萌萌哒服务员)。

    《中国传媒科技》:对涉黄、涉暴、侵犯隐私的不良视频进行过滤是国际惯例,但视频审核有可能降低内容的生产效率,秒拍如何实现“安全可控”与“多元高效”的平衡?

    韩坤:秒拍的签约作者库内的视频作者,拥有视频审核的“绿色通道”,其他作者发布的视频则需要逐条审核。系统会将视频按照一定的秒数间隔形成截图,编辑在好几个视频的截图上,眼光一扫而过。他们需要白加黑的工作。

    公司的MD5视频过滤系统由几百台机器构成:用户新创造违规视频的成本很高,因此网上流传的违规视频往往都是老视频,公司经营好几年了,有一个违规视频数据库,每一条新上传视频都会与数据库进行“声音比对”;一旦发现有疑点,就会将其纳入疑似违规视频数据库,相似度达到一定程度,机器就会将其删除,并对作者进行账号查封的处理。有的敏感地区发出来的视频,我们也会有更严格的审核标准。

    汤力嘉:秒拍的色清视频识别的“图谱技术”已经到了可用阶段。秒拍系统并不需要知道视频播放内容是什么,直接根据视频里的人类形状、皮肤裸露比例,从而判断是否色清视频,机器审核准确率高达80%。在机器预过滤环节,视频被分流:(1)完全是色情视频,(2)介于色情和非色情之间的视频,(3)完全不是色清视频。(1)先屏蔽再被列入高优先级审核;(2)发布后列入高优先级审核;(3)列入低优先级审核。

    然而, 对视频进行语义提炼非常困难。比如涉暴、涉犯罪、政治敏感视频,可用的特征点非常少,有可能是某个国家或政治团体的旗帜,或者某个政治敏感人物的脸型,这就不得不进行语义分析,这一技术在全球都是难题,误差非常大。不过,对于突发事件类视频,我们会列入高危列表,进行高优先级审核。

    一位视频聚合平台高管: 由于“ 千人千面”,我们并不知道特定某个用户的秒拍首页上呈现的是什么。这就带来了内容上的不可控。去年有那么几天把我们吓死了,好多地方的用户给我们发截屏,在他们的首页上看到了色情视频。在用户眼里,我们被视为一家媒体,而被发布色情内容,被视为是小编而非机器推荐的行为——显然,这已经触及媒体的监管底线了。在巨大压力之下,我们抛弃“纯UGC”模式,只能推荐进入精选序列的视频——被编辑审核、分类过的视频,这就导致整个数据(如推荐量)下滑不少。

    刘新征:几年前, 一位业余拍摄者(UGC)的专业拍摄资金、技巧严重欠缺,而且在场的概率很低。比如,某地发生连环车祸,哥几个要先揣着DV,装上电池录完,再把录像带转成数字格式,剪辑下来,上传过去,视频要过两三天,才能被用户看到。

    几年后的今天,在UGC方面,几乎所有人都有智能手机,随时随地就能拍摄,拍完立马就能上传,好视频的命中概率提高了。在PGC方面,传统媒体(报纸、电视台)收入下滑,供给下降,但媒介购买需求仍在增长,有的记者就转行做自媒体(如短视频),收入一下子就上去了,越来越多人紧随其后,这些老新闻人PGC的供给能力远在“记者”之上。

    我预计,今年的PGC会有大比例增长,内容投资领域如火如荼。市场人士预测,2016年是“视频自媒体元年”,那些错过微信公众号红利的团队,有机会在这当中掘金。

【纠错】 [责任编辑: 高海英 ]
新华炫闻客户端下载

相关稿件

010020111200000000000000011199861352616911