以微博为例浅析社交网站中的视频推荐算法 作者:闫子琪 来源:《科技传播》 2018年第23期 摘 要 随着网络的不断普及,人们在网络中获取消息的渠道也不断扩增,这也促进了网络上各种技术的不断发展。视频推荐算法就是这其中的一个,它的主要作用是通过一些数学上的算法,将网友在某社交网站上的喜好行为做出相应的归纳总结,再对该用户进行相关的视频推荐。因此,视频推荐算法是一个以数学理论为基础,应用于互联网,服务于全体网友的技术。文章先对视频推荐算法的发展历程做简要介绍,并就微博上的视频推荐算法进行介绍和相关优缺点的分析。 关键词 视频推荐算法;微博视频推荐;用户喜好;统计分析 中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2018)224-0148-02 当今社会,是一个信息爆炸的时代,获取信息的方式日益多样。微博作为当代社会一个巨大的公众交流平台,每时每刻都会产生无数的新信息,而它产出消息的精准和快速,也让微博从众多社交媒体中脱颖而出,成为人们获取信息的主要渠道。它具备了从海量信息中瞬间提取出我们喜好的强大功能。比如我们通常在刷微博的过程中会收到一些视频的推荐,而这些视频往往和我们的兴趣点不谋而合,所以出于好奇心人们就会点开视频。微博能够以视频的形式抓住用户的眼球,同时引发拥有相同兴趣的用户间的头脑风暴。这一技术应用的就是视频推荐算法。本文就是以微博作为例子来阐释社交网站中的视频推荐算法。 1 推荐系统的发展历程 推荐系统,顾名思义,是能给用户推荐相关信息的系统。主要目的是在现在这个互联网信息呈指数增长的时代里,解决信息过载的弊端,带给网友更加优质的网络体验,让人们能轻松了解到自己所感兴趣的信息。随着科技的不断进步,推荐系统也发展的愈加完善。 1.1 初步研究期(20 世纪90 年代初期) 我们一般认为,推荐系统的发现与研究,始于1994 年明尼苏达大学,当时GroupLens 研究组所推出的GroupLens 系统。那是最早将协同过滤算法融入到推荐算法中的系统。应用到了一些数学和统计学上的知识,巧妙地把数学算法和计算机技术联系到了一起,为视频推荐算法的开启和研究奠定了基础,也使处于起步阶段的互联网技术远离单调死板。本文后续将会就协同过滤算法展开研究。 1.2 发展期(20 世纪90 年代末) 推荐算法作为当时新兴的一种技术,能与协同过滤算法进行联系,无疑受到了不少人的关注。紧接着,1995 年,就由卡内基梅隆大学的RobertArmstrong 等人开发了全新的系统。该系统能协助互联网进行信息查找,同时进行个性化推荐。将刚起步的推荐算法进行优化,在原有的基础上扩大了其功能。同年,麻省理工学院和斯坦福大学也对此技术进行了相关的研究和发现。1997 年,随着研究的不断推进,美国计算机协会就此发起会议,逐渐把对于推荐系统的研究推向高潮。 1.3 成熟期(21 世纪) 21 世纪,是互联网高度普及的时代。随着科技的不断发展,推荐系统也得到了相应的完善。就我国的网络现状而言,目前推荐系统已遍布各种App,像微博搜索栏下的视频推荐系统、优酷爱奇艺等视频播放平台的兴趣推荐系统、淘宝中的“猜你喜欢”等。这些我们常用的软件,随着科技的发展,都渐渐地将推荐技术的原理应用其中,说明推荐系统已不再是人们触不可及的高端科技,渐渐变成了人们网络生活中一项必不可少的功能。 2 微博中的视频推荐算法原理 关于微博中的视频推荐算法,现在最常用的有3 种,分别是:基于内容的推荐算法、基于协同过滤的推荐算法和基于社交网络的推荐算法。这三种算法通过对用户的发帖内容、转发点赞和搜索等进行一系列的分析和评估,从而筛选出最符合用户喜好的视频并进行推荐。下面就这3 种方法进行详细介绍。 1)基于内容的推荐算法。基于内容的推荐算法是通过搜集用户的个人喜好,来对用户的搜索行为和兴趣进行建模,然后通过计算用户喜好和文本内容的相似度来匹配视频的一种方法。简单点说就是将用户微博内提及的内容进行总结,再联系出现相应关键词的视频文本,进行用户的兴趣视频推荐。关于提取用户文本里的关键词,我们通常用到的算法叫做“TF-IDF”。这种算法能将用户发布的微博中的“关键词”的“特征权重”进行计算分析,来衡量这个关键词在该用户喜好行为中的重要程度。“TF”是根据一个特征词在文本中出现的频率越高就越重要的原理计算的,而“IDF”则是说明一个特征词多次出现在不同文本里,这个词就不具备较强的区分性,就不能代表用户的喜好。两者的结合则高度的证明了一个用户在网络体验中的喜好。这种算法在某种程度上能使用户的兴趣和视频内容出现很大比重的重合。 2)基于协同过滤的推荐算法。协同过滤算法是通过分析该用户在微博上的喜好,同时在广大用户群中筛选出同样喜好的用户,并对这些用户对某一信息的评价进行整合评估,自动形成该用户对于这个关键词喜好程度的预测。比如说一个用户喜欢搜索关于娱乐方面的社会热点新闻,那么微博后台就会将所有这方面的爱好用户汇总,评估出这个用户在所有用户中对这方面的喜爱程度,得出用户对此内容喜爱度在广大网友中的排名,了解你在相应圈子里的位置,并进行相关视频推荐。 3)基于社交网络的推荐算法。这一算法,是基于上面两种算法进行的补充,可以用来解决一个用户特征不明确的问题。它的原理主要是利用微博上一个用户和另外用户的链接关系进行相关特征的预测。具体方法是通过分析这个用户的关注以及粉丝的特征取向,将它们共同的特征进行汇总,反映到这个用户的特征上。好友圈就是一个能很好应用这种算法的场所。两个互相关注的用户一定有着相类似的喜好,因此通过分析好友圈里各个用户的喜好可以更大程度的反应一个用户的喜好。如果说两人近期都搜索过某一综艺节目,那么微博后台自然就会推荐相应的节目花絮给此用户。 3 社交网站中的视频推荐算法短板及优势 随着时代的进步,越来越多的人选择通过微博来获取信息。但这一技术目前还没有发展到一个完善的阶段,微博平台中的视频推荐仍存在以下几点问题: 1)对于该视频搜索量的统计存在疏漏。使用目前微博里面的视频推荐算法来推荐视频,在某种程度上对其商业影响力造成影响。由于许多品牌是会对用户在搜索栏的搜索量进行数据的统计,因此搜索量的好坏可以直接影响到该品牌对于这一视频内容商业上的重视程度。微博热搜榜就是这一原理的良好体现。里面总结了当下时段搜索量最高的一些内容。品牌商官方微博的统计形式和热搜榜实则大同小异。而微博中推荐的视频是无法算作搜索量的,而搜索量对于 本文来源:https://www.wddqw.com/doc/c90b8b2151ea551810a6f524ccbff121dd36c514.html