电影评分数据
㈠ 电影十分评分有哪些
IMDB最高评分——《肖申克的救赎》——9.3分,《教父》同为9.2分紧随其后。
IMDB——世界上最大的电影数据库——IMDB网站可能是目前互联网上最为权威、系统、全面的电影资料网站,它所特有的电影评分系统深受影迷的欢迎,注册的用户可以给任何一部影片打分并加以评述,而网站又会根据影片所得平均分、选票的数目等计算得出影片的加权平均分并以此进行TOP250(最佳250部影片)和Bottom100(最差100部影片)的排行。 由于影片资料的更新和所得评分的不断变化,TOP250和Bottom100必定是份动态的名单,但大部分出色(或者说是受大众欢迎的)影片的位置会相对不变,于是这份TOP榜单也就有了窥视大众电影口味的意义。 评选最佳250部电影时只考虑正式的投票者的投票结果。分值系统采用10分制,最低为awful(令人厌恶)的1分,最高为excellent(出类拔萃)的10分。值得注意的是,虽然很多影片在资料系统中得分很高,但由于未能达到TOP所要求的最低1250张的投票数而无法参加排行。因此,很多曲高和寡(至少在美国)的优秀影片未能列入其中。 尽管如此,这份名单对选看影片仍具有重要的参考价值。
㈡ 已知某网站用户对电影评分数据(满分5分)。应用KNN算法预测哪位用户适合给小张推荐电影
已知某网站用户对电影评分数据(满分5分)。应用KNN算法预测哪位用户适合给小张推荐电影?
不要把手机关机
㈢ IMDb评分的排名规则是什么
评分方式以《魔戒1:护戒使者》具体分析。图1为魔戒1的所有评分者的分数的一个条状统计图。 图1从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分的。 图下面有两个分值,一个是算术平均值(arithmetic mean),一个是中值(median)。算术平均值大概就是平均数,中值是统计学中的中间数值,该值和比它大及比它小的数值是等差的。而最后我们查到的分数却既不是算术平均值,也不是中值。 IMDB的分数的计算方法应该不是就做一下平均就ok了,在它的网页上也提到了它的计算方法是保密的。不过imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下: weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 其中: R = average for the movie (mean) = (Rating) (是用普通的方法计算出的骄?郑?br>v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释) m = minimum votes required to be listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的) C = the mean vote across the whole report (currently 6.9) (目前所有电影的平均得分) 另外重点来了,根据这个注释: note: for this top 250, only votes from regular voters are considered. 只有'regular voters'的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某种电影的fans拉票而影响top 250结果,把top 250尽量限制在资深影迷投票范围内的主要方法。regular voter的标准不详,估计至少是“投票电影超过xxx部以上”这样的水平,搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不行。 因此,细心的人可以注意到,列入IMDB top 250的电影,其主页面上的分数与250列表中的分数是不同的。以魔戒1为例,它在自己的页面 中的分数是8.8,而列表中是8.7。一般250表中的得分都会低于自己页面中的得分,越是娱乐片差距越大。这大概是因为regular voter对于电影的要求通常较高的关系。) 而IMDB的过人之处不仅仅在于这儿,它除了给出分数,还给了一个更详细的投票人的列表(图2) 这个chart根据年龄、性别、国别等不同的情况,列出了不同的分数chart。而且你点击每个选项,上面(就是图一)都会出现一个不同的chart。这个其实是比较有用的。比如你在要选择动画片的时候,就应该点选一下小于18岁,或者30-44岁这个选项看看他们的评分,因为他们才是这部电影的最大观众群,其他人的分数都是仅供参考的。 碟报员或者我们在选择影片的时候,可以不仅仅看个总得分,多花一点时间,看看影片各个年龄段的得分会更有帮助的。有些影片我们觉得不好看,但是分数很高,你也可以参照一下,“us users”和“non-us users”这部分的数据,如果美国投票用户远远大于海外用户,那说明此片的确是有相当重的美国文化底蕴的,不觉得好看也是正常。相反的,如果我们觉得不错,但是IMDB的分数很低,这也许是老美的评分人数多,打的分低,就把总分给拉下来了。 从魔戒1的得分截图可以发现这部影片的确是各个年龄阶段都很喜欢,分数都打的很高的。 编辑本段250强影片250佳片是IMDb很受欢迎的特色,里面列出了注册用户投票选出的有史以来最佳250部电影。只有供影院播出的影片可以参加评选,而短片,纪录片,连续短剧和电视电影不在其列。用户在从"1"(最低)到"10"(最高)的范围内对影片评分。得分经过数学公式(登在列表末尾)的过滤而生成最后的评定。为了保护结果不受恶意投票的影响,数据库使用了数据过滤机制以及最小投票数量限制(目前为1250票),以得到“真实的贝叶斯概率结果”。并且,只有“经常投票的用户”的投票被记入结果,为保护公平性,成为该类用户的条件是保密的。 该榜因其综合广泛性以及不时的令人吃惊而受到瞩目。上榜的电影中有老电影比如大都会(Metropolis,1927年),也有新电影如盗梦空间(Inception,2010年)。有流行影片比如得到超过32万次投票的魔戒首部曲:魔戒现身(The Fellowship of the Ring,2001年),也有少有人问津的影片如不到1万张投票的小私家侦探(Sherlock Jr. 1924年)。排行榜包括了各种不同类型的电影如黑色影片双重保险(Double Indemnity,1944年);科幻片银翼杀手(Blade Runner,1983年);音乐片雨中曲(Singin' in the Rain,1952年);西部片黄金三镖客(Il buono, il brutto, il cattivo. 1966年);动画片机器人总动员(WALL·E,2008年)等等。榜上还有一些影片是本身并未大受好评但却在专注的影迷群体中有广泛的追随者的比如死亡幻觉(Donnie Darko,2001年)。迄今为止肖申克的救赎(台湾译名为"刺激1995")、教父、教父2为排名前三的电影,也是榜上仅有的评分超过9.0的影片。 这些条件是否能提供一个公正没有偏见的排行榜是有争议的。比如,新近上映的影片总是容易从一见钟情的影迷那里得到较高的评分,而这与成功影片应该经得起反复观赏的观念是不相符的。因此,有时新上映的影片冲进250最佳影片榜,甚至前100名,但随着更多观众的评分和重复观看后的评分而退出榜外的情景就十分常见了。另外一种对该榜的主要批评则是它反映的只是影片的受欢迎程度,并不体现对影片历史和艺术的客观知识。但实际上,在评论家年度评选和历史影片评选中名列前茅的影片通常在最佳250部影片中通常也都排名很高,让人不禁怀疑影评人与观众的观点是否真有那么不同。
㈣ 平台数据对比一下豆瓣评分真的能影响电影票房吗
当然!
1、很多人看电影的时候,如果对电影不了解,总是先关注一下豆瓣评内分,如果豆瓣评分5分以下容,肯定是垃圾片!
如果7分以上,肯定是好片!
2、这就是豆瓣评分影响票房的方法,除非影片本身是系列片。例如生化危机系列。速度与激情系列等。否则很多人都是先看评分再买票的!
㈤ 优酷 上的电影评分是根据什么来的观众也能打分吗
优酷视频采用的是站内评分和站外引用并行的双评分系统,站内是由优酷评分而专非用户,站外则引属用豆瓣数据,观众不能打分。和腾讯视频一样,由于优酷引用的豆瓣数据——评分和影评——仅被放置于视频播放页,不影响影片排序,也非用户观看行为的“触发器”。
优酷是由古永锵于2006年6月21日创立并正式上线。优酷现为阿里巴巴文化娱乐集团大优酷事业群下的视频平台。
(5)电影评分数据扩展阅读:
通常,影片评分的数据来源无外乎两种,一种站内评分,一种站外引用。站内不消说,站外可引用一些电影资料库,常见的有IMDb,烂蕃茄,国内如豆瓣电影,时光网等也相对比较权威。
国内的主流视频门户,早期多采用前者,顶踩挖埋及用户成长体系,也都是围绕站内机制来筛选优质内容。而站外引用评分数据,目的当然也是筛选优质内容,优化用户选片体验。
主流视频门户的影片评分功能,排名不分先后:
1、腾讯视频:站内(腾讯)评分,同时引用豆瓣数据;
2、搜狐视频:站内(用户)评分,同时引用IMDb数据;
3、优酷视频:站内(优酷)评分,同时引用豆瓣数据;
4、乐视网:站内(用户)评分;
5、爱奇艺,站内(用户)评分。
㈥ 什么软件上电影评分比较真实
《少年派的奇幻漂流》、《人再囧途之泰囧》、《十二生肖》、《分手合约》、专《致我属们终将失去的青春》、《中国合伙人》、《天机-富春山居图》、《小时代》、《天台爱情》、《校花诡异事件》、《笔仙2》、《早见晚爱》、《环太平洋》、《赤警威龙》、《功夫侠》!选自己喜欢的看!一起分享!
㈦ 用SQL查询 每个人评分最高的TOP10部电影,以及评分
select uid,movie,rate from table where uid=1 order by rate desc limit 10;
㈧ 如何用聚类取把电影评分数据集分类
聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重回要的人类行为。
聚类分析的目标就是在相似的基础上收集数据来分类。聚答类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
㈨ 豆瓣电影多少分算高分多少分以上值得去看
个人感觉6.5分及格,6.5以下就没有什么看的价值了。7.5分以上一般都不错了。8.5以上评价人数上千的一般都是好片值得看,因为有些冷门佳片评价人数不多的话也不是非常有参考性。豆瓣评分不是权威但能作参考喜好还是看个人。