電影評分數據
㈠ 電影十分評分有哪些
IMDB最高評分——《肖申克的救贖》——9.3分,《教父》同為9.2分緊隨其後。
IMDB——世界上最大的電影資料庫——IMDB網站可能是目前互聯網上最為權威、系統、全面的電影資料網站,它所特有的電影評分系統深受影迷的歡迎,注冊的用戶可以給任何一部影片打分並加以評述,而網站又會根據影片所得平均分、選票的數目等計算得出影片的加權平均分並以此進行TOP250(最佳250部影片)和Bottom100(最差100部影片)的排行。 由於影片資料的更新和所得評分的不斷變化,TOP250和Bottom100必定是份動態的名單,但大部分出色(或者說是受大眾歡迎的)影片的位置會相對不變,於是這份TOP榜單也就有了窺視大眾電影口味的意義。 評選最佳250部電影時只考慮正式的投票者的投票結果。分值系統採用10分制,最低為awful(令人厭惡)的1分,最高為excellent(出類拔萃)的10分。值得注意的是,雖然很多影片在資料系統中得分很高,但由於未能達到TOP所要求的最低1250張的投票數而無法參加排行。因此,很多曲高和寡(至少在美國)的優秀影片未能列入其中。 盡管如此,這份名單對選看影片仍具有重要的參考價值。
㈡ 已知某網站用戶對電影評分數據(滿分5分)。應用KNN演算法預測哪位用戶適合給小張推薦電影
已知某網站用戶對電影評分數據(滿分5分)。應用KNN演算法預測哪位用戶適合給小張推薦電影?
不要把手機關機
㈢ IMDb評分的排名規則是什麼
評分方式以《魔戒1:護戒使者》具體分析。圖1為魔戒1的所有評分者的分數的一個條狀統計圖。 圖1從中我們可以看到各個分數段的大致比例,比如這兒就可以發現,超過一半的人是打滿分的。 圖下面有兩個分值,一個是算術平均值(arithmetic mean),一個是中值(median)。算術平均值大概就是平均數,中值是統計學中的中間數值,該值和比它大及比它小的數值是等差的。而最後我們查到的分數卻既不是算術平均值,也不是中值。 IMDB的分數的計算方法應該不是就做一下平均就ok了,在它的網頁上也提到了它的計算方法是保密的。不過imdb top 250用的是貝葉斯統計的演算法得出的加權分(Weighted Rank-WR),公式如下: weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 其中: R = average for the movie (mean) = (Rating) (是用普通的方法計算出的驕?鄭?br>v = number of votes for the movie = (votes) (投票人數,需要注意的是,只有經常投票者才會被計算在內,這個下面詳細解釋) m = minimum votes required to be listed in the top 250 (currently 1250) (進入imdb top 250需要的最小票數,只有三兩個人投票的電影就算得滿分也沒用的) C = the mean vote across the whole report (currently 6.9) (目前所有電影的平均得分) 另外重點來了,根據這個注釋: note: for this top 250, only votes from regular voters are considered. 只有'regular voters'的投票才會被計算在IMDB top 250之內,這就是IMDB防禦因為某種電影的fans拉票而影響top 250結果,把top 250盡量限制在資深影迷投票范圍內的主要方法。regular voter的標准不詳,估計至少是「投票電影超過xxx部以上」這樣的水平,搞不好還會加上投票的時間分布,為支持自己的心愛電影一天內給N百部電影投票估計也不行。 因此,細心的人可以注意到,列入IMDB top 250的電影,其主頁面上的分數與250列表中的分數是不同的。以魔戒1為例,它在自己的頁面 中的分數是8.8,而列表中是8.7。一般250表中的得分都會低於自己頁面中的得分,越是娛樂片差距越大。這大概是因為regular voter對於電影的要求通常較高的關系。) 而IMDB的過人之處不僅僅在於這兒,它除了給出分數,還給了一個更詳細的投票人的列表(圖2) 這個chart根據年齡、性別、國別等不同的情況,列出了不同的分數chart。而且你點擊每個選項,上面(就是圖一)都會出現一個不同的chart。這個其實是比較有用的。比如你在要選擇動畫片的時候,就應該點選一下小於18歲,或者30-44歲這個選項看看他們的評分,因為他們才是這部電影的最大觀眾群,其他人的分數都是僅供參考的。 碟報員或者我們在選擇影片的時候,可以不僅僅看個總得分,多花一點時間,看看影片各個年齡段的得分會更有幫助的。有些影片我們覺得不好看,但是分數很高,你也可以參照一下,「us users」和「non-us users」這部分的數據,如果美國投票用戶遠遠大於海外用戶,那說明此片的確是有相當重的美國文化底蘊的,不覺得好看也是正常。相反的,如果我們覺得不錯,但是IMDB的分數很低,這也許是老美的評分人數多,打的分低,就把總分給拉下來了。 從魔戒1的得分截圖可以發現這部影片的確是各個年齡階段都很喜歡,分數都打的很高的。 編輯本段250強影片250佳片是IMDb很受歡迎的特色,裡面列出了注冊用戶投票選出的有史以來最佳250部電影。只有供影院播出的影片可以參加評選,而短片,紀錄片,連續短劇和電視電影不在其列。用戶在從"1"(最低)到"10"(最高)的范圍內對影片評分。得分經過數學公式(登在列表末尾)的過濾而生成最後的評定。為了保護結果不受惡意投票的影響,資料庫使用了數據過濾機制以及最小投票數量限制(目前為1250票),以得到「真實的貝葉斯概率結果」。並且,只有「經常投票的用戶」的投票被記入結果,為保護公平性,成為該類用戶的條件是保密的。 該榜因其綜合廣泛性以及不時的令人吃驚而受到矚目。上榜的電影中有老電影比如大都會(Metropolis,1927年),也有新電影如盜夢空間(Inception,2010年)。有流行影片比如得到超過32萬次投票的魔戒首部曲:魔戒現身(The Fellowship of the Ring,2001年),也有少有人問津的影片如不到1萬張投票的小私家偵探(Sherlock Jr. 1924年)。排行榜包括了各種不同類型的電影如黑色影片雙重保險(Double Indemnity,1944年);科幻片銀翼殺手(Blade Runner,1983年);音樂片雨中曲(Singin' in the Rain,1952年);西部片黃金三鏢客(Il buono, il brutto, il cattivo. 1966年);動畫片機器人總動員(WALL·E,2008年)等等。榜上還有一些影片是本身並未大受好評但卻在專注的影迷群體中有廣泛的追隨者的比如死亡幻覺(Donnie Darko,2001年)。迄今為止肖申克的救贖(台灣譯名為"刺激1995")、教父、教父2為排名前三的電影,也是榜上僅有的評分超過9.0的影片。 這些條件是否能提供一個公正沒有偏見的排行榜是有爭議的。比如,新近上映的影片總是容易從一見鍾情的影迷那裡得到較高的評分,而這與成功影片應該經得起反復觀賞的觀念是不相符的。因此,有時新上映的影片沖進250最佳影片榜,甚至前100名,但隨著更多觀眾的評分和重復觀看後的評分而退出榜外的情景就十分常見了。另外一種對該榜的主要批評則是它反映的只是影片的受歡迎程度,並不體現對影片歷史和藝術的客觀知識。但實際上,在評論家年度評選和歷史影片評選中名列前茅的影片通常在最佳250部影片中通常也都排名很高,讓人不禁懷疑影評人與觀眾的觀點是否真有那麼不同。
㈣ 平台數據對比一下豆瓣評分真的能影響電影票房嗎
當然!
1、很多人看電影的時候,如果對電影不了解,總是先關注一下豆瓣評內分,如果豆瓣評分5分以下容,肯定是垃圾片!
如果7分以上,肯定是好片!
2、這就是豆瓣評分影響票房的方法,除非影片本身是系列片。例如生化危機系列。速度與激情系列等。否則很多人都是先看評分再買票的!
㈤ 優酷 上的電影評分是根據什麼來的觀眾也能打分嗎
優酷視頻採用的是站內評分和站外引用並行的雙評分系統,站內是由優酷評分而專非用戶,站外則引屬用豆瓣數據,觀眾不能打分。和騰訊視頻一樣,由於優酷引用的豆瓣數據——評分和影評——僅被放置於視頻播放頁,不影響影片排序,也非用戶觀看行為的「觸發器」。
優酷是由古永鏘於2006年6月21日創立並正式上線。優酷現為阿里巴巴文化娛樂集團大優酷事業群下的視頻平台。
(5)電影評分數據擴展閱讀:
通常,影片評分的數據來源無外乎兩種,一種站內評分,一種站外引用。站內不消說,站外可引用一些電影資料庫,常見的有IMDb,爛蕃茄,國內如豆瓣電影,時光網等也相對比較權威。
國內的主流視頻門戶,早期多採用前者,頂踩挖埋及用戶成長體系,也都是圍繞站內機制來篩選優質內容。而站外引用評分數據,目的當然也是篩選優質內容,優化用戶選片體驗。
主流視頻門戶的影片評分功能,排名不分先後:
1、騰訊視頻:站內(騰訊)評分,同時引用豆瓣數據;
2、搜狐視頻:站內(用戶)評分,同時引用IMDb數據;
3、優酷視頻:站內(優酷)評分,同時引用豆瓣數據;
4、樂視網:站內(用戶)評分;
5、愛奇藝,站內(用戶)評分。
㈥ 什麼軟體上電影評分比較真實
《少年派的奇幻漂流》、《人再囧途之泰囧》、《十二生肖》、《分手合約》、專《致我屬們終將失去的青春》、《中國合夥人》、《天機-富春山居圖》、《小時代》、《天台愛情》、《校花詭異事件》、《筆仙2》、《早見晚愛》、《環太平洋》、《赤警威龍》、《功夫俠》!選自己喜歡的看!一起分享!
㈦ 用SQL查詢 每個人評分最高的TOP10部電影,以及評分
select uid,movie,rate from table where uid=1 order by rate desc limit 10;
㈧ 如何用聚類取把電影評分數據集分類
聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。它是一種重回要的人類行為。
聚類分析的目標就是在相似的基礎上收集數據來分類。聚答類源於很多領域,包括數學,計算機科學,統計學,生物學和經濟學。在不同的應用領域,很多聚類技術都得到了發展,這些技術方法被用作描述數據,衡量不同數據源間的相似性,以及把數據源分類到不同的簇中。
㈨ 豆瓣電影多少分算高分多少分以上值得去看
個人感覺6.5分及格,6.5以下就沒有什麼看的價值了。7.5分以上一般都不錯了。8.5以上評價人數上千的一般都是好片值得看,因為有些冷門佳片評價人數不多的話也不是非常有參考性。豆瓣評分不是權威但能作參考喜好還是看個人。