可以在以下網址找到此應用程序的更新版本
基於內容的推薦系統推薦類似於電影用戶喜歡的電影,並分析用戶對該電影的評論的觀點。
The details of the movies(title, genre, runtime, rating, poster, etc) are fetched using an API by TMDB, https://www.themoviedb.org/documentation/api, and using the IMDB id of the movie in the API, I did web scraping to get the reviews given by the user in the IMDB site using beautifulsoup4 and performed sentiment analysis on those reviews.
鏈接到YouTube演示:https://www.youtube.com/watch?v=dhveptyecfw
我已經開發了一個類似的應用程序,稱為“電影電影院”,該應用程序支持所有語言電影。但是與此應用程序不同的唯一一件事是,我在“電影電影院”中使用了TMDB的推薦引擎。我在此應用程序中開發的建議部分不支持多語言電影,因為它消耗了200%的RAM(即使在Heroku部署到Heroku之後)來生成TMDB中所有700,000多部電影的Count Vectorizer Matrix。
鏈接到“電影電影院”應用程序:https://tmc.kishanlal.dev/
如果在打字時找不到通過自動探索搜索的電影,則無需擔心。只需輸入電影的名稱,然後按“ Enter”。即使您有一些錯別字,它仍然可以正常工作。
源代碼:https://github.com/kishan0725/the-movie-cinema

在https://www.themoviedb.org/中創建一個帳戶,單擊您帳戶設置中左側側邊欄的API鏈接,並填寫所有詳細信息以應用API鍵。如果要求您提供網站URL,則只需提供“ NA”,如果您沒有一個網站。批准請求後,您將在API側邊欄中看到API鍵。
pip install -r requirements.txt安裝unignts.txt文件中提到的所有庫static/recommend.js文件中替換your_api_key,然後點擊保存。python main.py來運行main.pyhttp://127.0.0.1:5000/在地址欄中。
它如何確定哪個項目與用戶喜歡的項目最相似?這是相似性分數。
它是一個數值介於零到一個之間的數值範圍,有助於確定在零到一個的尺度上彼此相似的兩個項目。獲得此相似性評分,以測量兩個項目的文本細節之間的相似性。因此,相似性得分是兩個項目的給定文本詳細信息之間相似性的度量。這可以通過餘弦相似。
餘弦相似性是一種指標,用於測量文檔的相似程度如何,無論其大小如何。從數學上講,它測量了在多維空間中投影的兩個向量之間的角度的餘弦。餘弦相似性是有利的,因為即使兩個相似的文檔與歐幾里得距離相距很遠(由於文檔的大小),也可能仍然將它們定向更緊密。角度越小,餘弦相似性越高。

有關餘弦相似性的更多信息:了解餘弦相似性背後的數學