可以在以下网址找到此应用程序的更新版本
基于内容的推荐系统推荐类似于电影用户喜欢的电影,并分析用户对该电影的评论的观点。
The details of the movies(title, genre, runtime, rating, poster, etc) are fetched using an API by TMDB, https://www.themoviedb.org/documentation/api, and using the IMDB id of the movie in the API, I did web scraping to get the reviews given by the user in the IMDB site using beautifulsoup4 and performed sentiment analysis on those reviews.
链接到YouTube演示:https://www.youtube.com/watch?v=dhveptyecfw
我已经开发了一个类似的应用程序,称为“电影电影院”,该应用程序支持所有语言电影。但是与此应用程序不同的唯一一件事是,我在“电影电影院”中使用了TMDB的推荐引擎。我在此应用程序中开发的建议部分不支持多语言电影,因为它消耗了200%的RAM(即使在Heroku部署到Heroku之后)来生成TMDB中所有700,000多部电影的Count Vectorizer Matrix。
链接到“电影电影院”应用程序:https://tmc.kishanlal.dev/
如果在打字时找不到通过自动探索搜索的电影,则无需担心。只需输入电影的名称,然后按“ Enter”。即使您有一些错别字,它仍然可以正常工作。
源代码:https://github.com/kishan0725/the-movie-cinema

在https://www.themoviedb.org/中创建一个帐户,单击您帐户设置中左侧侧边栏的API链接,并填写所有详细信息以应用API键。如果要求您提供网站URL,则只需提供“ NA”,如果您没有一个网站。批准请求后,您将在API侧边栏中看到API键。
pip install -r requirements.txt安装unignts.txt文件中提到的所有库static/recommend.js文件中替换your_api_key,然后点击保存。python main.py来运行main.pyhttp://127.0.0.1:5000/在地址栏中。
它如何确定哪个项目与用户喜欢的项目最相似?这是相似性分数。
它是一个数值介于零到一个之间的数值范围,有助于确定在零到一个的尺度上彼此相似的两个项目。获得此相似性评分,以测量两个项目的文本细节之间的相似性。因此,相似性得分是两个项目的给定文本详细信息之间相似性的度量。这可以通过余弦相似。
余弦相似性是一种指标,用于测量文档的相似程度如何,无论其大小如何。从数学上讲,它测量了在多维空间中投影的两个向量之间的角度的余弦。余弦相似性是有利的,因为即使两个相似的文档与欧几里得距离相距很远(由于文档的大小),也可能仍然将它们定向更紧密。角度越小,余弦相似性越高。

有关余弦相似性的更多信息:了解余弦相似性背后的数学