이 응용 프로그램의 업데이트 된 버전은 https://github.com/kishan0725/the-movie-cinema에서 찾을 수 있습니다.
컨텐츠 기반 추천 시스템은 영화 사용자가 좋아하는 영화와 유사한 영화를 추천하고 해당 영화에 대한 사용자가 제공 한 리뷰에 대한 감정을 분석합니다.
영화 (제목, 장르, 런타임, 등급, 포스터 등)의 세부 사항은 TMDB, https://www.themoviedb.org/documentation/api에 의해 API를 사용하여 가져오고 API에서 영화의 IMDB ID를 사용하여 beautifulsoup4 Site에서 사용자가 제공 한 IMDB 사이트에서 리뷰를 수행하여 웹 스크래핑을 수행했습니다.
YouTube 데모 링크 : https://www.youtube.com/watch?v=dhveptyecfw
나는 모든 언어 영화를 지원하는 "The Movie Cinema"라는 비슷한 응용 프로그램을 개발했습니다. 그러나이 응용 프로그램과 다른 유일한 것은 "영화 영화"에서 TMDB의 추천 엔진을 사용했다는 것입니다. 이 애플리케이션에서 ME가 개발 한 권장 부분은 TMDB의 70 만 개 이상의 영화에 대해 Count Vectorizer Matrix를 생성하기 위해 RAM의 200% (Heroku에 배포 된 후에도)를 소비하기 때문에 다중 언어 영화를 지원하지 않습니다.
"영화 영화"응용 프로그램에 대한 링크 : https://tmc.kishanlal.dev/
입력하는 동안 자동 검색을 통해 검색하는 영화를 찾을 수 없다면 걱정할 필요가 없습니다. 영화의 이름을 입력하고 "Enter"를 누릅니다. 오타를 만들더라도 여전히 잘 작동해야합니다.
소스 코드 : https://github.com/kishan0725/the-movie-cinema

https://www.themoviedb.org/에서 계정을 만들고 계정 설정의 왼쪽 사이드바에서 API 링크를 클릭하고 모든 세부 정보를 작성하여 API 키를 적용하십시오. 웹 사이트 URL을 요청 받으면 "NA"를 제공하지 않으면 "NA"를 제공하십시오. 요청이 승인되면 API 사이드 바에 API 키가 표시됩니다.
pip install -r requirements.txt 사용하여 요구 사항.txt 파일에 언급 된 모든 라이브러리를 설치하십시오.static/recommend.js 파일의 두 장소 (15 및 29 라인)에서 your_api_key를 교체하고 저장을 누르십시오.python main.py 명령을 실행하여 main.py 파일을 실행하십시오.http://127.0.0.1:5000/ 입력하십시오.
사용자가 좋아하는 항목과 가장 유사한 항목을 어떻게 결정합니까? 여기 유사성 점수가 온다.
0에서 1 사이의 숫자 값 범위로, 두 항목이 0에서 1의 척도에서 서로 얼마나 유사한지를 결정하는 데 도움이됩니다. 이 유사성 점수는 두 항목의 텍스트 세부 사항 사이의 유사성을 측정하여 얻습니다. 따라서 유사성 점수는 두 항목의 주어진 텍스트 세부 사항 사이의 유사성 측정입니다. 이것은 코사인-유사성으로 수행 될 수 있습니다.
코사인 유사성은 문서가 크기에 관계없이 얼마나 유사한지를 측정하는 데 사용되는 메트릭입니다. 수학적으로, 다차원 공간에 투사 된 두 벡터 사이의 각도의 코사인을 측정합니다. 두 개의 유사한 문서가 유클리드 거리 (문서의 크기로 인해)에 의해 멀리 떨어져 있더라도 여전히 더 가깝게 지향 될 수 있기 때문에 코사인 유사성은 유리합니다. 각도가 작을수록 코사인 유사성이 높아집니다.

코사인 유사성에 대한 추가 정보 : 코사인 유사성의 수학 이해