
Kitabe ( Buch in Hindi ) ist ein Buchempfehlungssystem für alle Buchliebhaber. Bewerten Sie einfach einige Bücher und erhalten Sie sofortige Empfehlungen, die für Sie zugeschnitten sind?
Siehe Demo?
Zum Beitrag? und hier den Kopf einrichten.

Live -Anwendung
Unser Ziel ist es, eine Bewerbung für alle Buchliebhaber zu erstellen . zu lesen .
Der Datensatz, den wir für diese Aufgabe verwendet haben, ist der Goodbooks-10K-Datensatz. Es besteht aus 10 K -Büchern mit insgesamt 6 Millionen Bewertungen. Das ist riesig! ?. Es gibt einige größere Datensätze wie Buchkreuzungen, aber sie sind irgendwie alt?
Datensatzstruktur
GoodBooks10k
├── books.csv # Contains book info with book-id
├── ratings.csv # Maps user-id to book-id and rating
├── book_tags.csv # Contains tag-id associated with book-ids
├── tags.csv # Contains tag-name associated with tag-id
├── to_read.csv # Contains book-ids marked as to-read by user
Da dies ein Empfehlungsproblem ist, müssen wir sicherstellen, dass die books.csv so sauber wie möglich ist und nur die Bewertungen betrachten, deren Buch-ID vorhanden ist, gilt das Gleiche für umgekehrt.
Mehr Reinigung für books.csv
Bei Empfehlungsproblemen gibt es mehrere Ansätze, die möglich sind:
Wir experimentierten mit mehreren Methoden und entschieden uns für die Einbettungsmatrix und Termfrequenz.
Einbettungsmatrix - Diese Methode wird oft als Funksvd bezeichnet, die den Netflix -Preis im Jahr 2004 gewonnen hat. Da es sich um einen fachbasierten Funktionsminimierungsansatz handelt, nennen wir ihn gerne als Einbettungsmatrix. Das nennen SVD verwirrt es mit dem in linearen Algebra. Diese Einbettungsmatrix konstruiert einen Vektor für jeden Benutzer und jedes Buch, sodass wir die Bewertung erhalten, wenn das Produkt mit zusätzlichen Einschränkungen angewendet wird. Weitere aufwändige Informationen zu Funksvd finden Sie in diesem Bereich. Wir haben das Buch eingebettet, um die Bücher darzustellen, um die zugrunde liegenden Muster zu schließen. Dies führte dazu, dass die Einbettung in der Lage war, Bücher von denselben Autoren zu erkennen und auch Genres wie Fiktion, Autobiographie und mehr zu schließen.
Begriffsfrequenz - Diese Methode ist wie eine Helferfunktion, die oben schenkt, wo ein Einbettung fehlschlägt. Die Begriffsfrequenz berücksichtigt die Token in einem Buchtitel, sei es der Buchtitel selbst, der Name der Autoren und auch die Bewertung. In Anbetracht der Berücksichtigung von Büchern, die eng mit den Token im Nennbuch übereinstimmen.
? Der Code für jeden Schritt finden Sie im Abschnitt Notebooks und Dateien.
Das Bild sagt alles.

Kitabe
│
├───BookRecSystem # Main Project Directory
│
├───mainapp # Project Main App Directory
│ │
│ └───migrations # Migrations
│
├───static
| | # Static Directory
│ └───mainapp
│ ├───css # CSS Files
| |
│ ├───dataset # Dataset Files
│ │
│ ├───gif # GIF Media
│ │
│ ├───model_files # Model Files
| | |
│ │ ├───surprise # FunkSVD Files
│ │ │
│ │ └───cv # CV Files
│ │
│ └───png # PNG Media FIles
|
└───templates # Root Template DIrectory
|
├───account # Account App Templates
│
└───mainapp # Project Main App Templates
MIT License
Copyright (c) 2020 Praful Mohanan & Prajakta Mane
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in all
copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
SOFTWARE.