Alat yang dapat menemukan dokumen apa pun menggunakan pencarian semantik .
Ini adalah versi improvisasi dari pencari-dokumen cerdas
Daftar fitur baru--
Seberapa mudah Anda merasa mengingat lokasi yang tepat dari dokumen yang Anda buat tahun lalu? Tidak terlalu mudah, bukan? Organisasi besar/orang berurusan dengan ratusan dokumen setiap hari dan melupakannya, sebagian besar waktu.
Tetapi bagaimana jika kami menginginkan dokumentasi lama itu lagi untuk beberapa pekerjaan, tetapi sayangnya Anda tidak ingat nama atau konten aktual dari dokumen itu untuk mengambilnya dari penyimpanan besar komputer Anda.
Dalam kasus seperti itu, penggunaan pencari dokumen yang cerdas dapat benar -benar membuat perbedaan besar. As, dapat mencari dokumen ( semantically ) dari kebutuhan Anda berdasarkan input kueri. Ini tidak hanya akan membantu dalam akses yang lebih cepat ke dokumen, tetapi juga akan membantu dalam mengelompokkan dokumen serupa bersama -sama dan dalam menganalisisnya.
Tonton Demo Proyek:
Saat ini repositri ini menggunakan database artikel berita yang telah ditentukan sebelumnya yang dikumpulkan oleh pengikisan web. Karena pembatasan GitHub untuk mengunggah file besar, kami tidak dapat mengunggahnya di sini.
Segera, kami akan menambahkan dukungan dari database dinamis, sehingga Anda dapat menggunakan alat ini untuk database Anda sendiri untuk membangun mesin pencari khusus Anda sendiri.
Python3.6 JavaScript jQuery HTML & CSS

> mkdir IntelligentDocumentFinder
> cd IntelligentDocumentFinder
> git clone https://github.com/Sarthakjain1206/Intelligent_Document_Finder_2.0.git
Pasang lingkungan vital jika tidak terpasang
> python3 -m pip install --user virtualenv> py -m pip install --user virtualenvMenciptakan lingkungan virtual
> python3 -m venv env> py -m venv envAktifkan Lingkungan:
> source env/bin/activate> .envScriptsactivate > pip install -r requirements.txt
Unduh Embeddings Word Sarung Tangan Dari Tautan Ini, Decompress IT dan Salin File glove.6B.100d di Folder DataBase
Kemudian, jalankan initial_file.py melalui perintah ini > python initial_file.py
Sekarang Anda baik untuk pergi .. cukup ketik perintah ini setiap kali Anda ingin mengaksesnya, dan buka situs web di Chrome/Firefox
> python src/app.py
Anda dapat menghubungi kami di Profil Linkedln
Sarthak Jain Machine Learning NLP Web Crawling
Anda juga dapat mengikuti saya di GitHub untuk tetap diperbarui tentang proyek terbaru saya
Pengembang web rishabh mishra Full Stack Web Developer
Anda juga dapat mengikuti saya di GitHub untuk tetap diperbarui tentang proyek terbaru saya
Jika Anda menyukai repositori ini, maka dukung dengan memberikannya bintang
Ada banyak fitur yang dapat ditambahkan ke alat ini.
Jika Anda memiliki pengalaman dalam mengimplementasikan salah satu fitur ini maka, do contribue .
Artikel Awsome dari Algoritma Peringkat BM25 di Wikipedia - Okapi BM25
Baca artikel ini tentang pemodelan topik
Benar -benar mengikuti artikel indah ini tentang penandaan SVOS untuk menghasilkan tag untuk proyek ini.
Menggunakan implementasi peringkat peringkat BM25 dari gudang hebat ini di GitHub oleh dorianbrown .