A simple resume parser used for extracting information from resumes
สร้างด้วย❤︎และ☕โดย Omkar Pathak
pip install pyresparser # spaCy
python -m spacy download en_core_web_sm
# nltk
python -m nltk.downloader words
python -m nltk.downloader stopwordsเอกสารอย่างเป็นทางการมีอยู่ที่: https://www.omkarpathak.in/pyresparser/
from pyresparser import ResumeParser
data = ResumeParser ( '/path/to/resume/file' ). get_extracted_data () สำหรับการรันเรซูเม่สกัดคุณยังสามารถใช้ cli ที่ให้ไว้
usage: pyresparser [-h] [-f FILE] [-d DIRECTORY] [-r REMOTEFILE]
[-re CUSTOM_REGEX] [-sf SKILLSFILE] [-e EXPORT_FORMAT]
optional arguments:
-h, --help show this help message and exit
-f FILE, --file FILE resume file to be extracted
-d DIRECTORY, --directory DIRECTORY
directory containing all the resumes to be extracted
-r REMOTEFILE, --remotefile REMOTEFILE
remote path for resume file to be extracted
-re CUSTOM_REGEX, --custom-regex CUSTOM_REGEX
custom regex for parsing mobile numbers
-sf SKILLSFILE, --skillsfile SKILLSFILE
custom skills CSV file against which skills are
searched for
-e EXPORT_FORMAT, --export-format EXPORT_FORMAT
the information export format (json)โมดูลจะส่งคืนรายการวัตถุพจนานุกรมด้วยผลลัพธ์ดังนี้:
[
{
'college_name': ['Marathwada Mitra Mandal’s College of Engineering'],
'company_names': None,
'degree': ['B.E. IN COMPUTER ENGINEERING'],
'designation': ['Manager',
'TECHNICAL CONTENT WRITER',
'DATA ENGINEER'],
'email': '[email protected]',
'mobile_number': '8087996634',
'name': 'Omkar Pathak',
'no_of_pages': 3,
'skills': ['Operating systems',
'Linux',
'Github',
'Testing',
'Content',
'Automation',
'Python',
'Css',
'Website',
'Django',
'Opencv',
'Programming',
'C',
...],
'total_experience': 1.83
}
]
แนวคิดหลักบางส่วนที่อยู่เบื้องหลังอัลกอริทึมได้ถูกนำมาจาก https://github.com/divapriya/language_processing ซึ่งได้รับการสรุปไว้ในบล็อกนี้ https://medium.com/@divalicious.priya/information ขอบคุณ Priya สำหรับการแบ่งปันแนวคิดนี้
https://www.kaggle.com/nirant/hitchhiker-s-guide-to-nlp-in-spacy
https://www.analyticsvidhya.com/blog/2017/04/natural-language-processing-made-easy-using-spacy-%E2%80%8bin-python/
ขอขอบคุณเป็นพิเศษ สำหรับ Dataturks สำหรับชุดข้อมูลคำอธิบายประกอบของพวกเขา
หากคุณพบว่าซอฟต์แวร์ของฉันมีประโยชน์กับคุณลองพิจารณาช่วยฉันจ่ายค่าอินเทอร์เน็ตของฉัน สิ่งนี้จะกระตุ้นให้ฉันสร้างซอฟต์แวร์ดังกล่าวมากมายหรือไม่?
| paypal | |
|---|---|
| ₹ (INR) |