pyresparser Download - pyresparser Source Code Download

pyresparser

Autre code source

v1.0.6

Télécharger

pyrespathser

 A simple resume parser used for extracting information from resumes

Construit avec ❤︎ et ☕ par Omkar Pathak

Caractéristiques

Nom d'extraction
Extraire un e-mail
Extraire les numéros mobiles
Extraire les compétences
Extraire l'expérience totale
Extraire le nom du collège
Extrait de diplôme
Extrait de désignation
Extraire les noms de l'entreprise

Installation

Vous pouvez installer ce package en utilisant

pip install pyresparser

Pour les opérations NLP, nous utilisons Spacy et NLTK. Installez-les en utilisant les commandes ci-dessous:

 # spaCy
python -m spacy download en_core_web_sm

# nltk
python -m nltk.downloader words
python -m nltk.downloader stopwords

Documentation

La documentation officielle est disponible sur: https://www.omkarpathak.in/pyresparser/

Formats de fichiers pris en charge

Les fichiers PDF et DOCX sont pris en charge sur tous les systèmes d'exploitation
Si vous souhaitez extraire des fichiers DOC, vous pouvez installer Textract pour votre système d'exploitation (Linux, macOS)
Remarque: il vous suffit d'installer textract (et rien d'autre) et les fichiers DOC seront analysés facilement

Usage

Importez-le dans votre projet Python

 from pyresparser import ResumeParser
data = ResumeParser ( '/path/to/resume/file' ). get_extracted_data ()

CLI

Pour exécuter l'extracteur de CV, vous pouvez également utiliser la cli fournie

usage: pyresparser [-h] [-f FILE] [-d DIRECTORY] [-r REMOTEFILE]
                   [-re CUSTOM_REGEX] [-sf SKILLSFILE] [-e EXPORT_FORMAT]

optional arguments:
  -h, --help            show this help message and exit
  -f FILE, --file FILE  resume file to be extracted
  -d DIRECTORY, --directory DIRECTORY
                        directory containing all the resumes to be extracted
  -r REMOTEFILE, --remotefile REMOTEFILE
                        remote path for resume file to be extracted
  -re CUSTOM_REGEX, --custom-regex CUSTOM_REGEX
                        custom regex for parsing mobile numbers
  -sf SKILLSFILE, --skillsfile SKILLSFILE
                        custom skills CSV file against which skills are
                        searched for
  -e EXPORT_FORMAT, --export-format EXPORT_FORMAT
                        the information export format (json)

Notes:

Si vous exécutez l'application sous Windows, vous ne pouvez extraire que des fichiers .docs et .pdf

Résultat

Le module renverrait une liste d'objets de dictionnaire avec le résultat comme suit:

 [
  {
    'college_name': ['Marathwada Mitra Mandal’s College of Engineering'],
    'company_names': None,
    'degree': ['B.E. IN COMPUTER ENGINEERING'],
    'designation': ['Manager',
                    'TECHNICAL CONTENT WRITER',
                    'DATA ENGINEER'],
    'email': '[email protected]',
    'mobile_number': '8087996634',
    'name': 'Omkar Pathak',
    'no_of_pages': 3,
    'skills': ['Operating systems',
              'Linux',
              'Github',
              'Testing',
              'Content',
              'Automation',
              'Python',
              'Css',
              'Website',
              'Django',
              'Opencv',
              'Programming',
              'C',
              ...],
    'total_experience': 1.83
  }
]

Références qui m'ont aidé à arriver ici

Certains des concepts de base derrière l'algorithme ont été tirés de https://github.com/divapriya/language_processing qui a été résumé dans ce blog https://medium.com/@divalecious.priya/information-extraction-from-cv-acec216c3f48. Merci à Priya d'avoir partagé ce concept
https://www.kaggle.com/nirant/hitchhiker-s-guide-to-nlp-in-spacy
https://www.analyticsvidhya.com/blog/2017/04/natural-language-processing-made-easy-using-spacy-%e2%80%8bin-python/
Un merci spécial à Dataurks pour leur ensemble de données annoté

Donation

Si vous avez trouvé que mes logiciels vous sont utiles, envisagez de m'aider à payer mes factures Internet. Cela m'encouragerait à créer de nombreux logiciels de ce type?

Paypal
₹ (INR)

Stargazer au fil du temps

Développer

Informations supplémentaires

Version v1.0.6
Type Autre code source
Date de mise à jour 2025-04-15
taille 5.16MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout