pyresparser скачать - скачать исходный код pyresparser

pyresparser

Другой исходный код

v1.0.6

Скачать

ПИРЕСПАРСЕР

 A simple resume parser used for extracting information from resumes

Построен с ❤︎ и ☕ Omkar Pathak

Функции

Извлечь имя
Извлечь электронное письмо
Извлеките мобильные номера
Извлекать навыки
Извлекать общий опыт
Извлечь имя колледжа
Степень экстракта
Обозначение экстракта
Извлечение названий компании

Установка

Вы можете установить этот пакет, используя

pip install pyresparser

Для операций NLP мы используем Spacy и NLTK. Установите их с помощью команд ниже:

 # spaCy
python -m spacy download en_core_web_sm

# nltk
python -m nltk.downloader words
python -m nltk.downloader stopwords

Документация

Официальная документация доступна по адресу: https://www.omkarpathak.in/pyresparser/

Поддерживаемые форматы файлов

Файлы PDF и DOCX поддерживаются во всех операционных системах
Если вы хотите извлечь файлы DOC, вы можете установить Textract для своей ОС (Linux, MacOS)
Примечание: вам просто нужно установить textract (и ничего другого), а файлы DOC будут легко проанализированы

Использование

Импортируйте его в свой проект Python

 from pyresparser import ResumeParser
data = ResumeParser ( '/path/to/resume/file' ). get_extracted_data ()

Кли

Для запуска экстрактора резюме вы также можете использовать предоставленную cli

usage: pyresparser [-h] [-f FILE] [-d DIRECTORY] [-r REMOTEFILE]
                   [-re CUSTOM_REGEX] [-sf SKILLSFILE] [-e EXPORT_FORMAT]

optional arguments:
  -h, --help            show this help message and exit
  -f FILE, --file FILE  resume file to be extracted
  -d DIRECTORY, --directory DIRECTORY
                        directory containing all the resumes to be extracted
  -r REMOTEFILE, --remotefile REMOTEFILE
                        remote path for resume file to be extracted
  -re CUSTOM_REGEX, --custom-regex CUSTOM_REGEX
                        custom regex for parsing mobile numbers
  -sf SKILLSFILE, --skillsfile SKILLSFILE
                        custom skills CSV file against which skills are
                        searched for
  -e EXPORT_FORMAT, --export-format EXPORT_FORMAT
                        the information export format (json)

Примечания:

Если вы запускаете приложение в Windows, то вы можете только извлечь файлы .docs и .pdf

Результат

Модуль вернет список словарных объектов с результатом следующим образом:

 [
  {
    'college_name': ['Marathwada Mitra Mandal’s College of Engineering'],
    'company_names': None,
    'degree': ['B.E. IN COMPUTER ENGINEERING'],
    'designation': ['Manager',
                    'TECHNICAL CONTENT WRITER',
                    'DATA ENGINEER'],
    'email': '[email protected]',
    'mobile_number': '8087996634',
    'name': 'Omkar Pathak',
    'no_of_pages': 3,
    'skills': ['Operating systems',
              'Linux',
              'Github',
              'Testing',
              'Content',
              'Automation',
              'Python',
              'Css',
              'Website',
              'Django',
              'Opencv',
              'Programming',
              'C',
              ...],
    'total_experience': 1.83
  }
]

Ссылки, которые помогли мне попасть сюда

Некоторые из основных концепций, лежащих в основе алгоритма, были взяты с https://github.com/divapriya/language_processing, который был обобщен в этом блоге https://medium.com/@divalicious.priya/information-extraction-from-cv-acec216c3f48. Спасибо Priya за то, что поделились этой концепцией
https://www.kaggle.com/nirant/hitchhiker-s-guide-to-nlp-in-spacy
https://www.analyticsvidhya.com/blog/2017/04/natural-language-processing-made-easy-using-pacy-%E2%80%8bin-python/
Особая благодарность Dataturks за их аннотированный набор данных

Пожертвование

Если вы обнаружили, что мои программные силы имеют для вас полезные для вас, подумайте о том, чтобы помочь мне оплатить мои интернет -счета. Это побудит меня создать много таких программ?

PayPal
₹ (INR)

Stargazer со временем

Расширять

Дополнительная информация

Версия v1.0.6
Тип Другой исходный код
Время обновления 2025-04-15
размер 5.16MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

pyresparser

ПИРЕСПАРСЕР

Функции

Установка

Документация

Поддерживаемые форматы файлов

Использование

Кли

Примечания:

Результат

Ссылки, которые помогли мне попасть сюда

Пожертвование

Stargazer со временем

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express