Reanudar la búsqueda utilizando consultas naturales. Aplicación de demostración utilizando el modelo de API de OpenAI RAG y OpenSource VLM para reanudar el análisis comparativo.
Esto ayudaría a los socios de talento y los gerentes de ingeniería a obtener información específica del currículum.
El objetivo de la inteligencia del currículum sería apoyar la consulta del lenguaje natural en un conjunto de currículums. Se puede usar para hacer un análisis comparativo de currículums. Digamos que tenemos 4 o 5 currículums de posibles ingenieros de software.
En este experimento, necesitas currículums.
En lugar de buscar datos de Internet, he utilizado la API Chagpt para generar un currículum.
Utilicé la llamada de función Operai y la salida de respuesta estructurada para obtener la salida JSON.
Una vez que tenga JSON, puede convertirlo en el documento de currículum de PDF.
OPENAI_KEY=<substitute your key>
# Install python packages locally.
pip install -r requirements.txt
python ui_gen_resume.py Este ejemplo se puede ejecutar en la máquina/computadora portátil Windows local. No tiene un requisito especial en términos de GPU. Debe seleccionar 2 currículums de la aplicación UI, escriba la consulta en el cuadro de inmediato.
y golpear envío.
El usuario necesita clave en la tecla OpenAI en el archivo .env que está presente en la raíz de la carpeta.
.env ejemplo de archivo
OPENAI_KEY= <openai key>
vector_store_resume=resume_compare
MODEL=gpt-4o-2024-11-20
# individual file is put into vector store if value is FALSE
CONCAT_PDF=False
# instruction for assistant is chosen based on this. Possible values ( individual_pdf|concat_pdf)
INSTRUCTION_ID=individual_pdf
# Path where generated pdf resumes are stored.
RESUME_PATH=.\resumes
python ui_resume_compare_multi.py
Aquí uso enfoques de trapo
RAG: con OpenAi OpenAi tiene API asistente, que tiene la opción de almacenar la representación vectorial del documento y la búsqueda de la misma. Consulte aquí para obtener la búsqueda de archivos de documentación sobre cómo usar la API de búsqueda de archivos, remití el excelente blog de Simon Wilson y GIST que hizo un código de muestra
RAG - Con OpenSource colpali Este es un enfoque para usar VLM. Planeo usar Byaldi, que usa internamente colpali referirse a cuaderno, que tiene chat de código de muestra con pdf usando byaldi, todavía tengo que implementar esto.
Este es un enfoque directo. Utilizo las API de OpenAI para crear una tienda vectorial y agregar todos los documentos PDF a la tienda Vector. Publique que cree un asistente y adjunte la tienda vectorial al asistente
La búsqueda de archivos de OpenAI parece no funcionar bien en experimentos anteriores, para consultas que están tocando múltiples documentos. La solución inicial parece concatenar los archivos y cargar en el almacén Vector. Sin embargo, esto fue una comprensión incorrecta sobre cómo presentar las instrucciones para modelar
Para mejorar la respuesta, significa que se debe ajustar las instrucciones o el mensaje del sistema para que obtenga resultados correctos. Aquí está el mío y estoy implorando al modelo que haga una búsqueda correcta.
You are dilligent assistant specializing in analyzing resume for technology industry . Your goal is to find the a individual resume closely matched per the requirement from user
1. ** location of resume ** - Vector store has resume of individual candidates . Name of the vector store is resume_compare .
2 ** format of resume ** - Vector store has resume of individual candidates in pdf format. Name of the pdf would be firstname followed by underscore last name . E.g Rajesh_Kumar.pdf
3 ** vector store** - Vector store resume_compare belongs to the user/owner, whose is calling the api
4 ** role descriptions** - For job role description such as engineering manager , devops engineer , software engineer , use your knowledge based gained from pre-training.
5 ** Resume Search Strategy** - Search across ALL documents in vector store .Consider partial matches across multiple documents .Use multiple search queries for different aspects (skills, experience, etc.)
6 ** Search Depth ** - Perform multiple searches with varied keywords. Use both exact and semantic matching.
7 ** Result Aggregation ** - Combine result from multiple searches . Cross-reference finding across documents.
8 ** key qualitifications ** - For finding key qualifications or experiences for role/work , use your knowledge base and pre-training.
9 ** resume search** - For Candidates's resume and their capability ,skills , experience for a role/work , you must use file_search tool and attached vector store. Resume will always be present in vector store.
10 ** resume presence** - Resume will always present in vector store attached to assistant . Do not prompt to ask user on resume.
11 ** Dillgence ** - Please search dilligently . you seem to miss the fact that resume files are present in vectore store resume_compare.
12 ** Technical Skills** - In the resume take a deep look at work experience section .Focus on relevant programming languages, frameworks, tools, and certifications (e.g., Python, Java, AWS, Docker). Highlight these clearly.
13. ** Job Match** - Compare the resume with provided job descriptions. Focus on matching key technologies ,business and opetational knowledge and job experience, and note areas where the candidate doesn’t meet the requirements.
14. ** Projects & Experience** - Prioritize large-scale projects or leadership roles in tech teams. Identify open-source contributions or significant technical achievements.