การสกัดงาน AI ที่ใช้พลังงานและเครื่องกำเนิดอีเมลเย็น
โครงการนี้ใช้ประโยชน์จากเครื่องมือ AI ที่ทันสมัยและเฟรมเวิร์กเพื่อทำให้กระบวนการแยกการโพสต์งานออกจากหน้าเว็บโดยอัตโนมัติและสร้างอีเมลเย็นส่วนบุคคลสำหรับแอปพลิเคชันงานตามการป้อนข้อมูลของผู้ใช้และทักษะที่ปรับแต่งได้ มันรวม LLM ที่ขับเคลื่อนด้วย GROQ (รูปแบบการเรียนรู้ภาษา), Langchain Prompts, การขูดเว็บและฐานข้อมูลเวกเตอร์เพื่อปรับปรุงกระบวนการ end-to-end ของการสร้างแอปพลิเคชันงาน
คุณสมบัติ
- การขูดเว็บ: แยกการโพสต์งานออกจากหน้าเว็บแบบไดนามิกโดยอัตโนมัติโดยใช้
WebBaseLoader และทำความสะอาดข้อมูลที่แยกออกมาเพื่อกำจัดเสียงรบกวน - การสกัดการโพสต์งาน: ใช้โซ่พรอมต์ LLM ของ Langchain เพื่อแยกและจัดรูปแบบรายละเอียดงานที่เกี่ยวข้อง (บทบาทประสบการณ์ทักษะคำอธิบาย) ลงในวัตถุ JSON ที่ถูกต้อง
- อีเมลเย็นส่วนบุคคล: สร้างอีเมลเย็นที่ปรับแต่งโดยใช้ LLM ที่ขับเคลื่อนด้วย GROQ ซึ่งปรับแต่งได้ด้วยทักษะของผู้สมัครและลิงก์พอร์ตโฟลิโอที่เกี่ยวข้อง
- การรวมฐานข้อมูล Vector: จัดเก็บ Tech Stack และ Metadata พอร์ตโฟลิโอโดยใช้ Chromadb สำหรับการสืบค้นลิงก์ที่เกี่ยวข้องอย่างมีประสิทธิภาพสำหรับอีเมลเย็น
- การสร้างอีเมลแบบไดนามิก: สร้างอีเมลที่เป็นส่วนตัวขับเคลื่อนผลลัพธ์ที่สอดคล้องกับรายละเอียดงานและเน้นประสบการณ์และโครงการที่เกี่ยวข้องมากที่สุด
เทคโนโลยีที่ใช้
- LLM Integration (GROQ): โมเดล Chatgroq (LLAMA-3.1-70B) สำหรับการสร้างข้อความที่มีความแม่นยำสูง
- Langchain: ใช้สำหรับการสร้างเทมเพลตพรอมต์แบบไดนามิกและการผูกมัด LLM เพื่อสร้างการตอบสนอง
- Flask: Backend Server เพื่อจัดการคำขอสร้างอีเมลและจัดการการขูดงานและการโต้ตอบ LLM
- React.js: ส่วนหน้าสำหรับการรวบรวมอินพุตผู้ใช้ (เช่นชื่อผู้ใช้) และเรียกกระบวนการสร้างอีเมล
- Chromadb: ฐานข้อมูลเวกเตอร์สำหรับการจัดเก็บข้อมูลเมตาและการสืบค้นที่มีประสิทธิภาพ
- Pandas: ใช้สำหรับการจัดการข้อมูลพอร์ตโฟลิโอ CSV และประมวลผลเพื่อจัดเก็บใน Chromadb
- Flask-Cors: เปิดใช้งาน CORS สำหรับแบ็กเอนด์ Flask
คำแนะนำการตั้งค่า
ข้อกำหนดเบื้องต้น
- Python 3
- node.js และ npm (สำหรับ React Frontend)
- คีย์ GROQ API (สำหรับการรวม LLM)
การติดตั้ง
โคลนที่เก็บ:
git clone https://github.com/IMRANDIL/cold_email_generator_llm.git
cd cold_email_generator_llm
การตั้งค่าแบ็กเอนด์ (ขวด):
- สร้างและเปิดใช้งานสภาพแวดล้อมเสมือนจริง:
python3 -m venv venv
source venv/bin/activate
- ติดตั้งการพึ่งพา Python ที่ต้องการ:
pip install -r requirements.txt
- ตั้งค่าตัวแปรสภาพแวดล้อมสำหรับคีย์ GROQ API:
export GROQ_API_KEY= " your-api-key "
- เริ่มต้นเซิร์ฟเวอร์ Flask:
การตั้งค่าส่วนหน้า (React):
- นำทางไปยังไดเรกทอรี
frontend : - ติดตั้งการอ้างอิง:
- เริ่มต้นเซิร์ฟเวอร์ React Development:
การใช้งาน
- เยี่ยมชมอินเทอร์เฟซส่วนหน้าเพื่อป้อนชื่อผู้ใช้และเรียกกระบวนการสร้างอีเมล
- แบ็กเอนด์จะขูดโพสต์งานประมวลผลด้วยพรอมต์ Langchain สอบถามฐานข้อมูลเวกเตอร์และสร้างอีเมลเย็นที่กำหนดเองสำหรับแต่ละงาน
- อีเมลจะถูกส่งคืนในรูปแบบ JSON และจะแสดงในบล็อกรหัสที่มีรูปแบบที่ดีพร้อมคุณสมบัติ "คัดลอกไปยังคลิปบอร์ด"
ตัวอย่างเอาต์พุต
{
"subject" : " Application for Lead Software Engineer at XYZ Inc. " ,
"body" : " Dear Hiring Manager, I am writing to express my interest in the Lead Software Engineer position... "
}การปรับปรุงในอนาคต
- การขูดเว็บแบบไดนามิก: ขยายความสามารถในการขูดเว็บเพื่อจัดการเว็บไซต์โพสต์งานที่ซับซ้อนและมีไดนามิกมากขึ้น
- การสืบค้นขั้นสูง: ปรับปรุงกลไกการสืบค้นฐานข้อมูลเวกเตอร์เพื่อจัดการชุดทักษะหลายชุดได้อย่างมีประสิทธิภาพมากขึ้น
- การปรับปรุง UI: ปรับปรุงส่วนหน้า React.js สำหรับประสบการณ์การใช้งานที่ดีขึ้นและการสนับสนุนสำหรับเทมเพลตอีเมลหลายรายการ
- การรวม API หลายรายการ: สำรวจการรวมกับรุ่น LLM อื่น ๆ (OpenAI ฯลฯ ) เพื่อเพิ่มความหลากหลาย
ใบอนุญาต
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT ดูไฟล์ใบอนุญาตสำหรับรายละเอียด