Wikipedia Scraping with LLM Agents Download - Wikipedia Scraping with LLM Agents Source Download Download

ภาษาไทย

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

หน้าแรก>การเขียนโปรแกรมที่เกี่ยวข้อง>ซอร์สโค้ดอื่น ๆ

Wikipedia Scraping with LLM Agents

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

วิธีการขูดวิกิพีเดียกับตัวแทน LLM

การรวมตัวแทนและเครื่องมือของ Langchain เข้ากับ LLM และฟังก์ชั่นของ Openai ที่เรียกร้องให้มีการขูดเว็บของ Wikipedia

ลิงค์ไปยังคู่มือขั้นตอนโดยขั้นตอน: https://medium.com/datadriveninvestor/how-to-web-scrape-wikipedia-using-llm-agents-f0dba8400692

บริบท

งานของการขูด Wikipedia เป็นเทคนิคที่มีประโยชน์อย่างมากสำหรับการแยกข้อมูลที่มีค่าด้วยการรวบรวมข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างมากมาย
เครื่องมือดั้งเดิมเช่นซีลีเนียมในขณะที่มีประสิทธิภาพมีแนวโน้มที่จะใช้งานด้วยตนเองและใช้เวลานาน
ความสามารถที่น่าประทับใจของโมเดลภาษาขนาดใหญ่ (LLMs) และความสามารถในการเชื่อมต่อพวกเขากับอินเทอร์เน็ตได้นำไปสู่ความเป็นไปได้ใหม่ ๆ ในหลายกรณีการใช้งานรวมถึงโดเมนของการขูดเว็บ
ในบทความนี้เราควบคุมการรวมกันของตัวแทน LLM เครื่องมือและการเรียกใช้ฟังก์ชันเพื่อแยกข้อมูลจาก Wikipedia ได้อย่างง่ายดาย

ข้อมูล

เพลง 200 เพลงของปี 2010 (จาก Chart2000.com-https://chart2000.com/data/chart2000-song-2010-decade-0-3-0070.csv)

ชุดเครื่องมือ

คนขี้เกียจ
- ตัวแทน
- เครื่องมือ
- ตัวแยกวิเคราะห์ผลผลิต
Openai
- LLMS (โดยเฉพาะ gpt-3.5-turbo-1106 )
- การเรียกใช้ฟังก์ชัน

วิธี

เรียกใช้ python main.py เพื่อเรียกใช้งานเว็บขูดเว็บสำหรับชุดข้อมูลอินพุตเพลง

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-08
ขนาด 48.65KB
มาจาก Github

แอปที่เกี่ยวข้อง

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด