hydra link checker
1.0.0
โปรแกรม Python ที่ คลาน slithers? เว็บไซต์สำหรับลิงก์และพิมพ์รายงาน Yaml ของลิงก์ที่เสีย
Python 3.6 หรือสูงกว่า
ไม่มีการพึ่งพาภายนอก Neo
$ python hydra.py -h
usage: hydra.py [-h] [--config CONFIG] URLข้อโต้แย้งตำแหน่ง:
URL : URL ของเว็บไซต์เพื่อรวบรวมข้อมูล ตรวจสอบให้แน่ใจว่า URL นั้นแน่นอนรวมถึงสคีมาเช่น https://example.comอาร์กิวเมนต์เสริม:
-h , --help : แสดงข้อความช่วยเหลือและออก--config CONFIG , -c CONFIG : path ไปยังไฟล์การกำหนดค่ารายงานการเชื่อมโยงที่เสียจะถูกส่งไปยัง stdout ดังนั้นคุณอาจต้องการเปลี่ยนเส้นทางไปยังไฟล์
รายงานจะถูกจัดรูปแบบ Yaml หากต้องการบันทึกเอาต์พุตไปยังไฟล์ Run:
python hydra.py [URL] > [PATH/TO/FILE.yaml]คุณสามารถเพิ่มวันที่ปัจจุบันลงในชื่อไฟล์โดยใช้คำสั่งทดแทนเช่น:
python hydra.py [URL] > /path/to/ $( date ' +%Y_%m_%d ' ) _report.yaml หากต้องการดูว่าไฮดราใช้เวลานานเท่าใดในการตรวจสอบเว็บไซต์ของคุณเพิ่ม time :
time python hydra.py [URL]คุณสามารถรวมไฮดราเป็นส่วนหนึ่งของกระบวนการอัตโนมัติโดยใช้แอ็คชั่น Link-Snitch
ไฮดราสามารถยอมรับไฟล์กำหนดค่า JSON ที่เป็นตัวเลือกสำหรับพารามิเตอร์เฉพาะเช่น:
{
"OK" : [
200 ,
999 ,
403
],
"attrs" : [
" href "
],
"exclude_scheme_prefixes" : [
" tel "
],
"tags" : [
" a " ,
" img "
],
"threads" : 25 ,
"timeout" : 30 ,
"graceful_exit" : " True "
}หากต้องการใช้ไฟล์กำหนดค่าให้จัดหาชื่อไฟล์:
python hydra.py https://example.com --config ./hydra-config.jsonการตั้งค่าที่เป็นไปได้:
OK - รหัสการตอบกลับ HTTP เพื่อพิจารณาว่าเป็นการตรวจสอบลิงก์ที่ประสบความสำเร็จ ค่าเริ่มต้นเป็น [200, 999]attrs - แอตทริบิวต์ของแท็ก HTML เพื่อตรวจสอบลิงก์ ค่าเริ่มต้นเป็น ["href", "src"]exclude_scheme_prefixes - คำนำหน้าโครงการ HTTP เพื่อแยกออกจากการตรวจสอบ ค่าเริ่มต้นเป็น ["tel:", "javascript:"]tags - แท็ก HTML เพื่อตรวจสอบลิงก์ ค่าเริ่มต้นเป็น ["a", "link", "img", "script"]threads - คนงานสูงสุดที่จะทำงาน ค่าเริ่มต้นถึง 50timeout - ไม่กี่วินาทีสูงสุดในการรอการตอบกลับ http ค่าเริ่มต้นเป็น 60graceful_exit - ถ้าตั้งค่าเป็น True และมีลิงก์ที่เสียจะเป็นรหัสออกส่งคืน exit code 0 อื่นส่งคืน exit code 1 วิ่ง:
python -m unittest tests/test.py