ดาวน์โหลด autoPDFtagger - ดาวน์โหลดซอร์สโค้ด autoPDFtagger ดาวน์โหลด

autoPDFtagger

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

Autopdftagger

ภาพรวม

Autopdftagger เป็นเครื่องมือ Python ที่ออกแบบมาสำหรับองค์กรที่บ้านที่มีประสิทธิภาพโดยมุ่งเน้นไปที่การแปลงเป็นดิจิทัลและการจัดระเบียบเอกสารทั้งดิจิตอลและกระดาษ โดยการติดแท็กไฟล์ PDF โดยอัตโนมัติรวมถึงเอกสารที่อุดมไปด้วยรูปภาพและการสแกนคุณภาพที่แตกต่างกันทำให้มันมีจุดมุ่งหมายเพื่อปรับปรุงองค์กรของคลังเก็บดิจิตอล

แนวคิดหลัก

การติดแท็ก AI-powered : ใช้ประโยชน์จาก GPT-4 และ GPT-Vision สำหรับการติดแท็ก PDF แบบอัตโนมัติอย่างสมบูรณ์รวมถึงภาพวาดที่ซับซ้อนและการสแกนคุณภาพต่ำ
โฟกัส : ออกแบบทางวิศวกรรมสำหรับการตั้งค่าบ้านที่ไร้กระดาษโดยจัดลำดับความสำคัญการวิเคราะห์ข้อมูลที่แม่นยำผ่าน UI ที่ซับซ้อน
ข้อกำหนด : สภาพแวดล้อม Python และคีย์ OpenAI API
ฟังก์ชัน :
- การวิเคราะห์ข้อความที่แข็งแกร่งขับเคลื่อนโดย GPT
- การวิเคราะห์ภาพขั้นสูงโดยใช้ GPT-Vision
- ใช้ข้อมูลเมตาที่มีอยู่ชื่อไฟล์และโครงสร้างโฟลเดอร์
- รวบรวมข้อมูลลงในฐานข้อมูล JSON เพื่อการเข้าถึงได้ง่าย
- มาตรฐานการตั้งชื่อไฟล์ (yy-mm-dd- {title} .pdf) และอัปเดตข้อมูลเมตา PDF สำหรับการจัดทำดัชนีที่มีประสิทธิภาพ
- สามารถกำหนดค่าได้เพื่อรวมตัวแทน AI อื่น ๆ เข้าด้วยกัน
- การปรับปรุงในอนาคตเพื่อปรับแต่งองค์กรโฟลเดอร์

แนวคิดและบริบท

ในยุคดิจิตอลที่ก้าวหน้าตอนนี้เอกสารจำนวนมากได้รับการจัดส่งแบบดิจิทัล แต่เอกสารที่สำคัญมักยังคงมาถึงในรูปแบบกระดาษ เมื่อมองไปสู่อนาคตดิจิตอลการรวมเอกสารเหล่านี้ลงในคลังเก็บดิจิตอลแบบครบวงจรจะมีค่ามากขึ้นเรื่อย ๆ การสแกนอย่างง่ายโดยใช้กล้องสมาร์ทโฟนทำให้การใช้งานได้จริง อย่างไรก็ตามความน่าเชื่อถือของเทคโนโลยี OCR ที่มีอยู่และความสามารถที่ จำกัด ในการจัดทำดัชนีเนื้อหาที่ไม่ใช่ข้อความเช่นภาพวาดหรือภาพถ่ายเป็นอุปสรรคต่อการค้นหาเอกสารเหล่านี้อย่างมีประสิทธิภาพ Autopdftagger มีจุดมุ่งหมายที่จะลดช่องว่างนี้โดยนำเสนอการวิเคราะห์ AI-ASSISTED และการจัดระเบียบไฟล์ PDF เพิ่มความสามารถในการค้นหาและการจัดระเบียบของพวกเขาด้วยระดับความแม่นยำเทียบเท่ากับความพยายามของมนุษย์

สถานะปัจจุบัน

ในขณะนี้มีต้นแบบการทำงานในรูปแบบของโปรแกรมเทอร์มินัลด้วยโมดูล Python ซึ่งแสดงให้เห็นถึงการทำงานของมันและได้รับผลลัพธ์ที่น่าประทับใจสำหรับฉันแล้ว สำหรับแอพพลิเคชั่นที่กว้างขึ้นการปรับปรุงโดยละเอียดจำนวนมากจำเป็นอย่างยิ่งโดยเฉพาะอย่างยิ่งในการทดสอบการปรับแต่ง Promt-Optimization การจัดการข้อผิดพลาดและเอกสาร

ข้อควรระวังและข้อควรพิจารณา / ข้อจำกัดความรับผิดชอบ

ข้อมูลความเป็นส่วนตัว : เนื้อหา PDF ถูกส่งไปยังเซิร์ฟเวอร์ OpenAI สำหรับการวิเคราะห์ ในขณะที่ OpenAI อ้างว่าไม่ใช้อินพุต API สำหรับการฝึกอบรมแนะนำให้ใช้ความอ่อนไหวในการจัดการเอกสารส่วนตัว
การควบคุมต้นทุน : ระวังค่าใช้จ่ายที่เกี่ยวข้องกับการใช้ OpenAI API ซึ่งขึ้นอยู่กับปริมาณการร้องขอ การวิเคราะห์ค่าใช้จ่ายหน้าเดียวประมาณ 0.05 $
ความแม่นยำและความน่าเชื่อถือ : เวอร์ชันเริ่มต้นนี้เป็นข้อพิสูจน์แนวคิดและอาจมีข้อ จำกัด มันถูกออกแบบมาเพื่อสร้างสำเนาแทนที่จะเปลี่ยนไฟล์ต้นฉบับ
การแก้ไขข้อมูลเมตา : การเปลี่ยนแปลงข้อมูลเมตาอาจทำให้เอกสารบางอย่างเป็นโมฆะ ระวังเอกสารที่ลงนามดิจิตอล

มีส่วนช่วย

หากคุณพบว่าเครื่องมือนี้มีประโยชน์และมีแนวคิดในการปรับปรุงอย่าลังเลที่จะมีส่วนร่วม ในขณะที่ฉันไม่ใช่โปรแกรมเมอร์เต็มเวลาและฉันไม่รู้สึกเป็นมืออาชีพเลยคำแนะนำหรือการปรับปรุงใด ๆ ยินดีต้อนรับ ส่งรายงานข้อผิดพลาดคำขอคุณสมบัติหรือข้อเสนอแนะอื่น ๆ ขอบคุณที่หยุดโดย!

ข้อกำหนดในการเรียกใช้โปรแกรมนี้

งูหลาม
Openai-Api-Key ที่มีการเข้าถึงรุ่น GPT-4-Vision-Preview
คำนวณค่าใช้จ่ายประมาณ 0.03 $ ต่อ PDF-PAGE ที่ประมวลผลภาพ

การติดตั้ง

$ pip install git+https://github.com/Uli-Z/autoPDFtagger

สร้างไฟล์การกำหนดค่าและบันทึกเป็น ~/.Autopdftagger.conf :

 ; Configuration for autoPDFtagger

[DEFAULT]
language = {YOUR LANGUAGE}

[OPENAI-API]
API-Key = {INSERT YOUR API-KEY}

โครงสร้างโปรแกรม

โปรแกรมมีโครงสร้างพื้นฐานดังนี้:

1. อ่านฐานข้อมูล (อินพุต)

โดยการระบุไฟล์ PDF
โดยการระบุไฟล์ JSON
โดยป้อน JSON ผ่านอินพุตมาตรฐาน

2. แก้ไขฐานข้อมูล (การประมวลผล)

การกรองไฟล์ตามเกณฑ์คุณภาพ
การวิเคราะห์ข้อมูลเมตาที่มีอยู่, ชื่อไฟล์, โครงสร้างโฟลเดอร์ ( file analysis )
การวิเคราะห์ข้อความที่มีอยู่ ( text analysis )
การวิเคราะห์ภาพที่มีอยู่ ( image analysis )
การวิเคราะห์และการเรียงลำดับของแท็ก ( tag analysis )

3. ฐานข้อมูลเอาต์พุต (เอาต์พุต)

เป็น JSON ผ่านเอาต์พุตมาตรฐาน
เป็น JSON ในไฟล์
ในรูปแบบของไฟล์ PDF ที่มีข้อมูลเมตาที่ได้รับการปรับปรุง
เป็นสถิติ

หมายเหตุ: โดยหลักแล้ว (เกือบ) ตัวเลือกทั้งหมดสามารถรวมกันได้ ลำดับของแต่ละขั้นตอนได้รับการแก้ไขอย่างไรก็ตาม; พวกเขาจะถูกประมวลผลตามลำดับที่กล่าวถึงข้างต้น แต่การใช้ท่อในเทอร์มินัลได้รับการพิจารณาอย่างชัดเจนทำให้สามารถส่งผ่านสถานะของฐานข้อมูลไปยังอินสแตนซ์อื่นของโปรแกรม สิ่งนี้ทำให้มีแนวโน้มที่จะตรวจสอบและแก้ไขแต่ละขั้นตอน (เช่นการวิเคราะห์ข้อความแรกจากนั้นกรองด้วยคุณภาพตามด้วยการวิเคราะห์ภาพจากนั้นกรองใหม่และในที่สุดก็ส่งออกไฟล์ PDF) การใช้ json-output ผลลัพธ์ของโปรแกรมสามารถส่งโดยตรงไปยังอินสแตนซ์อื่นของโปรแกรม

การใช้งาน

$ autoPDFtagger --help
usage: autoPDFtagger [-h] [--config-file CONFIG_FILE] [-b [BASE_DIRECTORY]] [-j [JSON]] [-s [CSV]] [-d {0,1,2}] [-f] [-t] [-i] [-c] [-e [EXPORT]] [-l]
                    [--keep-above [KEEP_ABOVE]] [--keep-below [KEEP_BELOW]] [--calc-stats]
                    [input_items ...]

Smart PDF-analyzing Tool

positional arguments:
 input_items           List of input PDFs and folders, alternativly you can use a JSON- or CSV-file

options:
 -h , --help            show this help message and exit
 --config-file CONFIG_FILE
                       Specify path to configuration file. Defaults to ~ /.autoPDFtagger.conf
 -b [BASE_DIRECTORY], --base-directory [BASE_DIRECTORY]
                       Set base directory
 -j [JSON], --json [JSON]
                       Output JSON-Database to stdout. If filename provided, save it to file
 -s [CSV], --csv [CSV]
                       Output CSV-Database to specified file
 -d {0,1,2}, --debug {0,1,2}
                       Debug level (0: no debug, 1: basic debug, 2: detailed debug)
 -f , --file-analysis   Try to conventionally extract metadata from file, file name and folder structure
 -t , --ai-text-analysis
                       Do an AI text analysis
 -i, --ai-image-analysis
                       Do an AI image analysis
 -c , --ai-tag-analysis
                       Do an AI tag analysis
 -e [EXPORT], --export [EXPORT]
                       Copy Documents to a target folder
 -l, --list            List documents stored in database
 --keep-above [KEEP_ABOVE]
                       Before applying actions, filter out and retain only the documents with a confidence index greater than or equal to a specific       
                       value (default: 7).
 --keep-below [KEEP_BELOW]
                       Analogous to --keep-above. Retain only document with an index less than specified.
 --calc-stats          Calculate statistics and (roughly ! ) estimate costs for different analyses

ตัวอย่าง

อ่านไฟล์ PDF ทั้งหมดจากโฟลเดอร์ pdf_archive ทำการวิเคราะห์ไฟล์พื้นฐาน (-F) และจัดเก็บข้อมูลใน ไฟล์ JSON-Database.json (-J [ชื่อไฟล์])::

$ autoPDFtagger ./pdf_archive --file-analysis --json allfiles.json

อ่าน json-database ที่สร้างขึ้นก่อนหน้านี้และทำการวิเคราะห์ข้อความ ai-text ซึ่งจัดเก็บผลลัพธ์ในไฟล์ JSON ใหม่

$ autoPDFtagger allfiles.json --ai-text-analysis --json textanalysis.json

ทำการวิเคราะห์ AI-Image สำหรับไฟล์ทั้งหมดที่มีข้อมูลเมตาคุณภาพต่ำโดยประมาณ

$ autoPDFtagger textanalysis.json --keep-below --ai-image-analysis --json imageanalysis.json

จำได้ทั้งหมดร่วมกันวิเคราะห์และจัดระเบียบแท็ก

$ autoPDFtagger textanalysis.json imageanalysis.json --ai-tag-analysis --json final.json

คัดลอกไฟล์ไปยังโฟลเดอร์ใหม่ใหม่การตั้งค่าข้อมูลเม ตา ใหม่และกำหนดชื่อไฟล์ใหม่ โครงสร้างโฟลเดอร์ดั้งเดิมยังคงไม่เปลี่ยนแปลง

$ autoPDFtagger final.json -e ./new_archive

ทำทุกอย่างพร้อมกัน:

$ autoPDFtagger pdf_archive -ftic -e new_archive

ด้านเทคนิคแบบสุ่ม / ดำน้ำลึกถ้าคุณต้องการ

นอกเหนือจากโปรแกรมเทอร์มินัลแล้วโมดูล Python Autopdftagger ยังมีให้สำหรับการรวมเข้ากับซอฟต์แวร์อื่น ๆ ตรวจสอบรหัสสำหรับรายละเอียดส่วนต่อประสาน
การวิเคราะห์ไฟล์ไม่เพียง แต่ชื่อไฟล์เท่านั้น แต่ยังรวมถึงเส้นทางไฟล์ในท้องถิ่นที่สัมพันธ์กับไดเรกทอรีพื้นฐาน (ฐานไดเรกทอรี) โดยค่าเริ่มต้นเมื่อมีการระบุโฟลเดอร์โฟลเดอร์ที่เกี่ยวข้องจะถูกตั้งค่าเป็นไดเรกทอรีพื้นฐานสำหรับไฟล์ทั้งหมดลงไปที่โฟลเดอร์ย่อย ในบางกรณีอาจมีเหตุผลที่จะตั้งค่าไดเรกทอรีพื้นฐานที่แตกต่างกันด้วยตนเอง
การจัดการข้อมูลเมตาใช้ "ตรรกะความเชื่อมั่น" ซึ่งหมายความว่าข้อมูลจะได้รับการอัปเดตเฉพาะในกรณีที่ความมั่นใจ/ความมั่นใจ (โดยประมาณ) สูงกว่าข้อมูลที่มีอยู่ สิ่งนี้มีจุดมุ่งหมายเพื่อการปรับปรุงข้อมูลที่เพิ่มขึ้น แต่บางครั้งอาจนำไปสู่ผลลัพธ์ที่ไม่สอดคล้องกัน
คำหลัก ความเชื่อมั่น-ดัชนี : ภายในโปรแกรมเป็นไปได้ที่จะกรองฐานข้อมูลด้วยค่านี้ เหตุผลที่อยู่เบื้องหลังคืออะไร? ในขั้นต้นมันเป็นวิธีแก้ปัญหาที่ได้รับการปรับปรุงอย่างรวดเร็วเพื่อเปิดใช้งานการเรียงลำดับของรายการฐานข้อมูลด้วยคุณภาพของข้อมูลเมตาของพวกเขา AI เองประเมินว่าสามารถตอบคำถามที่กำหนดได้ดีเพียงใดตามข้อมูลที่มีอยู่และกำหนดระดับความมั่นใจ มีค่าความเชื่อมั่นส่วนบุคคลสำหรับชื่อเรื่องสรุปและวันที่สร้าง เพื่อรวมสิ่งเหล่านี้ไว้ในค่าเดียวค่าเฉลี่ยจะถูกคำนวณในขั้นต้น อย่างไรก็ตามเนื่องจากชื่อและวันที่สร้างมีความสำคัญอย่างยิ่งค่าต่ำสุดจากค่าเฉลี่ยชื่อและวันที่สร้าง
การวิเคราะห์ข้อความ ของเอกสารในการกำหนดค่าปัจจุบันดำเนินการด้วยความช่วยเหลือของ GPT-3.5-turbo-1106 ด้วยหน้าต่างบริบทของ 16K เอกสารที่มีขนาดใหญ่กว่าสามารถวิเคราะห์ได้ในราคาที่ไม่แพงต่ำกว่า $ 0.01 ในการทดสอบของฉันคุณภาพได้พิสูจน์แล้วว่าเพียงพอ เฉพาะเอกสารสั้น ๆ ที่ GPT-4 ดูเหมือนจะนำประโยชน์มาใช้อย่างมีนัยสำคัญ ดังนั้นโปรแกรมจะใช้ GPT-4 โดยอัตโนมัติสำหรับข้อความสั้น ๆ (~ 100 คำ)
การวิเคราะห์ภาพ เป็นกระบวนการที่ใช้เวลานานและมีราคาแพงที่สุดซึ่งเป็นสาเหตุที่อัลกอริทึมได้รับการปรับที่นี่ ในช่วงเวลาแห่งการสร้างมีเพียงรูปแบบ GPT-4-Vision-Preview เท่านั้น วิธีการปัจจุบันคือการวิเคราะห์เฉพาะหน้าแรกสำหรับเอกสารที่สแกน หน้าต่อมาจะถูกวิเคราะห์เฉพาะเมื่อข้อมูลเมตาที่เกี่ยวข้องไม่สามารถกำหนดได้ด้วยความมั่นใจเพียงพอ มีตรรกะที่คล้ายกันสำหรับ PDF ที่สร้างขึ้นแบบดิจิทัลซึ่งมีการวิเคราะห์ภาพที่มีอยู่เท่านั้นจนกว่าคุณภาพของข้อมูลจะเพียงพอ

โครงสร้างรหัส

main.py : อินเตอร์เฟสเทอร์มินัลสำหรับแอปพลิเคชัน
autoPDFtagger.py : จัดการฟังก์ชันหลักของเครื่องมือ
AIAgents.py : คลาสพื้นฐานสำหรับการจัดการตัวแทน AI รวมถึงการสื่อสาร OpenAI API
AIAgents_OPENAI_pdf.py : ตัวแทน AI เฉพาะที่อุทิศให้กับข้อความรูปภาพและการวิเคราะห์แท็ก
PDFDocument.py : จัดการเอกสาร PDF แต่ละตัวจัดการการอ่านและการเขียนข้อมูลเมตา
PDFList.py : ดูแลฐานข้อมูลเอกสาร PDF, ข้อมูลเมตาของพวกเขาและให้ฟังก์ชั่นการส่งออก
config.py : จัดการไฟล์การกำหนดค่า
autoPDFtagger_example_config.conf : ตัวอย่างไฟล์การกำหนดค่าการกำหนดการตั้งค่า API และการตั้งค่าอื่น ๆ

การพัฒนาในอนาคต

การใช้ AI-API-CACHE เพื่อประหยัดค่าใช้จ่ายและเวลาสำหรับการทดสอบ
การควบคุมต้นทุน : การใช้คุณสมบัติสำหรับการตรวจสอบและจัดการต้นทุนการใช้ API
ส่วนต่อประสานผู้ใช้กราฟิก : การพัฒนาอินเทอร์เฟซที่ใช้งานง่ายมากขึ้น
แอพ HTML Viewer : แอพที่เสนอเพื่อให้เห็นภาพฐานข้อมูล JSON และรวมเข้ากับไฟล์เก็บถาวร
การรวมและความเข้ากันได้ :
- ขยายไปยัง AI API อื่น ๆ และสำรวจการรวมโมเดล AI ในพื้นที่
- สร้างความมั่นใจว่าเข้ากันได้กับแอปพลิเคชันเช่น Paperless-NGX
การปรับปรุงองค์กรแท็กและการพัฒนาข้อมูลลำดับชั้นผ่านการใช้อัลกอริทึมการจัดกลุ่มบนฐานข้อมูลเวกเตอร์

ใบอนุญาต

GPL-3

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-06
ขนาด 41.54KB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด