มานุษยวิทยาประกาศเมื่อเร็ว ๆ นี้ว่าโมเดล CLAUDE 3.5 SONNET ได้เพิ่มความสามารถในการประมวลผลไฟล์ PDF และตอนนี้ได้เข้าสู่ขั้นตอนเบต้าสาธารณะ ฟังก์ชั่นนี้ช่วยให้ผู้ใช้วิเคราะห์องค์ประกอบข้อความและภาพในเอกสาร PDF รวมถึงรูปภาพแผนภูมิและตาราง การย้ายครั้งนี้ขยายฟังก์ชั่นของ Claude ให้ผู้ใช้มีความสามารถในการประมวลผลเอกสารที่แข็งแกร่งขึ้นและปรับปรุงประสิทธิภาพการทำงาน
เมื่อเร็ว ๆ นี้มานุษยวิทยา บริษัท ปัญญาประดิษฐ์ประกาศว่าได้เพิ่มความสามารถในการประมวลผลไฟล์ PDF ให้กับโมเดล Claude 3.5 SONNET ซึ่งตอนนี้เข้าสู่ขั้นตอนการทดสอบสาธารณะ ขณะนี้ผู้ใช้สามารถใช้โมเดลเพื่อวิเคราะห์องค์ประกอบข้อความและภาพในเอกสาร PDF รวมถึงรูปภาพแผนภูมิและตารางสำหรับสถานการณ์ที่หลากหลายเช่นรายงานทางการเงินเอกสารทางกฎหมายและการแปลเอกสาร
กระบวนการประมวลผล PDF ของ Claude 3.5 Sonnet แบ่งออกเป็นสามขั้นตอน ขั้นแรกให้ระบบดึงเนื้อหาข้อความออกจากเอกสาร จากนั้นแต่ละหน้าของเอกสารจะถูกแปลงเป็นภาพสำหรับการวิเคราะห์เชิงลึกเพิ่มเติม สิ่งนี้ช่วยให้ผู้ใช้ไม่เพียง แต่รับข้อมูลข้อความ แต่ยังเพื่อให้ได้ข้อมูลเชิงลึกเกี่ยวกับข้อมูลภาพในไฟล์ PDF
เป็นมูลค่าการกล่าวขวัญว่าคุณสมบัติ PDF ของ Claude สามารถใช้ร่วมกับคุณสมบัติอื่น ๆ เช่นการแยกข้อมูลเฉพาะและใช้เป็นอินพุตเครื่องมือ ควรสังเกตว่าไฟล์ที่อัปโหลดต้องน้อยกว่า 32MB และจำนวนหน้าต้องไม่เกิน 100 หน้า ปัจจุบันระบบไม่รองรับเอกสารที่เข้ารหัสหรือมีการป้องกันด้วยรหัสผ่าน
ค่าใช้จ่ายในการประมวลผลไฟล์ PDF แตกต่างกันไปตามความยาวของเอกสารและความหนาแน่นของเนื้อหา โดยทั่วไปจะมีการใช้โทเค็น 1,500 ถึง 3,000 ต่อหน้าโดยไม่มีค่าใช้จ่ายเพิ่มเติมเกินกว่าค่าธรรมเนียมโทเค็นมาตรฐาน ผู้ใช้สามารถใช้คุณสมบัติใหม่นี้ผ่านตัวอย่างคุณสมบัติการแชทของ Claude และการเข้าถึง API ซึ่งต้องใช้ส่วนหัวคำขอเฉพาะ "anthropic-beta: PDFS-2024-09-25" ในคำขอ API มานุษยวิทยาวางแผนที่จะขยายคุณสมบัตินี้ไปยังแพลตฟอร์ม Amazon Bedrock และ Google Vertex AI ในอนาคต
เพื่อปรับปรุงการประมวลผลมานุษยวิทยาแนะนำให้ผู้ใช้ตรวจสอบให้แน่ใจว่าเอกสารมีข้อความที่ชัดเจนและอ่านได้และเค้าโครงหน้านั้นถูกต้อง นอกจากนี้เมื่ออ้างถึงเนื้อหาเฉพาะผู้ใช้ควรใช้หมายเลขหน้าที่แสดงในเครื่องอ่าน PDF และในระหว่างการใช้งาน API ควรวางไฟล์ PDF ไว้ก่อนข้อความ หากเอกสารมีขนาดใหญ่กว่าและเกินขีด จำกัด มานุษยวิทยาแนะนำให้แยกออกเป็นส่วนเล็ก ๆ ในที่สุดเมื่อวิเคราะห์เอกสารเดียวกันหลายครั้งผู้ใช้ยังสามารถพิจารณาใช้แคชพรอมต์เพื่อปรับปรุงประสิทธิภาพการประมวลผล
ประเด็นสำคัญ:
มานุษยวิทยาเปิดตัว Claude 3.5 Sonnet เพิ่มความสามารถในการประมวลผลไฟล์ PDF เพื่อรองรับการวิเคราะห์ข้อความและภาพ
กระบวนการประมวลผลแบ่งออกเป็นสามขั้นตอน: การแยกข้อความแปลงหน้าเป็นภาพและการวิเคราะห์ที่ครอบคลุม
ค่าใช้จ่ายในการประมวลผลแตกต่างกันไปตามความยาวของเอกสารและความหนาแน่นของเนื้อหาและผู้ใช้อาจมีขนาดไฟล์และขีด จำกัด หน้า
ฟังก์ชั่นการประมวลผล PDF ของ Claude 3.5 SONNET ให้ผู้ใช้โซลูชั่นการวิเคราะห์เอกสารที่มีประสิทธิภาพและสะดวกสบาย