ดาวน์โหลด behemoth - ดาวน์โหลดซอร์สโค้ด behemoth

behemoth

ซอร์สโค้ดอื่น ๆ

behemoth-1.1

ดาวน์โหลด

Behemoth เป็นแพลตฟอร์มโอเพ่นซอร์สสำหรับการประมวลผลเอกสารขนาดใหญ่ตาม Apache Hadoop

ประกอบด้วยการใช้เอกสารที่ใช้คำอธิบายประกอบอย่างง่ายและโมดูลจำนวนหนึ่งที่ทำงานในเอกสารเหล่านี้ หนึ่งในประเด็นหลักของ Behemoth คือการทำให้การปรับใช้ของเครื่องวิเคราะห์เอกสารง่ายขึ้นในขนาดใหญ่ แต่ยังให้โมดูลที่นำกลับมาใช้ใหม่ได้สำหรับ:

การบริโภคจากแหล่งข้อมูลทั่วไป (Warc, Nutch ฯลฯ ... )
การประมวลผลข้อความ (Tika, UIMA, GATE, การระบุภาษา)
การสร้างเอาต์พุตสำหรับเครื่องมือภายนอก (Solr, Mahout)

สถาปัตยกรรมแบบแยกส่วนช่วยให้การพัฒนาคำอธิบายประกอบแบบกำหนดเองง่ายขึ้นตาม MapReduce

โปรดทราบว่า behemoth ไม่ได้ใช้ส่วนประกอบ NLP หรือการเรียนรู้ของเครื่องจักรใด ๆ แต่ทำหน้าที่เป็น 'glueware ขนาดใหญ่' สำหรับทรัพยากรที่มีอยู่ การใช้ Hadoop นั้นได้รับประโยชน์จากคุณสมบัติทั้งหมดคือความสามารถในการปรับขนาดการทนต่อความผิดพลาดและการสำรองข้อมูลชุมชนโอเพ่นซอร์สที่เจริญรุ่งเรืองที่สุด

Wiki: https://github.com/digitalpebble/behemoth/wiki

รายชื่อผู้รับจดหมาย: http://groups.google.com/group/digitalpebble

stackoverflow: http://stackoverflow.com/questions/tagged/behemoth

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน behemoth-1.1
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-16
ขนาด 1.55MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด