Widescale เป็นเครื่องมือทำดัชนีและการค้นหาแบบเต็มข้อความเขียนใน Golang Widescale มีวัตถุประสงค์เพื่อการศึกษาเท่านั้น มันมี API ง่าย ๆ ในการค้นหาคำหรือกลุ่มคำภายในข้อความจำนวนมากที่แพร่กระจายไปทั่วเอกสารหลายเอกสาร ภายใน Widescale ใช้ดัชนีคว่ำคล้ายกับ Elasticsearch สำหรับข้อมูลเพิ่มเติมดูบทความนี้
แจ้งให้เราทราบหากพวกคุณมีคำแนะนำใด ๆ
ฉันพบดัชนีคว่ำในขณะที่ฉันกำลังอ่านเกี่ยวกับ Elasticsearch เพื่อทำความเข้าใจว่าทำไมต้องใช้มันเป็นข้อความที่ตัดตอนมาจากบทความ Wikipedia เกี่ยวกับเรื่องนี้ -
เมื่อต้องรับมือกับเอกสารจำนวนน้อยเป็นไปได้ที่เอ็นจิ้นการค้นหาข้อความเต็มรูปแบบจะสแกนเนื้อหาของเอกสารโดยตรงด้วยการสืบค้นแต่ละครั้งซึ่งเป็นกลยุทธ์ที่เรียกว่า "การสแกนแบบอนุกรม" นี่คือสิ่งที่เครื่องมือบางอย่างเช่น GREP ทำเมื่อค้นหา
อย่างไรก็ตามเมื่อจำนวนเอกสารในการค้นหามีขนาดใหญ่หรือปริมาณของการค้นหาที่จะดำเนินการมีความสำคัญปัญหาของการค้นหาข้อความเต็มมักจะแบ่งออกเป็นสองงาน: การจัดทำดัชนีและการค้นหา ขั้นตอนการจัดทำดัชนีจะสแกนข้อความของเอกสารทั้งหมดและสร้างรายการคำค้นหา (มักเรียกว่าดัชนี) ในขั้นตอนการค้นหาเมื่อทำการสืบค้นเฉพาะเฉพาะดัชนีจะถูกอ้างอิงแทนที่จะเป็นข้อความของเอกสารต้นฉบับ
ฉันไม่คิดว่าฉันจะทำคำอธิบายได้ดีไปกว่านั้น
go ยังตัวแปรสภาพแวดล้อมเส้นทางของคุณ > go get github.com/gorilla/mux
> go get github.com/anubhavp28/WideScale/
> go install github.com/anubhavp28/WideScale/
ในการเริ่มต้นเซิร์ฟเวอร์เพียงเรียกใช้:
> cd $(go env GOPATH)/bin
> widescale <path-to-dir-containing-txt-files-to-index>
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT - ดูไฟล์ License.md สำหรับรายละเอียด