Clarin聯合內容搜索v3.0聚合器 - 增強搜索引擎
Clarin聯合內容搜索(CLARIN-FCS)引入了接口規範,該規範將搜索引擎功能與其開發(IE用戶互動,第三方應用程序)相解除,以允許服務以統一的方式訪問異質搜索引擎。
聚合v3.0正在國家瑞典語銀行的文本部門以及克拉林運行。
聯合內容搜索v2.0的規範可以作為PDF文檔找到。有關更多詳細信息,請訪問Clarin FCS-技術詳細信息頁面。
有關更改的詳細列表,請查看CHANGELOG.md 。
向後的兼容性使您作為中心搜索引擎維護者在您自己的方便下對新功能和功能的平滑偏好。
這些對Clarin-FCS的新添加不僅會在執行存儲庫中的查詢時增強用戶體驗和可能性,而且經驗不足的用戶會發現更容易探索不同的語料庫。
如果您使用KORP端點參考實現對搜索引擎有任何靜止的API,則應作為起點。如果您更具體地使用KORP,則應該只是對Corpora和標籤的簡單改編。無論如何,不要忘記看測試。
要測試端點,您可以將IDS端點測試器(代碼)指向您的端點。
還有一個端點開發人員的教程。
要構建FCS聚合器,您需要一些簡單的步驟(如果您沒有更改任何內容,請跳過步驟3):
./build.sh --npm./build.sh --jsx./build.sh --jar然後使用節點和maven構建前端(React)和後端(澤西式servlet)。
檢查aggregator_devel.yml配置文件。如果要側重加載ENPORT,只需在運行之前將端點添加到additionalCQLEndpoints或additionalFCSEndpoints :
./build.sh --run
您可能還需要分別在AGGREGATOR_FILE_PATH和AGGREGATOR_FILE_PATH_BACKUP中更改緩存文件的路徑。
然後,您可以通過http:// localhost訪問本地運行的聚合器:4019/
有關部署配置和有關設置的描述,請參見DEPLOYMENT.md 。