Clarin联合内容搜索v3.0聚合器 - 增强搜索引擎
Clarin联合内容搜索(CLARIN-FCS)引入了接口规范,该规范将搜索引擎功能与其开发(IE用户互动,第三方应用程序)相解除,以允许服务以统一的方式访问异质搜索引擎。
聚合v3.0正在国家瑞典语银行的文本部门以及克拉林运行。
联合内容搜索v2.0的规范可以作为PDF文档找到。有关更多详细信息,请访问Clarin FCS-技术详细信息页面。
有关更改的详细列表,请查看CHANGELOG.md 。
向后的兼容性使您作为中心搜索引擎维护者在您自己的方便下对新功能和功能的平滑偏好。
这些对Clarin-FCS的新添加不仅会在执行存储库中的查询时增强用户体验和可能性,而且经验不足的用户会发现更容易探索不同的语料库。
如果您使用KORP端点参考实现对搜索引擎有任何静止的API,则应作为起点。如果您更具体地使用KORP,则应该只是对Corpora和标签的简单改编。无论如何,不要忘记看测试。
要测试端点,您可以将IDS端点测试器(代码)指向您的端点。
还有一个端点开发人员的教程。
要构建FCS聚合器,您需要一些简单的步骤(如果您没有更改任何内容,请跳过步骤3):
./build.sh --npm./build.sh --jsx./build.sh --jar然后使用节点和maven构建前端(React)和后端(泽西式servlet)。
检查aggregator_devel.yml配置文件。如果要侧重加载ENPORT,只需在运行之前将端点添加到additionalCQLEndpoints或additionalFCSEndpoints :
./build.sh --run
您可能还需要分别在AGGREGATOR_FILE_PATH和AGGREGATOR_FILE_PATH_BACKUP中更改缓存文件的路径。
然后,您可以通过http:// localhost访问本地运行的聚合器:4019/
有关部署配置和有关设置的描述,请参见DEPLOYMENT.md 。