topic modeling toolkit
v0.5.6
该图书馆旨在通过提供易于使用的CLI来自动化主题建模与研究相关的活动。
CLI提供了与以下操作相关的操作的命令
该项目的源代码已用于开发Konstantinos Lampridis的“政治谱系意识模型”论文项目中的新颖性模型。
如果您想重现论文中报告的实验结果,也应使用该代码。
该论文是阿姆斯特丹大学人工智能MSC计划的一部分。
您可以在此处下载并阅读完整的论文。
| 测试 | |
|---|---|
| 包裹 |
该库是BigArtm(Artm Python接口)库周围的更高级别的API,并通过命令行有意地公开了它。
库的主要特征:
$ git克隆https://github.com/boromir674/topic-modeling-toolkit.git $ chmod +x主题模型 - toolkit/build_artm.sh $#在 /usr /local中构建和安装bigartm库,并创建Python3 Wheel $ topic modeling-toolkit/build_artm.sh $ ls bigartm/build/python/bigartm*.whl
Python -M PIP安装bigartm/build/python/path-python-wheel
$ CD主题模型 - toolkit $ pip安装。
如果以上失败再次尝试,请包括手动安装依赖项
$ CD主题模型 - toolkit $ pip install -r要求.txt $ pip安装。
示例示例如下。
$ current_dir = $(echo $ pwd) $ export collections_dir = $ current_dir/dataSets-dir $ mkdir $ collections_dir $变换帖子pipeline.cfg my-dataset $ train my-dataset train.cfg plsa-model-保存 $ make-graphs-Model-Labels“ PLSA模型” -Allmetrics--No-Legend $ xdg-open $ collections_dir/plsa-model/graphs/plsa*prpl*