topic modeling toolkit
v0.5.6
該圖書館旨在通過提供易於使用的CLI來自動化主題建模與研究相關的活動。
CLI提供了與以下操作相關的操作的命令
該項目的源代碼已用於開發Konstantinos Lampridis的“政治譜系意識模型”論文項目中的新穎性模型。
如果您想重現論文中報告的實驗結果,也應使用該代碼。
該論文是阿姆斯特丹大學人工智能MSC計劃的一部分。
您可以在此處下載並閱讀完整的論文。
| 測試 | |
|---|---|
| 包裹 |
該庫是BigArtm(Artm Python接口)庫周圍的更高級別的API,並通過命令行有意地公開了它。
庫的主要特徵:
$ git克隆https://github.com/boromir674/topic-modeling-toolkit.git $ chmod +x主題模型 - toolkit/build_artm.sh $#在 /usr /local中構建和安裝bigartm庫,並創建Python3 Wheel $ topic modeling-toolkit/build_artm.sh $ ls bigartm/build/python/bigartm*.whl
Python -M PIP安裝bigartm/build/python/path-python-wheel
$ CD主題模型 - toolkit $ pip安裝。
如果以上失敗再次嘗試,請包括手動安裝依賴項
$ CD主題模型 - toolkit $ pip install -r要求.txt $ pip安裝。
示例示例如下。
$ current_dir = $(echo $ pwd) $ export collections_dir = $ current_dir/dataSets-dir $ mkdir $ collections_dir $變換帖子pipeline.cfg my-dataset $ train my-dataset train.cfg plsa-model-保存 $ make-graphs-Model-Labels“ PLSA模型” -Allmetrics--No-Legend $ xdg-open $ collections_dir/plsa-model/graphs/plsa*prpl*