obsei
v0.0.15 ?
Pandas DataFrame
import pandas as pd
from obsei . source . pandas_source import PandasSource , PandasSourceConfig
# Initialize your Pandas DataFrame from your sources like csv, excel, sql etc
# In following example we are reading csv which have two columns title and text
csv_file = "https://raw.githubusercontent.com/deepset-ai/haystack/master/tutorials/small_generator_dataset.csv"
dataframe = pd . read_csv ( csv_file )
# initialize pandas sink config
sink_config = PandasSourceConfig (
dataframe = dataframe ,
include_columns = [ "score" ],
text_columns = [ "name" , "degree" ],
)
# initialize pandas sink
sink = PandasSource ()注意:要在离线模式下运行变压器,请检查变形金刚离线模式。
一些分析仪支持GPU并利用Pass设备参数。设备参数的可能值列表(默认值自动):
松弛 from obsei . sink . slack_sink import SlackSink , SlackSinkConfig
# initialize slack sink config
sink_config = SlackSinkConfig (
# Provide slack bot/app token
# For more detail refer https://slack.com/intl/en-de/help/articles/215770388-Create-and-regenerate-API-tokens
slack_token = "<Slack_app_token>" ,
# To get channel id refer https://stackoverflow.com/questions/40940327/what-is-the-simplest-way-to-find-a-slack-team-id-and-a-channel-id
channel_id = "C01LRS6CT9Q"
)
# initialize slack sink
sink = SlackSink () | |||
Pandas DataFrame from pandas import DataFrame
from obsei . sink . pandas_sink import PandasSink , PandasSinkConfig
# initialize pandas sink config
sink_config = PandasSinkConfig (
dataframe = DataFrame ()
)
# initialize pandas sink
sink = PandasSink () | |||
| 2 | 观察Google Play商店的应用程序评论,通过各种文本清洁功能进行预处理文本,通过执行文本分类来分析它们,告知他们到Pandas DataFrame,并将结果CSV存储到Google Drive | ||
| PlayStore评论→预处理→分类→PANDAS DataFrame→Google Drive中的CSV | |||
| 3 | 观察Apple App Store的应用程序评论,通过各种文本清洁功能进行预处理文本,通过执行文本分类来分析它们,告知它们到Pandas DataFrame,并将结果CSV存储到Google Drive | ||
| AppStore评论→预处理→分类→PANDAS DataFrame→Google Drive中的CSV | |||
| 4 | 观察Google新闻的新闻文章,通过各种文本清洁功能进行预处理文本,通过执行文本分类分析,同时将文本分类分为小块,然后使用给定公式计算最终推断 | ||
| Google新闻→文本清洁器→文本分离器→分类→推理聚合器 | |||
有关详细的安装说明,用法和示例,请参阅我们的文档。
| Linux | 苹果 | 视窗 | 评论 | |
|---|---|---|---|---|
| 测试 | ✅ | ✅ | ✅ | 低覆盖范围很难测试第三方libs |
| pip | ✅ | ✅ | ✅ | 完全支持 |
| 康达 | 不支持 |
关于Obsei的讨论可以在社区论坛上进行
参考版本的版本
有关任何安全问题,请通过电子邮件与我们联系
该项目由Oraika Technologies维护。 Lalit Pagaria和Girish Patel是该项目的维护者。
没有这些开源软件,这是不可能的。
首先,感谢您甚至考虑为此包裹做出贡献,大小的每一个贡献都非常感谢。请参考我们的贡献指南和行为准则。
非常感谢我们所有的贡献者