Pandas DataFrame
import pandas as pd
from obsei . source . pandas_source import PandasSource , PandasSourceConfig
# Initialize your Pandas DataFrame from your sources like csv, excel, sql etc
# In following example we are reading csv which have two columns title and text
csv_file = "https://raw.githubusercontent.com/deepset-ai/haystack/master/tutorials/small_generator_dataset.csv"
dataframe = pd . read_csv ( csv_file )
# initialize pandas sink config
sink_config = PandasSourceConfig (
dataframe = dataframe ,
include_columns = [ "score" ],
text_columns = [ "name" , "degree" ],
)
# initialize pandas sink
sink = PandasSource ()Nota: Para executar transformadores em um modo offline, verifique o modo offline dos Transformadores.
Alguns analisadores suportam a GPU e para utilizar o parâmetro de dispositivo Pass. Lista de valores possíveis do parâmetro do dispositivo (valor padrão automático ):
Folga from obsei . sink . slack_sink import SlackSink , SlackSinkConfig
# initialize slack sink config
sink_config = SlackSinkConfig (
# Provide slack bot/app token
# For more detail refer https://slack.com/intl/en-de/help/articles/215770388-Create-and-regenerate-API-tokens
slack_token = "<Slack_app_token>" ,
# To get channel id refer https://stackoverflow.com/questions/40940327/what-is-the-simplest-way-to-find-a-slack-team-id-and-a-channel-id
channel_id = "C01LRS6CT9Q"
)
# initialize slack sink
sink = SlackSink () | |||
Pandas DataFrame from pandas import DataFrame
from obsei . sink . pandas_sink import PandasSink , PandasSinkConfig
# initialize pandas sink config
sink_config = PandasSinkConfig (
dataframe = DataFrame ()
)
# initialize pandas sink
sink = PandasSink () | |||
| 2 | Observe as avaliações de aplicativos do Google Play Store, Texto de pré -processamento por meio de várias funções de limpeza de texto, analise -as executando a classificação de texto, informe -as para Pandas DataFrame e armazenar CSV resultante para o Google Drive | ||
| Playstore Reviews → Pré -processamento → Classificação → Pandas DataFrame → CSV no Google Drive | |||
| 3 | Observe as avaliações de aplicativos da Apple App Store, Texto de pré -processo por meio de várias funções de limpeza de texto, analise -as executando a classificação de texto, informe -as ao Pandas DataFrame e armazenam CSV resultante no Google Drive | ||
| Appstore Reviews → Pré -processamento → Classificação → Pandas DataFrame → CSV no Google Drive | |||
| 4 | Observe o artigo de notícias do Google News, Texto de pré -processamento por meio de várias funções de limpeza de texto, analise -as através da classificação de texto enquanto dividia o texto em pequenos pedaços e computando posterior inferência final usando a fórmula dada | ||
| Google News → Limpador de texto → Splitter de texto → Classificação → Agregação de inferência | |||
Para obter instruções detalhadas, usos e exemplos de instalação, consulte nossa documentação.
| Linux | Mac | Windows | Observação | |
|---|---|---|---|---|
| Testes | ✅ | ✅ | ✅ | Baixa cobertura como difícil de testar Libs de terceiros |
| Pip | ✅ | ✅ | ✅ | Totalmente suportado |
| CONDA | Não suportado |
Discussão sobre Obsei pode ser feita no Fórum Comunitário
Refere -se a lançamentos para changelogs
Para qualquer problema de segurança, entre em contato conosco por e -mail
Este projeto está sendo mantido pelas tecnologias ORAIKA. Lalit Pagaria e Girish Patel são mantenedores deste projeto.
Isso não poderia ter sido possível sem esses softwares de código aberto.
Primeiro, obrigado por considerar contribuir para este pacote, cada contribuição grande ou pequena é muito apreciada. Consulte nossa diretriz de contribuição e código de conduta.
Muito obrigado a todos os nossos colaboradores