Pandas dataframe
import pandas as pd
from obsei . source . pandas_source import PandasSource , PandasSourceConfig
# Initialize your Pandas DataFrame from your sources like csv, excel, sql etc
# In following example we are reading csv which have two columns title and text
csv_file = "https://raw.githubusercontent.com/deepset-ai/haystack/master/tutorials/small_generator_dataset.csv"
dataframe = pd . read_csv ( csv_file )
# initialize pandas sink config
sink_config = PandasSourceConfig (
dataframe = dataframe ,
include_columns = [ "score" ],
text_columns = [ "name" , "degree" ],
)
# initialize pandas sink
sink = PandasSource ()Remarque: Pour exécuter les transformateurs en mode hors ligne, vérifiez les transformateurs hors ligne.
Certains analyseurs prennent en charge le GPU et pour utiliser le paramètre de dispositif de passe. Liste des valeurs possibles du paramètre du périphérique (valeur par défaut automatique ):
Mou from obsei . sink . slack_sink import SlackSink , SlackSinkConfig
# initialize slack sink config
sink_config = SlackSinkConfig (
# Provide slack bot/app token
# For more detail refer https://slack.com/intl/en-de/help/articles/215770388-Create-and-regenerate-API-tokens
slack_token = "<Slack_app_token>" ,
# To get channel id refer https://stackoverflow.com/questions/40940327/what-is-the-simplest-way-to-find-a-slack-team-id-and-a-channel-id
channel_id = "C01LRS6CT9Q"
)
# initialize slack sink
sink = SlackSink () | |||
Pandas dataframe from pandas import DataFrame
from obsei . sink . pandas_sink import PandasSink , PandasSinkConfig
# initialize pandas sink config
sink_config = PandasSinkConfig (
dataframe = DataFrame ()
)
# initialize pandas sink
sink = PandasSink () | |||
| 2 | Observez les avis d'applications à partir de Google Play Store, du texte de prétraitement via diverses fonctions de nettoyage de texte, analysez-les en effectuant une classification de texte, informez-les de Pandas DataFrame et stockez CSV résultant à Google Drive | ||
| Playstore Reviews → Prétraitement → Classification → Pandas DataFrame → CSV dans Google Drive | |||
| 3 | Observez les avis sur les applications d'Apple App Store, le texte de prétraitement via diverses fonctions de nettoyage de texte, analysez-les en effectuant une classification de texte, informez-les à Pandas DataFrame et stockez CSV résultant à Google Drive | ||
| APPSTORE AVIS → PRÉMOISSANCE → Classification → Pandas DataFrame → CSV dans Google Drive | |||
| 4 | Observer l'article de presse de Google News, le texte prétraitement via diverses fonctions de nettoyage de texte, analysez-les en effectuant une classification de texte tout en divisant du texte en petits morceaux et en calculant ultérieurement l'inférence finale en utilisant la formule donnée | ||
| Google News → Nettoyer de texte → Splitter de texte → Classification → Aggréateur d'inférence | |||
Pour des instructions d'installation détaillées, des usages et des exemples, reportez-vous à notre documentation.
| Linux | Mac | Fenêtre | Remarque | |
|---|---|---|---|---|
| Tests | ✅ | ✅ | ✅ | Couverture faible comme difficile à tester les LIB tiers |
| PÉPIN | ✅ | ✅ | ✅ | Entièrement pris en charge |
| Conda | Non pris en charge |
La discussion sur Obsei peut être effectuée au Forum communautaire
Référer des versions pour Changelogs
Pour tout problème de sécurité, veuillez nous contacter par e-mail
Ce projet est maintenu par Oraika Technologies. Lalit Pagaria et Girish Patel sont des responsables de ce projet.
Cela n'aurait pas pu être possible sans ces logiciels open source.
Tout d'abord, merci d'avoir même envisagé de contribuer à ce package, chaque contribution grande ou petite est grandement appréciée. Veuillez référer nos directives de contribution et notre code de conduite.
Merci beaucoup à tous nos contributeurs