Pandas DataFrame
import pandas as pd
from obsei . source . pandas_source import PandasSource , PandasSourceConfig
# Initialize your Pandas DataFrame from your sources like csv, excel, sql etc
# In following example we are reading csv which have two columns title and text
csv_file = "https://raw.githubusercontent.com/deepset-ai/haystack/master/tutorials/small_generator_dataset.csv"
dataframe = pd . read_csv ( csv_file )
# initialize pandas sink config
sink_config = PandasSourceConfig (
dataframe = dataframe ,
include_columns = [ "score" ],
text_columns = [ "name" , "degree" ],
)
# initialize pandas sink
sink = PandasSource ()Hinweis: Um Transformatoren in einem Offline -Modus auszuführen, überprüfen Sie den Offline -Modus von Transformatoren.
Einige Analysator unterstützen die GPU und verwenden den Parameter des Pass -Geräts . Liste der möglichen Werte des Geräteparameters (Standardwert Auto ):
Locker from obsei . sink . slack_sink import SlackSink , SlackSinkConfig
# initialize slack sink config
sink_config = SlackSinkConfig (
# Provide slack bot/app token
# For more detail refer https://slack.com/intl/en-de/help/articles/215770388-Create-and-regenerate-API-tokens
slack_token = "<Slack_app_token>" ,
# To get channel id refer https://stackoverflow.com/questions/40940327/what-is-the-simplest-way-to-find-a-slack-team-id-and-a-channel-id
channel_id = "C01LRS6CT9Q"
)
# initialize slack sink
sink = SlackSink () | |||
Pandas DataFrame from pandas import DataFrame
from obsei . sink . pandas_sink import PandasSink , PandasSinkConfig
# initialize pandas sink config
sink_config = PandasSinkConfig (
dataframe = DataFrame ()
)
# initialize pandas sink
sink = PandasSink () | |||
| 2 | Beobachten Sie die App -Bewertungen im Google Play Store, im Vorverarbeitungstext über verschiedene Textreinigungsfunktionen, analysieren Sie sie, indem Sie die Textklassifizierung durchführen, sie über Pandas DataFrame informieren und resultierende CSV auf Google Drive speichern | ||
| PlayStore -Bewertungen → Vorverarbeitung → Klassifizierung → Pandas DataFrame → CSV im Google Drive | |||
| 3 | Beobachten Sie die App -Bewertungen im Apple App Store, im Vorverarbeitungstext über verschiedene Textreinigungsfunktionen, analysieren Sie sie, indem Sie die Textklassifizierung durchführen, sie über Pandas DataFrame informieren und resultierende CSV an Google Drive speichern | ||
| AppStore -Bewertungen → Vorverarbeitung → Klassifizierung → Pandas DataFrame → CSV im Google Drive | |||
| 4 | Beobachten Sie den Nachrichtenartikel aus Google News, Vorab -Text über verschiedene Textreinigungsfunktionen, analysieren Sie sie durch die Ausführung der Textklassifizierung, während Sie Text in kleinen Stücken aufspalten und später die endgültige Inferenz mit der angegebenen Formel berechnen | ||
| Google News → Textreiniger → Textsplitter → Klassifizierung → Inferenz -Aggregator | |||
Ausführliche Anweisungen, Verwendungen und Beispiele für Installation finden Sie in unserer Dokumentation.
| Linux | MAC | Fenster | Bemerkung | |
|---|---|---|---|---|
| Tests | ✅ | ✅ | ✅ | Niedrige Deckung als schwierig zu testen 3. Partei -Bibliotheken |
| PIP | ✅ | ✅ | ✅ | Voll unterstützt |
| Conda | Nicht unterstützt |
Die Diskussion über OBSEI kann im Community Forum durchgeführt werden
Siehe Veröffentlichungen für Changelogs
Für jedes Sicherheitsproblem kontaktieren Sie uns bitte per E -Mail
Dieses Projekt wird von Oraika -Technologien aufrechterhalten. Lalit -Pagaria und Girish Patel sind Indenker dieses Projekts.
Dies hätte ohne diese Open -Source -Software nicht möglich sein können.
Zunächst einmal vielen Dank, dass Sie sogar überlegt haben, zu diesem Paket beizutragen. Jeder große oder kleine Beitrag wird sehr geschätzt. Weitere Informationen finden Sie in unserer Beitragsrichtlinie und unserem Verhaltenskodex.
Vielen Dank an alle unsere Mitwirkenden