Pandas DataFrame
import pandas as pd
from obsei . source . pandas_source import PandasSource , PandasSourceConfig
# Initialize your Pandas DataFrame from your sources like csv, excel, sql etc
# In following example we are reading csv which have two columns title and text
csv_file = "https://raw.githubusercontent.com/deepset-ai/haystack/master/tutorials/small_generator_dataset.csv"
dataframe = pd . read_csv ( csv_file )
# initialize pandas sink config
sink_config = PandasSourceConfig (
dataframe = dataframe ,
include_columns = [ "score" ],
text_columns = [ "name" , "degree" ],
)
# initialize pandas sink
sink = PandasSource ()Nota: Para ejecutar transformadores en modo fuera de línea, verifique el modo de transformadores fuera de línea.
Algunos analizador admiten GPU y para utilizar el parámetro de dispositivo PASS. Lista de valores posibles del parámetro del dispositivo (valor predeterminado automático ):
Flojo from obsei . sink . slack_sink import SlackSink , SlackSinkConfig
# initialize slack sink config
sink_config = SlackSinkConfig (
# Provide slack bot/app token
# For more detail refer https://slack.com/intl/en-de/help/articles/215770388-Create-and-regenerate-API-tokens
slack_token = "<Slack_app_token>" ,
# To get channel id refer https://stackoverflow.com/questions/40940327/what-is-the-simplest-way-to-find-a-slack-team-id-and-a-channel-id
channel_id = "C01LRS6CT9Q"
)
# initialize slack sink
sink = SlackSink () | |||
Pandas DataFrame from pandas import DataFrame
from obsei . sink . pandas_sink import PandasSink , PandasSinkConfig
# initialize pandas sink config
sink_config = PandasSinkConfig (
dataframe = DataFrame ()
)
# initialize pandas sink
sink = PandasSink () | |||
| 2 | Observe las revisiones de aplicaciones de Google Play Store, el texto del preprocesamiento a través de varias funciones de limpieza de texto, analicelas realizando la clasificación de texto, informarles a Pandas DataFrame y almacenar CSV resultante a Google Drive | ||
| Revistas de PlayStore → Preprocesamiento → Clasificación → Pandas DataFrame → CSV en Google Drive | |||
| 3 | Observe las revisiones de aplicaciones de Apple App Store, texto de preprocesos a través de varias funciones de limpieza de texto, analizarlas realizando una clasificación de texto, informarles a Pandas DataFrame y almacenar CSV resultante a Google Drive | ||
| Revisiones de AppStore → Preprocesamiento → Clasificación → Pandas DataFrame → CSV en Google Drive | |||
| 4 | Observe el artículo de noticias de Google News, texto de preprocesamiento a través de varias funciones de limpieza de texto, analícelos mediante la realización de la clasificación de texto mientras divide el texto en pequeños trozos y luego calcula la inferencia final utilizando la fórmula dada | ||
| Google News → Cleaner de texto → divisor de texto → Clasificación → Agregador de inferencia | |||
Para obtener instrucciones de instalación detalladas, usos y ejemplos, consulte nuestra documentación.
| Linux | Impermeable | Windows | Observación | |
|---|---|---|---|---|
| Pruebas | ✅ | ✅ | ✅ | Baja cobertura como difícil de probar libres de terceros |
| PEPITA | ✅ | ✅ | ✅ | Totalmente compatible |
| Condición | No compatible |
La discusión sobre Obsei se puede hacer en el foro comunitario
Consulte lanzamientos para Changelogs
Para cualquier problema de seguridad, contáctenos por correo electrónico
Este proyecto está siendo mantenido por Oraika Technologies. Lalit Pagaria y Girish Patel son mantenedores de este proyecto.
Esto no podría haber sido posible sin estos softwares de código abierto.
En primer lugar, gracias por incluso considerar contribuir a este paquete, cada contribución grande o pequeña es muy apreciada. Consulte nuestra directriz de contribución y el código de conducta.
Muchas gracias a todos nuestros contribuyentes