Pandas DataFrame
import pandas as pd
from obsei . source . pandas_source import PandasSource , PandasSourceConfig
# Initialize your Pandas DataFrame from your sources like csv, excel, sql etc
# In following example we are reading csv which have two columns title and text
csv_file = "https://raw.githubusercontent.com/deepset-ai/haystack/master/tutorials/small_generator_dataset.csv"
dataframe = pd . read_csv ( csv_file )
# initialize pandas sink config
sink_config = PandasSourceConfig (
dataframe = dataframe ,
include_columns = [ "score" ],
text_columns = [ "name" , "degree" ],
)
# initialize pandas sink
sink = PandasSource ()Примечание. Чтобы запустить трансформаторы в автономном режиме, проверьте режим трансформаторов в автономном режиме.
Некоторый анализатор поддерживает графический процессор и использовать параметр устройства Pass. Список возможных значений параметра устройства ( значение значения по умолчанию):
Пролечить from obsei . sink . slack_sink import SlackSink , SlackSinkConfig
# initialize slack sink config
sink_config = SlackSinkConfig (
# Provide slack bot/app token
# For more detail refer https://slack.com/intl/en-de/help/articles/215770388-Create-and-regenerate-API-tokens
slack_token = "<Slack_app_token>" ,
# To get channel id refer https://stackoverflow.com/questions/40940327/what-is-the-simplest-way-to-find-a-slack-team-id-and-a-channel-id
channel_id = "C01LRS6CT9Q"
)
# initialize slack sink
sink = SlackSink () | |||
Pandas DataFrame from pandas import DataFrame
from obsei . sink . pandas_sink import PandasSink , PandasSinkConfig
# initialize pandas sink config
sink_config = PandasSinkConfig (
dataframe = DataFrame ()
)
# initialize pandas sink
sink = PandasSink () | |||
| 2 | Наблюдайте за обзорами приложений из Google Play Store, Preprocess Text через различные функции очистки текста, анализируйте их, выполнив текстовую классификацию, сообщите об этом в Pandas DataFrame и сохраните результирующий CSV для Google Drive | ||
| Обзоры PlayStore → Предварительная обработка → классификация → DataFrame Pandas → CSV в Google Drive | |||
| 3 | Наблюдайте за обзорами приложений из Apple App Store, Preprocess Text с помощью различной функции очистки текста, проанализируйте их, выполняя текстовую классификацию, информируйте их о Pandas DataFrame и сохраните результирующий CSV для Google Drive | ||
| Обзоры AppStore → Предварительная обработка → классификация → DataFrame Pandas → CSV в Google Drive | |||
| 4 | Соблюдайте новостную статью из Google News, Prefrocess Text с помощью различной функции очистки текста, проанализируйте их с помощью классификации текста, разделяя текст в небольших кусках, а затем вычисляя окончательный вывод с использованием данной формулы | ||
| Google News → Text Cleaner → Text Splitter → Классификация → Агрегатор вывода | |||
Для получения подробных инструкций по установке, использования и примеров см. В нашу документацию.
| Linux | Маки | Окна | Примечание | |
|---|---|---|---|---|
| Тесты | ✅ | ✅ | ✅ | Низкое покрытие, как трудно проверить сторонние либера |
| Пип | ✅ | ✅ | ✅ | Полностью поддерживается |
| Конда | Не поддерживается |
Обсуждение об Obsei может быть сделано на форуме сообщества
Ссылайте релизы для изменений
Для любой проблемы безопасности, пожалуйста, свяжитесь с нами по электронной почте
Этот проект поддерживается Oraika Technologies. Лалит Пагария и Гириш Патель являются сопровождающими этого проекта.
Это не могло быть возможным без этих программ с открытым исходным кодом.
Во -первых, спасибо, что даже задумались о внесении вклад в этот пакет, каждый большой или маленький вклад очень ценится. Пожалуйста, обратитесь к нашему руководству о вкладе и Кодексе поведения.
Большое спасибо всем нашим участникам