text_cleanerダウンロードtext_cleanerソースコードのダウンロード

text_cleaner

AI ソースコード

1.0.0

ダウンロード

自然言語処理によるテキストクリーニング

？進行中

自然言語処理（NLP）を使用したPythonライブラリを使用して、テキストを簡単かつ迅速にクリーニングします。

Automaticalyはテキストをトークン化し、句読点と特殊文字を削除し、ケースを正規化し、さまざまな言語でストップワードを削除し、単語を盗みました...このシンプルでありながらカスタマイズ可能なライブラリを使用します。

使用法

インストール：

pipインストールpytext_cleaner

例：

 from pytext_cleaner import TextCleaner

cleaner = TextCleaner()
cleaner.settings = ['rm_punctuation', 'rm_numeric', 'lowerize']
cleaner.lang_setting = ['italian', 'french']
clean_text = cleaner.clean_text(string_to_clean)

カスタマイズ

デフォルト設定： ['rm_punctuation', 'rm_numeric', 'lowerize', 'rm_stopwords']

利用可能な設定は次のとおりです。

rm_punctuation
rm_numeric
低くします
rm_stopwords
stem_words
rm_long_words

デフォルトの言語設定： ['english']

ストップワードを含める、または除外するには：

 cleaner.white_list = ['words', 'to', 'include']
cleaner.black_list = ['words', 'to', 'exclude']

返品タイプを変更します：

デフォルトでは、text_cleanerが変更された文字列を返します。

トークンのリストを返すには、tokenize = trueを追加します：

cleaner.clean_text(string_to_clean, tokenize=True)

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-09-02
サイズ 5.53KB
から Github

text_cleaner

自然言語処理によるテキストクリーニング

使用法

カスタマイズ

イエスとのテキストメッセージ

テキスト・オア・ダイ

ホームクリーナーホームクリーナー

賢いディスククリーナー

重複クリーナー

賢明なレジストリクリーナー

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express