download text_cleaner - text_cleaner download de código fonte

text_cleaner

Código-Fonte de IA

1.0.0

Baixar

Limpeza de texto com processamento de linguagem natural

? em andamento

Biblioteca Python usando o Processamento de Linguagem Natural (PNL) para limpar o texto de maneira fácil e rápida.

Tokenize automaticamente o texto, remova a pontuação e os caracteres especiais, normalize o gabinete, remova as palavras de parada em vários idiomas, as palavras do STEM ... com esta biblioteca simples e personalizável.

Uso

Instalar :

pip install pytext_cleaner

Exemplo :

 from pytext_cleaner import TextCleaner

cleaner = TextCleaner()
cleaner.settings = ['rm_punctuation', 'rm_numeric', 'lowerize']
cleaner.lang_setting = ['italian', 'french']
clean_text = cleaner.clean_text(string_to_clean)

Personalizar

Configurações padrão : ['rm_punctuation', 'rm_numeric', 'lowerize', 'rm_stopwords']

As configurações disponíveis são:

rm_punction
rm_numeric
abaixe
rm_stopwords
STEM_WORDS
rm_long_words

Configurações de idioma padrão : ['english']

Para incluir ou excluir palavras de parada :

 cleaner.white_list = ['words', 'to', 'include']
cleaner.black_list = ['words', 'to', 'exclude']

Alterar o tipo de retorno :

Por padrão, text_cleaner retorna uma string modificada.

Para retornar da lista de tokens, adicione tokenize = true:

cleaner.clean_text(string_to_clean, tokenize=True)

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-02
tamanho 5.53KB
Vindo de Github

Aplicativos Relacionados

Texto com Jesus

2023-08-17
Texto ou Morra

2023-07-03
Limpador Doméstico Limpador Doméstico

2023-06-05
Limpador de disco sábio

2009-06-22
Limpador Duplicado

2009-06-03
Limpador de registro sábio

2009-05-30

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos