تنزيل text_cleaner - تنزيل رمز المصدر text

text_cleaner

كود الذكاء الاصطناعي

1.0.0

تنزيل

تنظيف النص مع معالجة اللغة الطبيعية

؟ في تَقَدم

مكتبة Python باستخدام معالجة اللغة الطبيعية (NLP) لتنظيف النص بسهولة وبسرعة.

رمز الرمز المميز التلقائي ، قم بإزالة علامات الترقيم والأحرف الخاصة ، وتطبيع العلبة ، وإزالة الكلمات المتوقفة بلغات مختلفة ، والكلمات الجذعية ... مع هذه المكتبة البسيطة والقابلة للتخصيص.

الاستخدام

ثَبَّتَ :

PIP تثبيت pytext_cleaner

مثال :

 from pytext_cleaner import TextCleaner

cleaner = TextCleaner()
cleaner.settings = ['rm_punctuation', 'rm_numeric', 'lowerize']
cleaner.lang_setting = ['italian', 'french']
clean_text = cleaner.clean_text(string_to_clean)

تخصيص

الإعدادات الافتراضية : ['rm_punctuation', 'rm_numeric', 'lowerize', 'rm_stopwords']

الإعدادات المتاحة هي:

rm_punctuation
rm_numeric
خفض
rm_stopwords
STEM_Words
rm_long_words

إعدادات اللغة الافتراضية : ['english']

لتضمين أو استبعاد كلمات التوقف :

 cleaner.white_list = ['words', 'to', 'include']
cleaner.black_list = ['words', 'to', 'exclude']

تغيير نوع العودة :

بشكل افتراضي ، تُرجع text_cleaner سلسلة معدلة.

لإرجاع قائمة الرموز ، أضف tokenize = صحيح:

cleaner.clean_text(string_to_clean, tokenize=True)

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-02
الحجم 5.53KB
من Github

تطبيقات ذات صلة

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل

text_cleaner

تنظيف النص مع معالجة اللغة الطبيعية

الاستخدام

تخصيص

النص مع يسوع

النص أو يموت

منظف المنزل منظف المنزل

منظف القرص الحكيم

منظف مكرر

منظف التسجيل الحكيم

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express