تنزيل php text analysis - تنزيل رمز مصدر php text analysis

php text analysis

شفرة المصدر الأخرى

Update Snowball Stemmer Library

تنزيل

تحليل php-text

تحليل نص PHP هو مكتبة لأداء مهام استرجاع المعلومات (IR) ومعالجة اللغة الطبيعية (NLP) باستخدام لغة PHP. هناك أدوات في هذه المكتبة يمكنها أداء:

تصنيف المستند
تحليل المشاعر
قارن الوثائق
تحليل التردد
الرمز المميز
تنبع
collocations مع معلومات متبادلة نقطة
التنوع المعجمي
تحليل الجسم
تلخيص النص

يمكن العثور على جميع وثائق هذا المشروع في الكتاب والويكي.

كتاب تحليل النص PHP و Wiki

كتاب في الأعمال ويحتاج مساهماتك. يمكنك العثور على الكتاب على https://github.com/yooper/php-text-analysis-book

أيضا ، توثق المكتبة في الويكي ، أيضا. https://github.com/yooper/php-text-analysis/wiki

تعليمات التثبيت

أضف تحليل نص PHP إلى مشروعك

 composer require yooper/php-text-analysis

الرمز المميز

 $ tokens = tokenize ( $ text );

يمكنك تخصيص أي نوع من الرمز المميز الذي يميزه من خلال المرور باسم فئة الرمز المميز

 $ tokens = tokenize ( $ text ,  TextAnalysis  Tokenizers PennTreeBankTokenizer::class);

الرمز المميز الافتراضي هو textanalysis tokenizers GeneralTokenizer :: Class . تتطلب بعض المميزات المعلمات التي سيتم تعيينها على مثيل.

تطبيع

بشكل افتراضي ، يستخدم Normalize_tokens الدالة strtoLower لصقل جميع الرموز. لتخصيص وظيفة تطبيع ، تمرير إما في دالة أو سلسلة لاستخدامها بواسطة Array_map.

 $ normalizedTokens = normalize_tokens (array $ tokens );

 $ normalizedTokens = normalize_tokens (array $ tokens , ' mb_strtolower ' );

$ normalizedTokens = normalize_tokens (array $ tokens , function ( $ token ){ return mb_strtoupper ( $ token ); });

توزيعات التردد

تُرجع المكالمة إلى FREQ_DIST مثيل Freqdist.

 $ freqDist = freq_dist ( tokenize ( $ text ));

جيل نغرام

بشكل افتراضي يتم إنشاء bigrams.

 $ bigrams = ngrams ( $ tokens );

تخصيص ngrams

 // create trigrams with a pipe delimiter in between each word
$ trigrams = ngrams ( $ tokens , 3 , ' | ' );

تنبع

بشكل افتراضي ، يستخدم STEM STEMMER Porter.

 $ stemmedTokens = stem ( $ tokens );

يمكنك تخصيص نوع STEMMER الذي يجب استخدامه عن طريق تمرير اسم فئة STEMMER

 $ stemmedTokens = stem ( $ tokens ,  TextAnalysis  Stemmers MorphStemmer::class);

خلاصة الكلمات الرئيسية مع أشعل النار

هناك طريقة مختصرة لاستخدام خوارزمية أشعل النار. ستحتاج إلى تنظيف بياناتك قبل الاستخدام. المعلمة الثانية هي حجم NGRAM من كلماتك الرئيسية لاستخراج.

 $ rake = rake ( $ tokens , 3 );
$ results = $ rake -> getKeywordScores ();

تحليل المشاعر مع Vader

تحتاج إلى تحليل المشاعر مع PHP استخدم Vader ، https://github.com/cjhutto/vadersentiment. يمكن استدعاء تطبيق PHP بسهولة. فقط قم بتطبيع بياناتك قبل اليد.

 $ sentimentScores = vader ( $ tokens );

تصنيف المستندات مع بايز الساذجة

تحتاج إلى القيام ببعض تصنيف المستندات مع PHP ، ومحاولة استخدام تطبيق Bayes الساذج. يمكن العثور على مثال على تصنيف مراجعات الأفلام في اختبارات الوحدة

 $ nb = naive_bayes ();
$ nb -> train ( ' mexican ' , tokenize ( ' taco nacho enchilada burrito ' ));        
$ nb -> train ( ' american ' , tokenize ( ' hamburger burger fries pop ' ));  
$ nb -> predict ( tokenize ( ' my favorite food is a burrito ' ));

يوسع

معلومات إضافية

الإصدار Update Snowball Stemmer Library
النوع شفرة المصدر الأخرى
وقت التحديث 2025-04-19
الحجم 854.18KB
من Github

تطبيقات ذات صلة

النص مع يسوع الصينية

2023-08-23
النص مع يسوع

2023-08-17
النص مع النسخة الصينية يسوع

2023-08-17
النص أو يموت

2023-07-03
RTE (محرر النص المنسق) ASP.NET

2011-05-25
PHP تبادل الارتباط النصي

2009-04-29

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل