الكشف عن اللغة الطبيعية للصدأ مع التركيز على البساطة والأداء.
جرب العرض التوضيحي عبر الإنترنت.
مثال:
use whatlang :: { detect , Lang , Script } ;
fn main ( ) {
let text = "Ĉu vi ne volas eklerni Esperanton? Bonvolu! Estas unu de la plej bonaj aferoj!" ;
let info = detect ( text ) . unwrap ( ) ;
assert_eq ! ( info.lang ( ) , Lang :: Epo ) ;
assert_eq ! ( info.script ( ) , Script :: Latin ) ;
assert_eq ! ( info.confidence ( ) , 1.0 ) ;
assert ! ( info.is_reliable ( ) ) ;
}لمزيد من التفاصيل (على سبيل المثال كيفية إدراج بعض اللغات) ، يرجى التحقق من الوثائق.
يتم استخدام Whatlang ضمن المشاريع الكبيرة التالية كاعتماد مباشر أو غير مباشر للتعرف على اللغة. ستكون في شركة رائعة باستخدام Whatlang:
| ميزة | وصف |
|---|---|
enum-map | Lang و Script تنفيذ سمة Enum من خريطة التعداد |
arbitrary | دعم التعسفي |
serde | ينفذ Serialize Deserialize Lang Script |
dev | تتيح الوحدة النمطية whatlang::dev التي توفر بعض واجهة برمجة التطبيقات الداخلية.إنه موجود لأغراض التنميط ويشجع المستخدمون العاديون على الاعتماد على واجهة برمجة التطبيقات هذه. |
تعتمد الخوارزمية على نماذج لغة Trigram ، وهي حالة معينة من n-grams. لفهم الفكرة ، يرجى التحقق من ورقة Cavnar و Trenkle '94 الأصلية: تصنيف النص المستند إلى N-Gram.
is_reliable ؟يعتمد على العوامل التالية:
rate في قاعدة الكود.لذلك ، يمكن تقديمها كمساحة ثنائية الأبعاد مع وظائف العتبة ، والتي تقسمها إلى مجالات "موثوقة" و "غير موثوقة". هذه الوظيفة عبارة
لمزيد من التفاصيل ، يرجى التحقق من مقالة مدونة في مكتبة Rust Whatlang وخوارزميات تحديد اللغة الطبيعية.
make bench - معايير الأداءmake doc - توليد وفتح مستندmake test - إجراء اختباراتmake watch - شاهد التغييرات وتشغيل الاختبارات | Whatlang | CLD2 | CLD3 | |
|---|---|---|---|
| لغة التنفيذ | الصدأ | C ++ | C ++ |
| اللغات | 68 | 83 | 107 |
| خوارزمية | trigrams | Quadgrams | الشبكة العصبية |
| الترميز المدعوم | UTF-8 | UTF-8 | ؟ |
| دعم HTML | لا | نعم | ؟ |
يمكنك دعم المشروع من خلال التبرع بالقرب من الرموز.
عنوان المحفظة القريب هو whatlang.near
Whatlang هو عمل مشتق من Franc (JavaScript ، MIT) من قبل Titus Wormer.
MIT © سيرجي بوتابوف