يضم هذا المستودع حلتي لتحدي تطبيع النص من Google - اللغة الإنجليزية. يحدث معظم السحر داخل دليل المحول ، وهو المسؤول عن التحويلات الفعلية من المدخلات إلى الرموز المخرجات. إلى جانب الرمز عبارة عن ورقة مكتوبة بخصوص حلي. الملخص لهذه الورقة على النحو التالي:
تقترح هذه الورقة طريقة لحل ، وكذلك حل لمشكلة تطبيع النص إلى كلام ، والتي تركز على تحويل النص من التعبيرات المكتوبة إلى أشكال منطوقة. تقوم الطريقة بتوصيف الرموز المميزة من خلال نموذج شجرة القرار المعززة ، والذي يصنف الرمز المميز كواحد من 16 نوعًا مختلفًا من الرموز. ثم يتم تحويل الرمز المميز بناءً على نوع الرمز المميز المتوقع ، مما يؤدي إلى إخراج تطبيع النموذج المنطوق. عند إدخال مسابقة تطبيع النص إلى الكلام ذات الصلة ، حقق الحل دقة 99.590 ٪ ، ووضع المركز الثاني عشر من أصل 260 فريقًا ، أو ضمن أفضل 5 ٪ من جميع التقديمات.
من أجل تشغيل أي من ملفات Python ، يجب أن يحتوي مجلد data/raw على بيانات التدريب والاختبار الخام من المنافسة نفسها. نظرًا لشروط وأحكام المنافسة ، لا يمكن مشاركة هذه البيانات على هذا المستودع.
يعمل هذا المستودع كأرشيف ، وليس المقصود تحديثه.
أنا لا أتلقى مساهمات لهذا المستودع ، لأنه تم تصميمه كأرشيف.
تم ترخيص هذا المشروع بموجب ترخيص معهد ماساتشوستس للتكنولوجيا - راجع ملف الترخيص.