محتويات
Homer عبارة عن حزمة Python يمكن أن تساعد في جعل نصك أكثر وضوحًا وبسيطة ومفيدة للقارئ. يوفر معلومات عن نص إجمالي وكذلك على الفقرات الفردية. إنه يعطي نظرة ثاقبة على قابلية القراءة ، وطول الفقرات ، وطول الجمل ، ومتوسط الجمل في الفقرة ، والكلمات المتوسطة في الجملة ، وما إلى ذلك. كما أنه يحاول تحديد نوع معين من الكلمات الغامضة. كما أنه يتتبع تواتر "و" الكلمات في النص. (مزيد من المعلومات حول كل هذه يلي في قسم الإقرار.)
نشأت حزمة البرامج هذه من حاجة شخصية. بما أنني لست متحدثًا باللغة الإنجليزية ، لكنني مهتم بالكتابة ، لقد صممت وأستخدم Homer لتحسين كتابتي. آمل أن يجدها الآخرون مفيدًا.
يرجى ملاحظة أن هذا ليس دليلًا صارمًا للتحكم في كتاباتك. على الأقل ، أنا لا أستخدمها بهذه الطريقة. أستخدمه كدليل لجعل كتابتي بسيطة قدر الإمكان. أسعى جاهداً لكتابة فقرات وجمل موجزة وكذلك استخدام عدد أقل من الكلمات غير الواضحة ، وقد ساعدني هوميروس.
لقد استخدمتها فقط لتحليل مدوناتي ومقالاتها وليس مجموعة النص الكبيرة. نظرًا لأن هذا البرنامج جديد ، يمكنك اكتشاف الأخطاء جيدًا ، وفي هذه الحالة ، لا تتردد في فتح المشكلات/عمليات السحب.
يمكنك استخدام Homer كحزمة مستقلة أو على سطر الأوامر. إذا قمت بتشغيله على سطر الأوامر ، فيمكنك الحصول على إحصائيات عامة على مقالتك أو مقالك وكذلك إحصائيات الفقرة.
يدير Homer من سطر الأوامر رؤى التالية حول المقالة/المقال:
تشير إحصائيات الفقرة إلى المعلومات التالية لكل فقرة:
لقد بنيت هذا على بيثون 3.4.5. لذلك أولاً نحتاج إلى تثبيت Python.
على Mac ، استخدمت Homebrew لتثبيت Python على سبيل المثال يمكن للمرء استخدام هذا الأمر:
للتثبيت على Windows ، يمكنك تنزيل المثبت من هنا. بمجرد تنزيل هذا ، يمكن تشغيل هذا المثبت لإكمال تثبيت Python.
بالنسبة لأوبونتو ، قد تجد هذا المورد مفيدًا.
حان الوقت الآن لإنشاء بيئة افتراضية (على افتراض أنك استنساخ الرمز ضمن ~/code/homer).
يقوم السطر الأول في المقتطف أعلاه بإنشاء بيئة افتراضية تسمى VenV ضمن ~/Code/Homer. ينشط الأمر الثاني البيئة الافتراضية.
في حال كنت بحاجة إلى مزيد من المساعدة في إنشاء بيئة افتراضية يمكن أن يكون هذا المورد مفيدًا.
التثبيت باستخدام PIP:
~ /code/homer $ pip install homer-textوهذا كل شيء. يجب أن تثبيت كل شيء ، أي المكتبات المطلوبة ، وحزم NLTK و homer_text نفسها.
قبل استخدامه لأول مرة ، تأكد من أن لديك جميع ملفات قاموس NLTK:
import nltk
nltk . download ( 'punkt' )
nltk . download ( 'cmudict' )
nltk . download ( 'stopwords' )تم توفير أداة سطر الأوامر ، تحت دليل هوميروس. فيما يلي مثال يوضح كيفية استخدامه:
> python homer_cmd.py --name article_name --author lalala --file_path=/correct/path/to/file.txtكلاهما -name و -مؤلف اختياري في حين أن file_path إلزامي.
يمكنك أيضًا استخدام هوميروس في الكود الخاص بك. هنا مثال:
# file: analyse.py
import sys
from homer . analyzer import Article
from homer . cmdline_printer import ArticlePrinter
article = Article ( 'Article name' , 'Author' , open ( sys . argv [ 1 ]). read ())
ap = ArticlePrinter ( article )
ap . print_article_stats ()
ap . print_paragraph_stats ()استخدمه مثل هذا:
> python analyse.py text_to_analyse.mdيمكن إجراء الاختبارات من دليل الاختبارات.
مؤلف:
المساهمين:
ستيفن بينكر ذا إحساس الأسلوب: دليل شخص التفكير للكتابة في القرن الحادي والعشرين. أعطاني هذا الكتاب بعض الأفكار. كما دفعني إلى تضمين تتبع الكلمات الغامضة ، والهيدات المعقدة والمكثفة.
Bankspeak:
تقارير البنك الدولي ، 1946-2012: https://litlab.stanford.edu/literarylabpamphlet9.pdf. هذا المصدر أعطاني أيضًا بعض الأفكار. تم أخذ فكرة تتبع "و" والكلمات الغامضة في النص من هنا.
- "و" التردد: في الأساس هو عدد المرات التي يتم فيها استخدام الكلمة "و" في النص (معطى كنسبة مئوية من النص الكلي). أحاول الاحتفاظ بها أقل من 3 ٪.
- الكلمات الغامضة هي قائمة بالكلمات التي قمت بتجميعها بعد قراءة التقرير أعلاه. إن استخدام هذه الكلمات دون داع ، أو دون منحها السياق المناسب ، يمكن أن يجعل النص أكثر تجريدًا. هذه هي كلمات مثل _ _ القيمة العادلة ، المحفظة ، التقييم ، الاستراتيجية ، القدرة التنافسية ، الإصلاح ، النمو ، القدرة ، التقدم ، الاستقرار ، الحماية ، الوصول ، المستدام ، إلخ ، اي.
طلبات السحب موضع ترحيب. للتغييرات الرئيسية ، يرجى فتح مشكلة أولاً لمناقشة ما تريد تغييره.
يرجى التأكد من تحديث الاختبارات حسب الاقتضاء. أيضًا ، أضف اسمك ضمن قسم المؤلفين في ملف ReadMe.
معهد ماساتشوستس للتكنولوجيا