تنزيل rat sql - تنزيل رمز المصدر rat sql

rat sql

شفرة المصدر الأخرى

1.0.0

تنزيل

الفئران SQL

يحتوي هذا المستودع على رمز لورقة ACL 2020 "RAT-SQL: مخطط العلاقة الوعرة الذي يربط وربط لمحللات النص إلى SQL".

إذا كنت تستخدم RAT-SQL في عملك ، فيرجى الاستشهاد به على النحو التالي:

 @inproceedings { rat-sql ,
    title = " {RAT-SQL}: Relation-Aware Schema Encoding and Linking for Text-to-{SQL} Parsers " ,
    author = " Wang, Bailin and Shin, Richard and Liu, Xiaodong and Polozov, Oleksandr and Richardson, Matthew " ,
    booktitle = " Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics " ,
    month = jul,
    year = " 2020 " ,
    address = " Online " ,
    publisher = " Association for Computational Linguistics " ,
    pages = " 7567--7578 "
}

Changelog

2020-08-14:

ترث صورة Docker الآن من صورة قاعدة CUDA.
متطلبات الذاكرة ومجموعة البيانات الموضحة على الصورة.
تم إصلاح المشكلة التي لم يتم تحويل معرفات الرمز المميز إلى معرفات كلمة لربط قيمة BERT.

الاستخدام

الخطوة 1: قم بتنزيل مجموعات بيانات وتبعيات الطرف الثالث

قم بتنزيل مجموعات البيانات: العنكبوت و Wikisql. في حالة العنكبوت ، تأكد من تنزيل إصدار 08/03/2020 أو الأحدث. قم بفك مجموعات البيانات في مكان ما خارج هذا المشروع لإنشاء بنية الدليل التالية:

 /path/to/data
├── spider
│   ├── database
│   │   └── ...
│   ├── dev.json
│   ├── dev_gold.sql
│   ├── tables.json
│   ├── train_gold.sql
│   ├── train_others.json
│   └── train_spider.json
└── wikisql
    ├── dev.db
    ├── dev.jsonl
    ├── dev.tables.jsonl
    ├── test.db
    ├── test.jsonl
    ├── test.tables.jsonl
    ├── train.db
    ├── train.jsonl
    └── train.tables.jsonl

للعمل مع مجموعة بيانات WikisQL ، استنساخ البرامج النصية للتقييم في هذا المشروع:

mkdir -p third_party
git clone https://github.com/salesforce/WikiSQL third_party/wikisql

الخطوة 2: بناء وتشغيل صورة Docker

لقد قدمنا Dockerfile الذي يضع البيئة بأكملها لك. يفترض أنك تقوم بتنزيل مجموعات البيانات في الخطوة 1 كمعدل /mnt/data في صورة قيد التشغيل. وبالتالي ، فإن إعداد البيئة لـ RAT-SQL هو:

docker build -t ratsql .
docker run --rm -m4g -v /path/to/data:/mnt/data -it ratsql

لاحظ أن الصورة تتطلب ما لا يقل عن 4 جيجابايت من ذاكرة الوصول العشوائي لتشغيل المعالجة المسبقة. افتراضيًا ، Docker Desktop لـ Mac و Docker Desktop لنظام التشغيل Windows يعمل مع 2 غيغابايت من ذاكرة الوصول العشوائي. مفتاح -m4g يتجاوزه ؛ بدلاً من ذلك ، يمكنك زيادة الحد الافتراضي في إعدادات سطح المكتب Docker.

إذا كنت تفضل إعداد قاعدة الشفرة وتشغيلها بدون Docker ، فاتبع الخطوات في Dockerfile واحدة تلو الأخرى. لاحظ أن هذا المستودع يتطلب Python 3.7 أو أعلى و JVM لتشغيل Stanford Corenlp.

الخطوة 3: قم بتشغيل التجارب

كل تجربة لها ملف تكوين خاص به في experiments . خط أنابيب العمل مع أي إصدار نموذج أو مجموعة بيانات هو:

python run.py preprocess experiment_config_file  # Step 3a: preprocess the data
python run.py train experiment_config_file       # Step 3b: train a model
python run.py eval experiment_config_file        # Step 3b: evaluate the results

استخدم ملفات تكوين التجربة التالية لإعادة إنتاج نتائجنا:

العنكبوت ، الإصدار القفاز: experiments/spider-glove-run.jsonnet
العنكبوت ، إصدار BERT (يتطلب وحدة معالجة الرسومات مع ذاكرة 16 جيجابايت على الأقل): experiments/spider-bert-run.jsonnet
Wikisql ، إصدار القفازات: experiments/wikisql-glove-run.jsonnet

قد تختلف دقة النموذج الدقيق بنسبة ± 2 ٪ اعتمادًا على بذرة عشوائية. انظر الورق للحصول على التفاصيل.

المساهمة

يرحب هذا المشروع بالمساهمات والاقتراحات. تطلب منك معظم المساهمات الموافقة على اتفاقية ترخيص المساهم (CLA) مع إعلان أن لديك الحق في ذلك في الواقع ، ويفعلنا في الواقع حقوق استخدام مساهمتك. لمزيد من التفاصيل ، تفضل بزيارة https://cla.opensource.microsoft.com.

عند إرسال طلب سحب ، سيحدد CLA Bot تلقائيًا ما إذا كنت بحاجة إلى توفير CLA وتزيين العلاقات العامة بشكل مناسب (على سبيل المثال ، فحص الحالة ، التعليق). ببساطة اتبع الإرشادات التي يقدمها الروبوت. ستحتاج فقط إلى القيام بذلك مرة واحدة عبر جميع عمليات إعادة الشراء باستخدام CLA لدينا.

اعتمد هذا المشروع رمز سلوك المصدر المفتوح Microsoft. لمزيد من المعلومات ، راجع مدونة الشهادة الأسئلة الشائعة أو الاتصال بـ [email protected] مع أي أسئلة أو تعليقات إضافية.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-04-15
الحجم 109.18KB
من Github

تطبيقات ذات صلة

فأر المختبر

2022-08-08
رئيس SQL الأول

2010-03-29
SQL الأصدقاء

2009-09-15
خادم SQL

2009-07-04
الدليل المرجعي لـ Microsoft Jet SQL

2009-05-31
إصدار Business Express SQL

2009-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل