NLP Knowledge Graph
1.0.0
إذا كنت بحاجة إلى المساهمة في هذا المشروع مفتوح المصدر ، فيرجى الاتصال بي.
استكشاف سلسلة الذكاء المعرفي --- الاتجاهات: 1. معرفة اندماج البيانات ؛ 2. الكل في LLM. بما في ذلك اكتساب المعرفة ، وبناء قاعدة المعرفة ، وسلسلة من الأبحاث التقنية وتطبيق أنظمة الأسئلة والأجوبة على أساس قاعدة المعرفة. أنه يتضمن التقنيات والأوراق المتطورة في مجال NLP.
NLP-Progress
مستودع لتتبع التقدم المحرز في معالجة اللغة الطبيعية (NLP) ، بما في ذلك مجموعات البيانات والحالة الحديثة الحالية لمهام NLP الأكثر شيوعًا.
PAPERSWITHCODE
يتم توفير الأوراق والرموز.
التكنولوجيا على الانترنت
التكنولوجيا اليومية الشخصية ومواقع الدردشة.
| رقم سري | شرط |
|---|---|
| 1 | لماذا يعود "الرسم البياني المعرفة" إلى عام 1956؟ |
| رقم سري | اسم | درجة | يكتب | مجال |
|---|---|---|---|---|
| 1 | ACL | الفئة أ | المؤتمر الأكاديمي | منظمة العفو الدولية |
| 2 | CVPR | الفئة أ | المؤتمر الأكاديمي | منظمة العفو الدولية |
| 3 | ICML | الفئة أ | المؤتمر الأكاديمي | منظمة العفو الدولية |
| 4 | ijcai | الفئة أ | المؤتمر الأكاديمي | منظمة العفو الدولية |
| 5 | emnlp | الفئة ب | المؤتمر الأكاديمي | منظمة العفو الدولية |
| 6 | cikm | الفئة ب | المؤتمر الأكاديمي | قاعدة البيانات/استخراج البيانات/استرجاع المحتوى |
| 7 | aaai | الفئة أ | المؤتمر الأكاديمي | منظمة العفو الدولية |
| 8 | SIGKDD | الفئة أ | المؤتمر الأكاديمي | قاعدة البيانات/استخراج البيانات/استرجاع المحتوى |
| 9 | TKDE | الفئة أ | المجلات الأكاديمية | (قاعدة البيانات/استخراج البيانات/استرجاع المحتوى) |
| 10 | سيجير | الفئة أ | المؤتمر الأكاديمي | قاعدة البيانات/استخراج البيانات/استرجاع المحتوى |
| رقم سري | اسم | عنوان |
|---|---|---|
| 1 | QuestionAnsweringSystem | QuestionAnsweringsystem هو نظام أسئلة وأجوبة من الحاسبات البشرية التي يتم تنفيذها من Java والتي يمكنها تلقائيًا تحليل الأسئلة وإعطاء إجابات للمرشحين. |
| 2 | qabassonmedicaknowledgegraph | من نقطة الصفر ، نقوم ببناء رسم بياني معرفة مجال طبية يركز على المرض ، ونستخدم هذا الرسم البياني المعرفة لإكمال خدمات الأسئلة والأجوبة التلقائية والتحليل. بيثون |
| 3 | ديبافلوف | مكتبة مفتوحة المصدر للتعلم العميق أنظمة الحوار من طرف إلى طرف ودردشة chatbots. بيثون |
| رقم سري | اسم |
|---|---|
| 1 | منصة Tencent Wenzhi الصينية الدلالية |
| 2 | Iflytek تفتح منصة الدلالية |
| 3 | منصة Bosen الصينية الدلالات المفتوحة |
| 4 | سحابة معهد هاربين للتكنولوجيا |
| رقم سري | اسم | الوظائف الرئيسية |
|---|---|---|
| 1 | ثولاك | أداة التحليل المعجمية الصينية ، تدعم C ++/Java/Python بواسطة Tsinghua |
| 2 | LTP | منصة تكنولوجيا اللغة Pylyp LTP Python Packaging من قبل معهد هاربين للتكنولوجيا |
| 3 | هانلب | دعم جافا |
| 4 | STUTTER النعت | Word الصينية النعت (Word فقط النعت النعت) ، Java ، Python ، C ++ |
| 5 | جياجو | يوفر وظائف معالجة اللغة الطبيعية الشائعة مثل تجزئة الكلمات الصينية ، وشرح توضيح جزء من الكلام ، والتعرف على كيان التسمية ، واستخراج الكلمات الرئيسية ، وملخص النص ، واكتشاف الكلمات الجديد. بيثون |
| 6 | Fudannlp | النعت النعت الكلمة الصينية (كلمة النعت ، شرح توضيحي جزء من الكلام ، التعرف على الكيان التسمية) ، يدعم Java |
| 7 | عميق عميق | أداة استخراج المعرفة مفتوحة المصادر بجامعة ستانفورد (استخراج ثلاثية) ، تدعم بيثون |
| 8 | Fudandnn-NLP3.0 | يستخدم في تجزئة الكلمات الصينية ، والاعتراف بالتسمية ، وشرح الجزأ ، وتصنيف الجملة ، والتحليل الدلالي ، والوصول إلى قاعدة المعرفة ، ومسألة الحوار والإجابة ، ويدعم Java ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| 9 | ستانفورد كوريند | علامة جزئية متعددة اللغات من الكلام ، معرف كيان تسمية ، محلل (الجملة والبنية النحوية) ، الهضم المرجعي (أي ، مسألة تحديد عبارة الاسم التي تشير إليها الضمير في الفصل) ، ومحلل المشاعر ، ومتعلم الوضع المرشدين ، ومستصن المعلومات المفتوحة ، |
| رقم سري | اسم | الوظائف الرئيسية |
|---|---|---|
| 1 | neo4j | قاعدة بيانات الرسم البياني مفتوح المصدر تم تطويرها بواسطة Java. |
| 2 | OrientDB | قاعدة بيانات NOSQL مفتوحة المصدر التي يمكنها التعامل مع المستندات والرسومات ومكونات قاعدة البيانات التقليدية. كتبها جافا ، تخزين سريع. |
| 3 | Virtuoso | يدعم استعلامات RDF و Sparql. |
| 4 | تيتان | يمكن دمجها مع Gremlin/HBase لتمكين معالجة بيانات التخزين الموزعة وحساب بيانات الرسم البياني. |
| 5 | Apache Jena-idb | تشغيل RDF تحت جافا. من بينها ، يستخدم TDB المتجر الثلاثي لتوفير متجر ثابت لبيانات RDF. TDB أسرع وقابل للتطوير من RDB و SDB. |
| 6 | Cypher | لغة استعلام الرسم البياني التصريحي ، والتعبير عن قاعدة بيانات الاستعلام الفعالة وتحديث قاعدة بيانات الرسم البياني. |
| 7 | شبح | لغة تدفق البيانات الوظيفية تتيح للمستخدمين التعبير عن اجتياز أو الاستعلام عن الرسوم البيانية للممتلكات المعقدة بطريقة موجزة. |
| 8 | Sparql | تم تطوير لغة الاستعلام وبروتوكول الحصول على البيانات لـ RDF. |
| 9 | rdflib | يدعم محلل ومسلسل مكتوب على أساس Python و RDF/XML و N3 و Ntriples و N-Quads و Turtle و Trix و RDFA و Microdata ، SPARQL 1.1. |
| رقم سري | اسم | الوظائف الرئيسية |
|---|---|---|
| 1 | Echarts | أداة Baidu Open Source ، وتغليف API الكامل ، والبسيط وسهل الاستخدام ، وسهلة الاستخدام ، ولكن لا تدعم معالجة الأحداث. |
| 2 | cytoscape.js | بالنسبة للرسومات والشبكة ، فإن التفاعل بين الأحداث جيد وسهل الاستخدام. |
| 3 | D3.JS | عتبة الاستخدام عالية ، لكنها تدعم معالجات الأحداث. يحتوي D3 على النفقات العامة الصغيرة للغاية ، ويدعم السلوك الديناميكي لمجموعات البيانات الكبيرة والرسوم المتحركة التفاعلية ، ويدعم الرسومات الغنية. |
| رقم سري | اسم | مهام التطبيق |
|---|---|---|
| 1 | Openkg | فتح الرسم البياني المعرفة |
| 2 | CN-Probase | خريطة المفهوم الصينية على نطاق واسع |
| 3 | srentibridge | قاعدة المعرفة العاطفية الكيان الصيني ، تصور كيف يصف الناس كيانًا ، بما في ذلك الأخبار والسياحة والتموين ، ما مجموعه 300000 زوج |
| 4 | الرسم البياني المعرفة الموسيقية | الرسم البياني للموسيقى الصينية والمعرفة والمطربين والأغاني والمعلومات الأخرى |
| 5 | شخصية المعرفة RDF | معرفة الشخصية التي تم جمعها من موقع الموسوعة ، ما مجموعه 650،000 ثلاث مرات RDF |
| 6 | الرسم البياني المعرفة لمناطق الجذب السياحي الصينية | خريطة المعرفة الصينية لمناطق الجذب السياحية الصينية هي جزء من خريطة المعرفة Casia-KB. مستخرجة من موسوعة Baidu والموسوعة التفاعلية. يمكن استخدام خريطة المعرفة لمناطق الجذب السياحي في الجغرافيا والحياة والترفيه والتطبيقات الأخرى. |
| 7 | 2 مليون بيانات صورة منتج | هذه البيانات هي ملخص لبيانات صورة المنتج التي يتراكمها Bai Dan في السنوات السبع من التشغيل. قام Bai Dan ببناء نظام تصنيف للتجارة الإلكترونية الغنية ونظام تصنيف الوسائط. |
| 8 | بنك الأعراض الصينية | هذه مجموعة بيانات تحتوي على كيانات الأعراض والتوائم المتعلقة بالأعراض. تأتي البيانات من قاعدة بيانات الأعراض الصينية من 8 مواقع استشارية صينية ، و 3 مواقع مواقع موسوعة صينية وسجلات طبية إلكترونية. |
| 9 | الرسم البياني معرفة مطار Cnschema | يمكن أن يقوم الرسم البياني المعرفة في المطار القائم على CNSChema بالاستعلام عن خصائص المطارات في جميع أنحاء العالم ، بما في ذلك الاسم والمنطقة الزمنية ورمز المطار والموقع الجغرافي (خط العرض وخط الطول) ، إلخ. |
| 10 | الرسم البياني للمعرفة العامة من سبع أحرف | تحتوي هذه البيانات على ما مجموعه 80 مليون موسوعة ثلاثية ، والتي تعد جزءًا من المجموعة الفرعية من قصائد الأحرف المكونة من سبع أحرف ، وستظل أكثر انفتاحًا في المستقبل. Qiluo-7lore هو رسم بياني للمعرفة الموسوعة التي تم إنشاؤها بعناية بواسطة تقنية عشب الكلاب. إنها مجموعة من المعرفة الهائلة في العالم البشري. أنه يحتوي على أشياء ، حقائق ، مفاهيم ، قواعد ، إلخ. |
<strong> بالنسبة لهيكل البيانات النصية ، بالإضافة إلى استخدام طرق التعلم الآلي ، يمكن أيضًا استخدام التعبيرات العادية لاستخراج البيانات ، وروابط المعالجة الوسيطة في النمذجة ، وما إلى ذلك: على سبيل المثال: التعبير العادي مع التعلم العميق </strong>