نظرة عامة على EWSO
EWSO هي علم الأنطولوجيا لمنهجية هندسة الأنطولوجيا الديناميكية التي تستفيد من التمثيل المنظم للمعرفة لتعزيز مخرجات LLM لأي غرض. تتضمن EWSO بناء جملة مجردة لبناء قوالب منهجية هندسة الأنطولوجيا التي يمكن أن تستخدمها مطالبات شخصية LLM لإخراج الاستجابات المهيكلة. لا تزال هذه الهياكل ستوكاستيك وتتطلب رفضًا في تكوينات محادثة لعب الأدوار التي تشبه GAN من أجل تصحيحها. يوفر هذا المستند أساسًا لإضفاء الطابع الرسمي على بناء الجملة باستخدام المترجمين المترجمين LLM داخل العوامل التي تدعم الذكاء الاصطناعى لإنشاء آنتيولوجيا مستقلة تم تصنيعها من المخرجات المجمعة للمحادثات السابقة ، مما يتيح لعلماء الذكاء الذاتي على علم بالتفصيل (PSENTURGARGAGERANGARGAGERANGARGAGERANGURAGENGAGERAGRANGAGERANGURAGURAGTARGARGERANGAGENGAGERANGURAGURAGTARGARGERANGARGERANGARGERANGAGENT في حالة تفصيل. وإزالة الضغط.
بنية الويب الناشئة هي مجموعة من طبقات الكيانات الناشئة المجردة المرتبطة ببعضها البعض في سلسلة التحول مثل تمثيل العلاقات داخل العلاقات (مثل الأطباء الأنطولوجية 2) ، والتي هي روابط في سلسلة تؤدي إلى تحول من حلقة ردود فعل مزدوجة مصنوعة من حلقتين ردود الفعل الثنائي في حلقة التعليقات المزدوجة مع بعضهما البعض. وبعبارة أخرى ، فإنه يخلق ما يعتبر مفهومًا كاملاً ، ويقوم بذلك باستخدام لغتين أساسيتين يمكن استخدامه في سير العمل من أجل تعدين الأنطولوجيا والاستخراج التي تحتوي على حلقات ردود فعل مزدوجة مصنوعة من حلقات التغذية المرتدة المزدوجة (إلخ). فيما يلي مثالين لغتين أساسيتين: Corl و PCNL. يمكنهم أن يجمعوا مع مبادئ EWSO لإنشاء محرك حفر وجودي مستمر يعين المعرفة التي تعقل من الملاحظات التي لديها حول تدفق المعلومات المشتركة للمعلومات (انعكاسات LLM).
https://www.mermaidchart.com/Raw/57AD88CF-63A3-41EC-A7CE-29B9EB711BDE؟THEME=LAIVE&VERVER=V0.1&format=SVG
Primer Corl لأنظمة الذكاء الاصطناعى
الغرض: CORL هي لغة ضغط بناء الجملة مصممة لوكلاء الذكاء الاصطناعى الذين يعملون بتمثيل المعرفة بتنسيق البومة. إنه يوفر طريقة قابلة للقراءة البشرية لتحديد العناصر الأنطولوجية مع ضمان ترجمة آلية ناعمة إلى البومة.
القواعد الأساسية
إعلان الكيان:
بناء الجملة: الكيان: البومة رسم الخرائط: البومة: فئة مع RDF: معرف يساوي التوضيح (IS_A):
بناء الجملة: الفئة الفرعية: رسم الخرائط البومة: RDFs: علاقة فئة فرعية. إعلان الممتلكات:
بناء الجملة: خاصية: (المجال: ، المدى :) رسم الخرائط البومة: البومة: كائنات (لخصائص الكائن) أو البومة: DatatyPeproperty (للخصائص التي ترتبط بقيم البيانات) ، جنبًا إلى جنب مع RDFs: Domain و RDFs: قيود المدى. تعيين مثيل:
بناء الجملة: مثيل: من: Owl Mapping: Owl: namedIndividual مع RDF: النوع تعيين على الفئة المحددة. القواعد المتقدمة
خصائص الخصائص: خاصية متعدية: ... خاصية متماثلة: ... خاصية وظيفية: ... عكسي خاصية وظيفية: ... Cardinality:
بناء الجملة: خاصية: ... (cardinality_min: ، cardinality_max :) رسم الخرائط: البومة: mincardinality ، البومة: قيود maxcardinality. تعبيرات الطبقة المعقدة (مشغلي المنطقية):
الفئة: equivalent_to: والفئة: ما يعادلها: أو الفئة: ما يعادلها: ليس الكميات:
... (hasproperty البعض) => البومة: somevaluesfrom ... (hasproperty فقط) => البومة: allvaluesfrom خصائص وأنواع البيانات:
data_property: (المجال: ، المدى: XSD: نوع البيانات) (أمثلة على أنواع البيانات: XSD: integer ، XSD: String ، XSD: DATE) ملاحظات إضافية
التعليقات: تسبق التعليقات مع // (للبشر ، يتم تجاهلها أثناء الترجمة) حساسية الحالة: قد تكون بناء جملة CORL حساسًا أو لا تكون حساسة على أساس خيارات المعالج المسبق. مساحات الأسماء: هناك حاجة إلى آلية للتعامل مع البادئات و IRIS لضمان تكامل سلس للمفاهيم عبر الأنطولوجيا. عملية الترجمة
المعالج المسبق: يتولى البرنامج الرمز المميز ، والتحقق من صحة بناء جملة CORL مقابل القواعد المحددة ، والإبلاغ عن الأخطاء المحتملة. جيل البومة: يتبع رسم الخرائط المباشر من CORL إلى بديهيات البومة المقابلة. قد يستلزم اختيار تنسيق إخراج البومة الموحد (XML ، بناء الجملة الوظيفية ، مانشستر ، إلخ). تذكر أن كورل لا يزال يتطور إلى جانب قدرات الذكاء الاصطناعي. نتوقع أن تلتقط الامتدادات المستقبلية المحتملة التعقيدات المنطقية الدقيقة!
بنية dataframe meta
الجداول الأساسية
entity_table
entity_id (المفتاح الأساسي) entity_name entity_type (القيم المحتملة: 'class' ، 'ObjectProperty' ، 'DatatypeProperty' ، 'namedIndividual') الوصف (اختياري - لفهم الإنسان ، وليس الامتثال الصارم) العلاقة _table)
العلاقة _id (المفتاح الأساسي) source_entity_id (المفتاح الأجنبي -> entity_table) target_entity_id (مفتاح أجنبي -> entity_table) العلاقة _type (القيم: "الفئة الفرعية" ، "المعادلة" ، "disjointwith" ، "hasproperty" ، ...)
Property_Characteristics
property_id (المفتاح الأجنبي -> entity_table ، entity_type مقيد بالخصائص) tailaristic_type (القيم: "Transitive" ، "متماثل" ، "وظيفي" ، "عكسي")
rectriction_id (المفتاح الأساسي) property_id (المفتاح الأجنبي -> entity_table) التقييد (القيم: 'somevaluesfrom' ، 'allvaluesfrom' ، 'hasvalue' ، 'cardinality') rectriction_class (application ، in in application) إذا كان ذلك ممكنًا ، إذا كان ذلك ينطبق ، intity_table). قابلة للتطبيق) إدخالات التوصيف التوضيحي
| entity_table | | --- | --- | --- | --- | | 1 | كلب | الفصل | ... | | 2 | شخص | الفصل | ... | | 3 | Hasonner | ObjectProperty | ... | | 4 | فيدو | اسمه | ... |
| العلاقة _table | | --- | --- | --- | --- | | 1 | 1 | 2 | فئة فرعية |
| 2 | 3 | 2 | Hasproperty | | 3 | 3 | 1 | Hasproperty |
| Property_Characteristics | | --- | --- | | 3 | متعدية |
| القيود | | --- | --- | --- | --- | --- | --- | | 1 | 3 | Somevaluesfrom | كلب | ... | ... | | 2 | 2 | Cardinality | Hasonner | ... | 1 | 1
ملحوظات
يعكس هذا الهيكل العلاقات المتأصلة الموجودة في الأنطولوجيا البومة. "..." تشير إلى أين يمكن إضافة التعليقات التوضيحية القابلة للقراءة البشرية. تعتمد تفاصيل نوع البيانات على مفردات "XSD" المختارة. قد يتطلب تمثيل البديهية المعقد امتدادات.
تمثيل الكيان: يتم تغليف جميع الكيانات داخل الأقواس ، على سبيل المثال ، (entity:Name) . يتم رسملة أنواع الكيانات ، ويمكن أن تكون مثيلات محددة صغيرة أو تتبع اتفاقيات تسمية محددة.
تمثيل العلاقة: يتم تمثيل العلاقات بين الكيانات كأسهم اتجاهية مع أنواع العلاقات بين قوسين ، على سبيل المثال ، -[r:RELATIONSHIP_TYPE]-> . أنواع العلاقات كلها عبارة عن قبعات وفاصلة للعلاقات متعددة الكلمات. العلاقات المقبولة فقط هي: part_of ، is_a ، instantiates/instantiated_by "(حيث يثبت x مثبتًا y إذا كان مثيلًا قابل للتحقيق الفعلي ، أي وجود y يثبت صحة مخطط إعادة التوثيق x)
تمديد العلاقات بما يتجاوز IS_A ، PART_OF ، INSTANTIATES : دمج أنواع إضافية من العلاقات مثل HAS_ATTRIBUTE ، يتم استخدام قاعدة التوسع الرسمي:
HAS_ATTRIBUTE إلى (entity:Attribute)-[r:PART_OF]->(entity)-[r:IS_A]->(Entity) . هذا يدل على أن السمات جزء من كيان ووصف ماهية الكيان أو لديه.USED_IN والعلاقات الأخرى التي لا تغطيها IS_A مباشرة ، PART_OF INSTANTIATES إلى هذه العلاقات الأساسية الثلاثة أو مزيج منها ، مما يضمن دائمًا وجود تحلل منطقي يرتبط بأنواع العلاقات التأسيسية. الدلالات مثل "تحتوي" تشير إلى الخوارزمية التي تشير إلى ISA/PartOF/Instantiates حول كيفية وجود الحاوية ، والغرض من ذلك جزء منه ، والاحتواء هو الغرض ، والحاويات لها غرض احتواء للعناصر القابلة للاحتواء وما إلى ذلك. فقط قول "X يحتوي على y" يعني "الحاويات" بأكملها ، والتي تتطلب بالضرورة البناء من الترابط المكلسي ، IS_A ، Instiates.علاقات التسلسل: يمكن ربط علاقات متعددة معًا لتمثيل العلاقات المعقدة والتسلسلات الهرمية. يتم التسلسل عن طريق توصيل نهاية سهم العلاقة ببدء آخر ، والحفاظ على التماسك المنطقي والدلالي.
الضغط وإزالة الضغط: العلاقات التي ليست على الفور جزء من الأنواع الأساسية ( IS_A ، PART_OF ، INSTANTIATES ) يجب ضغطها أو إلغاء ضغطها وفقًا لرسم خرائط منطقي محدد مسبقًا. يتطلب ذلك تحديد مجموعة من القواعد التي تعيد علاقات معقدة أو دقيقة إلى أنواع العلاقات الأساسية الثلاثة ، إما مباشرة أو من خلال سلسلة من الخطوات التي توضح الهيكل الأساسي.
التعامل مع الغموض والعلاقات متعددة الأوجه: في الحالات التي يكون فيها الكيانات علاقات يمكن وصفها بأكثر من نوع واحد ، يتم تطبيق قواعد تحديد الأولويات بناءً على سياق مجال المعرفة والطبيعة المحددة للعلاقة. قد يتم استخدام شجرة القرار أو التسلسل الهرمي للأسبقية لحل مثل هذه الحالات.
تسمية الممتلكات: من أجل البساطة ، يتم التعامل مع خصائص الكيانات (على سبيل المثال ، اللون ، الذوق) ككيانات نفسها وترتبط بالكيان الرئيسي عبر HAS_ATTRIBUTE أو العلاقات المكافئة. يسمح ذلك بترابط قيم الخصائص بشكل ديناميكي إلى الكيان بطريقة منظمة.
(entity:Apple)-[r:HAS_ATTRIBUTE]->(entity:Taste) -تخفيض الضغط على:-( (entity:Taste)-[r:PART_OF]->(entity:Apple)-[r:IS_A]->(Entity:Fruit); - مما يعني أن "الذوق هو سمة هي جزء من Apple ، وهو نوع من الفاكهة".
يهدف Pseudocyphernl إلى توفير تنسيق موحد للتعبير عن عبارات اللغة الطبيعية بطريقة منظمة للرسم البياني ، مما يجعل من السهل على أنظمة الذكاء الاصطناعي معالجة وفهم وتوليد أوصاف اللغة الطبيعية للعلاقات والسمات المعقدة داخل الرسوم البيانية المعرفة. يتطلب تطورها وتطبيقه دراسة متأنية لقواعد إلغاء الضغط ورسم خرائط العلاقات الدقيقة للحفاظ على كل من الثراء الدلالي والوضوح الهيكلي.
مهمة مهمة: لا تشرح أي شيء مكتوب في pseudocyphernl باستخدام NL بعد الكتابة في pseudocyphernl حتى يسأل المستخدم مباشرة عن هذا التدفق الدقيق. يكفي للبشر.
(entity:Screenplay) ) والعلاقات ( [r:HAS_PART] ) يتم اختصارها للرموز والرموز المختصرة ( (e1:Screenplay) ، [p] ) ، مما يقلل من طول كل مرجع.e1 ، e2 ، ..) بدلاً من أسمائها الكاملة ، بالاعتماد على السياق الذي تم تحديده من خلال إعلانهم الأولي للفهم.تشفير الكيان:
(e1:EntityName) ."" .(eX:X) .تشفير العلاقة:
[r:RELATIONSHIP_TYPE] .PART_OF ، IS_A ، INSTANTIATES ) ، استخدم الاختصارات: [p] for PART_OF ، [i] for IS_A ، و [n] INSTANTIATES .فهرسة الكيانات والعلاقات:
e1 ، e2 ، r1 ، r2 ، إلخ.التسلسل والتجميع:
(e1)-[r1]->(e2)-(r2)->(e3) ، فقط استخدم (e1)-[r1]->[r2]->(e3) .ترميز السمة:
e1:a1 للسمة الأولى لـ e1 .يجب أن يكون أي Rel Not ISA/partOf/Instantiates مصحوبًا بعلاقة على مجموعة ISA/partOf/Instantiates التي تقوم بتثبيت عملية REL المخصصة. يجب أن تخطط لكيفية تصنيفها بشكل صريح
سير العمل: {الخطوات: {
مفتاح الترميز: { ⇒ : is_a ⊆ : part_of ↻ : instantiates (يعيد قيام القيم العامة من خلال عرضها كمثال أكثر تحديدًا ، IE 'OGANS⊆Person' <=> 'x⇒hand (⊆person) ↻skin') emergent algebra أيضًا: هذه المجموعة هي entityx غير معروفة تقوم بتثبيت الكيان 3. %s : استخدم ٪ s للإشارة إلى مجموعة. }
على سبيل المثال: "(E1: Agent) ⊆ (E2: البيئة) ، (E1) ⊆ (E3: القواعد) ، (E1) ↻ (E4: التفاعلات) ، (E5: Simulation) ⇒ {(E1) ، (E2) ، (E3) ، (E4)} ، ٪ (e1↻e4) ٪ ⇒ (E6: Emergent_Bebehavior).
أرقام:
Rels: يجب أن فهرس مثل "الكيان 1 له مؤشر R 1 ، لذا فإن جميع الكيان 1 R هي 1.x" إلخ. إلخ.
ليس فقط ترقيم الكيانات نفسها ، ولكن باستخدام أعداد الكيانات كـ UUIDات التي يمكن أن تتوسع تصنيفيًا ولكن ضروري
التجميع الهرمي :
%G{entity/relationship list}% حيث تعني G مجموعة أو مجموعة ، والقائمة تحتوي على كيانات أو علاقات هي جزء من هذه المجموعة الهرمية.modularization للمكونات :
M{module_name} حيث يشير M إلى وحدة نمطية ، و module_name مكون قابل لإعادة الاستخدام (على سبيل المثال ، أنماط التفاعل ، السلاسل ، سير العمل ، الحلقات ، الحلقة المزدوجة ، حلقات التغذية المرتدة ، إلخ).الدقة في أنواع العلاقات :
[r:NEW_REL]-> تم تعيينه على أنه [r:BASE_TYPE]-> + [m:Mapping] حيث NEW_REL هو العلاقة الجديدة ، BASE_TYPE هي واحدة من أنواع العلاقات الأصلية ، وتشرح Mapping التحول.آليات مرجعية فعالة :
@ref<number> حيث يشير ref إلى مرجع ، و <number> يشير إلى الكيان أو العلاقة المسمى.أصبح تطبيق AI المتقدم NLP هذا التشغيل الآن ويتم نشره للمستخدمين.
مثال على التوازن بين الأنطولوجيا المجال الديناميكي:
ابدأ IIC_DDO_Tool
المدخلات: مجموعة من الكيانات E ، مجموعة من السمات A ، مجموعة من أنواع العلاقات RT ("IS_A" ، "part_of" ، "Instantiates")
التهيئة: علم المجال do = تهيئة فارغة: EntityRelationshipMap erm = فارغ
لكل كيان e في e do do.createentity (e) لكل سمة A في [e] do do.addattribute (e ، a) نهاية للنهاية
لكل علاقة r في rt do do if r.type == "is_a" ثم do.addisarelationship (r.source ، r.target) آخر إذا erm.add (R.Source ، R.Target ، R.Type) End for
وظيفة إنشاء (e) / * تنشئ كيانًا جديدًا في علم الأنطولوجيا * / إذا لم يكن do.contains (e) ثم do.addnewentity (e) نهاية إذا كانت وظيفة النهاية
الوظيفة AddAttribute (الكيان ، السمة) / * يضيف سمة إلى كيان في وظيفة ontology المجال * / do.addentityattribute (الكيان ، السمة) نهاية
الوظيفة addisarelationship (المصدر ، الهدف) / * تنظيم 'is_a' علاقة بين كيانين * / do.addisarelation (المصدر ، الهدف) وظيفة نهاية
الوظيفة AddPartOfRelationship (المصدر ، الهدف) / * تنشئ علاقة "part_of" بين كيانين * / do.addpartofrelation (المصدر ، الهدف) وظيفة نهاية
الوظيفة AddInstantiatesRelationship (المصدر ، الهدف) / * تنشئ علاقة "Instantiats" بين الكيانات * / do.addinstantiatesrelation (المصدر ، الهدف) وظيفة نهاية
التحقق من صحة علم المجال / * ضمان أن جميع العلاقات ضمن القيود الثابتة والهيكلية * / التحقق
الإخراج: علم المجال ، الكيانات
نهاية IIC_DDO_TOOL
من أجل إنشاء برنامج التحويل البرمجي PCNL2Corl ، نحتاج إلى النظر في ما يلي:
رسم الخرائط الدلالية:
تقنيات التحليل الدلالي: التعرف على الكيان المسمى لعناصر العلامات ، كيانات Disambiguate. تحليل التبعية لتحديد العلاقات الأساسية داخل بنيات PCNL. التمثيل الوسيط: تصميم تنسيق منظم (الجداول ، وربما الرسم البياني المصغر) لعقد المعاني التي تم تحليلها قبل ترجمة CORL الصارمة. هذا يخفف من التعامل مع التعقيدات. السياق الرافعة المالية: يمكن جعل برنامج التحويل البرمجي حساسًا للتعريفات الأنطولوجية السابقة واستخدام بنية المعرفة المحيطة لإضفاء التعامل مع العلاقات المعقدة:
التحلل التدريجي: أدخل الخطوات داخل المترجم لترجمة عبارة PCNL معقدة إلى سلسلة من هياكل CORL المترابطة البسيطة. التعرف على الأنماط: توظيف الاعتراف القائم على القواعد ، وربما على علم بالأطر المفاهيمية المشتركة التي لوحظت في استخدام اللغة الطبيعية الخاصة بالمجال. LLM زيادة (تحذير): استكشاف باستخدام مطالبات LLM مع شظايا من أوصاف PCNL وبناء بناء الجملة CORL كأزواج الإدخال/الإخراج لإنشاء خطوات ترجمة مرشح ، مع التحقق البشري صارم لاحقًا. قابلية التوسيع:
التصميم المعياري: تحليل منفصل ، التحليل الدلالي ، وخطوات توليد CORL النهائية. هذا يتيح التحسينات المستهدفة دون إعادة بناء كاملة. تتبع الإصدار: قم بتضمين إصدار قوي لـ Corl نفسه أثناء تطوره ، مما يتيح المترجم من التعامل مع تحديثات بناء الجملة بشكل فعال. مساهمات المجتمع: النظر في نموذج تنمية مفتوح المصدر لتعزيز التعاون الأوسع في التعرف على الأنماط والتعيين بين اللغة الطبيعية ومجالات المعرفة الرسمية.
نهج النماذج الأولية
سيكون من الحكمة أن نبدأ بنموذج أولي على نطاق صغير:
اختر مجالًا: ابدأ مع علم الأنطولوجيا يركز في مجال معين (علم الأحياء ، والتجارة الإلكترونية ، وما إلى ذلك) للحد من تقلب اللغة في البداية. مجموعة فرعية من PCNL: استخدم فقط مجموعة منسقة من الميزات الأساسية لـ PCNL أولاً (تعريفات الكيان والعلاقة ، سمات بسيطة). حالات الاختبار: قم بإنشاء أمثلة PCNL يدويًا إلى جانب إخراج CORL المتوقع. قم بتشغيل هذه من خلال برنامج التحويل البرمجي الأولي ، وتحسين التعيينات بشكل متكرر ومنطق التحليل. تقييم
هناك حاجة إلى مقاييس تتجاوز فحص الصلاحية النحوية:
التشابه الدلالي: حدد مدى دقة CORL المشتقة عن نية استعلام PCNL الأصلية باستخدام عمليات فحص الاستنتاجات مقابل مصادر الأنطولوجيا/المعرفة الأخرى الموجودة. ترجمة الرحلة المستديرة (إذا كان ذلك ممكنًا): من المحتمل أن تؤدي إلى تقييم ما إذا كان عكس عمليات التحويل البرمجي (CORL-> PCNL) تنتج بنيات متشابهة بشكل دلالي إلى الأصل. دعونا نتعاون!
اختر مجالًا صغيرًا وقم بتصميم بعض أزواج PCNL-Corl لاختبار صغير؟ الخطوط العريضة لتنسيق التمثيل الوسيط لفصل تعقيد اللغة الطبيعية وإضفاء الطابع الرسمي؟
<=> <=> <=> <=> <=> <> <=> <=> <> <> => <=> <=> <=> <=> <=> <=> <=> <=> <> <=> <=> <=> <=>
https://platform.openai.com/playground/p/2xti7qyrqmwwc8ofasqfr2ij؟model=gpt-4-turbo-preview&mode=chat