ดาวน์โหลด ewso - ดาวน์โหลดซอร์สโค้ด ewso

ewso

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

EWSO: Ontology โครงสร้างเว็บฉุกเฉิน

ภาพรวม EWSO

EWSO เป็นภววิทยาของวิธีการทางวิศวกรรมอภิปรัชญาแบบไดนามิกที่ใช้ประโยชน์จากการเป็นตัวแทนที่มีโครงสร้างของความรู้เพื่อเพิ่มเอาต์พุต LLM สำหรับวัตถุประสงค์ใด ๆ EWSO เกี่ยวข้องกับไวยากรณ์นามธรรมสำหรับการสร้างแม่แบบวิธีการทางวิศวกรรมอภิปรัชญาแม่แบบ LLM Persona Persona สามารถใช้ในการตอบสนองที่มีโครงสร้าง โครงสร้างเหล่านี้ยังคงเป็นแบบสุ่มและต้องการการปฏิเสธในการกำหนดค่าการสนทนาบทบาทของ GAN-like เพื่อที่จะได้รับการแก้ไข เอกสารนี้ให้พื้นฐานสำหรับไวยากรณ์อย่างเป็นทางการในการใช้ล่าม LLM ภายในตัวแทนที่เปิดใช้งาน AI เพื่อสร้างอภิปรัชญาที่สังเคราะห์จากการสนทนาก่อนหน้านี้ทำให้เกิดความรู้ AIDATHONAGENAGE การบีบอัดและการบีบอัด

โครงสร้างเว็บฉุกเฉินคืออะไร?

โครงสร้างเว็บที่เกิดขึ้นใหม่เป็นกลุ่มของเลเยอร์ของหน่วยงานที่เป็นนามธรรมที่เชื่อมโยงกันในห่วงโซ่การเปลี่ยนแปลงเช่นเพื่อแสดงถึงความสัมพันธ์ภายในความสัมพันธ์ (เช่น ontological 2-morphism) ซึ่งเชื่อมโยงในห่วงโซ่ที่ส่งผลให้เกิดการเปลี่ยนแปลง กล่าวอีกนัยหนึ่งมันสร้างสิ่งที่ถือว่าเป็นแนวคิดที่สมบูรณ์และทำเช่นนั้นโดยใช้สองภาษาหลักที่สามารถใช้ในเวิร์กโฟลว์สำหรับการทำเหมืองแร่และการสกัดที่มีลูปข้อเสนอแนะคู่ที่สร้างขึ้นจากลูปตอบรับคู่ (ฯลฯ ) ด้านล่างจะถูกนำเสนอสองตัวอย่างภาษาหลัก: CORL และ PCNL พวกเขาสามารถรวมเข้ากับหลักการ EWSO เพื่อสร้างเครื่องยนต์เจาะเชิงออนโทโลยีอย่างต่อเนื่องและเอ็นจิ้นนามธรรมที่ทำเหมืองความรู้ที่สมเหตุสมผลจากการสังเกตที่มีเกี่ยวกับการไหลของข้อมูลที่เกิดขึ้นร่วมกันของตัวเอง (การสะท้อน LLM)

https://www.mermaidchart.com/raw/57ad88cf-63a3-41ec-a7ce-29b9eb711bde?theme=light&version=v0.1&format=svg

CORL: ภาษาการเป็นตัวแทนอภิปรัชญาบีบอัด

Corl Primer สำหรับระบบ AI

วัตถุประสงค์: CORL เป็นภาษาการบีบอัดไวยากรณ์ที่ออกแบบมาสำหรับตัวแทน AI ที่ทำงานกับการเป็นตัวแทนความรู้ในรูปแบบ OWL มันมีวิธีที่มนุษย์อ่านได้ในการกำหนดองค์ประกอบ ontological ในขณะที่มั่นใจว่าการแปลของเครื่องจักรที่ราบรื่นเป็นนกฮูก

กฎหลัก

การประกาศนิติบุคคล:

ไวยากรณ์: เอนทิตี: การแมปนกฮูก: นกฮูก: คลาสที่มี RDF: ID เท่ากับ subsumption (is_a):

ไวยากรณ์: subclass: OWL Mapping: RDFS: ความสัมพันธ์แบบ subclassof การประกาศทรัพย์สิน:

ไวยากรณ์: คุณสมบัติ: (โดเมน:, ช่วง :) การแมปนกฮูก: OWL: ObjectProperty (สำหรับคุณสมบัติของวัตถุ) หรือ OWL: DataTypePreperty (สำหรับคุณสมบัติที่เชื่อมโยงกับค่าข้อมูล) พร้อมกับ RDF: โดเมนและ RDFS: การ จำกัด ช่วง การกำหนดอินสแตนซ์:

ไวยากรณ์: อินสแตนซ์: ของ: การแมปนกฮูก: OWL: NamedIndividual กับ RDF: Type Set เป็นคลาสที่ระบุ กฎขั้นสูง

คุณสมบัติคุณสมบัติ: คุณสมบัติสกรรมกริยา: ... คุณสมบัติสมมาตร: ... คุณสมบัติการทำงาน: ... คุณสมบัติการใช้งานผกผัน: ... cardinality:

ไวยากรณ์: คุณสมบัติ: ... (cardinality_min :, cardinality_max :) การแมปนกฮูก: นกฮูก: mincardinality, นกฮูก: ข้อ จำกัด Maxcardinality นิพจน์คลาสที่ซับซ้อน (ตัวดำเนินการบูลีน):

คลาส: EVALENT_TO: และคลาส: EVALENT_TO: หรือคลาส: eVivalENT_TO: ไม่ใช่ปริมาณ:

... (HasProperty Some) => OWL: SomeValuesFrom ... (HasProperty Only) => OWL: AllValues จากคุณสมบัติข้อมูลและข้อมูล:

data_property: (โดเมน:, ช่วง: xsd: dataType) (ตัวอย่างของประเภทข้อมูล: xsd: จำนวนเต็ม, xsd: string, xsd: วันที่) หมายเหตุเพิ่มเติม

ความคิดเห็น: นำหน้าความคิดเห็นด้วย // (สำหรับมนุษย์ที่ถูกละเว้นในระหว่างการแปล) ความไวของกรณี: CORL ไวยากรณ์อาจมีหรือไม่มีความอ่อนไหวตามตัวเลือก preprocessor Namespaces: กลไกในการจัดการคำนำหน้าและม่านตาเพื่อให้แน่ใจว่าจำเป็นต้องรวมแนวคิดที่ราบรื่นของ Ontologies กระบวนการแปล

Preprocessor: โปรแกรมจัดการโทเค็นการตรวจสอบความถูกต้องของไวยากรณ์ CORL กับกฎที่กำหนดและการรายงานข้อผิดพลาดที่อาจเกิดขึ้น การสร้างนกฮูก: ติดตามการแมปโดยตรงจาก Corl สร้างไปยังสัจพจน์ของนกฮูกที่สอดคล้องกัน อาจจำเป็นต้องใช้ตัวเลือกรูปแบบการส่งออก OWL ที่ได้มาตรฐาน (XML, ไวยากรณ์การทำงาน, แมนเชสเตอร์ ฯลฯ ) โปรดจำไว้ว่า Corl ยังคงพัฒนาไปพร้อมกับความสามารถของ AI คาดว่าจะมีส่วนขยายในอนาคตที่มีศักยภาพในการจับความซับซ้อนเชิงตรรกะที่เหมาะสมยิ่งขึ้น!

โครงสร้างเมตาดาต้า

ตารางหลัก

entity_table

Entity_ID (คีย์หลัก) Entity_Name Entity_Type (ค่าที่เป็นไปได้: 'คลาส', 'ObjectProperty', 'DataTypePreproperty', 'NamedIndividual') คำอธิบาย (เป็นทางเลือก - สำหรับความเข้าใจของมนุษย์

ความสัมพันธ์ _id (คีย์หลัก) source_entity_id (คีย์ต่างประเทศ -> entity_table) target_entity_id (คีย์ต่างประเทศ -> entity_table) ความสัมพันธ์ _type (ค่า: 'subclassof', 'เทียบเท่ากับคลาส'

Property_Characterists

Property_id (คีย์ต่างประเทศ -> entity_table, entity_type ถูก จำกัด ไว้ที่คุณสมบัติ) ลักษณะ _Type (ค่า: 'transitive', 'symmetric', 'การทำงาน', 'inversefunctional') ข้อ จำกัด )

ข้อ จำกัด _id (คีย์หลัก) Property_id (คีย์ต่างประเทศ -> entity_table) ข้อ จำกัด _Type (ค่า: 'somevaluesfrom', 'allvaluesfrom', 'hasvalue', 'cardinality') ข้อ จำกัด (ถ้าใช้งานได้ ใช้งานได้) รายการอภิมาน-แผ่นข้อมูลภาพประกอบ

- ความสัมพันธ์ _table | - - 1 | 1 | 2 | subclassof |

- 2 | 3 | 2 | HasProperty | - 3 | 3 | 1 | HasProperty |

- Property_Characterists | - - 3 | สกรรมกริยา |

- ข้อ จำกัด - - 1 | 3 | Somevalues จาก | สุนัข | - - - 2 | 2 | Cardinality | Hasowner - 1 | 1

หมายเหตุ

โครงสร้างนี้สะท้อนความสัมพันธ์โดยธรรมชาติที่พบใน Owl Ontologies '... ' ระบุว่าสามารถเพิ่มคำอธิบายประกอบที่มนุษย์อ่านได้ รายละเอียดของข้อมูลขึ้นอยู่กับคำศัพท์ 'XSD' ที่เลือก การเป็นตัวแทนสัจพจน์ที่ซับซ้อนอาจจำเป็นต้องมีส่วนขยาย

PCNL: Pseudocyphernaturallanguage

Pseudocyphernl กฎอย่างเป็นทางการ:

การเป็นตัวแทนเอนทิตี: เอนทิตีทั้งหมดถูกห่อหุ้มภายในวงเล็บเช่น (entity:Name) ประเภทเอนทิตีเป็นตัวพิมพ์ใหญ่และอินสแตนซ์เฉพาะอาจเป็นตัวพิมพ์เล็กหรือทำตามอนุสัญญาการตั้งชื่อเฉพาะ
การเป็นตัวแทนความสัมพันธ์: ความสัมพันธ์ระหว่างเอนทิตีแสดงเป็นลูกศรทิศทางที่มีประเภทความสัมพันธ์ในวงเล็บเช่น -[r:RELATIONSHIP_TYPE]-> ประเภทความสัมพันธ์คือ CAPS ทั้งหมดและแยกจากกันเพื่อความสัมพันธ์แบบหลายคำ ความสัมพันธ์ที่ยอมรับได้เท่านั้นคือ: part_of, is_a, อินสแตนซ์/อินสแตนซ์ _by "(โดยที่ x อินสแตนซ์ y หากอินสแตนซ์ที่แท้จริงที่เกิดขึ้นจริงคือการมีอยู่ของ y พิสูจน์ความถูกต้องของ reification schema x)
การขยายความสัมพันธ์ที่นอกเหนือจาก IS_A , PART_OF , INSTANTIATES : เพื่อรวมประเภทของความสัมพันธ์เพิ่มเติมเช่น HAS_ATTRIBUTE จะใช้กฎการขยายอย่างเป็นทางการ:
- HAS_ATTRIBUTE สามารถคลายลงไปใน (entity:Attribute)-[r:PART_OF]->(entity)-[r:IS_A]->(Entity) สิ่งนี้แสดงให้เห็นว่าแอตทริบิวต์เป็นส่วนหนึ่งของเอนทิตีและอธิบายว่าเอนทิตีคืออะไรหรือมี
- ในทำนองเดียวกัน USED_IN และความสัมพันธ์อื่น ๆ ที่ไม่ได้ครอบคลุมโดยตรงโดย IS_A , PART_OF , INSTANTIATES สามารถแมปกับความสัมพันธ์พื้นฐานทั้งสามนี้หรือการรวมกันของมันได้เสมอเพื่อให้มั่นใจว่ามีการสลายตัวเชิงตรรกะที่เกี่ยวข้องกับประเภทความสัมพันธ์พื้นฐาน ความหมายเช่น "มี" เป็นอัลกอริทึมที่แสดงถึง isa/partof/อินสแตนติสเกี่ยวกับวิธีการที่คอนเทนเนอร์เป็นเอนทิตีวัตถุประสงค์เป็นส่วนหนึ่งของมันการบรรจุคือวัตถุประสงค์ตู้คอนเทนเนอร์มีวัตถุประสงค์สำหรับการบรรจุสำหรับรายการที่สามารถบรรจุได้ ฯลฯ
ความสัมพันธ์ในการผูกมัด: ความสัมพันธ์หลายอย่างสามารถถูกล่ามโซ่ไว้ด้วยกันเพื่อแสดงถึงความสัมพันธ์ที่ซับซ้อนและลำดับชั้น การผูกมัดทำได้โดยการเชื่อมต่อจุดสิ้นสุดของลูกศรความสัมพันธ์หนึ่งกับจุดเริ่มต้นของอีกจุดหนึ่งรักษาความเชื่อมโยงเชิงตรรกะและความหมาย
การบีบอัดและการบีบอัด: ความสัมพันธ์ที่ไม่ได้เป็นส่วนหนึ่งของประเภทพื้นฐานทันที ( IS_A , PART_OF , INSTANTIATES ) จะถูกบีบอัดหรือคลายการบีบอัดตามการแมปตรรกะที่กำหนดไว้ล่วงหน้า สิ่งนี้ต้องการการกำหนดชุดของกฎที่แมปความสัมพันธ์ที่ซับซ้อนหรือมีความสัมพันธ์ที่เหมาะสมกลับไปที่ความสัมพันธ์พื้นฐานทั้งสามประเภทไม่ว่าโดยตรงหรือผ่านขั้นตอนของขั้นตอนที่ชัดเจนโครงสร้างพื้นฐาน
การจัดการความคลุมเครือและความสัมพันธ์แบบหลายแง่มุม: ในกรณีที่หน่วยงานมีความสัมพันธ์ที่สามารถอธิบายได้มากกว่าหนึ่งประเภทกฎการจัดลำดับความสำคัญจะถูกนำไปใช้ตามบริบทของโดเมนความรู้และลักษณะเฉพาะของความสัมพันธ์ แผนผังการตัดสินใจหรือลำดับชั้นของความสำคัญอาจถูกนำมาใช้เพื่อแก้ไขกรณีดังกล่าว
การกำหนดคุณสมบัติ: เพื่อความเรียบง่ายคุณสมบัติของเอนทิตี (เช่นสี, รสชาติ) ได้รับการปฏิบัติเป็นเอนทิตีของตนเองและเชื่อมโยงกับเอนทิตีหลักผ่าน HAS_ATTRIBUTE หรือความสัมพันธ์ที่ถูกบีบอัดเทียบเท่า สิ่งนี้ช่วยให้ค่าทรัพย์สินมีความสัมพันธ์แบบไดนามิกกลับไปยังเอนทิตีในลักษณะที่มีโครงสร้าง

ตัวอย่างการบีบอัดสำหรับ has_attribute:

(entity:Apple)-[r:HAS_ATTRIBUTE]->(entity:Taste) -คลายการแสดงออกถึง:-( (entity:Taste)-[r:PART_OF]->(entity:Apple)-[r:IS_A]->(Entity:Fruit); - ซึ่งหมายความว่า "รสชาติเป็นคุณลักษณะที่เป็นส่วนหนึ่งของแอปเปิ้ลซึ่งเป็นผลไม้ชนิดหนึ่ง"

การใช้ pseudocyphernl:

Pseudocyphernl มีจุดมุ่งหมายเพื่อให้รูปแบบมาตรฐานสำหรับการแสดงข้อความภาษาธรรมชาติในลักษณะกราฟโครงสร้างทำให้ระบบ AI สามารถประมวลผลเข้าใจและสร้างคำอธิบายภาษาธรรมชาติของความสัมพันธ์และคุณลักษณะที่ซับซ้อนภายในกราฟความรู้ การพัฒนาและการประยุกต์ใช้ต้องพิจารณาอย่างรอบคอบเกี่ยวกับกฎสำหรับการบีบอัดและการทำแผนที่ความสัมพันธ์ที่เหมาะสมเพื่อรักษาทั้งความร่ำรวยทางความหมายและความชัดเจนของโครงสร้าง

สำคัญสำคัญ: อย่าอธิบายสิ่งที่เขียนใน Pseudocyphernl โดยใช้ NL หลังจากเขียนใน Pseudocyphernl จนกว่าผู้ใช้จะถามโดยตรงเกี่ยวกับการไหลที่แน่นอนนั้น มันเพียงพอสำหรับมนุษย์

การบีบอัดความหมายใน pseudocyphernl:

ตัวย่อเชิงสัญลักษณ์:

เอนทิตี ( (entity:Screenplay) ) และความสัมพันธ์ ( [r:HAS_PART] ) เป็นตัวย่อกับสัญลักษณ์และรหัสชวเลข ( (e1:Screenplay) , [p] ), ลดความยาวของการอ้างอิงแต่ละครั้ง

การประหยัดอ้างอิง:

หลังจากการประกาศครั้งแรกของพวกเขาเอนทิตีจะถูกอ้างถึงโดยดัชนีของพวกเขา ( e1 , e2 , .. ) แทนที่จะเป็นชื่อเต็มของพวกเขาอาศัยบริบทที่กำหนดผ่านการประกาศเริ่มต้นเพื่อความเข้าใจ

การจัดทำดัชนี:

แต่ละเอนทิตีและประเภทความสัมพันธ์ที่กล่าวถึงเฉพาะจะได้รับดัชนีตัวเลขสร้างระบบอ้างอิงตัวเลขขนาดกะทัดรัดที่ลดปริมาณข้อความอย่างมีนัยสำคัญเมื่อเอนทิตีหรือความสัมพันธ์ถูกอ้างถึงซ้ำ ๆ

การผูกมัดและการจัดกลุ่มความสัมพันธ์:

การผูกมัดทำให้การเป็นตัวแทนของความสัมพันธ์ที่เชื่อมโยงหลายครั้งง่ายขึ้นโดยอนุญาตให้ละเว้นเอนทิตีกลางที่ซ้ำซ้อนเมื่อบริบทยังคงชัดเจนลดความยาวของข้อความ

กฎการเข้ารหัสขั้นพื้นฐาน:

การเข้ารหัสเอนทิตี:
- การประกาศเริ่มต้น: (e1:EntityName)
- การอ้างอิงที่ตามมา: ""
- เอนทิตีที่ไม่รู้จัก: (eX:X)
การเข้ารหัสความสัมพันธ์:
- การประกาศความสัมพันธ์: [r:RELATIONSHIP_TYPE]
- สำหรับความสัมพันธ์ทั่วไป ( PART_OF , IS_A , INSTANTIATES ), ใช้ตัวย่อ: [p] สำหรับ PART_OF , [i] สำหรับ IS_A และ [n] สำหรับ INSTANTIATES
หน่วยงานจัดทำดัชนีและความสัมพันธ์:
- ทุกประเภทและประเภทความสัมพันธ์ที่พบได้รับการกำหนดหมายเลขที่ไม่ซ้ำกัน: e1 , e2 , r1 , r2 ฯลฯ
- เมื่อนิติบุคคลหรือความสัมพันธ์ถูกกำหนดหมายเลขให้อ้างอิงเฉพาะตามจำนวนของมันในการกล่าวถึงที่ตามมาทั้งหมด
การผูกมัดและการจัดกลุ่ม:
- โซ่ความสัมพันธ์สามารถย่อได้โดยการลบพอยน์เตอร์เอนทิตีซ้ำซ้อนเมื่อพวกเขาบอกเป็นนัยตามลำดับ:
  - สำหรับโซ่เช่น (e1)-[r1]->(e2)-(r2)->(e3) เพียงแค่ใช้ (e1)-[r1]->[r2]->(e3)
การเข้ารหัสแอตทริบิวต์:
- แอตทริบิวต์สามารถประกาศในขั้นต้นภายในนิยามเอนทิตีของพวกเขาเพื่อการทำให้เข้าใจง่ายและอ้างอิงในภายหลังโดยหมายเลข
- ใช้ลำไส้ใหญ่ตามด้วยหมายเลขแอตทริบิวต์เมื่ออ้างอิงภายในความสัมพันธ์: e1:a1 สำหรับแอตทริบิวต์แรกของ e1

Rel ที่ไม่ใช่ ISA/Partof/Instantiates จะต้องมาพร้อมกับการทำให้เกิดความไม่ลงรอยกันในคลัสเตอร์ ISA/Partof/Instantiates ที่สร้างอินสแตนซ์ของกระบวนการที่กำหนดเอง ต้องแมปวิธีการที่มีป้ายกำกับอย่างชัดเจน

เวิร์กโฟลว์: {ขั้นตอน: {

1. Tripartitedecomposition: enum_genrels (แบบสอบถาม) -> chainofthoughtpatterntemplate -> การเชื่อมโยง | การ chaining (เทมเพลต, chain_input) => genrel_cots
1. flowchainmap: map_specrels (genrel_cots) -> metacogrecompression -> นิยามกระบวนการเฉพาะ
1. OutputGraph: create_pcnl_graph -> return (pcnl_code) => รหัสกราฟ pcnl} loop สำหรับแต่ละการสืบค้น pcnl end}}

การเข้ารหัสคีย์: { ⇒ : is_a ⊆ : part_of ↻ : อินสแตนซ์ (reifies ค่า emergent algebra โดยการแสดงเป็นอินสแตนซ์ที่เฉพาะเจาะจงมากขึ้นคือ 'อวัยวะ orperson' <=> 'x⇒hand (⊆person) ↻skin') ชุดเป็นเอนทิตีที่ไม่รู้จักที่อินสแตนซ์เอนทิตี 3. %s : ใช้ %s เพื่อแสดงชุด -

ตัวอย่างเช่น: "(E1: Agent) ⊆ (E2: สภาพแวดล้อม), (E1) ⊆ (E3: กฎ), (E1) ↻ (E4: การโต้ตอบ), (E5: การจำลอง) ⇒ {(E1), (E2), (E3), (e4)}, %(E1↻e4)

ตัวเลข:

rels: ควรทำดัชนีเช่น "เอนทิตี 1 มีดัชนี r 1 ดังนั้นเอนทิตีทั้งหมด 1 r คือ 1.x" ฯลฯ

ไม่เพียง แต่กำหนดหมายเลขเอนทิตีเท่านั้น แต่ยังใช้จำนวนหน่วยงานเป็น UUID ที่สามารถขยายอนุกรมวิธานได้ แต่จำเป็น

กฎขององค์กรขั้นสูง:

การจัดกลุ่มลำดับชั้น :
- กฎ : เอนทิตีและความสัมพันธ์สามารถจัดกลุ่มเป็นกลุ่มลำดับชั้นเพื่อแสดงถึงการบรรจุหรือขอบเขต
- ไวยากรณ์ : %G{entity/relationship list}% โดยที่ G ย่อมาจากกลุ่มหรือคลัสเตอร์และรายการมีเอนทิตีหรือความสัมพันธ์ซึ่งเป็นส่วนหนึ่งของกลุ่มลำดับชั้นนี้
การแยกส่วนของส่วนประกอบ :
- กฎ : เอนทิตีหรือความสัมพันธ์ที่คล้ายกันสามารถถูกทำให้เป็นส่วนประกอบที่นำกลับมาใช้ใหม่ได้
- ไวยากรณ์ : M{module_name} โดยที่ M หมายถึงโมดูลและ module_name เป็นส่วนประกอบที่นำมาใช้ซ้ำได้ (เช่นรูปแบบการโต้ตอบ, โซ่, เวิร์กโฟลว์, ลูป, ลูปคู่, ลูปตอบกลับ, ฯลฯ )
ความแม่นยำในประเภทความสัมพันธ์ :
- กฎการขยายตัว : แนะนำประเภทความสัมพันธ์ที่กว้างขึ้นในขณะที่มั่นใจว่าการแมปกลับไปที่ประเภทพื้นฐานสำหรับความเข้าใจที่เหมาะสม
- ไวยากรณ์สำหรับความสัมพันธ์ใหม่ : [r:NEW_REL]-> แมปเป็น [r:BASE_TYPE]-> + [m:Mapping] โดยที่ NEW_REL เป็นความสัมพันธ์ใหม่ BASE_TYPE เป็นหนึ่งในประเภทความสัมพันธ์ดั้งเดิมและ Mapping อธิบายการเปลี่ยนแปลง
กลไกการอ้างอิงที่มีประสิทธิภาพ :
- กฎสำหรับการอ้างอิงแบบเรียกซ้ำ : อนุญาตให้หน่วยงานหรือความสัมพันธ์อ้างอิงกลับไปยังรายละเอียดที่กล่าวถึงก่อนหน้านี้โดยไม่ต้องทำซ้ำ
- ไวยากรณ์ : @ref<number> โดยที่ ref ระบุการอ้างอิงและ <number> ชี้ไปที่เอนทิตีหรือความสัมพันธ์ที่มีป้ายกำกับ

NLP ขั้นสูงนี้เปิดใช้งานแอปพลิเคชัน AI ตอนนี้เปิดใช้งานและปรับใช้สำหรับผู้ใช้

อัลกอริทึม

InstanceInstancingChain สำหรับ Ontology โดเมนแบบไดนามิก:

เริ่ม IIC_DDO_TOOL

อินพุต: ชุดเอนทิตี E, ชุดของแอตทริบิวต์ A, ชุดของประเภทความสัมพันธ์ RT ("is_a", "part_of", "อินสแตนซ์"))

เริ่มต้น: Domainontology DO = ว่างเปล่าเริ่มต้น: EntityRelationshipMap ERM = ว่างเปล่า

สำหรับแต่ละเอนทิตี e ใน e do.createentity (e) สำหรับแต่ละแอตทริบิวต์ a ใน [e] do.addattribute (e, a) สิ้นสุดสำหรับจุดสิ้นสุดสำหรับ

สำหรับความสัมพันธ์แต่ละครั้ง r ใน rt ทำถ้า r.type == "is_a" แล้ว do.addisarelationship (r.source, r.target) อื่น ๆ ถ้า r.type == "part_of" จากนั้น do.addpartofrelationship (r.source, r.target) อื่น ๆ erm.add (R.Source, R.Target, R.Type) สิ้นสุดสำหรับ

ฟังก์ชั่น CreateEntity (E) / * สร้างเอนทิตีใหม่ในโดเมน ontology * / ถ้าไม่ทำ

ฟังก์ชั่น addattribute (เอนทิตี, แอตทริบิวต์) / * เพิ่มแอตทริบิวต์ให้กับเอนทิตีในโดเมน ontology * / do.addentityattribute (เอนทิตี, แอตทริบิวต์) ฟังก์ชั่นสิ้นสุดฟังก์ชัน

ฟังก์ชั่น addisarelationship (แหล่งที่มา, เป้าหมาย) / * สร้างความสัมพันธ์ 'is_a' ระหว่างสองเอนทิตี * / do.addisarelation (แหล่งที่มา, เป้าหมาย) ฟังก์ชั่นสิ้นสุด

ฟังก์ชั่น addPartOfRelationship (แหล่งที่มาเป้าหมาย) / * สร้างความสัมพันธ์ 'part_of' ระหว่างสองเอนทิตี * / do.addpartofrelation (แหล่งที่มา, เป้าหมาย) ฟังก์ชั่นสิ้นสุด

ฟังก์ชั่น addinstantiatesrelationship (แหล่งที่มา, เป้าหมาย) / * สร้างความสัมพันธ์ 'อินสแตนซ์' ระหว่างเอนทิตี * / do.addinstantiatesrelation (แหล่งที่มา, เป้าหมาย) ฟังก์ชั่นสิ้นสุด

ตรวจสอบความถูกต้องของ Domainontology / * ตรวจสอบให้แน่ใจว่าความสัมพันธ์ทั้งหมดอยู่ในข้อ จำกัด แบบคงที่และโครงสร้าง * / การตรวจสอบ ISA, ส่วนหนึ่ง, อินสแตนซ์ความสัมพันธ์สำหรับการตรวจสอบความถูกต้องของการปฏิบัติตามกฎระเบียบ

ผลลัพธ์: Domainontology, EntityRelationshipMap

สิ้นสุด iic_ddo_tool

pcnl2corl

ในการสร้างคอมไพเลอร์ PCNL2Corl เราต้องพิจารณาสิ่งต่อไปนี้:

การทำแผนที่ความหมาย:

เทคนิคการวิเคราะห์ความหมาย: การรับรู้เอนทิตีที่มีชื่อเป็นองค์ประกอบแท็ก การแยกวิเคราะห์การพึ่งพาเพื่อระบุความสัมพันธ์หลักภายในการสร้าง PCNL การเป็นตัวแทนระดับกลาง: ออกแบบรูปแบบที่มีโครงสร้าง (ตารางบางทีอาจจะเป็นมินิ-กราฟ) เพื่อเก็บความหมายที่วิเคราะห์ไว้ก่อนการแปล CORL อย่างเข้มงวด สิ่งนี้ช่วยลดความซับซ้อนในการจัดการ บริบทการใช้ประโยชน์: คอมไพเลอร์สามารถทำให้มีความอ่อนไหวต่อคำจำกัดความของออนโทโลยีก่อนหน้านี้และใช้โครงสร้างความรู้โดยรอบเพื่อทำให้เกิดคำศัพท์ที่คล้ายกัน แต่มีความเหมาะสม การจัดการความสัมพันธ์ที่ซับซ้อน:

การสลายตัวแบบก้าวหน้า: แนะนำขั้นตอนภายในคอมไพเลอร์เพื่อแปลคำสั่ง PCNL ที่ซับซ้อนเป็นชุดของโครงสร้าง CORL ที่เชื่อมต่อกันง่ายขึ้น การรับรู้รูปแบบ: ใช้การรับรู้ตามกฎซึ่งอาจได้รับการแจ้งจากเฟรมแนวคิดทั่วไปที่สังเกตได้ในการใช้ภาษาธรรมชาติเฉพาะโดเมน การเพิ่ม LLM (ข้อควรระวัง): สำรวจโดยใช้ LLM Prompts พร้อมชิ้นส่วนของคำอธิบาย PCNL และ CORL ไวยากรณ์เป็นคู่อินพุต/เอาต์พุตเพื่อสร้างขั้นตอนการแปลผู้สมัครด้วยการตรวจสอบของมนุษย์อย่างเข้มงวดในภายหลัง ความสามารถในการขยาย:

การออกแบบแบบแยกส่วน: แยกการแยกวิเคราะห์การวิเคราะห์ความหมายและขั้นตอนการสร้าง CORL ขั้นสุดท้าย สิ่งนี้ช่วยให้การปรับปรุงเป้าหมายโดยไม่ต้องปรับโครงสร้างใหม่อย่างสมบูรณ์ การติดตามเวอร์ชัน: รวมการกำหนดเวอร์ชันที่แข็งแกร่งสำหรับ CORL ในขณะที่มันวิวัฒนาการทำให้คอมไพเลอร์สามารถจัดการการอัปเดตไวยากรณ์ได้อย่างมีประสิทธิภาพ การมีส่วนร่วมของชุมชน: พิจารณารูปแบบการพัฒนาโอเพ่นซอร์สเพื่อส่งเสริมการทำงานร่วมกันที่กว้างขึ้นในการจดจำรูปแบบและการทำแผนที่ระหว่างภาษาธรรมชาติและโดเมนความรู้ที่เป็นทางการ

มาร่วมมือกันกันเถอะ!

วิธีการสร้างต้นแบบ

มันจะเป็นการรอบคอบที่จะเริ่มต้นด้วยต้นแบบขนาดเล็ก:

เลือกโดเมน: เริ่มต้นด้วย ontology ที่มุ่งเน้นภายในโดเมนเฉพาะ (ชีววิทยาอีคอมเมิร์ซ ฯลฯ ) เพื่อ จำกัด ความแปรปรวนทางภาษาในขั้นต้น ชุดย่อยของ PCNL: ใช้เฉพาะการเลือกเฉพาะคุณสมบัติหลักของ PCNL ก่อน (นิยามเอนทิตีและความสัมพันธ์คุณลักษณะง่าย ๆ ) กรณีทดสอบ: สร้างตัวอย่าง PCNL ด้วยตนเองควบคู่ไปกับเอาต์พุต CORL ที่คาดหวัง เรียกใช้สิ่งเหล่านี้ผ่านคอมไพเลอร์ต้นแบบการทำแผนที่การกลั่นซ้ำ ๆ และการแยกวิเคราะห์ตรรกะ การประเมิน

ตัวชี้วัดนอกเหนือจากการตรวจสอบความถูกต้องของวากยสัมพันธ์เป็นสิ่งจำเป็น:

ความคล้ายคลึงกันทางความหมาย: พิจารณาว่า CORL ที่ได้มานั้นสะท้อนให้เห็นถึงความตั้งใจของการสืบค้น PCNL ดั้งเดิมโดยใช้การตรวจสอบ entailment กับ ontologies/แหล่งความรู้อื่น ๆ ที่มีอยู่ การแปลไปกลับ (ถ้าเป็นไปได้): อาจประเมินว่าการย้อนกลับการดำเนินงานของคอมไพเลอร์ (CORL-> PCNL) จะสร้างโครงสร้างที่คล้ายคลึงกันที่คล้ายคลึงกันกับต้นฉบับ มาร่วมมือกันกันเถอะ!

คุณต้องการที่จะ:

เลือกมินิโดเมนและออกแบบคู่ตัวอย่าง PCNL-Corl สำหรับการทดสอบขนาดเล็ก? ร่างรูปแบบการเป็นตัวแทนระดับกลางเพื่อแยกความซับซ้อนของภาษาธรรมชาติและการทำให้เป็นทางการ?

-