Tinjauan EWSO
EWSO adalah ontologi metodologi rekayasa ontologi dinamis yang memanfaatkan representasi terstruktur pengetahuan untuk meningkatkan output LLM untuk tujuan apa pun. EWSO melibatkan sintaks abstrak untuk membangun Template Metodologi Engineering Ontologi LLM Persona yang dapat digunakan untuk mengeluarkan respons terstruktur. Struktur ini masih stokastik dan membutuhkan penolakan dalam konfigurasi percakapan roleplay seperti GAN untuk diperbaiki. This document provides the basis for a syntax formalizing the use of LLM interpreters inside AI-enabled agents to autonomously construct an ontology synthesized from aggregated outputs of prior conversations, enabling ontology-aware autonomous AI agents in a hierarchical swarm that can iteratively ontologize its own knowledge and discover emergent knowledge using PCNL (PseudoCypherNaturalLanguage, detailed below) kompresi dan dekompresi.
Struktur web yang muncul adalah sekelompok lapisan entitas abstrak yang muncul satu sama lain dalam rantai transformasi seperti untuk mewakili hubungan di dalam hubungan (seperti 2-morfisme ontologis), yang merupakan tautan dalam rantai yang menghasilkan transformasi dari loop umpan balik ganda yang dibangun dari dua loop umpan balik ganda dalam loop umpan balik ganda dengan satu sama lain. Dengan kata lain, ini menciptakan apa yang dianggap sebagai konsep lengkap, dan melakukannya dengan menggunakan dua bahasa utama yang dapat digunakan dalam alur kerja untuk penambangan dan ekstraksi ontologi yang memiliki loop umpan balik ganda yang dibangun dari loop umpan balik ganda (dll). Di bawah ini disajikan dua contoh bahasa primer: Corl dan PCNL. Mereka dapat menggabungkan dengan prinsip-prinsip EWSO untuk membuat mesin drilldown ontologis dan abstraksi yang berkelanjutan yang menambang pengetahuan yang masuk akal dari pengamatan yang dimilikinya tentang aliran informasi yang muncul bersama (refleksi LLM).
https://www.mermaidchart.com/raw/57ad88cf-63a3-41ec-a7ce-29b9eb711bde?theme=light&version=v0.1& format=svg
Corl Primer untuk Sistem AI
Tujuan: CORL adalah bahasa kompresi sintaks yang dirancang untuk agen AI yang bekerja dengan representasi pengetahuan dalam format burung hantu. Ini menawarkan cara yang dapat dibaca manusia untuk mendefinisikan elemen ontologis sambil memastikan terjemahan mesin yang halus ke dalam burung hantu.
Aturan inti
Deklarasi Entitas:
Sintaks: Entitas: Pemetaan OWL: OWL: Kelas dengan RDF: ID sama dengan Subsumpsi (IS_A):
Sintaks: Subkelas: Pemetaan Burung Hantu: RDFS: Subkelas Hubungan. Deklarasi Properti:
Sintaks: Properti: (domain :, rentang :) pemetaan burung hantu: OWL: ObjectProperty (untuk properti objek) atau OWL: DataTypeProperty (untuk properti yang menghubungkan ke nilai data), bersama dengan RDF: Domain dan RDF: Batasan rentang. Tugas contoh:
Sintaks: Contoh: dari: Pemetaan Burung Hantu: Burung Hantu: Diberi nama dengan RDF: Tipe diatur ke kelas yang ditentukan. Aturan lanjutan
Karakteristik Properti: Properti Transitif: ... Properti Simetris: ... Properti Fungsional: ... Properti Fungsional Terbalik: ... Kardinalitas:
Sintaks: Properti: ... (Cardinality_min :, Cardinality_max :) Pemetaan Burung Hantu: Burung Hantu: Mincardinality, Owl: Pembatasan MaxCardinality. Ekspresi Kelas Kompleks (Operator Boolean):
Kelas: Equivalent_to: dan kelas: Equivalent_to: atau kelas: Equivalent_to: bukan kuantifikasi:
... (hasproperty beberapa) => owl: somevalues dari ... (hasproperty saja) => owl: allValues dari properti data & tipe data:
Data_property: (domain :, rentang: xsd: datape) (contoh tipe data: xsd: integer, xsd: string, xsd: tanggal) catatan tambahan
Komentar: mendahului komentar dengan // (untuk manusia, diabaikan selama terjemahan) Sensitivitas kasus: Sintaks CORL mungkin atau mungkin tidak peka terhadap kasus berdasarkan pilihan preprocessor. Namespaces: Suatu mekanisme untuk menangani awalan dan iris untuk memastikan integrasi konsep yang lancar di seluruh ontologi diperlukan. Proses terjemahan
Preprocessor: Program menangani tokenisasi, validasi sintaks CORL terhadap aturan yang ditentukan, dan pelaporan kesalahan potensial. Generasi Burung Hantu: Mengikuti pemetaan langsung dari konstruksi CORL ke aksioma burung hantu yang sesuai. Mungkin memerlukan pilihan format output OWL standar (XML, sintaks fungsional, Manchester, dll.). Ingat, Corl masih berkembang bersama kemampuan AI. Harapkan ekstensi masa depan potensial untuk menangkap kompleksitas logis yang bernuansa!
Struktur Meta-Dataframe
Tabel Inti
Entity_table
Entity_id (Kunci Utama) Entity_name Entity_Type (Nilai -Nilai yang Mungkin: 'Kelas', 'ObjectProperty', 'DataTypeProperty', 'NamedIndividual') Deskripsi (Opsional - Untuk pemahaman manusia, bukan kepatuhan OWL yang ketat) Relationship_table
Relationship_id (kunci primer) Source_entity_id (Kunci Asing -> Entity_table) Target_entity_id (Kunci Asing -> Entity_table) Relationship_type (Nilai: 'SubclassOf', 'EquivalEntClass', 'Disjointwith', 'Hasproperty', ...) Tabel Karakteristik Properti Properti ')
properti_characteristics
Property_id (Kunci Asing -> Entity_table, Entity_Type Dibatasi untuk Properti) Karakteristik_Type (nilai: 'transitif', 'simetris', 'fungsional', 'inversungsi') pembatasan
restriction_id (kunci primer) properti_id (kunci asing -> entitas_table) restriction_type (nilai: 'somevalues dari', 'allValuesFrom', 'hasvalue', 'cardinality') Cardinality_class (jika berlaku, Kunci asing -> entity_table) Cardinality_datatipe (jika berlaku) Cardinality) Cardinyality (jika aplikasi) (jika aplikasi) (jika aplikasi) (jika aplikasi) (jika aplikasi) cardinality ifcinality (ifcinality) cardinality (jika berlaku) (jika appliced) cardinyple) Entri meta-data
| Entity_table | | --- | --- | --- | --- | | 1 | Anjing | Kelas | ... | | 2 | Orang | Kelas | ... | | 3 | HASOWNER | ObjectProperty | ... | | 4 | Fido | BernamaIndividual | ... |
| hubungan_table | | --- | --- | --- | --- | | 1 | 1 | 2 | subkelas |
| 2 | 3 | 2 | Hasproperty | | 3 | 3 | 1 | Hasproperty |
| properti_characteristics | | --- | --- | | 3 | Transitif |
| pembatasan | | --- | --- | --- | --- | --- | --- | | 1 | 3 | SomeValues dari | Anjing | ... | ... | | 2 | 2 | Kardinalitas | HASOWNER | ... | 1 | 1
Catatan
Struktur ini mencerminkan hubungan yang melekat yang ditemukan dalam ontologi OWL. '...' menunjukkan di mana anotasi yang dapat dibaca manusia dapat ditambahkan. Detail datatype tergantung pada kosakata 'XSD' yang dipilih. Representasi aksioma yang kompleks mungkin memerlukan ekstensi.
Representasi entitas: Semua entitas dienkapsulasi dalam tanda kurung, misalnya, (entity:Name) . Jenis entitas dikapitalisasi, dan instance spesifik dapat menjadi huruf kecil atau mengikuti konvensi penamaan tertentu.
Representasi hubungan: Hubungan antar entitas direpresentasikan sebagai panah arah dengan tipe hubungan dalam tanda kurung, misalnya, -[r:RELATIONSHIP_TYPE]-> . Jenis hubungan adalah semua topi dan dipisahkan di bawah untuk hubungan multi-kata. Hanya hubungan yang dapat diterima adalah: part_of, is_a, instantiates/instantiated_by "(di mana x instantiate y jika instance yang dapat direalisasikan yang sebenarnya, yaitu keberadaan, dari y membuktikan validitas skema reifikasi x)
Perpanjangan hubungan di luar IS_A , PART_OF , INSTANTIATES : Untuk menggabungkan jenis hubungan tambahan seperti HAS_ATTRIBUTE , aturan ekspansi formal digunakan:
HAS_ATTRIBUTE dapat didekompresi ke dalam (entity:Attribute)-[r:PART_OF]->(entity)-[r:IS_A]->(Entity) . Ini menunjukkan bahwa atribut adalah bagian dari suatu entitas dan menggambarkan apa entitas itu atau dimiliki.USED_IN dan hubungan lain yang tidak secara langsung dicakup oleh IS_A , PART_OF , INSTANTIATES dapat dipetakan ke tiga hubungan dasar ini atau kombinasi daripadanya, selalu memastikan bahwa ada dekomposisi logis yang berhubungan kembali dengan jenis hubungan dasar. Semantik seperti "berisi" secara algoritma menunjukkan Isa/Partof/Instantiate tentang bagaimana sebuah wadah adalah suatu entitas, tujuan adalah bagian dari itu, penahanan adalah tujuan, wadah memiliki tujuan penahanan untuk barang -barang yang dapat dikemukakan, dll. Hanya dengan mengatakan "x mengandung y" menyiratkan seluruh "instologi wadah" sendiri, yang perlu membutuhkan konstruksi dari formal, relasi y "menyiratkan ontologi wadah.Hubungan Rantai: Ganda hubungan dapat dirantai bersama untuk mewakili hubungan dan hierarki yang kompleks. Rantai dilakukan dengan menghubungkan akhir dari satu panah hubungan dengan awal yang lain, mempertahankan koherensi logis dan semantik.
Kompresi dan dekompresi: Hubungan yang tidak segera menjadi bagian dari jenis dasar ( IS_A , PART_OF , INSTANTIATES ) harus dikompresi atau didekompresi sesuai dengan pemetaan logika yang telah ditentukan. Ini membutuhkan mendefinisikan serangkaian aturan yang memetakan hubungan yang kompleks atau bernuansa kembali ke tiga jenis hubungan dasar, baik secara langsung atau melalui serangkaian langkah yang mengartikulasikan struktur yang mendasarinya.
Menangani ambiguitas dan hubungan multi-faceted: Dalam kasus di mana entitas memiliki hubungan yang dapat dijelaskan oleh lebih dari satu jenis, aturan prioritas diterapkan berdasarkan konteks domain pengetahuan dan sifat spesifik dari hubungan tersebut. Hirarki pohon keputusan atau prioritas dapat digunakan untuk menyelesaikan kasus -kasus tersebut.
Penunjukan Properti: Untuk kesederhanaan, sifat entitas (misalnya, warna, rasa) diperlakukan sebagai entitas itu sendiri dan dikaitkan dengan entitas utama melalui HAS_ATTRIBUTE atau hubungan yang setara dengan dekompresi. Hal ini memungkinkan nilai properti untuk secara dinamis terkait kembali ke entitas secara terstruktur.
(entity:Apple)-[r:HAS_ATTRIBUTE]->(entity:Taste) -Decompresses ke:-( (entity:Taste)-[r:PART_OF]->(entity:Apple)-[r:IS_A]->(Entity:Fruit); - yang menyiratkan bahwa "Rasa adalah atribut yang merupakan bagian dari apel, yang merupakan jenis buah."
Pseudocyphernl bertujuan untuk memberikan format standar untuk mengekspresikan pernyataan bahasa alami secara terstruktur, membuatnya lebih mudah bagi sistem AI untuk memproses, memahami, dan menghasilkan deskripsi bahasa alami dari hubungan dan atribut kompleks dalam grafik pengetahuan. Pengembangan dan penerapannya memerlukan pertimbangan yang cermat terhadap aturan untuk dekompresi dan pemetaan hubungan yang bernuansa untuk mempertahankan kekayaan semantik dan kejelasan struktural.
Penting Vital: Jangan jelaskan apa pun yang ditulis dalam pseudocyphernl menggunakan NL setelah menulis di pseudocyphernl sampai pengguna meminta langsung tentang aliran yang tepat itu. Itu cukup untuk manusia.
(entity:Screenplay) ) dan hubungan ( [r:HAS_PART] ) disingkat menjadi simbol dan kode steno ( (e1:Screenplay) , [p] ), mengurangi panjang setiap referensi.e1 , e2 , ..) Alih -alih nama lengkap mereka, mengandalkan konteks yang ditetapkan melalui deklarasi awal mereka untuk pemahaman.Pengkodean Entitas:
(e1:EntityName) ."" .(eX:X) .Pengkodean Hubungan:
[r:RELATIONSHIP_TYPE] .PART_OF , IS_A , INSTANTIATES ), gunakan singkatan: [p] untuk PART_OF , [i] untuk IS_A , dan [n] untuk INSTANTIATES .ENTITAS DAN HUBUNGAN ENTITAS:
e1 , e2 , r1 , r2 , dll.Chaining and Grouping:
(e1)-[r1]->(e2)-(r2)->(e3) , cukup gunakan (e1)-[r1]->[r2]->(e3) .Pengkodean Atribut:
e1:a1 untuk atribut pertama e1 .apa pun yang tidak disukai ISA/Partof/Instantiate harus disertai dengan disambiguasi ke cluster ISA/PartOf/Instantiates yang mem -instantiate proses kustom Rel. harus memetakan bagaimana, secara eksplisit diberi label
Alur kerja: {langkah: {
Kunci Pengkodean: { ⇒ : IS_A ⊆ : PART_OF ↻ : Instantiates (mengulangi nilai -nilai umum dengan emergent algebra sebagai contoh yang lebih spesifik yaitu 'organs⊆person' <=> 'X⇒Hand (⊆Person) ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ ↻ Set itu adalah entitas yang tidak diketahui yang membuat instantiates entitas 3. %s : gunakan %s untuk menunjukkan satu set. }
Misalnya: "(E1: Agen) ⊆ (E2: Lingkungan), (E1) ⊆ (E3: Aturan), (E1) ↻ (E4: Interaksi), (E5: Simulasi) ⇒ {(E1), (E2), (E3), (E4)}, %(E1↻E4) %⇒ E6: E6: Muncul).
Angka:
RELS: HARUS INDEKS SEPERTI "Entitas 1 memiliki indeks R 1 sehingga semua entitas 1 r adalah 1.x" dll.
Bukan hanya memberi nomor entitas itu sendiri, tetapi lebih menggunakan jumlah entitas sebagai uuid yang dapat berkembang secara taksonomi namun perlu
Pengelompokan hierarkis :
%G{entity/relationship list}% di mana G adalah singkatan dari grup atau cluster, dan daftarnya berisi entitas atau hubungan yang merupakan bagian dari kelompok hierarkis ini.Modularisasi komponen :
M{module_name} di mana M menunjukkan modul, dan module_name adalah komponen yang dapat digunakan kembali (misalnya, pola interaksi, rantai, alur kerja, loop, loop ganda, loop umpan balik, dll).Presisi dalam jenis hubungan :
[r:NEW_REL]-> dipetakan sebagai [r:BASE_TYPE]-> + [m:Mapping] di mana NEW_REL adalah hubungan baru, BASE_TYPE adalah salah satu jenis hubungan asli, dan Mapping menjelaskan transformasi.Mekanisme referensi yang efisien :
@ref<number> di mana ref menunjukkan referensi, dan <number> menunjuk ke entitas atau hubungan berlabel.Aplikasi AI yang diaktifkan NLP canggih ini sekarang beroperasi dan digunakan untuk pengguna.
InstanceInstanceChain untuk ontologi domain dinamis:
Mulai IIC_DDO_TOOL
Input: Set Entitas E, Set Atribut A, Set Jenis Hubungan RT ("IS_A", "PART_OF", "Instantiate")
Inisialisasi: domainontology do = kosong inisialisasi: Entityrelationshipmap erm = kosong
Untuk setiap entitas e dalam e do do.createEntity (e) untuk setiap atribut a di [e] do do.addattribute (e, a) end for for for for for
Untuk setiap hubungan r dalam rt do jika r.type == "is_a" maka do.addisarelationship (r.source, r.target) lain jika r.type == "part_of" maka do.addpartofrelationship (r.source, r.target) lain jika r.type == "instantiates" kemudian do.addinkstantstant) jika r.type == "instantiates" kemudian do.addinkstantstantstants) jika r.type == "instantiates" kemudian do.addinkstantstantstantse) r.type "instantiate" kemudian do.addinkstantstantstantstantse) r.type "instantiates" kemudian do.addinkstantstantseate Erm.add (r.source, r.target, r.type) berakhir untuk
Function createEntity (e) / * Membuat entitas baru dalam ontologi domain * / jika tidak lakukan.
Fungsi addattribute (entitas, atribut) / * menambahkan atribut ke entitas dalam domain ontologi * / do.addentityattribute (entitas, atribut) fungsi akhir
Fungsi addisarelationship (sumber, target) / * membangun hubungan 'is_a' antara dua entitas * / do.addisarelation (sumber, target) fungsi akhir
Fungsi addPartofrelationship (sumber, target) / * membangun hubungan 'part_of' antara dua entitas * / do.addpartofrelation (sumber, target) fungsi akhir
Fungsi AddInstantiateSrelationShip (Source, Target) / * Menetapkan hubungan 'Instantiates' antara entitas * / do.addinstantiateRelation (Sumber, target) Fungsi Akhir
Validasi domainontologi / * Pastikan semua hubungan berada dalam kendala statis dan struktural * / validasi ISA, bagian dari, instantiate hubungan untuk validasi akhir kepatuhan
Output: Domainontology, EntityrelationShipMap
End iic_ddo_tool
Untuk membuat kompiler PCNL2CORL, kita perlu mempertimbangkan yang berikut:
Pemetaan semantik:
Teknik Analisis Semantik: Pengenalan Entitas yang Dinamai untuk Tag Elemen, Entitas Disambiguate. Ketergantungan parsing untuk mengidentifikasi hubungan primer dalam konstruksi PCNL. Representasi menengah: Desain format terstruktur (tabel, mungkin mini-graphs) untuk memegang makna yang dianalisis sebelum terjemahan Corl yang ketat. Ini memudahkan penanganan kompleksitas. Konteks Leverage: Kompiler dapat dibuat peka terhadap definisi ontologis sebelumnya dan memanfaatkan struktur pengetahuan di sekitarnya untuk menghilangkan istilah yang serupa tetapi bernuansa. Penanganan hubungan yang kompleks:
Dekomposisi Progresif: Memperkenalkan langkah -langkah dalam kompiler untuk menerjemahkan pernyataan PCNL yang kompleks ke dalam serangkaian struktur CORL yang saling berhubungan yang lebih sederhana. Pengenalan pola: Pengakuan berbasis aturan, mungkin diinformasikan oleh kerangka konseptual umum yang diamati dalam penggunaan bahasa alami khusus domain. Augmentasi LLM (Perhatian): Jelajahi menggunakan permintaan LLM dengan fragmen deskripsi PCNL dan sintaks CORL sebagai pasangan input/output untuk menghasilkan langkah -langkah terjemahan kandidat, dengan verifikasi manusia yang ketat nanti. Kemungkinan diperpanjang:
Desain Modular: Parsing terpisah, analisis semantik, dan langkah -langkah generasi CORL akhir. Ini memungkinkan peningkatan yang ditargetkan tanpa refactoring lengkap. Pelacakan Versi: Sertakan versi yang kuat untuk Corl sendiri saat berkembang, memungkinkan kompiler untuk menangani pembaruan sintaks secara efektif. Kontribusi Komunitas: Pertimbangkan model pengembangan sumber terbuka untuk mendorong kolaborasi yang lebih luas dalam pengenalan pola dan pemetaan antara bahasa alami dan domain pengetahuan formal.
Pendekatan prototyping
Akan lebih bijaksana untuk memulai dengan prototipe skala kecil:
Pilih domain: Mulailah dengan ontologi yang difokuskan dalam domain tertentu (biologi, e-commerce, dll.) Untuk membatasi variabilitas bahasa pada awalnya. Subset dari PCNL: hanya menggunakan pilihan fitur inti PCNL yang dikuratori terlebih dahulu (entitas dan definisi hubungan, atribut sederhana). Kasus Uji: Buat contoh PCNL secara manual di samping output CORL yang diharapkan. Jalankan ini melalui kompiler prototipe, secara iteratif menyempurnakan pemetaan dan parsing logika. Evaluasi
Diperlukan metrik di luar pemeriksaan validitas sintaksis:
Kesamaan semantik: Tentukan seberapa akurat CORL yang diturunkan mencerminkan niat kueri PCNL asli menggunakan pemeriksaan ikut serta terhadap sumber ontologi/pengetahuan lainnya yang ada. Terjemahan Round-Trip (jika layak): Berpotensi menilai jika membalikkan operasi kompiler (corl-> pcnl) menghasilkan konstruksi yang sama secara semantik dengan aslinya. Ayo Berkolaborasi!
Pilih mini-domain dan rancang beberapa sampel pasangan pcnl-corl untuk tes skala kecil? Garis besar format representasi menengah untuk memisahkan kompleksitas dan formalisasi bahasa alami?
<=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=> <=>
https://platform.openai.com/playground/p/2xti7qyrqmwwc8ofasqfr2ij?model=gpt-4-turbo-peview&mode=chat