Unduh flora - Unduh Kode Sumber flora

flora

Kode sumber lainnya

1.0.0

Unduh

Flora?

Taman Digital 2D/Dunia Virtual Untuk Menjelajahi Koneksi di seluruh Data Anda dan Turun Lubang Kelinci Spontan

Demo

demo.mov

Isi

Latar belakang
Bagaimana cara menavigasi taman?
Desain
Arsitektur
Bagaimana kami menemukan koneksi antara data Anda?
Rendering
Dimana datanya?
Instruksi
Masa depan
Ucapan Terima Kasih

Latar belakang

Gagasan kebun digital selalu sangat menarik bagi saya. Awal bulan ini, saya mulai bertanya -tanya bagaimana kami bisa menyajikan taman digital kami lebih dari sekadar teks di halaman? Bagaimana kami bisa membuatnya interaktif dan membuat pengalaman di sekitar menjelajahi jejak digital Anda? Bagaimana kita bisa membuat taman digital kita terasa seperti taman digital yang sebenarnya .

Flora adalah percobaan untuk mengeksplorasi ini.

Bagaimana cara menavigasi taman?

Ini dijelaskan secara rinci dalam tutorial di awal ketika Anda meluncurkan Flora - silakan merujuk itu.

Desain

Menyelesaikan desain membutuhkan beberapa minggu percobaan. Saya ingin dapat membuat nuansa seperti grafik untuk melihat data di kebun saya. Tantangannya adalah menciptakan sesuatu yang intuitif tetapi juga layak secara teknis (dalam sedikit waktu). Inilah sebabnya saya memilih "pohon induk" yang diisolasi dari "hutan" yang merupakan semua data yang paling terkait dengan induk. induk terkait

Catatan pada awalnya, orang tua hanyalah situs web rumah saya dan hutan terdiri dari data yang paling mirip dengan topik yang saya pedulikan. Ini tidak dipilih sendiri . Lebih lanjut tentang itu nanti!

Peta lengkap dirancang menggunakan alat MapEditor yang sangat baik sepenuhnya dari awal menggunakan tileset hebat yang saya temukan dari Jestan.

Baik tileset dan peta tersedia sepenuhnya di bawah folder map sehingga Anda dapat sepenuhnya bermain dengannya untuk membuatnya sendiri.

Lihat bagian Rendering untuk detail lebih lanjut tentang bagaimana kami membuat peta dan menambahkan logika game.

Arsitektur

Flora ditulis dengan Poseidon dan Pixi (untuk bantuan dengan rendering) di frontend, menggunakan plugin Pixi Tilemap (untuk rendering tilemap cepat) dan pergi di backend. Ini menggunakan algoritma pencarian semantik dan teks lengkap khusus untuk menemukan koneksi antara data di jejak digital saya. Ini membantu kami menemukan konten terkait yang secara topikal dan leksikal mirip dengan data tertentu atau kata kunci tertentu (yang mungkin Anda perhatikan, saya memuat beberapa yang penting untuk saya secara pribadi di layar pertama, seperti startup, komunitas, proyek sampingan dll). Lihat di bawah untuk cara kerja algoritma ini.

Bagaimana kami menemukan koneksi antara data Anda?

Saya suka menyebut langkah ini menghasilkan "grafik sesuai permintaan." Sebagian besar data saya tidak hidup dalam alat yang berisi tautan dua arah - sebagian besar data saya tersebar di berbagai tautan, catatan, artikel yang disimpan, dan banyak lagi. Mencoba menemukan hyperlink dalam data (yang telah saya simpan sebagai teks) akan hampir mustahil. Sebagai gantinya, saya mengarsipkan flora sehingga kami dapat melakukan sesuatu yang lain - kami dapat menggunakan algoritma pencarian semantik dan teks lengkap khusus untuk menemukan bagian data yang paling terkait .

Ini mengambil beberapa bentuk. Dengan catatan data tertentu, kami dapat menemukan catatan data lain yang paling terkait untuk yang satu ini, dengan cara ini agak meniru tautan dua arah.

Kami juga dapat, dengan kueri atau kata tertentu, menemukan catatan data yang paling terkait dengan kueri spesifik itu - yang mungkin Anda perhatikan pada beban pertama dalam video demo atau jika Anda mencobanya (dengan kata -kata build , community , startups , side projects , dll.). Dengan demikian, kita dapat menghasilkan "grafik sesuai permintaan" dengan algoritma pencarian yang kuat, yang berisi dua komponen penting.

1. Pencarian semantik

Bagian semantik dari algoritma pencarian terdiri dari menggunakan kata embeddings yang merupakan vektor dimensi tinggi yang menyandikan berbagai bit informasi yang terkait dengan kata-kata (misalnya vektor untuk kata raja mungkin memiliki beberapa informasi yang terkait dengan pria, penguasa dll.). Ini dibangun sedemikian rupa di mana kita dapat beroperasi pada vektor -vektor ini (yaitu menambahkannya, kurangi mereka rata -rata) dan mempertahankan semacam struktur informasi tentang hasilnya.

Ini berarti untuk setiap bagian data, kami dapat rata -rata semua kata untuk membuat vektor dokumen yang hanya merupakan vektor tunggal yang mencoba menyandikan/merangkum informasi tentang data. Ada cara yang lebih kompleks dan bermakna untuk melakukan ini daripada hanya rata -rata semua kata embeddings, tetapi ini cukup sederhana untuk diimplementasikan dan bekerja relatif baik untuk tujuan proyek ini.

Setelah kami memiliki vektor dokumen untuk sepotong data, kami dapat menggunakan kemiripan cosinus untuk menemukan seberapa mirip dua vektor dokumen ini (dan karenanya seberapa mirip topik dari dua bagian data).

Saya menggunakan kata-embeddings pra-terlatih dari dataset FastText Word Embeddings Creative Commons Facebook. Secara khusus saya menggunakan 50k kata dari data yang dilatih di Wikipedia 2017 UMBC Webbase Corpus yang ditemukan di sini. Dataset yang sebenarnya berisi ~ 1 juta token tetapi saya hanya klip dan menggunakan 50k pertama sehingga server saya dapat menanganinya. Saya dapat mengubah ini atau menukarnya di masa depan, saya hanya memilih ini karena memiliki ukuran file terkecil.

2. Pencarian Teks

Komponen teks pencarian membuat vektor TF-IDF untuk setiap bagian data, yang merupakan vektor yang menyimpan frekuensi token dari semua kata yang muncul dalam dokumen. Karena dokumen mungkin memiliki kosa kata yang berbeda, vektor TF-IDF ini menggunakan kosakata seluruh korpus, sehingga kata apa pun yang tidak muncul dalam dokumen memiliki 0 untuk lokasi terkait di vektor.

Setelah kami memiliki vektor TF-IDF untuk dua kata, kami dapat sekali lagi menggunakan kemiripan kosinus untuk menemukan seberapa mirip vektor TF-IDF ini (dan karenanya seberapa mirip kata yang digunakan untuk dua potong data).

Algoritma pencarian lengkap

Menyatukan semua ini, "skor khusus" kami untuk seberapa mirip data satu jejak saya dengan yang lain hanyalah rata-rata dari kesamaan cosinus pencarian teks dan kesamaan cosinus pencarian semantik.

Ketika kami "turun lubang kelinci" untuk setiap data, kami menghitung skor antara bagian awal data dan setiap data lainnya dalam jejak kaki kami, dan menggunakan skor tersebut untuk memberi peringkat n yang paling relevan, yang kemudian kami kembalikan di frontend.

Ingat bagaimana saya mengatakan pohon pertama yang terkait dengan kata -kata tertentu tidak dipilih sendiri ? Nah itu karena kami menggunakan pencarian semantik kami untuk menemukan dokumen yang paling dekat dengan kata embeddings dari kata -kata yang dipilih!

Rendering

Flora menggunakan Pixi untuk rendering dan plugin Pixi Tilemap untuk rendering peta. Catatan Saya tidak akan terlalu mendetail tentang bagaimana kerangka kerja ini bekerja, tetapi mereka mengabstraksi banyak rendering yang dapat kita manfaatkan melalui WebGL dengan fallback pada kanvas HTML ketika itu tidak tersedia. Mereka hebat!

Dalam hal peta kami di Flora, tidak ada pemusnahan yang diimplementasikan (saya mencobanya tetapi tidak bisa membuatnya bekerja dengan lancar dari file JSON yang merupakan cara saya memuat peta saya, akan menyukai beberapa petunjuk!) Secara default - sebaliknya seluruh peta dimuat dari peta JSON yang diekspor dan kami menampilkan jendela kecil/kamera peta.

Flora menyimpan semua ubin di grid 2D baris dan kolom dari seluruh peta kami. Ini juga bagaimana ia mengimplementasikan sistem deteksi tabrakannya. Perhatikan bahwa sprite tidak "bergerak secara fisik" tetapi sebaliknya, kami memutar peta di sekitar sprite untuk memberikan ilusi gerakan. Kami juga menyimpan beberapa petunjuk untuk melacak jendela yang terlihat saat ini yang kami offset di gameloop kami saat sprite "bergerak" melintasi layar. Kami menggunakan file tilset.json yang merupakan tileset yang diekspor dari MapEditor untuk memuat informasi yang relevan untuk setiap ubin yang diperlukan untuk menentukan apakah ubin adalah pohon, tidak boleh membiarkan pengguna bergerak melaluinya (misalnya batu bata rumah) dll dan merespons dengan tepat di loop permainan kami.

Dimana datanya?

Flora beroperasi pada data Apollo dan indeks terbalik. Jika Anda ingin dapat menggunakan ini untuk data Anda sendiri, Anda harus membuat data tersedia dalam format data Apollo masuk (detail dalam ReadMe Apollo) atau mengubah langkah -langkah pemuatan pada backend untuk mengakomadasi format data Anda.

Instruksi

Buat models dan folder corpus
Tambahkan lokasi indeks terbalik dan data yang ingin Anda tarik dari sini
- Catatan Lihat Bagaimana Apollo Menyimpan Indeks Terbalik dan Catatan Jika Anda ingin menambahkan data Anda sendiri
Unduh embeddings kata pra-terlatih dari fasttext dan letakkan di folder model
Mulai server dengan go run cmd/flora.go
Server web harus berjalan pada 127.0.0.1:8992 dan recordVectors.json seharusnya dibuat yang berisi vektor dokumen dari semua data/catatan dari database

Masa depan

Tingkatkan prosedur untuk menemukan koneksi
- Dapat membuatnya lebih efisien di berbagai tempat
Eksperimen dengan cara yang lebih baik untuk menemukan koneksi - cara yang lebih halus untuk membuat vektor dokumen, menggunakan model bahasa skala besar seperti Bert dll.

Ucapan Terima Kasih

Tileset untuk proyek
Ide Desain Awal
Sungguh peta yang dirancang dengan baik seharusnya terlihat dan terasa seperti
Pikiran tentang Taman Digital
Hormat untuk ide juga termasuk pencarian semantik

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-05-24
ukuran 2.02MB
Berasal dari Github

Aplikasi Terkait

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua