Repositori ini berisi implementasi untuk mesin virtual sederhana , bersama dengan driver yang akan membaca program dari file dan menjalankannya melalui mesin virtual itu.
Selain penerjemah mesin virtual, Anda juga akan menemukan:
Mesin virtual khusus ini sengaja sederhana, tetapi meskipun itu diharapkan diterapkan dengan cara yang dapat dibaca. ("Kesederhanaan" di sini berarti bahwa kami hanya mendukung sejumlah kecil instruksi, dan register yang dimiliki CPU virtual dapat menyimpan string dan bilangan bulat, tetapi bukan nilai titik mengambang.) Mesin virtual ini berbasis register, memiliki sepuluh register yang dapat digunakan untuk menyimpan string atau nilai integer.
Karena kompiler dan dekompiler ditulis dalam Perl, mereka tidak membutuhkan perlakuan khusus.
Interpretter, yang ditulis dalam C, dapat dibangun seperti itu:
$ make
Ini akan menghasilkan simple-vm dan embedded dari isi SRC/.
Menerapkan mesin virtual dasar, seperti ini, adalah masalah yang sangat dipahami:
case panjang.halt , atau exit instruksi.Komplikasi utama penulisan mesin virtual adalah:
goto repeat " tidak " 0x10 0x03 0x00 ". Mesin virtual khusus ini hanya berisi beberapa primitif, tetapi memang termasuk dukungan untuk label, perulangan, lompatan bersyarat, panggilan dan pengembalian. Ada juga tumpukan yang dapat digunakan untuk menyimpan nilai -nilai sementara, dan digunakan untuk penanganan call / ret .
Penanganan label dalam implementasi ini mungkin patut dicatat, karena banyak mesin virtual sederhana/demonstrasi tidak menanganinya sama sekali.
Untuk mendukung lompatan ke label yang belum tentu telah ditentukan namun kompiler kami menyimpan daftar berjalan dari semua label (yaitu kemungkinan tujuan lompat) dan ketika menemukan instruksi lompatan, atau sesuatu yang lain yang mengacu pada label, itu menghasilkan penambahan placeholder, seperti:
JUMP 0x0000x10 0x00 0x00 sebagai instruksi lompatan didefinisikan sebagai 0x10 .Setelah kompilasi selesai, semua target seharusnya ditemukan dan kompiler bebas untuk memperbarui bytecode yang dihasilkan untuk mengisi tujuan yang sesuai.
CATATAN : Di mesin virtual kami semua lompatan mutlak, jadi mereka mungkin terlihat seperti "
JUMP 0x0123" daripada "JUMP -4" atau "JUMP +30".
Catatan : Hal yang sama berlaku untuk instruksi lain yang menangani label, seperti menyimpan alamat label, melakukan panggilan, dll.
Mesin virtual ini dirancang terutama sebagai pengalaman belajar, tetapi dibangun dengan gagasan menanamkan dalam pikiran.
Biner simple-vm standar, yang akan membaca opcodes dari file dan menafsirkannya, berukuran kurang dari 40k.
Karena pemrosesan opcodes biner ditangani melalui tabel pengiriman, mungkin sepele bagi Anda untuk menambahkan opcode spesifik aplikasi Anda sendiri ke sistem yang memungkinkan Anda untuk menjalankan program kecil yang dikompilasi, dan efisien, yang dapat memanggil kembali ke aplikasi Anda ketika mereka mau.
Ada contoh mendefinisikan opcode khusus dalam file src/embedded.c . Contoh ini mendefinisikan opcode 0xCD khusus, dan menjalankan program kecil yang menggunakan opcode itu untuk tujuan demonstrasi:
$ ./embedded
[stdout] Register R01 => 16962 [Hex:4242]
Custom Handling Here
Our bytecode is 8 bytes long
Ada beberapa jenis instruksi yang diterapkan:
Instruksi cukup mendasar, karena ini hanya mainan, tetapi menambahkan yang baru tidak sulit dan primitif yang tersedia cukup berguna apa adanya.
Berikut ini adalah contoh dari semua instruksi:
:test
:label
goto 0x44ff # Jump to the given address
goto label # Jump to the given label
jmpnz label # Jump to label if Zero-Flag is not set
jmpz label # Jump to label if Zero-Flag is set
store #1, 33 # store 33 in register 1
store #2, "Steve" # Store the string "Steve" in register 1.
store #1, #3 # register1 is set to the contents of register #3.
exit # Stop processing.
nop # Do nothing
print_int #3 # Print the (integer) contents of register 3
print_str #3 # Print the (string) contents of register 3
system #3 # Call the (string) command stored in register 3
add #1, #2, #3 # Add register 2 + register 3 contents, store in reg 1
sub #1, #2, #3 # sub register 2 + register 3 contents, store in reg 1
mul #1, #2, #3 # multiply register 2 + register 3 contents, store in reg 1
concat #1, #2,#3 # store concatenated strings from reg2 + reg3 in reg1.
dec #2 # Decrement the integer in register 2
inc #2 # Increment the integer in register 2
string2int #3 # Change register 3 to have a string from an int
is_integer #3 # Does the given register have an integer content?
int2string #3 # Change register 3 to have an int from a string
is_string #3 # Does the given register have a string-content?
cmp #3, #4 # Compare contents of reg 3 & 4, set the Z-flag.
cmp #3, 42 # Compare contents of reg 3 with the constant 42. sets z.
cmp #3, "Moi" # Compare contents of reg 3 with the constant string "Moi". sets z.
peek #1, #4 # Load register 1 with the contents of the address in #4.
poke #1, #4 # Set the address stored in register4 with the contents of reg1.
random #2 # Store a random integer in register #2.
push #1 # Store the contents of register #1 in the stack
pop #1 # Load register #1 with the contents of the stack.
call 0xFFEE # Call the given address.
call my_label # Call the defined label
ret # Return from a called-routine.
Program berikut hanya akan menghasilkan string tanpa henti:
:start
store #1, "I like loops"
print_str #1
goto start
Program ini pertama -tama menyimpan string " I like loops " di Register 1, lalu mencetak daftar itu, sebelum melompat kembali ke awal program.
Untuk benar -benar menyusun program ini menjadi bytecode run:
$ ./compiler ./examples/simple.in
Ini akan menghasilkan file output yang penuh dengan kode biner dalam file simple.raw :
$ od -t x1 -An ./examples/simple.raw
01 01 0c 49 20 6c 69 6b 65 20 6c 6f 6f 70 73 03
01 06 00 00
Sekarang kita dapat menjalankan serangkaian opcodes itu:
./simple-vm ./examples/simple.raw
Jika Anda ingin men -debug eksekusi maka jalankan:
DEBUG=1 ./simple-vm ./examples/simple.raw
Ada lebih banyak contoh yang disimpan di bawah examples/ subdirektori dalam repositori ini. File contoh/quine.in memberikan contoh yang baik dari berbagai fitur - itu menghasilkan opcodes sendiri.
Jika Anda ingin melakukan fuzz-test dengan AFL, Anda harus menemukannya cukup lurus:
afl sendiri, sesuai instruksi.CC=afl-gcc di Makefile .Anda dapat menyusun masing -masing sampel yang dibundel kami seperti itu:
cd examples/
for i in *.in; do ../compiler $i; done
cd ..
Ini akan menyusun examples/*.in ke dalam examples/*.raw . Tempatkan mereka di direktori, dan mulai fuzzer Anda:
mkdir samples/
cp examples/*.raw samples/
Sekarang Anda memiliki ./samples/ hanya berisi program yang dikompilasi. Anda kemudian dapat bermutasi/memungkinkan contoh-contoh tersebut di bawah kendali fuzzer dengan baris perintah seperti ini:
export FUZZ=1
afl-fuzz -i ./samples/ -o results/ ./simple-vm @@ 16384
CATATAN : Di sini kita membatasi setiap menjalankan untuk mengeksekusi tidak lebih dari 16384 instruksi. Ini akan memastikan bahwa program tidak memiliki loop tak terbatas di dalamnya.
Kami mengatur FUZZ variabel lingkungan untuk berisi 1 semata -mata untuk menonaktifkan penggunaan fungsi system() . Yang mungkin secara tidak sengaja menghapus rumah tangga rumah Anda, memformat drive Anda, atau mengirim saya sumbangan!
Port Golang dari kompiler dan penerjemah virtual-mesin tersedia dari repositori berikut:
Selain itu, Anda dapat menemukan mesin virtual nyata di dalam mesin skrip tertanam yang saya tulis, juga untuk Golang. Dalam hal itu bahasa skrip diuraikan dan dikonversi menjadi serangkaian instruksi bytecode, yang dieksekusi oleh mesin virtual. Mirip dengan proyek ini, tetapi operasi bytecode lebih kompleks dan tingkat tinggi:
Jika Anda tertarik pada kompiler, dan penerjemah, umumnya Anda mungkin menikmati proyek -proyek lain ini juga: