mir Download - mir Quellcode herunterladen

mir

C#-Quellcode

version 1.0.0

Herunterladen

GitHub MIR-Teststatus GitHub MIR-Teststatus auf Apple Silicon GitHub MIR-Teststatus auf aarch64 GitHub MIR-Teststatus auf ppc64le GitHub MIR-Teststatus auf s390x GitHub MIR-Teststatus auf riscv64 GitHub MIR-Benchmark-Status

MIR-Projekt

MIR bedeutet mittlere interne Darstellung
Ziel des MIR-Projekts ist es, eine Grundlage für die Implementierung schneller und einfacher JITs zu schaffen
Plant, zunächst MIR-Light-Weight-JIT für die CRuby- und/oder MRuby-Implementierung auszuprobieren
Motivationen für das Projekt finden Sie in diesem Blogbeitrag
Eine Beschreibung des C2MIR-Compilers finden Sie in diesem Blogbeitrag
Die Zukunft der Codespezialisierung in MIR für dynamische Sprach-JITs finden Sie in diesem Blogbeitrag

Haftungsausschluss

Es gibt absolut keine Garantie dafür, dass der Code für Tests außer den hier angegebenen und auf anderen Plattformen als x86_64 Linux/OSX, aarch64 Linux/OSX (Apple M1) und ppc64le/s390x/riscv64 Linux funktioniert

MIR

MIR ist stark typisiertes IR
MIR kann maschinelle 32-Bit- und 64-Bit-Insns verschiedener Architekturen darstellen
MIR.md enthält eine detaillierte Beschreibung von MIR und seiner API. Hier ist eine kurze MIR-Beschreibung:
MIR besteht aus Modulen
- Jedes Modul kann Funktionen sowie einige Deklarationen und Daten enthalten
- Jede Funktion verfügt über eine Signatur (Parameter und Rückgabetypen), lokale Variablen (einschließlich Funktionsargumente) und Anweisungen
  - Jede lokale Variable hat einen Typ , der nur 64-Bit-Integer, Float, Double oder Long Double sein kann und an ein bestimmtes Zielmaschinenregister gebunden werden kann
  - Jeder Befehl verfügt über Opcode und Operanden
    - Der Operand kann eine lokale Variable (oder ein Funktionsargument), „immediate “, „memory“ , „label“ oder „Reference“ sein
      - Der unmittelbare Operand kann ein 64-Bit-Integer-, Float-, Double- oder Long-Double-Wert sein
  - Der Speicheroperand verfügt über einen Typ , eine Verschiebung , eine lokale Ganzzahlvariable für Basis und Index sowie eine Ganzzahlkonstante als Skala für den Index
    - Der Speichertyp kann ein 8-, 16-, 32- und 64-Bit-Ganzzahltyp mit oder ohne Vorzeichen, Float-Typ, Double- oder Long-Double-Typ sein
      - Wenn ein ganzzahliger Speicherwert verwendet wird, wird er zuerst mit Vorzeichen oder Null erweitert und auf einen 64-Bit-Ganzzahlwert hochgestuft
  - Der Label-Operand hat einen Namen und wird für Kontrollflussanweisungen verwendet
  - Der Referenzoperand wird verwendet, um auf Funktionen und Deklarationen im aktuellen Modul, in anderen MIR-Modulen oder für externe C-Funktionen oder -Deklarationen zu verweisen
- Opcode beschreibt, was die Anweisung bewirkt
- Es gibt Konvertierungsanweisungen für die Konvertierung zwischen verschiedenen 32- und 64-Bit-Werten mit und ohne Vorzeichen sowie Float-, Double- und Long-Double-Werten
- Es gibt arithmetische Anweisungen (Addition, Subtraktion, Multiplikation, Division, Modulo), die mit 32- und 64-Bit-Werten mit und ohne Vorzeichen, Float-, Double- und Long-Double-Werten arbeiten
- Es gibt logische Anweisungen (und, oder, xor, verschiedene Verschiebungen), die mit vorzeichenbehafteten und vorzeichenlosen 32- und 64-Bit-Werten arbeiten
- Es gibt Vergleichsanweisungen, die mit vorzeichenbehafteten und vorzeichenlosen 32- und 64-Bit-Werten sowie Float-, Double- und Long-Double-Werten arbeiten
- Es gibt Anweisungen zur Adresse lokaler Variablen, um die Adresse einer lokalen Variablen abzurufen
- Es gibt Verzweigungs-Insns (bedingungsloser Sprung und Sprung auf einen Null- oder Nicht-Null-Wert), die eine Bezeichnung als einen ihrer Operanden verwenden
- Es gibt kombinierte Vergleichs- und Verzweigungsanweisungen, die eine Bezeichnung als einen Operanden und zwei 32- und 64-Bit-Werte mit und ohne Vorzeichen, Float-, Double- und Long-Double-Werte verwenden
- Es gibt eine Schalteranweisung , um von als Operanden angegebenen Etiketten zu einer Beschriftung zu springen, abhängig vom als ersten Operanden angegebenen Index
- Es gibt einen Label-Adressbefehl zum Abrufen einer Label-Adresse und einen bedingungslosen indirekten Sprungbefehl , dessen Operand die zuvor genommene Label-Adresse enthält
- Es gibt Funktions- und Prozeduraufrufanweisungen
- Es gibt Rückgabeanweisungen, die optional 32- und 64-Bit-Ganzzahlwerte, Float-, Double- und Long-Double-Werte zurückgeben
- Es gibt spezielle, leichtgewichtige Aufruf- und Rückgabeanweisungen, die für den schnellen Wechsel vom Thread-Interpreter zum JITted-Code und umgekehrt verwendet werden können
- Es gibt Eigenschaftsanweisungen zum Generieren von speziellem Maschinencode, wenn eine verzögerte Basisblockversionierung verwendet wird

MIR-Beispiel

Sie können MIR über eine API erstellen, die aus Funktionen zum Erstellen von Modulen, Funktionen, Anweisungen, Operanden usw. besteht
Sie können MIR auch aus einer MIR- Binär- oder Textdatei erstellen
Der beste Weg, ein Gefühl für MIR zu bekommen, ist die Verwendung einer textuellen MIR-Darstellung
Beispiel eines Eratosthenes-Siebs auf C

 #define Size 819000
int sieve ( int N ) {
  int64_t i , k , prime , count , n ; char flags [ Size ];

  for ( n = 0 ; n < N ; n ++ ) {
    count = 0 ;
    for ( i = 0 ; i < Size ; i ++ )
      flags [ i ] = 1 ;
    for ( i = 0 ; i < Size ; i ++ )
      if ( flags [ i ]) {
        prime = i + i + 3 ;
        for ( k = i + prime ; k < Size ; k += prime )
          flags [ k ] = 0 ;
        count ++ ;
      }
  }
  return count ;
}
void ex100 ( void ) {
  printf ("sieve (100) = %d", sieve (100));
}

Beispiel einer MIR-Textdatei für dieselbe Funktion:

 m_sieve :  module
          export sieve
sieve :    func i32, i32:N
          local i64:iter, i64:count, i64:i, i64:k, i64:prime, i64:temp, i64:flags
          alloca flags, 819000
          mov iter, 0
loop :     bge fin, iter, N
          mov count, 0;  mov i, 0
loop2 :    bge fin2, i, 819000
          mov u8:(flags, i), 1;  add i, i, 1
          jmp loop2
fin2 :     mov i, 0
loop3 :    bge fin3, i, 819000
          beq cont3, u8:(flags,i), 0
          add temp, i, i;  add prime, temp, 3;  add k, i, prime
loop4 :    bge fin4, k, 819000
          mov u8:(flags, k), 0;  add k, k, prime
          jmp loop4
fin4 :     add count, count, 1
cont3 :    add i, i, 1
          jmp loop3
fin3 :     add iter, iter, 1
          jmp loop
fin :      ret count
          endfunc
          endmodule
m_ex100 :  module
format :   string "sieve (10) = %dn"
p_printf : proto p:fmt, i32:result
p_sieve :  proto i32, i32:iter
          export ex100
          import sieve, printf
ex100 :    func v, 0
          local i64:r
          call p_sieve, sieve, r, 100
          call p_printf, printf, format, r
          endfunc
          endmodule

func beschreibt die Signatur der Funktion (nimmt ein 32-Bit-Ganzzahlargument mit Vorzeichen und gibt einen 32-Bit-Ganzzahlwert mit Vorzeichen zurück) und das Funktionsargument N , das eine lokale Variable vom Typ 64-Bit-Ganzzahl mit Vorzeichen ist
- Funktionsergebnisse werden zunächst durch ihren Typ beschrieben und haben keinen Namen. Parameter haben immer Namen und folgen der Ergebnisbeschreibung
- Die Funktion kann mehr als ein Ergebnis haben, aber die mögliche Anzahl und Kombination von Ergebnistypen ist derzeit maschinell definiert
Sie können mehrere Anweisungen in eine Zeile schreiben, wenn Sie diese durch ; trennen.
Das Befehlsergebnis, falls vorhanden, ist immer der erste Operand
Bei Berechnungen verwenden wir 64-Bit-Anweisungen
Wir könnten 32-Bit-Anweisungen in Berechnungen verwenden, was sinnvoll wäre, wenn wir eine 32-Bit-CPU verwenden
- Wenn wir 32-Bit-Anweisungen verwenden, nehmen wir nur den 32-Bit-signifikanten Teil des 64-Bit-Operanden und der hohe 32-Bit-Teil des Ergebnisses ist maschinendefiniert (wenn Sie also einen portablen MIR-Code schreiben, berücksichtigen Sie den hohen 32-Bit-Teilwert). undefiniert)
string beschreibt Daten in Form eines C-Strings
- Der C-String kann direkt als Insn-Operand verwendet werden. In diesem Fall werden die Daten dem Modul hinzugefügt und die Datenadresse wird als Operand verwendet
export beschreibt die Modulfunktionen oder Daten, die außerhalb des aktuellen Moduls sichtbar sind
import beschreibt die Modulfunktionen oder Daten, die in anderen MIR-Modulen definiert werden sollen
proto beschreibt Funktionsprototypen. Seine Syntax ist dieselbe wie func -Syntax
call sind MIR-Anweisungen zum Aufrufen von Funktionen

Ausführen von MIR-Code

Nachdem Sie MIR-Module erstellt haben (über die MIR-API oder das Lesen von MIR-Binär- oder Textdateien), sollten Sie die Module laden
- Durch das Laden von Modulen werden exportierte Modulfunktionen und -daten sichtbar
- Sie können externe C-Funktionen mit MIR_load_external laden
Nach dem Laden von Modulen sollten Sie die geladenen Module verknüpfen
- Durch das Verknüpfen von Modulen werden importierte Modulreferenzen aufgelöst, Daten initialisiert und Aufrufschnittstellen eingerichtet
Nach der Verknüpfung können Sie Funktionen aus den Modulen interpretieren oder Maschinencode für die mit dem MIR JIT-Compiler (Generator) generierten Funktionen aufrufen. Auf welche Weise die Funktion ausgeführt werden kann, wird normalerweise durch die eingerichtete Schnittstelle definiert. Wie der generierte Code erzeugt wird (träge beim ersten Aufruf oder im Voraus), kann auch von der Schnittstelle abhängen
Das Ausführen des Codes aus dem obigen Beispiel könnte wie folgt aussehen (hier sind m1 und m2 die Module m_sieve und m_e100 , func ist die Funktion ex100 , sieve ist die Funktion sieve ):

    /* ctx is a context created by MIR_init / MIR_init2 */
    MIR_load_module ( ctx , m1 ); MIR_load_module ( ctx , m2 );
    MIR_load_external ( ctx , "printf" , printf );
    MIR_link ( ctx , MIR_set_interp_interface , import_resolver );
    /* or use MIR_set_gen_interface to generate and use the machine code */
    /* or use MIR_set_lazy_gen_interface to generate function code on its 1st call */
    /* use MIR_gen (ctx, func) to explicitly generate the function machine code */
    MIR_interp ( ctx , func , & result , 0 ); /* zero here is arguments number  */
    /* or ((void (*) (void)) func->addr) (); to call interpr. or gen. code through the interface */

Ausführen binärer MIR-Dateien unter Linux über `binfmt_misc`

Die mir-bin-run -Binärdatei wird für die Verwendung von binfmt_misc mit der folgenden Zeile (Beispiel) vorbereitet:

line=:mir:M::MIR::/usr/local/bin/mir-bin-run:P
echo $line > /proc/sys/fs/binfmt_misc/register

Passen Sie den mir-bin-run-Binärpfad an Ihr System an, das ist der Standardpfad

Und renne mit

c2m your-file.c -o your-file
chmod +x your-file
./your-file your args

Die ausführbare Datei ist mit Umgebungsvariablen „konfigurierbar“:

MIR_TYPE legt die Schnittstelle für die Codeausführung fest: interp (zur Interpretation), jit (zur Generierung) und lazy (zur verzögerten Generierung, Standard);
MIR_LIBS (durch Doppelpunkte getrennte Liste) definiert eine Liste zusätzlicher zu ladender Bibliotheken;
MIR_LIB_DIRS oder LD_LIBRARY_PATH (durch Doppelpunkte getrennte Liste) definiert eine zusätzliche Liste von Verzeichnissen, in denen die Bibliotheken durchsucht werden sollen.

Aufgrund der Verknüpfung von mir-bin-run mit binfmt_misc kann es etwas seltsam sein, mir-bin-run direkt aufzurufen. Das P Flag auf binfmt_misc übergibt ein zusätzliches Argument mit dem vollständigen Pfad zur MIR-Binärdatei.

Der aktuelle Stand des MIR-Projekts

Sie können die C-Funktionen setjmp/longjmp verwenden, um Longjump in MIR zu implementieren
Binärer MIR-Code ist normalerweise bis zu zehnmal kompakter und bis zu zehnmal schneller zu lesen als analoger MIR-Textcode
Der MIR-Interpreter ist etwa 6–10 Mal langsamer als der vom MIR-JIT-Compiler generierte Code
Der LLVM IR-zu-MIR-Übersetzer ist noch nicht fertig und wird wahrscheinlich nie vollständig implementiert, da LLVM IR viel umfangreicher ist als MIR, aber die Übersetzung von LLVM IR, die aus Standard-C/C++ generiert wurde, nach MIR ist eine machbare Aufgabe

Der mögliche zukünftige Stand des MIR-Projekts

Die Übersetzung von WASM in MIR sollte ziemlich einfach sein
- Für MIR musste nur eine kleine WASM-Laufzeit für WASM-Gleitkomma-Runden-Insns bereitgestellt werden
Auch die Portierung von GCC nach MIR ist möglich. Ein erfahrener GCC-Entwickler kann dies 6 bis 12 Monate lang umsetzen
Nach meiner Schätzung wird die Portierung des MIR-JIT-Compilers auf mips64 oder sparc64 für jedes Ziel 1–2 Monate Arbeit in Anspruch nehmen
Eine leistungsorientierte Portierung des MIR-JIT-Compilers auf 32-Bit-Ziele erfordert die Implementierung eines zusätzlichen kleinen Analysedurchlaufs, um Informationen darüber zu erhalten, welche 64-Bit-Variablen nur in 32-Bit-Anweisungen verwendet werden

MIR JIT-Compiler

Sehr kurze Optimierungspipeline für Geschwindigkeit und geringes Gewicht
Nur die wertvollste Optimierungsnutzung:
- Funktions-Inlining
- Globale Eliminierung gemeinsamer Unterausdrücke
- Variablenumbenennung
- Registrieren Sie die Bewegung des invarianten Codes der druckempfindlichen Schleife
- bedingte konstante Ausbreitung
- Eliminierung von totem Code
- Codeauswahl
- schneller Registerzuteiler mit
  - Aggressive Koaleszenzregister und Stack-Slots zur Eliminierung von Kopien
  - Aufteilung des Live-Bereichs
Verschiedene Optimierungsstufen zur Abstimmung der Kompilierungsgeschwindigkeit im Vergleich zur Leistung des generierten Codes
Die SSA- Form von MIR wird vor der Registerzuweisung verwendet
- Wir verwenden eine Form des Braun-Algorithmus, um SSA zu erstellen (M. Braun et al. „Simple and Efficient Construction of Static Single Assignment Form“).
Einfache Optimierungsimplementierung bei extremer Leistung des generierten Codes
Weitere Details zur vollständigen JIT-Compiler-Pipeline :
Vereinfachen : MIR senken
Inline : Inline-MIR-Aufrufe
CFG erstellen : Kontrollflussdiagramm erstellen (Basisblöcke und CFG-Kanten)
SSA erstellen : Erstellen eines einzelnen statischen Zuweisungsformulars durch Hinzufügen von Phi-Knoten und SSA-Kanten zu Operanden
Adresstransformation : MIR ADDR-Anweisungen entfernen oder ändern
Globale Wertnummerierung : Entfernen redundanter Inns durch GVN. Dazu gehören die ständige Ausbreitung und die Eliminierung redundanter Lasten
Kopierweitergabe : SSA-Kopierweitergabe und Entfernung redundanter Erweiterungsanweisungen
Eliminierung toter Filialen : Entfernen überflüssiger Filialen
Eliminierung von totem Code : Entfernen von Insns mit ungenutzten Ausgängen
Druckentlastung : Verschieben der Inns, um den Registerdruck zu verringern
SSA-Kombination : Kombinieren von Adressen und Vergleichs- und Verzweigungsbefehlspaaren
Außerhalb von SSA : Phi-Knoten und SSA-Kanten werden entfernt
Sprungoptionen : Verschiedene Sprungoptimierungen
Machinisieren : Führen Sie maschinenabhängigen Code aus, der MIR für Anrufe, ABI, 2-Op-Insns usw. umwandelt
Schleifen finden : Natürliche Schleifen finden und Schleifenbaum erstellen
Live-Info erstellen : Berechnung von Live-In und Live-Out für die Basisblöcke
Registerkonflikte erstellen : Erstellen einer Konfliktmatrix für Register, die an Umzügen beteiligt sind. Es wird zur Registerzusammenführung verwendet
Coalesce : Aggressive Registerverschmelzung
Register Allocator (RA) : Prioritätsbasierter linearer Scan-RA mit Live-Bereichsaufteilung
Live-Bereiche erstellen : Programmpunktbereiche für Register berechnen
Zuweisen : schnelle RA für -O0 oder prioritätsbasierte lineare Scan-RA für -O1 und höher
Umschreiben : Transformieren Sie MIR entsprechend der Zuweisung unter Verwendung reservierter Hardregs
Kombinieren (Codeauswahl): Zusammenführen datenabhängiger Insns zu einem
Eliminierung von totem Code : Entfernen von Insns mit ungenutzten Ausgängen
Maschinen-Insns generieren : Führen Sie maschinenabhängigen Code aus, der Maschinen-Insns erstellt

C-zu-MIR-Übersetzung

Wir haben einen kleinen C11 (2011 ANSI C-Standard mit einigen GCC-Erweiterungen) für den MIR-Compiler c2m implementiert. Siehe README.md
C-Code kann neben MIR auch als Eingabe des JIT-Compilers verwendet werden
- Die Verwendung von C als Eingabe für den JIT-Compiler kann die Kompilierungsgeschwindigkeit um das Zweifache verlangsamen

Struktur des Projektcodes

Die Dateien mir.h und mir.c enthalten den wichtigsten API-Code, einschließlich der Eingabe/Ausgabe der MIR-Binär- und MIR-Textdarstellung
Die Dateien mir-dlist.h , mir-mp.h , mir-varr.h , mir-bitmap.h , mir-hash.h , mir-htab.h und mir-reduce.h enthalten generischen Code entsprechend für Doppelverknüpfungen Listen, Speicherpools, Arrays variabler Länge, Bitmaps, Hash-Berechnungen, Hash-Tabellen und Komprimierung/Dekomprimierung von Daten. Die Datei mir-hash.h ist eine allgemeine, einfache und qualitativ hochwertige Hash-Funktion, die von Hashtabellen verwendet wird
Die Datei mir-interp.c enthält Code zur Interpretation des MIR-Codes. Es ist in mir.c enthalten und wird nie separat kompiliert
Dateien mir-gen.h , mir-gen.c , mir-gen-x86_64.c , mir-gen-aarch64.c , mir-gen-ppc64.c , mir-gen-s390x.c und mir-gen-riscv64.c enthält Code für den MIR-JIT-Compiler
- Die Dateien mir-gen-x86_64.c , mir-gen-aarch64.c , mir-gen-ppc64.c , mir-gen-s390x.c und mir-gen-riscv64.c sind maschinenabhängiger Code des JIT-Compilers
Die Dateien mir-<target>.c enthalten einfachen maschinenabhängigen Code, der für Interpreter und JIT-Compiler üblich ist
Die Dateien mir-<target>.h enthalten gemeinsame Deklarationen für Interpreter und JIT-Compiler
Die Dateien mir2c/mir2c.h und mir2c/mir2c.c enthalten Code für den MIR-zu-C-Compiler. Der generierte Code ist möglicherweise nicht portierbar
Die Dateien c2mir/c2mir.h , c2mir/c2mir.c , c2mir/c2mir-driver.c und c2mir/mirc.h enthalten Code für den C-zu-MIR-Compiler. Dateien in den Verzeichnissen c2mir/x86_64 und c2mir/aarch64 , c2mir/ppc64 , c2mir/s390x und c2mir/riscv64 enthalten entsprechend x86_64, aarch64, ppc64le, s390x und riscv maschinenabhängigen Code für den C-zu-MIR-Compiler
Die Datei mir-bin-run.c enthält den oben beschriebenen Code für mir-bin-run
Die Datei mir-bin-driver.c mit dem Dienstprogramm b2ctab kann für eine portable Möglichkeit zum Generieren von Binärdateien aus MIR-Binärdateien verwendet werden
Das Verzeichnis mir-utils enthält verschiedene Dienstprogramme für die Arbeit mit MIR, z. B. die Umwandlung von binärem MIR in textuelles MIR und umgekehrt
Das Verzeichnis adt-tests , mir-tests , c-tests und c-benchmarks enthält Code zum Testen und Benchmarking von MIR und c2m

Spielen mit aktuellem MIR-Projektcode

Mit make bench und make test können Sie einige Benchmarks und Tests durchführen

Aktuelle MIR-Leistungsdaten

Intel i5-13600K mit 64 GB Speicher unter FC37 mit GCC-12.3.1

	MIR-Generator	MIR-Dolmetscher	gcc-O2	gcc -O0
Zusammenstellung [1]	1,0 (249us)	0,09 (22us)	109 (27,1 ms)	105 (26,1 ms)
Ausführung [2]	1,0 (1,74 Sek.)	13,7 (23,8 Sek.)	0,92 (1,6 s)	2,28 (3,97 Sek.)
Codegröße [3]	1.0 (557 KB)	0,43 (240 KB)	58 (32,2 MB)	58 (32,2 MB)
LOC [4]	1,0 (23,4K)	0,48 (11,3K)	103 (2420K)	103 (2402K)

[1] basiert auf der Zeit für die Kompilierung des C-Siebcodes (ohne Include-Datei und unter Verwendung des Speicherdateisystems für GCC) und des entsprechenden MIR-Siebcodes durch MIR-Interpreter und MIR-Generator mit Optimierungsstufe 2

[2] basiert auf der besten Wandzeit von 10 Läufen mit dem verwendeten MIR-Generator Optimierungsstufe 2

[3] basiert auf abgespeckten Größen von cc1 für GCC und MIR-Kern und Interpreter oder Generator für MIR

[4] Meine Schätzung basiert nur auf Dateien, die für den x86-64 GNU C-Compiler und MIR-Dateien für ein Minimalprogramm zum Erstellen und Ausführen von MIR-Code erforderlich sind

Aktuelle C2MIR-Leistungsdaten

Intel i5-13600K mit 64 GB Speicher unter FC37 mit GCC-12.3.1

	c2m -O2 -eg (Generator)	c2m -ei (Dolmetscher)	gcc-O2	gcc -O0
Zusammenstellung [1]	1,0 (336us)	1,0 (337us)	80 (27,1 ms)	77 (26,1 ms)
Ausführung [2]	1,0 (1,74 Sek.)	13,7 (23,8 Sek.)	0,92 (1,6 s)	2,28 (3,97 Sek.)
Codegröße [3]	1.0 (961 KB)	1.0 (961 KB)	34 (32,2 MB)	34 (32,2 MB)
LOC [4]	1,0 (54,8K)	1,0 (54,8K)	44 (2420K)	44 (2420K)

[1] basiert auf der Zeit für die Kompilierung des C-Sieve-Codes (ohne Include-Datei und unter Verwendung des Speicherdateisystems für GCC).

[2] basiert auf der besten Wandzeit von 10 Läufen mit dem verwendeten MIR-Generator Optimierungsstufe 2

[3] basiert auf reduzierten Größen von cc1 für GCC und C2MIR, MIR-Kern, Interpreter und Generator für MIR

[4] basiert auf allen Quelldateien mit Ausnahme von Tests

Hier wird die Codeleistung im Zusammenhang mit GCC -O2 für verschiedene C-Compiler auf 15 kleinen C-Benchmarks (aus dem Verzeichnis c-benchmarks ) auf demselben Computer generiert

Die gcc-Version ist 12.3.1
Clang-Version ist 15.0.7
chibicc ist Rui Ueyamas neueste C11-Implementierung
cparser ist eine C99-Implementierung, die auf einem ziemlich ausgefeilten Backend, libFirm Version 1.22, basiert
cproc ist die C11-Implementierung von Michael Forney, die auf dem QBE- Compiler-Backend basiert
lacc ist eine C89-Implementierung
pcc (1.2.0.DEVEL) ist eine moderne Version des Portable C-Compilers
tcc (0.9.27) ist der winzige C11-Compiler
emcc (2.0.20) ist ein Emscript-Compiler für Webassembly mit Wasmer-Laufzeit (1.0.2).
Wasi Cranelift ist ein C-zu-Webassember-Clang-Compiler (11.0.0) mit Wasmer (1.0.2), der auf dem Cranelift-Backend basiert
wasi LLVM ist ein C-zu-Webassember-Clang-Compiler (11.0.0) mit Wasmer (1.0.2), der auf dem LLVM-Backend basiert
Wasi Singlepass ist ein C-zu-Webassember-Clang-Compiler (11.0.0) mit Wasmer (1.0.2), der auf dem Singlepass-Backend basiert
wasi wasmtime ist ein C-zu-Webassember-Clang-Compiler (11.0.0) mit Wasmtime-Laufzeit (0.26.0), basierend auf dem Cranelift-Backend

	Durchschnitt	Geomean
gcc-O2	1,00	1,00
gcc -O0	0,63	0,57
c2m -eg	0,96	0,91
c2m -eb	0,92	0,85
chibicc	0,38	0,30
klirren -O2	1.12	1.09
cparser -O3	1.02	0,98
cproc	0,68	0,65
lacc -O3	0,47	0,39
pcc -O	0,80	0,78
tcc	0,54	0,50
emcc -O2/wasmer	0,60	0,55
Wasi-O2/Wasmer-Kranlift	0,60	0,54
wasi -O2/wasmer LLVM	0,78	0,72
wasi -O2/wasmer Singlepass	0,45	0,36
wasi -O2/wasmtime	0,92	0,87

Wettbewerber des MIR-Projekts

Ich sehe nur drei Projekte, die als echte universelle Light-Weight-JIT-Konkurrenten in Betracht gezogen oder angepasst werden könnten
QBE :
- Es ist klein (10K C-Linien)
- Es verwendet SSA-basierte IR (eine Art vereinfachte LLVM-IR).
- Es verfügt über die gleichen Optimierungen wie der MIR-Generator plus Aliasing, QBE verfügt jedoch über kein Inlining
- Es generiert Assembler-Code, wodurch QBE 30 bei der Maschinencode-Generierung langsamer ist als der MIR-Generator
- Bei meinen Benchmarks generiert es Code, dessen geomean-Leistung nur 65 % von GCC mit -O2 beträgt (die Leistung von MIR-generiertem Code beträgt 91 % von GCC mit -O2), während er die gleiche Kompilierungsgeschwindigkeit wie MIR aufweist
LIBJIT wurde als Teil des DotGNU-Projekts gestartet:
- LIBJIT ist größer:
  - 80.000 C-Zeilen (für LIBJIT ohne dynamischen Pascal-Compiler) vs. 20.000 C-Zeilen für MIR (ohne C-zu-MIR-Compiler)
- LIBJIT hat weniger Optimierungen: nur Kopierweitergabe und Registerzuweisung
RyuJIT ist Teil der Laufzeit für .NET Core:
- RyuJIT ist noch größer: 360K SLOC
- Bei RyuJIT-Optimierungen handelt es sich grundsätzlich um MIR-Generator-Optimierungen
- RyuJIT verwendet SSA
Weitere Kandidaten:
- LIBFirm : weniger Standalone-, Big- (140K LOC), SSA, ASM-Generation-, LGPL2
- CraneLift : weniger Standalone-, Big- (70K LOC of Rust-), SSA, Apache-Lizenz
- NanoJIT , Standalone+, mittel (40K C++ LOC), nur einfaches RA-, Mozilla Public License

Portierung von MIR

Derzeit funktioniert MIR auf x86_64, aarch64, ppc64le, s390x, riscv64 Linux und x86_64/aarch64 (Apple M1) MacOS
HOW-TO-PORT-MIR.md beschreibt den Prozess der MIR-Portierung
- Nach meiner Einschätzung kann ein erfahrener Entwickler 1-2 Monate lang MIR (einschließlich c2m ) auf ein anderes Ziel portieren

Expandieren

Zusätzliche Informationen

Version version 1.0.0
Typ C#-Quellcode
Aktualisierungszeit 2024-12-13
Größe 36.29MB
Kommt von Github

Ähnliche Anwendungen

TANI MIR app

2024-07-03
MIR-Spielinstallation

2023-08-18

mir

MIR-Projekt

Haftungsausschluss

MIR

MIR-Beispiel

Ausführen von MIR-Code

Ausführen binärer MIR-Dateien unter Linux über `binfmt_misc`

Der aktuelle Stand des MIR-Projekts

Der mögliche zukünftige Stand des MIR-Projekts

MIR JIT-Compiler

C-zu-MIR-Übersetzung

Struktur des Projektcodes

Spielen mit aktuellem MIR-Projektcode

Aktuelle MIR-Leistungsdaten

Aktuelle C2MIR-Leistungsdaten

Wettbewerber des MIR-Projekts

Portierung von MIR

TANI MIR app

MIR-Spielinstallation

chat.petals.dev

GPT Prompt Templates

GPTyped

Python

modern embedded programming course

yash

Google Dorks

shepherd

mongo express

mir

MIR-Projekt

Haftungsausschluss

MIR

MIR-Beispiel

Ausführen von MIR-Code

Ausführen binärer MIR-Dateien unter Linux über binfmt_misc

Der aktuelle Stand des MIR-Projekts

Der mögliche zukünftige Stand des MIR-Projekts

MIR JIT-Compiler

C-zu-MIR-Übersetzung

Struktur des Projektcodes

Spielen mit aktuellem MIR-Projektcode

Aktuelle MIR-Leistungsdaten

Aktuelle C2MIR-Leistungsdaten

Wettbewerber des MIR-Projekts

Portierung von MIR

Ausführen binärer MIR-Dateien unter Linux über `binfmt_misc`