binaryenダウンロードbinaryenソースコードのダウンロード

バイナリエン

Binaryenは、C ++で記述されたWebAssembly用のコンパイラおよびツールチェーンインフラストラクチャライブラリです。 WebAssemblyを簡単に、高速で、効果的にコンパイルすることを目指しています。

簡単：Binaryenには単一のヘッダーに単純なC APIがあり、JavaScriptからも使用できます。 WebAssemblyのような形式での入力を受け入れますが、それを好むコンパイラの一般的な制御フローグラフも受け入れます。
FAST ：Binaryenの内部IRは、コンパクトなデータ構造を使用し、利用可能なすべてのCPUコアを使用して、完全に並列コードゲンと最適化のために設計されています。また、BinaryenのIRは、本質的にWebAssemblyのサブセットであるため、非常に簡単かつ迅速にWebAssemblyにコンパイルします。
有効：Binaryenのオプティマイザーには、コードのサイズと速度を改善できる多くのパス（後で概要を参照）があります。これらの最適化は、バイナリエンをコンパイラバックエンドとして単独で使用するのに十分な強力にすることを目的としています。焦点の1つの領域は、Webセンブリ固有の最適化（汎用コンパイラが実行できない可能性がある）にあります。これは、JavaScript、CSSなどの模倣と同様のWASMの最小化と考えることができます。これらはすべて言語固有です。

Binaryenをコンポーネントとして使用するツールチェーン（通常はwasm-optを実行している）が含まれます。

Emscripten （c/c ++）
wasm-pack （錆）
J2CL （Java; J2Wasm ）
Kotlin （Kotlin/Wasm）
Dart （フラッター）
wasm_of_ocaml （ocaml）

これらの作品のいくつかについては、V8 WASMGCポーティングBlogPostのツールチェーンアーキテクチャ部分を参照してください。

ライブラリとしてBinaryenを使用するコンパイラは次のとおりです。

TypeScriptのバリアントをWebAssemblyにコンパイルするAssemblyScript
WebAssemblyをJSにコンパイルするwasm2js
HaskellをWebAssemblyにコンパイルするAsterius
穀物をコンパイルするGrainは、WebAssemblyにコンパイルします

Binaryenはまた、できる一連のツールチェーンユーティリティを提供します

WebAssemblyを解析して放出します。特に、これにより、WebAssemblyをロードし、Binaryenを使用して最適化し、再放出することで、単一のコマンドにWASM-to Wasm Optimizerを実装できます。
WebAssemblyを解釈するだけでなく、WebAssembly仕様テストを実行します。
CおよびC ++からWebAssemblyに完全なコンパイラツールチェーンを提供するために、 EmScriptenと統合します。
ブラウザがまだネイティブサポートを持っていない場合（テストに役立つ）、JavaScriptにコンパイルされたインタープリターで実行することにより、 PolyFill WebAssemblyを実行します。

参加に興味がある場合は、貢献指示を参照してください。

Binaryen IR

Binaryenの内部IRは設計されています

最適化のために柔軟で高速。
WebAssemblyに可能な限り近いため、WebAssemblyとの間でそれを変換するのがシンプルで高速です。

Binaryen IRとWebAssembly言語にはいくつかの違いがあります。

ツリー構造
- Binaryen Irはツリーです。つまり、最適化の利便性のために階層構造を備えています。これは、スタックマシンであるWebAssemblyバイナリ形式とは異なります。
- したがって、Binaryenのテキスト形式では、S発現のみが可能になります。 WebAssemblyの公式テキスト形式は、主に線形命令リストです（S-Expression拡張機能）。 Binaryenは線形スタイルを読み取ることができませんが、S-Expressionsのみが含まれている場合はWASMテキストファイルを読み取ることができます。
- BinaryenはStack IRを使用して、「積み重なった」コード（構造化された形式で表現することはできません）を最適化します。
- マルチバリューの命令やブロックなど、積み重なったコードをBinaryen IRで表現する必要がある場合、WebAssembly言語には存在しないタプルタイプで表されます。マルチバリューの指示に加えて、地元の人々やグローバルは、Binaryen IRにタプルタイプを持つこともできますが、WebAssemblyではそうではありません。実験は、マルチバリューのより良いサポートにより、1〜3％の有用であるが小さいコードサイズの節約を可能にする可能性があることが示されているため、コアIR構造をより良くサポートする価値はありません。
- ブロック入力値（現在、例外処理機能のcatchブロックでのみサポートされています）は、 popサブ発現として表されます。
タイプと到達不可能なコード
- WebAssemblyはブロック/IF/ループタイプをなし、具体的な値タイプに制限します（I32、I64、F32、F64）。 Binaryen IRには到達不可能なタイプがあり、ブロック/IF/ループがそれを取ることができ、グローバルなコンテキストを知る必要のないローカル変換を可能にします。その結果、Binaryenのデフォルトのテキスト出力は、必ずしも有効なWASMテキストではありません。（有効なWASMテキストを取得するには、Stack IRを印刷する--generate-stack-ir --print-stack-ir実行できます。これは、WASMパーサーに対して有効であることが保証されています。）
- Binaryenは、WebAssemblyバイナリを読み取るときに到達不可能なコードを無視します。つまり、到達不可能なコードを使用してWASMファイルを読み取ると、そのコードは最適化されているかのように破棄されます（これはとにかく必要なものであり、最適化されたプログラムにはとにかく到達不可能なコードがありませんが、最適化されていないファイルを書いてから読むと、見た目が異なる場合があります）。この動作の理由は、WebAssemblyの到達不可能なコードには、Binaryen IRで処理するのが難しいコーナーケースがあるためです（非常に非構造化されている可能性があり、Binaryen IRは前述のようにWebSemblyよりも構造化されています）。 Binaryenは、Binaryenが構造化されたS-Expressionsのみをサポートするのをサポートするため、Birationeenは.watテキストファイルの到達不可能なコードをサポートしていることに注意してください。
ブロック
- Binaryen IRには、オペランドの可変長リスト、ブロックを含む1つのノードのみがあります。一方、WebAssemblyは、アームの場合はループのリストと関数の最上位レベルを許可します。 Binaryen's IRには、すべての非ブロックノードに単一のオペランドがあります。もちろん、このオペランドはブロックになる可能性があります。このプロパティの動機は、多くのパスがリストを反復するために特別なコードを必要とするため、リストを備えた単一のIRノードを使用するとそれらを簡素化することです。
- WASMと同様に、ブロックとループには名前が付いている場合があります。 IRの分岐ターゲットは、ネスティングの深さとは対照的に）名前で解決されます。これには2つの結果があります。
  - 名前のないブロックは、分岐ターゲットではない場合があります。
  - 名前は一意である必要があります。（読み取り.watファイルが重複しているのはサポートされています。IRが構築されたときに名前が変更されます）。
- 最適化として、ループの子であるブロック（または腕、または機能する場合）であり、それを標的とする分岐がない場合は、WASMを生成するときに放出されません。代わりに、そのオペランドのリストは、含まれるノードで直接使用されます。このようなブロックは、「暗黙的なブロック」と呼ばれることもあります。
参照タイプ
WASMのテキストとバイナリ形式では、 ref.funcがアドレスを撮影する関数をテーブル内にあるか、 (elem declare func $..)で宣言する必要がある必要があります。 Binaryenは必要に応じてそのデータを放出しますが、IRでそれを表しません。つまり、IRは、関数の参照の宣言について考える必要なく、取り組むことができます。
Binaryen IRは、WASM仕様（歴史的には「1a」と呼ばれていた）の形式で非脆弱な地元の人々を許可します。ここでは、 local.getが検証するためにlocal.setによって構造的に支配されなければなりません（nullのデフォルト値を読み取らないことを保証します）。 WASM仕様に沿っているにもかかわらず、あなたが気付くかもしれないいくつかの小さな詳細があります：
- Binaryen IRの無名のBlockは、検証を妨げません。無名のブロックがバイナリ形式に放出されることはありません（コンテンツを放出するだけです）ので、非脆弱な地元の人々の目的でそれらを無視します。その結果、Binaryenによって放出されたWASMテキストを読むと、仕様ごとに検証されてはならないコードと思われるものが表示されます（WASMテキストパーサーでは検証できない場合があります）が、バイナリ形式ではその違いは存在しません（Binaryenによって放出されるバイナリは、もちろん、バグのために常に機能します）。
- Binaryen Passランナーは、各パス後に自動的に検証を修正します（通常、ローカルを無視できるように降格することにより、検証しないものを見つけて固定します）。その結果、Binaryenが合格するときにこれについてあまり心配する必要はありません。詳細については、 pass.hおよびLocalStructuralDominanceクラスのrequiresNonNullableLocalFixups()フックを参照してください。
Binaryen IRは、特に参照に可能な最も洗練されたタイプを使用しています。
- ref.funcのIRタイプは常に特定の関数タイプであり、単純なfuncrefではありません。それはまた否定できません。
- 非nullableタイプは、 try_tableブランチに送信するタイプにも使用されます（分岐した場合、nullは送信されません）。どちらの場合も、GCが有効になっていない場合、バイナリであまり洗練されていないタイプを発します。バイナリを読むと、IRを構築する際に、より洗練されたタイプが適用されます。
br_if出力タイプは、バイナリのIRでより洗練されています。値のタイプがあります。値が流れると、WASMスペックでは、洗練されていないブランチターゲットのタイプです。ここでより洗練されたタイプを使用すると、すべてのタイプ情報を使用して、可能な限り最良の方法で最適化することが保証されますが、一部の往復操作は少し違うように見えることを意味します。特に、タイプがバイナリエンIRでより洗練されているbr_ifを発すると、その直後にキャストを発し、出力がWASM仕様に適切なタイプを持つようにします。まれな場合には、数バイトの余分なサイズが発生する可能性があります（ br_if値が使用されていない一般的なケースでは、このオーバーヘッドを回避します）。
文字列
- Binaryenを使用すると、文字列ビュー（ stringview_wtf16など）をref.castを使用してキャストできます。これにより、 ref.castすべての場所で常に使用できるようになります（そして、可能な限りOptimizerでref.as_non_nullに下げられます）。 StringRef Specはこれを許可していないようであり、バイナリライターがref.as_non_nullに非微細なタイプに文字列ビューをキャストするref.castを置き換えることを修正するために修正します。 No-opである文字列ビューのref.cast 、完全にスキップされます。

その結果、一部のコーナーケースでは、往復変換（wasm => binaryen ir => wasm）が少し変更されることに気付くかもしれません。

Binaryenが追加のIR、Stack IRを最適化する場合（ src/wasm-stack.hを参照）。 Stack IRは、WebAssemblyのバイナリ形式のスタックマシン形式に合わせて調整された多数の最適化を可能にします（ただし、スタックIRは、主要なバイナリIRよりも一般的な最適化の効率が低くなります）。特に最適化されたWASMファイルがある場合、単純な往復変換（最適化なしで読み取りと書き込みだけです）は、BinaryenがBinaryen IRのより構造化された形式に適合するため、より顕著な違いを引き起こす可能性があります。また、往復変換中に最適化すると、Stack IR Optsが実行され、最終的なWASMが最適化されます。

ノートbinaryen irで作業する場合：

上記のように、Binaryen IRにはツリー構造があります。その結果、各式には正確に1つの親が必要です。ツリーに複数回表示することで、ノードを「再利用」しないでください。この制限の動機は、最適化するとノードを変更するため、ツリーに複数回表示される場合、ある場所の変更が別の場所に誤って表示される可能性があることです。
同様の理由で、ノードは複数の関数に表示されないはずです。

内因性

バイナリエン固有関数は、インポートへの呼び出しのように見えます。

( import " binaryen-intrinsics " " foo " ( func $foo ))

それらをそのように実装することで、他のツールによって読み書きができます。また、カスタムバイナリ形式の拡張機能がある場合にこれらのツールで発生する可能性のあるバイナリ形式のエラーでの混乱エラーが回避されます。

本質的な方法は、オプティマイザーによって最適化される場合があります。そうでない場合は、WASMを出荷する前に下げる必要があります。そうしないと、存在しないインポートへの呼び出しのように見えます（そして、VMはそのインポートに適切な値を持たないというエラーが表示されます）。その最終低下は自動的に行われません。ユーザーが複数の最適化ステップのパイプラインを持っている可能性があるため、または局所的な実験を行う可能性があるため、ユーザーが最適化を終了することをツールが知らないため、ツールは最適化/削減などを行うことができるため、ツールが最適化を終了することをツールが明示的に実行する必要があります。ユーザーのみが「最終的な」前に最終的な最適化が発生し、準備ができていることを知っているため、ツールは最適化を完了することをツールが知らないため、明示的にパスを実行する必要があります。一般的に、最終低下後にいくつかの追加の最適化が可能になる可能性があるため、通常、本質的に一度最適化してから、それらを下げてから最適化してから、その後最適化することであることに注意してください。

wasm-opt input.wasm -o output.wasm -O --intrinsic-lowering -O

それぞれの内因性は、オプティマイザーがそれを許可していることと、最終低下がそれを変えるものを含むセマンティクスを定義します。詳細な定義については、Intrinsics.hを参照してください。ここに簡単な要約が表示されます：

call.without.effects ： call_refと同様に、パラメーターを受信し、コールする関数への参照と、それらのパラメーターでその機能を呼び出します。

ツール

このリポジトリにはbin/に次のツールを構築するコードが含まれています（建物の指示を参照）：

wasm-opt ：WebAssemblyをロードし、Binaryen IRを実行します。
wasm-as ：WebAssemblyをテキスト形式で組み立て（現在はS-Expressionフォーマット）、バイナリ形式（Binaryen IRを介して）に組み立てます。
wasm-dis ：バイナリ形式でWebAssemblyをテキスト形式に組み立てる（Binaryen IRを使用）。
wasm2js ：WebAssembly-to-JSコンパイラ。これは、emscriptenがWebAssemblyの代替としてJavaScriptを生成するために使用されます。
wasm-reduce ：WebAssemblyファイル用のテストケースリデューサー。何らかの理由で興味深いWASMファイル（特定のVMをクラッシュさせるなど）を考えると、WASM-Reduceは同じプロパティを持つ小さなWASMファイルを見つけることができます。詳細については、ドキュメントを参照してください。
wasm-shell ：WebAssemblyコードをロードおよび解釈できるシェル。また、仕様テストスイートを実行できます。
wasm-emscripten-finalize ：LLVM+LLDによって生成されたWASMバイナリを取得し、それを上回るEmscripten固有のパスを実行します。
wasm-ctor-eval ：コンパイル時に関数（または関数の一部）を実行できるツール。
wasm-merge ：複数のWASMファイルを単一のファイルにマージし、対応するインポートをエクスポートに接続します。 JSのバンドラーのように、しかしWASMのための。
wasm-metadce ：Moduleの使用方法に依存する柔軟な方法でWASMファイルの一部を削除するツール。
binaryen.js ：WASMモジュールを作成および最適化するためのBiniryenメソッドを公開するスタンドアロンJavaScriptライブラリ。ビルドについては、npmのbinaryen.jsを参照してください（またはGithubまたはunpkgから直接ダウンロードしてください）。最小要件：node.js V15.8またはChrome V75またはFirefox V78。

すべてのバイナリツールは決定論的です。つまり、同じ入力が与えられると、常に同じ出力を取得する必要があります。（そうでなければ動作するケースが表示されている場合は、問題を提出してください。）

それぞれの使用手順は以下にあります。

バイナリエン最適化

Binaryenには、WebAssemblyをより小さく速くするために、多くの最適化パスが含まれています。 wasm-optを使用してバイナリオプティマイザーを実行できますが、 wasm2jsやwasm-metadceなどの他のツールを使用しながら実行することもできます。

デフォルトの最適化パイプラインは、 addDefaultFunctionOptimizationPassesなどの関数によって設定されます。
可能性の低いトラップを無視したり、ヒューリスティックをインラキングする、速いことなど、最適化と縮小レベルを調整するために設定できるさまざまなパスオプションがあります。 wasm-opt --help参照してください。

それが何をするかの詳細については、各最適化パスを参照してくださいが、ここに関連するもののいくつかの簡単な概要があります。

coalescelocals-キー「登録割り当て」パス。ライブレンジ分析を行い、その数を最小化するために地元の人々を再利用し、それらの間のコピーを削除します。
CodeFolding-マージして重複したコードを回避します（例：Armが最後に共有の指示があるif 2つの場合）。
CODEPUSHING-ブランチ操作を過ぎてコードを「プッシュ」し、ブランチが使用された場合にコードを実行しない可能性があります。
DeadargumentElimination -LTOは、同じ定数で常に呼び出される場合、関数を削除するために渡されます。
DeadCodeElimination
Directize-テーブルインデックスが一定の場合、間接コールを通常の呼び出しにします。
DuplicateFunctionElimination -LTO Pass。
インライン化-LTOパス。
localcse-単純なローカル共通サブエクスペッション除去。
loopinvariantCodemotion
メモリパッキング- セグメントを組み合わせ、不要な部品を削除するキー「最適化データセグメント」パス。
Mergeblocks-可能な場合は、 block外側のブロックにマージして、数を減らします。
合併- 2人の地元の人々がオーバーラップの一部で同じ価値を持っている場合、Coalescelocalsが後でより良くなるのを助ける方法で選択します（Coalescelocalsから分裂して後者を単純に保ちます）。
minifimportsandexports-それらを「a」、「b」などに模倣します。
optimizeaddedConstants-定数が追加されています。
OptimizeInstructions -Key Peephole Optimization Passは、パターンの絶えず増加しているリストを使用します。
PickLoadSigns-後で署名/署名操作を避けるために、負荷が署名されているか署名されているかどうかを調整します。
Precopute-組み込みのインタープリターを使用して、コンパイル時に定数式を計算します（これは、一定の式を処理できるように保証されています）。
RERELOOP -WASM構造化制御フローをCFGに変換し、Relooperアルゴリズムを使用して構造化された形式に戻り、より最適な形状を見つける可能性があります。
redundantsetelimination-ローカルに既に存在する値のlocal.setを削除します。（Coalescelocalsと重複しています。これにより、他のすべての作業が行われずに言及された特定の操作が達成されます。したがって、最適化パイプラインの他の場所で役立ちます。）
removeunsedbrs -Jumpスレッドやbrまたはbr_tableを取り除く可能性のあるさまざまな変換を含むキー「マイナーコントロールフロー最適化」パス（可能な場合if中央にbrを使用してblockを回すなど）。
removeUsusedModuleElements- 「グローバルDCE」は、使用されていないときに輸入、関数、グローバルなどを削除するLTOパスです。
ReorderFunctions-より多くのコール機能を最初に配置し、潜在的に、排出されたLebがそれらをより小さく（非常に大きなプログラムで）呼び出すことができるようにします。
Reorderlocals-より使用した地元の人々を最初に置き、潜在的に、排出されたLebがそれらをより小さく（非常に大きな機能で）使用できるようにします。ソートの後、それはまったく使用されていない地元の人々も削除します。
SimplifyGlobals-たとえば、グローバルをさまざまな方法で最適化します。たとえば、それらを融合させ、不変のグローバルから一定の値を適用するグローバルから変化を除去します。
SimplifyLocals -key " local.get/set/tee " optimizationパス。セットを交換して、セットの値をGet（およびTeeを作成する）に移動することなどを行います。また、値を渡すためにローカルを使用する代わりにblock/if/loop戻り値を作成します。
真空- キー「愚かなコードを削除する」パス、内容のないif 、副作用のない一定の値のドロップ、一人の子供を持つblockなどを削除するなどを行います。

上記の「LTO」は、最適化が複数の関数にわたって機能するという点でリンク時間最適化のようなものであることを意味しますが、ある意味では、最終リンクされたWASMで通常実行されるため、Binaryenは常に「LTO」です。

バイナリエンオプティマイザーの高度な最適化手法には、SSAIFICITION、FLAT IR、およびSTACK/POPPY IRが含まれます。

オプティマイザーを効果的に使用する方法の詳細については、Optimizer Cookbook Wikiページを参照してください。

Binaryenには、JavaScript、Asyncifyなどの合法化など、最適化以外のことを行うさまざまなパスも含まれています。

建物

BinaryenはGitサブモジュールを使用します（GTESTのためだけに書く時点で）。したがって、ビルドする前にサブモジュールを初期化する必要があります。

git submodule init
git submodule update

その後、cmakeで構築できます。

cmake . && make

C ++ 17コンパイラが必要です。 MacOSでは、たとえばbrew install cmake cmakeを介してCmakeをインストールする必要があります。 ninja発電機として使用することもできることに注意してください： cmake -G Ninja . && ninja 。

GTESTの依存関係を回避するために、 -DBUILD_TESTS=OFFをcmakeに渡すことができます。

binaryen.jsは、sdkを介してインストールできるemscriptenを使用して構築できます。

node.js用の建物：

emcmake cmake . && emmake make binaryen_js

ブラウザ用の構築：

emcmake cmake -DBUILD_FOR_BROWSER=ON . && emmake make

ビジュアルC ++

Microsoft Visual Studioインストーラーを使用して、「CMake用のVisual C ++ツール」コンポーネントをインストールします。
プロジェクトを生成します：
```
mkdir build
cd build
" %VISUAL_STUDIO_ROOT%Common7IDECommonExtensionsMicrosoftCMakeCMakebincmake.exe " ..
```
Visual StudioインストールへのパスでVisual_Studio_Rootを置き換えます。 Visual Studioビルドツールを使用している場合、パスは「C：プログラムファイル（x86） Microsoft Visual Studio 2017 BuildTools」になります。
開発者コマンドプロンプトから、目的のプロジェクトを構築します。
```
msbuild binaryen.vcxproj
```
Cmakeは、すべてのプロジェクトを便利に構築するために、「all_build.vcxproj」という名前のプロジェクトを生成します。

リリース

ビルドは、emscripten、 wasm-packなどのBinaryenを使用するさまざまなツールチェーンによって配布されます。Githubには公式リリースもあります。

https://github.com/webassembly/binaryen/releases

現在、次のプラットフォームのビルドが含まれています。

Linux-x86_64
Linux-arm64
MacOS-x86_64
MacOS-arm64
Windows-x86_64
Node.js （実験）：javascript+webAssemblyへのwasm-optのポート。 node.jsが実行されている任意のプラットフォームでwasm-optのネイティブビルドのドロップイン置換としてnode wasm-opt.jsを実行します。 node.js 18+が必要です（WASM EHおよびWASMスレッドの場合）。（このビルドは、Deno、Bun、またはその他のJavaScript+WebAssembly環境でも実行される場合がありますが、Node.jsでのみテストされています）

ランニング

wasm-opt

走る

bin/wasm-opt [.wasm or .wat file] [options] [passes, see --help] [--help]

WASM Optimizerは、入力としてWebAssemblyを受信し、変換を実行することができます。たとえば、試してみてください

bin/wasm-opt test/lit/passes/name-types.wast -all -S -o -

これにより、テストスイートにテストケースの1つが出力されます。変換パスを実行するには、試してみてください

bin/wasm-opt test/lit/passes/name-types.wast --name-types -all -S -o -

name-types Passは、各タイプに名前があり、非常に長いタイプ名を変更します。 2つのコマンドの出力を比較することにより、変換が引き起こす変更を確認できます。

独自の変換パスをシェルに追加し、 .cppファイルをsrc/passesに追加してシェルを再構築するのは簡単です。たとえば、コードを使用して、 name-typesパスをご覧ください。

いくつかのメモ：

bin/wasm-opt --helpオプションとパスの完全なリストについては、ヘルプ。
--debugを渡すと、いくつかのデバッグ情報が発生します。個々のデバッグチャネル（ #define DEBUG_TYPE xxxを介してソースコードで定義）は、コンマ分離された文字列のリストとして渡すことで有効にできます。例： bin/wasm-opt --debug=binary 。これらのデバッグチャネルは、 BINARYEN_DEBUG環境変数を介して有効にすることもできます。

wasm2js

走る

bin/wasm2js [input.wasm file]

これにより、JavaScriptがコンソールに印刷されます。

たとえば、試してみてください

bin/wasm2js test/hello_world.wat

その出力には含まれています

 function add ( x , y ) {
  x = x | 0 ;
  y = y | 0 ;
  return x + y | 0 | 0 ;
 }

の翻訳として

 ( func $add (; 0 ;) ( type $0 ) ( param $x i32 ) ( param $y i32 ) ( result i32 )
  ( i32.add
   ( local.get $x )
   ( local.get $y )
  )
 )

WASM2JSの出力はES6モジュール形式です - 基本的に、WASMモジュールをES6モジュールに変換します（古いブラウザーとnode.jsバージョンで実行するには、babelなどを使用してES5に変換できます）。 Hello World Watを呼んでいる例を見てみましょう。まず、メインJSファイルを作成します。

 // main.mjs
import { add } from "./hello_world.mjs" ;
console . log ( 'the sum of 1 and 2 is:' , add ( 1 , 2 ) ) ;

これを実行します（ES6モジュールサポートを備えた新しいNode.jsが必要であることに注意してください）：

$ bin/wasm2js test/hello_world.wat -o hello_world.mjs
$ node --experimental-modules main.mjs
the sum of 1 and 2 is: 3

wasm2jsの出力では、物事は留意してください。

-Oまたは別の最適化レベルを使用して、リリースビルドの最適化でwasm2jsを実行する必要があります。パイプライン全体（WASMおよびJS）全体に沿って最適化されます。しかし、JSミニファーがWhitespaceをMinifyするようにすべてを実行するわけではないため、その後は通常のJSミニファーを実行する必要があります。
高速JavaScriptコードでWebAssemblyセマンティクスを100％正確に一致させることはできません。たとえば、すべての負荷とストアがトラップする場合があり、JavaScriptを実行させるには、どこにでもチェックを追加する必要があります。これは大きくて遅くなります。代わりに、wasm2jsは負荷とストアがトラップされないと想定しています。int/float変換はトラップしないなどです。また、非閉じ込められたフロートのように、コンバージョンのコーナーケースにわずかな違いがある場合があります。

WASM-CTOR-EVAL

wasm-ctor-evalコンパイル時に関数、またはそれらの一部を実行します。その後、ランタイム状態をWASMにシリアル化します。これは「スナップショット」を取るようなものです。 WASMが後でロードされてVMで実行されると、すでに実行されている作業を再入力することなく、その時点から実行を継続します。

たとえば、この小さなプログラムを考えてみましょう。

( module
 ;; A global variable that begins at 0.
 ( global $global ( mut i32 ) ( i32.const 0 ))

 ( import " import " " import " ( func $import ))

 ( func " main "
  ;; Set the global to 1.
  ( global.set $global
   ( i32.const 1 ))

  ;; Call the imported function. This *cannot* be executed at
  ;; compile time.
  ( call $import )

  ;; We will never get to this point, since we stop at the
  ;; import.
  ( global.set $global
   ( i32.const 2 ))
 )
)

このようなコンパイル時間でその一部を評価できます。

wasm-ctor-eval input.wat --ctors=main -S -o -

これは、実行したい単一の関数があることを示しています（「ctor」は「グローバルコンストラクター」、プログラムのエントリポイントの前に実行されるコードから来る名前）、そしてそれをテキストとしてstdoutに印刷することです。その結果、これは次のとおりです。

trying to eval main
  ...partial evalling successful, but stopping since could not eval: call import: import.import
  ...stopping
(module
 (type $none_ = > _none (func))
 (import " import " " import " (func $import ))
 (global $global (mut i32) (i32.const 1))
 (export " main " (func $0 _0))
 (func $0 _0
  (call $import )
  (global.set $global
   (i32.const 2)
  )
 )
)

ロギングは、すべてのmain()の一部を評価していることを示していますが、予想通りではありません。最初のglobal.getを評価できますが、インポートされた関数への呼び出しで停止します（WASMが実際にVMで実行されるときにその関数が何であるかわからないため）。出力がWASMでは、グローバルの値が0から1に更新され、最初のglobal.getが削除されたことに注意してください。WASMは、VMで実行すると、 wasm-ctor-evalに実行され続けるという状態にあります。

この小さな例では、少量の作業を保存しました。どれだけの作業を節約できるかは、プログラムによって異なります。（それは純粋な計算を前もって行い、できるだけ遅く輸入への呼び出しを残すのに役立ちます。）

前述のように、 wasm-ctor-evalの名前はグローバルコンストラクター関数に関連していることに注意してくださいが、ここで実行できるものには制限はありません。その内容が適切な場合、WASMからのエクスポートは実行できます。たとえば、emscriptenでは、可能な場合はmain()でwasm-ctor-evalが実行されます。

wasm-merge

wasm-merge WASMファイルを組み合わせます。たとえば、複数のツールチェーンのWASMファイルを使用するプロジェクトがあると想像してください。 1つのWASMファイルでは、モジュール間の呼び出しがモジュール内の通常の呼び出しになるため、速度とサイズを改善する可能性があるため、モジュール間の呼び出しがモジュール内の通常の呼び出しになるためです。

wasm-merge通常のWASMファイルで動作します。 wasm-ldはWASMオブジェクトファイルで動作するため、その点でwasm-ld LDとは異なります。 wasm-merge少なくとも1つのツールチェーンがWASMオブジェクトファイルを使用しないマルチツールチェーンの状況で役立ちます。

たとえば、これら2つのWASMファイルがあると想像してください。

 ;; a.wasm
( module
  ( import " second " " bar " ( func $second.bar ))

  ( export " main " ( func $func ))

  ( func $func
    ( call $second.bar )
  )
)

 ;; b.wasm
( module
  ( import " outside " " log " ( func $log ( param i32 )))

  ( export " bar " ( func $func ))

  ( func $func
    ( call $log
      ( i32.const 42 )
    )
  )
)

ローカルドライブのファイル名はa.wasmとb.wasmですが、マージ /バンドリングの目的では、1つ目は"first"として知られており、2番目は"second"として知られています。つまり、最初のモジュールの"second.bar"のインポートが、2番目のモジュールの関数$funcを呼び出すことを望んでいます。これがそのためのwasm-mergeコマンドです：

wasm-merge a.wasm first b.wasm second -o output.wasm

最初のWASMファイル、次にその名前、次に2番目のWASMファイル、次にその名前を付けます。マージされた出力はこれです：

( module
  ( import " outside " " log " ( func $log ( param i32 )))

  ( export " main " ( func $func ))
  ( export " bar " ( func $func_2 ))

  ( func $func
    ( call $func_2 )
  )

  ( func $func_2
    ( call $log
      ( i32.const 42 )
    )
  )
)

wasm-merge 2つのファイルを1つに組み合わせて、機能、インポートなどをすべてマージし、名前の競合を修正し、対応するインポートをエクスポートに接続しました。特に、 $func $func_2呼び出す方法に注意してください。これはまさに私たちが望んでいたものです： $func_2 2番目のモジュールの関数です（名前の衝突を避けるために変更されました）。

この例のWASM出力は、追加の最適化の恩恵を受ける可能性があることに注意してください。まず、 $func_2への呼び出しを簡単にインラインすることができるため、 wasm-opt -O3を実行してそれを行うことができます。また、すべての輸入品と輸出を必要としない場合があります。そのため、WASM-Metadceを実行できます。優れたワークフローは、 wasm-mergeを実行してから、 wasm-metadce実行してから、 wasm-optで終了することです。

wasm-merge 、「JSバンドラー」という意味で、WASMの意味で、WASMファイルのバンドラーのようなものです。つまり、上記のWASMファイルを使用して、実行時にこのJSコードをインスタンス化して接続するためのJSコードがあると想像してください。

 // Compile the first module.
var first = await fetch ( "a.wasm" ) ;
first = new WebAssembly . Module ( first ) ;

// Compile the first module.
var second = await fetch ( "b.wasm" ) ;
second = new WebAssembly . Module ( second ) ;

// Instantiate the second, with a JS import.
second = new WebAssembly . Instance ( second , {
  outside : {
    log : ( value ) => {
      console . log ( 'value:' , value ) ;
    }
  }
} ) ;

// Instantiate the first, importing from the second.
first = new WebAssembly . Instance ( first , {
  second : second . exports
} ) ;

// Call the main function.
first . exports . main ( ) ;

wasm-mergeが行うことは、基本的にJSが行うことです。エクスポートにインポートを接続し、提供したモジュール名を使用して名前を解決します。つまり、 wasm-merge実行することにより、ランタイムからコンパイルされるモジュールを接続する作業を動かしています。その結果、 wasm-mergeを実行した後、同じ結果を得るにはJSがはるかに少ない必要があります。

 // Compile the single module.
var merged = await fetch ( "merged.wasm" ) ;
merged = new WebAssembly . Module ( merged ) ;

// Instantiate it with a JS import.
merged = new WebAssembly . Instance ( merged , {
  outside : {
    log : ( value ) => {
      console . log ( 'value:' , value ) ;
    }
  }
} ) ;

// Call the main function.
merged . exports . main ( ) ;

マージされたWASMを取得してコンパイルし、JSインポートを提供する必要がありますが、2つのWASMモジュールを接続する作業はもう必要ありません。

エクスポートの処理

デフォルトでは、エクスポート名が重複している場合はwasm-mergeエラー。つまり、 wasm-merge 、外部から表示されていないため（コードはまだ同じように動作します）、輸出と改名された場合、外部を変更するために変更するために変更する必要があるため、wasm-mergeは重複する関数名などを自動的に処理します。

エクスポートの名前を変更したい場合は、 --rename-export-conflictsでwasm-merge実行します。後のエクスポートには、以前のエクスポートと重複しないように、サフィックスが追加されます。接尾辞は決定論的であるため、それらが何であるかを確認したら、外側から呼び出すことができます。

別のオプションは、競合する名前がある後のエクスポートを単純にスキップするだけで--skip-export-conflictsを使用することです。たとえば、これは、最初のモジュールが外部と対話する唯一のモジュールであり、後のモジュールが最初のモジュールと対話する場合に役立ちます。

特徴

wasm-mergeマルチメモリとマルチテーブル機能を使用しています。つまり、複数の入力モジュールにそれぞれメモリがある場合、出力WASMにはいくつかの記憶があり、マルチメモリ機能に依存します。つまり、古いWASM VMがWASMを実行できない可能性があります。（このような古いVMの回避策としてwasm-opt --multi-memory-loweringを実行することができます。

テスト

./check.py

（またはpython check.py ）は、 wasm-shell 、 wasm-optなどをtest/のテストケースで実行し、出力を検証します。

check.pyスクリプトはいくつかのオプションをサポートしています。

./check.py [--interpreter = /path/to/interpreter] [TEST1] [TEST2]..

インタープリターが提供されている場合、それを通して出力を実行し、解析エラーを確認します。
テストが提供されている場合、それらを正確に実行します。何も提供されていない場合、それらすべてを実行します。どのテストが利用可能かを確認するには、run ./check.py --list-suites 。
一部のテストでは、パス内のemccまたはnodejs必要です。ツールが見つからない場合は実行されません。警告が表示されます。
tests/specの上流からのテスト、Gitサブモジュールがあります。 running ./check.pyはそれらを更新する必要があります。

Legacy WASM-OPTテストを徐々に移植して、 litとfilecheck変更するときに使用しようとしていることに注意してください。出力が廃棄さpasses passesテストの場合、これはscripts/port_passes_tests_to_lit.pyで自動的に実行できます。

LITテストの場合、テストの期待（チェックライン）は、バイナリの変更が行われると、多くの場合自動的に更新できます。 scripts/update_lit_checks.pyを参照してください。

ほとんどの場合、非明かりのテストも自動的に更新できます。 scripts/auto_update_tests.pyを参照してください。

依存関係の設定

./third_party/setup.py [mozjs | v8 | wabt | all]

（またはpython third_party/setup.py ）Spidermonkey JSシェル、V8 JSシェル、WABTのような必要な依存関係をthird_party/にインストールします。他のスクリプトは、インストール時にこれらを自動的にピックアップします。

pip3 install -r requirements-dev.txtを実行して、 litテストの要件を取得します。 $PATH （linux、 ~/.local/bin ）にロケーションpipをインストールする必要があることに注意してください。

ファジング

./scripts/fuzz_opt.py [--binaryen-bin = build/bin]

（またはpython scripts/fuzz_opt.py ）は、バグが可能になるまで、ランダムなパスでランダム入力でさまざまなファジングモードを実行します。すべての詳細については、Wikiページを参照してください。

デザイン原則

名前のインターン文字列：文字列と数値インデックスのパフォーマンスの違いのほとんどを回避するために、数値インデックスなどではなく、ノードに名前を付けるのは非常に便利です。すべての文字列はインターンされています。
アリーナの割り当て：他の最適化/変換ツールチェーンの経験に基づいて、個々のノードのメモリを慎重に追跡するためにオーバーヘッドの価値はありません。代わりに、アリーナ内のモジュールのすべての要素を割り当て、モジュールが不要になったときにアリーナ全体を解放できます。

デバッグ情報サポート

ソースマップ

Binaryen can read and write source maps (see the -ism and -osm flags to wasm-opt ). It can also read and read source map annotations in the text format, that is,

 ;; @ src.cpp:100:33
( i32.const 42 )

That 42 constant is annotated as appearing in a file called src.cpp at line 100 and column 33 . Source maps and text format annotations are interchangeable, that is, they both lead to the same IR representation, so you can start with an annotated wat and have Binaryen write that to a binary + a source map file, or read a binary + source map file and print text which will contain those annotations.

The IR representation of source map info is simple: in each function we have a map of expressions to their locations. Optimization passes should update the map as relevant. Often this "just works" because the optimizer tries to reuse nodes when possible, so they keep the same debug info.

Shorthand notation

The text format annotations support a shorthand in which repeated annotations are not necessary. For example, children are tagged with the debug info of the parent, if they have no annotation of their own:

 ;; @ src.cpp:100:33
( i32.add
  ( i32.const 41 )      ;; This receives an annotation of src.cpp:100:33
  ;; @ src.cpp:111:44
  ( i32.const 1 )
)

The first const will have debug info identical to the parent, because it has none specified, and generally such nesting indicates a "bundle" of instructions that all implement the same source code.

Note that text printing will not emit such repeated annotations, which can be confusing. To print out all the annotations, set BINARYEN_PRINT_FULL=1 in the environment. That will print this for the above add :

[i32] ;; @ src.cpp:100:33
( i32.add
 [i32] ;; @ src.cpp:100:33
 ( i32.const 41 )
 [i32] ;; @ src.cpp:111:44
 ( i32.const 1 )
)

(full print mode also adds a [type] for each expression, right before the debug location).

The debug information is also propagated from an expression to its next sibling:

 ;; @ src.cpp:100:33
( local.set $x
 ( i32.const 0 )
)
( local.set $y ;; This receives an annotation of src.cpp:100:33
 ( i32.const 0 )
)

You can prevent the propagation of debug info by explicitly mentioning that an expression has not debug info using the annotation ;;@ with nothing else:

 ;; @ src.cpp:100:33
( local.set $x
 ;; @
 ( i32.const 0 ) ;; This does not receive any annotation
)
;; @
( local.set $y ;; This does not receive any annotation
 ( i32.const 7 )
)

This stops the propagatation to children and siblings as well. So, expression (i32.const 7) does not have any debug info either.

There is no shorthand in the binary format. That is, roundtripping (writing and reading) through a binary + source map should not change which expressions have debug info on them or the contents of that info.

Implementation Details

The source maps format defines a mapping using segments , that is, if a segment starts at binary offset 10 then it applies to all instructions at that offset and until another segment begins (or the end of the input is reached). Binaryen's IR represents a mapping from expressions to locations, as mentioned, so we need to map to and from the segment-based format when writing and reading source maps.

That is mostly straightforward, but one thing we need to do is to handle the lack of debug info in between things that have it. If we have ABC where B lacks debug info, then just emitting a segment for A and C would lead A 's segment to also cover B , since in source maps segments do not have a size - rather they end when a new segment begins. To avoid B getting smeared in this manner, we emit a source maps entry to B of size 1, which just marks the binary offset it has, and without the later 3 fields of the source file, line number, and column. (This appears to be the intent of the source maps spec, and works in browsers and tools.)

DWARF

Binaryen also has optional support for DWARF. This primarily just tracks the locations of expressions and rewrites the DWARF's locations accordingly; it does not handle things like re-indexing of locals, and so passes that might break DWARF are disabled by default. As a result, this mode is not suitable for a fully optimized release build, but it can be useful for local debugging.

よくある質問

Why the weird name for the project?

Binaryen's name was inspired by Emscripten 's: Emscripten's name suggests it converts something into a script - specifically JavaScript - and Binaryen's suggests it converts something into a binary - specifically WebAssembly . Binaryen began as Emscripten's WebAssembly generation and optimization tool, so the name fit as it moved Emscripten from something that emitted the text-based format JavaScript (as it did from its early days) to the binary format WebAssembly (which it has done since WebAssembly launched).

"Binaryen" is pronounced in the same manner as "Targaryen".

Does it compile under Windows and/or Visual Studio?

はい、そうです。 Here's a step-by-step tutorial on how to compile it under Windows 10 x64 with with CMake and Visual Studio 2015 . However, Visual Studio 2017 may now be required. Help would be appreciated on Windows and OS X as most of the core devs are on Linux.

拡大する