stringsifterのダウンロードstringsifterソースコードのダウンロード

stringsifter

その他のカテゴリー

1.0.0

ダウンロード

Stringsifterは、マルウェア分析との関連性に基づいて文字列を自動的にランク付けする機械学習ツールです。

クイックリンク

テクニカルブログポスト -より速いマルウェア分析のために文字列出力をランク付けすることを学ぶ
発表blogpost -Open Sourcing Stringingifter
derbycon talk-文字盤：速度のマルウェア分析のために文字列出力をランク付けすることを学ぶ
StringsifterがPYPIでリリースします

使用法

Stringsifterには、Pythonバージョン3.9以降が必要です。次のコマンドを実行して、コードを取得し、ユニットテストを実行し、ツールを使用します。

インストール

pip install stringsifter

開発のために、詩を使用してください。

git clone https://github.com/mandiant/stringsifter.git
cd stringsifter
poetry install --with dev

ユニットテストの実行

Stringsifterインストールディレクトリからユニットテストを実行するには：

poetry run tests -v

コマンドラインから走ります

pip installコマンドは、2つの実行可能なスクリプトflarestringsとrank_strings Python環境にインストールします。ソースから開発するときは、 pipenv run flarestringsとpipenv run rank_strings使用します。

flarestrings 、Gnu Binutilsのstringsの特徴を模倣し、 rank_stringsパイプされた入力を受け入れます。

flarestrings < my_sample > | rank_strings

rank_strings 、多くのコマンドライン引数をサポートしています。ポジション引数input_strings 、ランク付けする文字列のファイルを指定します。オプションの引数は次のとおりです。

オプション	意味
- スコア（-s）	出力にランクスコアを含めます
-limit（-l）	制限出力は、 `limit`ランクの文字列になります
- マインスコア（-m）	スコアのある文字列に出力を制限> = `min-score`
- バッチ（-b）	バッチ処理用の`strings`出力のフォルダーを指定します

ランク付けされた文字列は、 --batchオプションが指定されていない限り標準出力に書き込まれ、ランク付けされた出力は<input_file>.ranked_stringsという名前のファイルに書き込まれます。

flarestrings 、デフォルトの4ではなく、少なくともmin-len文字の文字のシーケンスを印刷するオプション-n （または--min-len ）をサポートします。

flarestrings -n 8 < my_sample > | rank_strings

長さ8以上の文字列のみを印刷してランク付けします。

Dockerコンテナから実行されます

レポをクローニングした後、コンテナを構築します。パッケージのトップレベルディレクトリから：

docker build -t stringsifter -f docker/Dockerfile .

それぞれのコマンドを使用するために、 flarestringsまたはrank_strings引数を使用してコンテナを実行します。コンテナ化されたコマンドは、パイプラインで使用できます。

cat < my_sample > | docker run -i stringsifter flarestrings | docker run -i stringsifter rank_strings

または、 -vフラグを使用してホストディレクトリをコンテナに公開するために、シェルプロンプトを取得するために引数なしでコンテナを実行します。

docker run -v < my_malware > :/samples -it stringsifter

たとえば、 <my_malware>に分析用のサンプルが含まれています。

docker run -v $HOME /malware/binaries:/samples -it stringsifter

コンテナプロンプトで：

flarestrings /samples/ < my_sample > | rank_strings < options >

すべてのコマンドライン引数は、コンテナ化されたスクリプトでサポートされています。

フロス出力での実行

弦楽器は、文字列の任意のリストに適用でき、ライブメモリダンプ、サンドボックスラン、および難読化された文字列を含むバイナリなどの代替インテリジェンス収集ソースから洞察を収集しようとする実務家にとって有用です。たとえば、Fireeye Labsは文字列ソルバー（Floss）を抽出しますが、弦と同様に印刷可能な文字列を抽出しますが、さらに、スタックにエンコード、梱包、または手動で構築された難読化された文字列が明らかになります。文字列のインライン代替品として使用できます。つまり、弦楽器は次のコマンドを使用してフロス出力で同様に呼び出すことができます。

 $PY2_VENV /bin/floss –q < options > < my_sample > | rank_strings < options >

注：

–q引数は、ヘッダーとフォーマットを抑制して、抽出された文字列のみを表示します。追加のフロスオプションの詳細については、その使用ドキュメントをご覧ください。
FlossはPython 2を必要としますが、StringsifterはPython 3を必要とします。例のコマンドでは、 flossまたはrank_stringsの少なくとも1つがPython仮想環境を参照する相対パスを含める必要があります。
フロスは、スタンドアロン実行可能ファイルとしてダウンロードできます。この場合、実行可能ファイルはPythonインタープリターに依存していないため、Python環境を指定する必要はありません。

ランニング`strings`に関するメモ

この分布には、プラットフォーム全体で予測可能な出力を確保するためのflarestringsプログラムが含まれています。システムのインストールされているstringsを実行することを選択した場合、そのオプションはバージョンやプラットフォーム間で一貫していないことに注意してください。

Linux

ほとんどのLinux分布には、Gnu Binutilsのstringsプログラムが含まれます。「広い」文字列と「狭い」文字列の両方を抽出するには、プログラムを2回実行する必要があります。

strings < my_sample >       > strs.txt   # narrow strings
strings -el < my_sample >  >> strs.txt   # wide strings.  note the ">>"

macos

macOSでパッケージ化されたBSD stringsの一部のバージョンは、広い弦をサポートしていません。また、ファイル全体をスキャンする文字列の-aオプションは、デフォルトの構成で無効になる場合があることに注意してください。 -aがない場合は、有益な文字列が失われる可能性があります。 HomebrewまたはMacPortsを介してGNU Binutilsをインストールして、幅広いキャラクターをサポートするstringsのバージョンを入手することをお勧めします。ケアを使用して、正しいバージョンのstringsを呼び出します。

Windows

strings 、デフォルトでWindowsにインストールされていません。 Windows Sysinternals、Cygwin、またはMalcode Analyst Packをインストールして、作業stringsを取得することをお勧めします。

議論

このバージョンのStringsifterは、最初のEmberデータセットに関連付けられたサンプリングされたマルウェアバイナリからの文字列出力を使用してトレーニングされました。順序ラベルは、弱い監督手順を使用して生成され、監視された学習は、ランクトゥランク目的関数を備えた勾配ブースト決定ツリーによって実行されます。詳細な詳細については、クイックリンクを参照してください。将来のリリースでこのアプローチを再考する場合がありますが、ラベル付きデータもトレーニングコードも現在利用できないことに注意してください。

問題

Githubの問題を使用して、バグと機能リクエストを投稿します。

謝辞

Fireeye Data Science（FDS）およびFireeye Labs Reverse Engineering（Flare）チームのレビューとフィードバックのおかげで。
Stringsifterは、Philip Tully（FDS）、Matthew Haigh（Flare）、Jay Gibble（Flare）、Michael Sikorski（Flare）によって設計および開発されました。
Stringsifterロゴは、Josh Langner（Flare）によって設計されました。
flarestringsは、優れたツールフロスから派生しています。

拡大する

追加情報