db benchmarksのダウンロード-DB db benchmarksソースコードのダウンロード

db benchmarks

その他のソースコード

1.0.0

ダウンロード

DBベンチマークロゴ

ベンチマーク•イントロ•これが重要な理由•機能•テスト原則•インストール•UI

導入

https://db-benchmarks.comは、データベースと検索エンジンのベンチマークを作成することを目指しています。

⚖️公正で透明性- これまたはそのデータベース /検索エンジンがこれまたはそのパフォーマンスを提供する条件下で明確にする必要があります

高品質- 変動係数の制御により、今日、明日、または来週クエリを実行した場合、同じままの結果を生成できます

？簡単に再現できます- 誰でも自分のハードウェアでテストを再現できます

理解しやすい- チャートは非常にシンプルです

extende拡張可能- プラグ可能なアーキテクチャにより、より多くのデータベースを追加してテストすることができます

そして、それをすべて100％オープンソースに保ちます！

このリポジトリは、ジョブを行うテストフレームワークを提供します。

なぜこれが重要なのですか？

多くのデータベースベンチマークは客観的ではありません。他の人は、結果の正確性と安定性を確保するのに十分なことをしません。いくつかの例：

Druid vs Clickhouse vs Rockset

https://imply.io/blog/druid-nails-cost-efficiency-challenge-ageainst-clickhouse-and-rockset/：

実際には、同じハードウェア、M5.8xlargeでベンチマークを作成したかったのですが、M5.8xLarge用に持っている唯一の事前に焼き付けられた構成は、実際にはM5D.8XLARGEです...代わりに、C5.9XLARGEインスタンスで実行します。

悪いニュース、みんな：さまざまなハードウェアでベンチマークを実行すると、少なくとも他の何かの「106.76％」と「103.13％」であると言うことはできません。同じベアメタルサーバーでテストする場合でも、5％未満の変動係数を取得することは非常に困難です。さまざまなサーバーの3％の違いは無視できる可能性があります。それをすべて考えると、最終的な結論が真であることをどのように確認できますか？

多くのデータベースとエンジン

https://tech.marksblogg.com/benchmarks.html

マークは、非常に多くの異なるデータベースと検索エンジンでタクシーに乗るテストを行う素晴らしい仕事をしました。しかし、テストは異なるハードウェアで行われるため、結果のテーブルの数値は実際には匹敵しません。テーブルの結果を評価するときは、常にこれを念頭に置いておく必要があります。

クリックハウス対その他

https://clickhouse.com/benchmark/dbms/

各クエリを3回だけ実行すると、それぞれのバリエーションの係数が非常に高いと思われます。つまり、1分後にテストを実行すると、20％のバリエーションが得られる可能性があります。そして、自分のハードウェアでテストをどのように再現しますか？残念ながら、私はそれがどのようにできるかを見つけることができません。

テスト原則

私たちの信念は、公正なデータベースベンチマークはいくつかの重要な原則に従うべきであるということです。

cordまったく同じハードウェアで異なるデータベースをテストします

それ以外の場合は、小さな違いがある場合はエラーマージンを確認する必要があります。

full各テストの前に完全なOSキャッシュをパージしたテスト

それ以外の場合は、コールドクエリをテストすることはできません。

testされているデータベースは、すべての内部キャッシュを無効にする必要があります

それ以外の場合は、キャッシュパフォーマンスを測定します。

coldあなたもコールドランを測定する場合に最適です。コールドクエリが頻繁に発生する可能性のある分析クエリにとって特に重要です

それ以外の場合は、データベースがI/Oを処理する方法を完全に非表示にします。

testテスト中に他に実行されるべきではありません

それ以外の場合、テスト結果は非常に不安定です。

query各クエリの前にデータベースを再起動する必要があります

それ以外の場合、内部キャッシュのクリアにもかかわらず、以前のクエリは現在のクエリの応答時間に影響を与える可能性があります。

dataデータベースが開始された後、データベースが完全に暖まるまで待つ必要があります

それ以外の場合は、テスト結果を大幅に台無しにする可能性のあるI/Oのデータベースのウォームアッププロセスと競合することになります。

bariation係数を提供する場合に最適なので、誰もがあなたの結果がどれほど安定しているかを理解し、それが十分に低いことを確認してください

変動係数は、テスト結果の安定性を示す非常に優れたメトリックです。 n％よりも高い場合、あるデータベースが別のデータベースよりもn％高速であるとは言えません。

codific CPU周波数でテストする場合に最適

それ以外の場合、「オンデマンド」CPUガバナー（通常はデフォルトです）を使用している場合、500msの応答時間を1000以上のMSに簡単に変えることができます。

hddではなくSSD/NVMEでテストする場合に最適

それ以外の場合、ファイルがHDDの場所に応じて、最大2倍低い/高いI/Oパフォーマンス（テスト）を得ることができます。

テストフレームワーク

https://db-benchmarks.comのバックエンドで使用されるテストフレームワークは、完全にオープンソース（Agplv3ライセンス）であり、https：//github.com/db-benchmarks/db-benchmarksにあります。これがそれがすることです：

リポジトリに含まれるデータベース/検索エンジンへのデータの読み込みを自動化します。
特定のCPU/RAMの制約でDockerでデータベース/検索エンジンを実行できます。
テスト中：
- OSキャッシュを自動的にパージします
- 各コールドランの前に、データベースのキャッシュを自動化します
- 各コールドランの前にデータベースを再起動します
- スロットリングを避けるために、CPU温度の世話をします
- クエリを作成しながら変動係数の世話をし、次のようにすぐに停止できます。
  - CVは十分に低いです
  - そして、作成されたクエリの数で十分です
- データベース/検索エンジンを起動した後、ウォームアップ段階（ディスクから必要なデータを事前に読んでください）を実行して、次のように待機を停止します。
  - 数秒間IOはありません
  - また、データベース/検索エンジンに接続できます
- データベース/検索エンジンを停止した後、完全に停止するまで待機します
- 異なるタイムアウトを受け入れることができます：開始、ウォームアップ、初期接続、データベース/検索エンジンに関する情報の取得、クエリ
- データベースのベンチマークアルゴリズム機能をより客観的に可能にする1つの物理コアをエミュレートできます（ --limited ）
- CIシステムとの統合を容易にするために、すべての値をコマンドライン引数と環境変数として受け入れることができます
- --testテスト結果をファイルに保存します
- --saveファイルからテスト結果をリモートデータベースに保存します（テストされたものはどちらも）
- テスト中に多くのことを追跡します：
  - サーバー情報：CPU、メモリ、実行プロセス、ファイルシステム、ホスト名
  - ローカルの変更がないことを確認するための現在のリポジトリ情報
  - パフォーマンスメトリック：マイクロ秒、集約された統計での各クエリ応答時間：
    - すべてのクエリの変動係数
    - 80％の最速クエリの変動係数
    - コールドクエリの応答時間
    - AVG（応答時間）
    - AVG（80％の最速クエリの応答時間）
    - 最も遅いクエリの応答時間
  - データベース/検索エンジン情報：
    - select count(*) 、 select * limit 1データコレクションが異なるデータベースで類似していることを確認します
    - 内部データベース/検索エンジンデータ構造ステータス（チャンク、破片、セグメント、パーティション、パーツなど）
テストの内外でCPU/RAMの消費を簡単に制限できます（環境変数cpusetおよびmemを使用）。
手動テストとテストクエリの準備のためのフレームワークによって開始されるのと同じように、各データベース/検索エンジンを簡単に開始できます。

インストール

テストフレームワークを展開する前に、次のことを確認してください。

Linuxサーバーはテストに完全に専念しています
CPUが絞り込まないようにするための新鮮なCPUサーマルペースト
PHP 8および：
- curlモジュール
- mysqliモジュール
docker
docker-compose
CPU温度を制御するsensorsスロットリングを防ぐ
dstat
cgroups v2

インストールするには：

リポジトリからのgitクローン：

git clone [email protected]:db-benchmarks/db-benchmarks.git
cd db-benchmarks

copy .env.example to .env
memとcpusetを.envで更新し、メモリのデフォルト値（Megabytes）とCPUを使用して、テストフレームワークはセカンダリタスクに使用できます（データの読み込み、データベースに関する情報の取得）
Tune JVMは、テストのためにES_JAVA_OPTSを制限します。通常、Dockerマシンに割り当てられたメモリのサイズです

始めましょう

テストを準備します

まず、テストを準備する必要があります。

特定のテストのディレクトリに移動します（すべてのテストはディレクトリ./testsにある必要があります）。たとえば、「hn_small」：

 cd tests/hn_small

initスクリプトを実行します：

./init

これは：

インターネットからデータ収集をダウンロードします
テーブル/インデックスを構築します

テストを実行します

次に../../test Test（プロジェクトルートのフォルダーにあります）を実行して、オプションを確認します。

To run a particular test with specified engines, memory constraints and number of attempts and save the results locally:
	/perf/test_engines/test
	--test=test_name
	--engines={engine1:type,...,engineN}
	--memory=1024,2048,...,1048576 - memory constraints to test with, MB
	[--times = N] - max number of times to test each query, 100 by default
	[--dir = path] - if path is omitted - save to directory ' results ' in the same dir where this file is located
	[--probe_timeout = N] - how long to wait for an initial connection, 30 seconds by default
	[--start_timeout = N] - how long to wait for a db/engine to start, 120 seconds by default
	[--warmup_timeout = N] - how long to wait for a db/engine to warmup after start, 300 seconds by default
	[--query_timeout = N] - max time a query can run, 900 seconds by default
	[--info_timeout = N] - how long to wait for getting info from a db/engine
	[--limited] - emulate one physical CPU core
	[--queries = /path/to/queries] - queries to test, ./tests/ < test name > /test_queries by default
To save to db all results it finds by path
	/perf/test_engines/test
	--save=path/to/file/or/dir, all files in the dir recursively will be saved
	--host=HOSTNAME
	--port=PORT
	--username=USERNAME
	--password=PASSWORD
	--rm - remove after successful saving to database
	--skip_calm - avoid waiting until discs become calm
----------------------
Environment variables:
	All the options can be specified as environment variables, but you can ' t use the same option as an environment variables and as a command line argument at the same time.

テストを実行します：

../../test --test=hn_small --engines=elasticsearch,clickhouse --memory=16384

テストをローカルモード（開発）で実行し、テストの不正確さを気にしない場合、パラメーターを設定することでディスクの穏やかさとCPUチェックを避けることができます--skip_inaccuracy

../../test --test=hn_small --engines=elasticsearch,clickhouse --memory=16384 --skip_inaccuracy

たとえば、 ./results/ （リポジトリのルート）にテスト結果があります。

 # ls results/
220401_054753

視覚化するためにDBに保存します

これで、結果をデータベースにアップロードして、さらに視覚化できます。 https://db-benchmarks.com/で使用される視覚化ツールは、オープンソースでもあり、https：//github.com/db-benchmarks/uiにあります。

結果を保存する方法は次のとおりです。

username=login password=pass host=db.db-benchmarks.com port=443 save=./results ./test

または

 ./test --username=login --password=pass --host=db.db-benchmarks.com --port=443 --save=./results

プルリクエストを行います

私たちはあなたのテスト結果を見たいと思っています。それらをhttps://db-benchmarks.comに追加する必要があると思われる場合は、このリポジトリに結果をプルリクエストしてください。

次のことを念頭に置いてください：

結果は、ディレクトリ./resultsに配置する必要があります。
新しいテスト/エンジンの場合、他の変更は同じプルリクエストに含める必要があります。
私たちや他の誰でもあなたのテストを再現し、うまくいけば同様の結果を得ることができるはずです。

それでは：

結果を確認して、テストの原則に従うことを確認してください。
ハードウェアでテストを再現して、他のテストと同等であることを確認してください。
発生する質問についてあなたと話し合う。
そして、すべてがチェックアウトされた場合、プルリクエストをマージします。

ディレクトリ構造

 .
  |-core                                    <- Core directory, contains base files required for tests.
  |  |-engine.php                           <- Abstract class Engine. Manages test execution, result saving, and parsing of test attributes.
  |  |-helpers.php                          <- Helper file with logging functions, attribute parsing, exit functions, etc.
  |-misc                                    <- Miscellaneous directory, intended for storing files useful during the initialization step.
  |  |-func.sh                              <- Meilisearch initialization helper script.
  |-plugins                                 <- Plugins directory: if you want to extend the framework by adding another database or search engine for testing, place it here.
  |  |-elasticsearch.php                    <- Elasticsearch plugin.
  |  |-manticoresearch.php                  <- Manticore Search plugin.
  |  |-clickhouse.php                       <- ClickHouse plugin.
  |  |-mysql.php                            <- MySQL plugin.
  |  |-meilisearch.php                      <- Meilisearch plugin.
  |  |-mysql_percona.php                    <- MySQL (Percona) plugin.
  |  |-postgres.php                         <- Postgres plugin.
  |  |-typesense.php                        <- Typesense plugin.
  |-results                                 <- Test results directory. The results shown on https://db-benchmarks.com/ are found here. You can also use `./test --save` to visualize them locally.
  |-tests                                   <- Directory containing test suites.
  |  |-hn                                   <- Hackernews test suite.
  |  |  |-clickhouse                        <- Directory for "Hackernews test -> ClickHouse".
  |  |  |  |-inflate_hook                   <- Engine initialization script. Handles data ingestion into the database.
  |  |  |  |-post_hook                      <- Engine verification script. Ensures the correct number of documents have been ingested and verifies data consistency.
  |  |  |  |-pre_hook                       <- Engine pre-check script. Determines if tables need to be rebuilt, starts the engine, and ensures availability.
  |  |  |-data                              <- Prepared data collection for the tests.
  |  |  |-elasticsearch                     <- Directory for "Hackernews test -> Elasticsearch".
  |  |  |  |-logstash_tuned                 <- Logstash configuration directory for the "tuned" type.
  |  |  |  |  |-logstash.conf
  |  |  |  |  |-template.json
  |  |  |  |-elasticsearch_tuned.yml
  |  |  |  |-inflate_hook                   <- Engine initialization script for data ingestion.
  |  |  |  |-post_hook                      <- Verifies document count and data consistency.
  |  |  |  |-pre_hook                       <- Pre-check script for table rebuilding and engine initialization.
  |  |  |-manticoresearch                   <- Directory for testing Manticore Search in the Hackernews test suite.
  |  |  |  |-generate_manticore_config.php  <- Script for dynamically generating Manticore Search configuration.
  |  |  |  |-inflate_hook                   <- Data ingestion script.
  |  |  |  |-post_hook                      <- Verifies document count and consistency.
  |  |  |  |-pre_hook                       <- Pre-check for table rebuilds and engine availability.
  |  |  |-meilisearch                       <- Directory for "Hackernews test -> Meilisearch".
  |  |  |  |-inflate_hook                   <- Data ingestion script.
  |  |  |  |-post_hook                      <- Ensures correct document count and data consistency.
  |  |  |  |-pre_hook                       <- Pre-check for table rebuilds and engine start.
  |  |  |-mysql                             <- Directory for "Hackernews test -> MySQL".
  |  |  |  |-inflate_hook                   <- Data ingestion script.
  |  |  |  |-post_hook                      <- Ensures document count and consistency.
  |  |  |  |-pre_hook                       <- Pre-check for table rebuilds and engine start.
  |  |  |-postgres                          <- Directory for "Hackernews test -> Postgres".
  |  |  |  |-inflate_hook                   <- Data ingestion script.
  |  |  |  |-post_hook                      <- Verifies document count and data consistency.
  |  |  |  |-pre_hook                       <- Pre-check for table rebuilds and engine availability.
  |  |  |-prepare_csv                       <- Prepares the data collection, handled in `./tests/hn/init`.
  |  |  |-description                       <- Test description, included in test results and used during result visualization.
  |  |  |-init                              <- Main initialization script for the test.
  |  |  |-test_info_queries                 <- Contains queries to retrieve information about the data collection.
  |  |  |-test_queries                      <- Contains all test queries for the current test.
  |  |-taxi                                 <- Taxi rides test suite, with a similar structure.
  |  |-hn_small                             <- Test for a smaller, non-multiplied Hackernews dataset, similar structure.
  |  |-logs10m                              <- Test for Nginx logs, similar structure.
  |-.env.example                            <- Example environment file. Update the "mem" and "cpuset" values as needed.
  |-LICENSE                                 <- License file.
  |-NOTICE                                  <- Notice file.
  |-README.md                               <- You're reading this file.
  |-docker-compose.yml                      <- Docker Compose configuration for starting and stopping databases and search engines.
  |-important_tests.sh
  |-init                                    <- Initialization script. Handles data ingestion and tracks the time taken.
  |-logo.svg                                <- Logo file.
  |-test                                    <- The executable file to run and save test results.

特定のデータセットで特定のデータベース /検索エンジンを開始する方法

test=logs10m cpuset= " 0,1 " mem=32768 suffix=_tuned docker-compose up elasticsearch

意思：

ElasticSearchを開始して、次の設定で「logs10m」をテストします。
suffix=_tuned ：maps ./tests/logs10m/es/data/idx_tunedデータディレクトリとして
mem=32768はRAMを32GBに制限します。指定されていない場合は、デフォルトがファイルから使用されます.env
cpuset="0,1" ：Elasticsearchのコンテナは、CPUコア0および1でのみ実行されます（これは最初の物理CPU全体である可能性があります）

停止するCTRL-Cだけ。

メモ

UIの元のテスト結果レイアウトは、Clickhouseのベンチマーク（https：//clickhouse.com/benchmark/dbms/）に大きく触発されました。 Alexey MilovidovとClickhouseチームに感謝します！

❤️貢献

プロジェクトに参加したいですか？貢献する方法は次のとおりです。

より多くのデータベースと検索エンジン

mysql vs perconaサーバー
Cassandra vs Scylla
mysql vs postgresql
mongodb vs ferretdb
他に何が何であれ

これらはすべてあなたの貢献を待っています！

機能ウィッシュリスト：

応答時間だけでなく、次のようなリソース消費も測定します。
- 各クエリのRAM消費
- CPU消費
- IO消費
応答時間だけでなく、スループットも測定します。
CIで簡単に使用できるようにするため、新しいコミットごとにテストされ、以前よりも遅い場合は、テストが渡されません。
モバイルフレンドリーにします。
コールドクエリテストの品質を向上させる（現在、クエリごとに1つのコールドランが作成されているため、情報目的のみでメトリックを使用できるようになり、AVGほど高品質ではありません」）。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-03-12
サイズ 6.41MB
から Github

db benchmarks

ベンチマーク•イントロ•これが重要な理由•機能•テスト原則•インストール•UI

導入

なぜこれが重要なのですか？

Druid vs Clickhouse vs Rockset

多くのデータベースとエンジン

クリックハウス対その他

テスト原則

テストフレームワーク

インストール

始めましょう

テストを準備します

テストを実行します

視覚化するためにDBに保存します

プルリクエストを行います

ディレクトリ構造

特定のデータセットで特定のデータベース /検索エンジンを開始する方法

メモ

❤️貢献

より多くのデータベースと検索エンジン

機能ウィッシュリスト：

ip location db

yugabyte db

DBツールボックスアプリ

Beluga DBシステムアプリ

DB Mail Pro メールサーバー

ASP ページングクラス Kin_Db_Pager

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express