db benchmarks Download - db benchmarks Quellcode Download

db benchmarks

Anderer Quellcode

1.0.0

Herunterladen

DB-Benchmarks-Logo

Benchmarks • Intro • Warum dies wichtig ist • Merkmale • Testprinzipien • Installation • UI

Einführung

https://db-tenchmarks.com zielt darauf ab, Datenbank- und Suchmaschinen-Benchmarks zu erstellen:

⚖️ fair und transparent - es sollte klar sein, unter welchen Bedingungen diese oder diese Datenbank / Suchmaschine diese oder diese Leistung verleiht

Hohe Qualität - Kontrolle über den Variationskoeffizienten ermöglicht die Erzeugung von Ergebnissen, die gleich bleiben, wenn Sie heute, morgen oder nächste Woche eine Abfrage ausführen

? Leicht reproduzierbar - jeder kann jeden Test auf seiner eigenen Hardware reproduzieren

Leicht zu verstehen - die Diagramme sind sehr einfach

➕ Extendable - Steckbare Architektur ermöglicht das Hinzufügen weiterer Testen von Datenbanken

Und halten Sie alles 100% Open Source!

Dieses Repository enthält ein Testframework, das den Auftrag erledigt.

Warum ist das wichtig?

Viele Datenbank -Benchmarks sind nicht objektiv. Andere tun nicht genug, um die Genauigkeit und Stabilität der Ergebnisse sicherzustellen, was in einigen Fällen die gesamte Idee von Benchmarks bricht. Ein paar Beispiele:

Druid gegen Clickhouse vs Rockset

https://imply.io/blog/druid-nail-cost-ection-chalenge-against-clickhouse-and-and-rockset/:

Wir wollten eigentlich den Benchmark auf derselben Hardware, einen M5.8XLarge, aber die einzige vorgebackene Konfiguration für M5.8xLarge sind tatsächlich die M5D.8xlarge ... Stattdessen laufen wir auf einer C5.9xlarge-Instanz.

Schlechte Nachrichten, Leute: Wenn Sie Benchmarks für verschiedene Hardware ausführen, kann man zumindest nicht sagen, dass etwas "106,76%" und "103,13%" von etwas anderem ist. Selbst wenn Sie auf demselben Bare-Metal-Server testen, ist es ziemlich schwierig, einen Variationskoeffizienten von weniger als 5%zu erhalten. Ein Unterschied von 3% auf verschiedenen Servern kann höchstwahrscheinlich ignoriert werden. Wie kann man angesichts dessen sicherstellen, dass die endgültige Schlussfolgerung wahr ist?

Viele Datenbanken und Motoren

https://tech.marksblogg.com/benchmarks.html

Mark hat großartige Arbeit geleistet, um den Taxi -Fahrgeschäfte auf so vielen verschiedenen Datenbanken und Suchmaschinen zu testen. Da die Tests jedoch auf verschiedenen Hardware durchgeführt werden, sind die Zahlen in der resultierenden Tabelle nicht wirklich vergleichbar. Sie müssen dies immer berücksichtigen, wenn Sie die Ergebnisse in der Tabelle bewerten.

Klicken Sie auf andere und andere

https://clickhouse.com/benchmark/dbms/

Wenn Sie jede Abfrage nur dreimal ausführen, erhalten Sie für jede von ihnen höchstwahrscheinlich sehr hohe Variationskoeffizienten. Das heißt, wenn Sie den Test eine Minute später durchführen, können Sie eine Variation von 20%erhalten. Und wie reproduziert man einen Test auf der eigenen Hardware? Leider kann ich nicht herausfinden, wie man es kann.

Testprinzipien

Wir glauben, dass ein fairer Datenbank -Benchmark einige wichtige Prinzipien folgen sollte:

✅ Testen Sie verschiedene Datenbanken auf genau derselben Hardware

Andernfalls sollten Sie einen Fehlerrand anerkennen, wenn es kleine Unterschiede gibt.

✅ Testen Sie vor jedem Test mit dem vollständigen Betriebssystem -Cache

Andernfalls können Sie Kaltanfragen nicht testen.

✅ Die getestete Datenbank sollte alle internen Caches deaktiviert haben

Andernfalls werden Sie die Cache -Leistung messen.

✅ Am besten, wenn Sie auch einen Kaltlauf messen. Es ist besonders wichtig für analytische Abfragen, bei denen häufig kalte Fragen auftreten können

Andernfalls verbergen Sie vollständig, wie die Datenbank mit E/A umgehen kann.

✅ Nichts anderes sollte während des Tests ausgeführt werden

Andernfalls können Ihre Testergebnisse sehr instabil sein.

✅ Sie müssen die Datenbank vor jeder Abfrage neu starten

Andernfalls können frühere Abfragen trotz des Löschens interner Caches die Reaktionszeit der aktuellen Abfrage weiterhin beeinflussen.

✅ Sie müssen warten, bis sich die Datenbank vollständig erwärmt, nachdem sie begonnen hat

Andernfalls konkurrieren Sie möglicherweise mit dem Aufwärmprozess der Datenbank für I/A, der Ihre Testergebnisse stark verderben kann.

✅ Am besten, wenn Sie einen Variationskoeffizienten anbieten, versteht jeder, wie stabil Ihre Ergebnisse sind, und stellen Sie sicher, dass es niedrig genug ist

Variationskoeffizient ist eine sehr gute Metrik, die zeigt, wie stabil Ihre Testergebnisse sind. Wenn es höher als n% ist, können Sie nicht sagen, dass eine Datenbank n% schneller ist als eine andere.

✅ Am besten, wenn Sie eine feste CPU -Frequenz testen

Andernfalls kann der CPU-Gouverneur von "On-Demand" -Louverneur (was normalerweise ein Standard ist) Ihre Reaktionszeit von 500 ms problemlos in eine Reaktionszeit von 500 ms verwandeln.

✅ Am besten, wenn Sie eher auf SSD/NVME als auf HDD testen

Andernfalls können Sie je nachdem, wo sich Ihre Dateien auf HDD befinden, bis zu 2x niedrigere/höhere E/A -Leistung (wir getestet) erhalten, was zumindest Ihre kalten Abfragenergebnisse falsch machen kann.

Testframework

Das Test-Framework, das im Backend von https://db-benchmarks.com verwendet wird, ist vollständig Open Source (AGPLV3-Lizenz) und finden Sie unter https://github.com/db-Benchmarks/db-Benchmarks. Hier ist, was es tut:

Automatisiert das Laden von Daten zu den im Repository enthaltenen Datenbanken/Suchmaschinen.
Kann eine Datenbank/Suchmaschine in Docker mit einer bestimmten CPU/RAM -Einschränkung ausführen.
Beim Testen:
- Spült OS -Cache automatisch
- Automatisiert vor jedem Kaltlauf die Löschdatenbank -Caches
- Startet die Datenbank vor jedem Kaltlauf neu
- Kümmert sich um Ihre CPU -Temperatur, um das Droseln zu vermeiden
- Kümmert sich um den Variationskoeffizienten, während Sie Abfragen erstellen, und kann sobald anhalten:
  - Der Lebenslauf ist niedrig genug
  - Und die Anzahl der angegebenen Abfragen ist ausreichend
- Nachdem Sie eine Datenbank/Suchmaschine gestartet haben, lasst es sich um die Aufwärmstufe (vor dem Lesen benötigte Daten von der Festplatte) machen Sie nicht mehr warten, sobald er:
  - Für ein paar Sekunden gibt es kein IO
  - Und es kann eine Verbindung zur Datenbank/Suchmaschine herstellen
- Nach dem Anhalten einer Datenbank/Suchmaschine wartet, bis sie vollständig stoppt
- Kann verschiedene Zeitüberschreitungen akzeptieren: Start, Aufwärmen, Erstverbindung, Erhalten von Informationen zur Datenbank/Suchmaschine, Abfrage
- Kann einen physischen Kern emulieren, der das Benchmarking -algorithmische Funktionen von Datenbanken objektiver ermöglicht ( --limited ).
- Kann alle Werte als Befehlszeilenargumente sowie Umgebungsvariablen akzeptieren, um eine einfachere Integration in CI -Systeme zu erhalten
- --test speichert Testergebnisse in der Datei
- --save speichert Testergebnisse von Dateien in einer Remote-Datenbank (keine der getesteten derjenigen)
- Verfolgt viele Dinge beim Testen:
  - Serverinformationen: CPU, Speicher, Auslaufprozesse, Dateisystem, Hostname
  - Aktuelle Repository -Informationen, um sicherzustellen, dass es keine lokalen Änderungen gibt
  - Leistungsmetriken: Jede Abfrageantwortzeit in Mikrosekunden, aggregierte Statistiken:
    - Variationskoeffizient aller Abfragen
    - Variationskoeffizient von 80% schnellsten Abfragen
    - Reaktionszeit von Cold Query
    - AVG (Antwortzeiten)
    - AVG (80% schnellste Reaktionszeiten der Abfragen)
    - Die Reaktionszeit der langsamsten Abfrage
  - Datenbank/Suchmaschineninformationen:
    - select count(*) und select * limit 1 um sicherzustellen, dass die Datensammlungen in verschiedenen Datenbanken ähnlich sind
    - Interne Datenbank-/Suchmaschinendatenstrukturen Status (Stücke, Scherben, Segmente, Partitionen, Teile usw.)
Erleichtert es einfach, den CPU/RAM -Verbrauch innerhalb oder außerhalb des Tests zu begrenzen (unter Verwendung von Umgebungsvariablen cpuset und mem ).
Ermöglicht das Starten jeder Datenbank/Suchmaschine auf die gleiche Weise wie das Framework für manuelle Tests und Erstellung von Testfragen.

Installation

Bevor Sie das Testframework bereitstellen, stellen Sie sicher, dass Sie Folgendes haben:

Linux -Server, der sich vollständig dem Testen entspricht
Frische CPU -Wärmepaste, um sicherzustellen, dass Ihr CPUs nicht droselt
PHP 8 und:
- curl
- mysqli Modul
docker
docker-compose
sensors zur Kontrolle der CPU -Temperatur, um das Drossel zu verhindern
dstat
cgroups v2

Zu installieren:

Git -Klon aus dem Repository:

git clone [email protected]:db-benchmarks/db-benchmarks.git
cd db-benchmarks

Kopieren .env.example nach .env
Aktualisieren Sie mem und cpuset in .env mit dem Standardwert des Speichers (in Megabyte) und CPUs Das Testframework kann für Sekundäraufgaben verwendet werden (Datenladen, Informationen zu Datenbanken erhalten)
Tune JVM Limits ES_JAVA_OPTS für Ihre Tests. Normalerweise hat die Größe des zugewiesenen Speichers für Docker -Maschine

Fangen an

Test vorbereiten

Zuerst müssen Sie einen Test vorbereiten:

Gehen Sie zum Verzeichnis eines bestimmten Tests (alle Tests müssen im Verzeichnis sein ./tests ), zum Beispiel "hn_small":

 cd tests/hn_small

Führen Sie das Init -Skript aus:

./init

Dies wird:

Laden Sie die Datenerfassung aus dem Internet herunter
Erstellen Sie die Tabellen/Indizes

Test durchführen

Dann laufen Sie ../../test (es befindet sich im Ordner des Projektroots), um die Optionen zu sehen:

To run a particular test with specified engines, memory constraints and number of attempts and save the results locally:
	/perf/test_engines/test
	--test=test_name
	--engines={engine1:type,...,engineN}
	--memory=1024,2048,...,1048576 - memory constraints to test with, MB
	[--times = N] - max number of times to test each query, 100 by default
	[--dir = path] - if path is omitted - save to directory ' results ' in the same dir where this file is located
	[--probe_timeout = N] - how long to wait for an initial connection, 30 seconds by default
	[--start_timeout = N] - how long to wait for a db/engine to start, 120 seconds by default
	[--warmup_timeout = N] - how long to wait for a db/engine to warmup after start, 300 seconds by default
	[--query_timeout = N] - max time a query can run, 900 seconds by default
	[--info_timeout = N] - how long to wait for getting info from a db/engine
	[--limited] - emulate one physical CPU core
	[--queries = /path/to/queries] - queries to test, ./tests/ < test name > /test_queries by default
To save to db all results it finds by path
	/perf/test_engines/test
	--save=path/to/file/or/dir, all files in the dir recursively will be saved
	--host=HOSTNAME
	--port=PORT
	--username=USERNAME
	--password=PASSWORD
	--rm - remove after successful saving to database
	--skip_calm - avoid waiting until discs become calm
----------------------
Environment variables:
	All the options can be specified as environment variables, but you can ' t use the same option as an environment variables and as a command line argument at the same time.

Und führen Sie den Test aus:

../../test --test=hn_small --engines=elasticsearch,clickhouse --memory=16384

Wenn Sie Ihre Tests --skip_inaccuracy lokalen Modus (Entwicklung) ausführen und sich nicht für die Ungenauigkeiten der Tests interessieren

../../test --test=hn_small --engines=elasticsearch,clickhouse --memory=16384 --skip_inaccuracy

Jetzt haben Sie Testergebnisse in ./results/ (im Wurzel des Repositorys) beispielsweise:

 # ls results/
220401_054753

Speichern Sie in DB, um sich zu visualisieren

Sie können die Ergebnisse jetzt zur weiteren Visualisierung in die Datenbank hochladen. Das Visualisierungsinstrument, das auf https://db-benchmarks.com/ verwendet wird, ist ebenfalls Open Source und finden Sie unter https://github.com/db-autchmarks/ui.

So können Sie die Ergebnisse speichern:

username=login password=pass host=db.db-benchmarks.com port=443 save=./results ./test

oder

 ./test --username=login --password=pass --host=db.db-benchmarks.com --port=443 --save=./results

Pull -Anfrage stellen

Wir sind bestrebt, Ihre Testergebnisse zu sehen. Wenn Sie der Meinung sind, dass sie zu https://db-tenchmarks.com hinzugefügt werden sollten, stellen Sie bitte eine Pull-Anfrage Ihrer Ergebnisse zu diesem Repository.

Bitte beachten Sie Folgendes:

Ihre Ergebnisse sollten sich im Verzeichnis befinden ./results .
Wenn es sich um einen neuen Test/Motor handelt, sollten andere Änderungen in derselben Pull -Anfrage enthalten sein.
Es ist wichtig, dass wir und jeder andere in der Lage sein sollten, Ihren Test zu reproduzieren und hoffentlich ähnliche Ergebnisse zu erzielen.

Wir werden dann:

Überprüfen Sie Ihre Ergebnisse, um sicherzustellen, dass sie die Testprinzipien befolgen.
Reproduzieren Sie Ihren Test auf unserer Hardware, um sicherzustellen, dass sie mit anderen Tests vergleichbar sind.
Besprechen Sie alle Fragen mit Ihnen.
Und wenn alles auscheckt, werden wir Ihre Pull -Anfrage zusammenführen.

Verzeichnisstruktur

 .
  |-core                                    <- Core directory, contains base files required for tests.
  |  |-engine.php                           <- Abstract class Engine. Manages test execution, result saving, and parsing of test attributes.
  |  |-helpers.php                          <- Helper file with logging functions, attribute parsing, exit functions, etc.
  |-misc                                    <- Miscellaneous directory, intended for storing files useful during the initialization step.
  |  |-func.sh                              <- Meilisearch initialization helper script.
  |-plugins                                 <- Plugins directory: if you want to extend the framework by adding another database or search engine for testing, place it here.
  |  |-elasticsearch.php                    <- Elasticsearch plugin.
  |  |-manticoresearch.php                  <- Manticore Search plugin.
  |  |-clickhouse.php                       <- ClickHouse plugin.
  |  |-mysql.php                            <- MySQL plugin.
  |  |-meilisearch.php                      <- Meilisearch plugin.
  |  |-mysql_percona.php                    <- MySQL (Percona) plugin.
  |  |-postgres.php                         <- Postgres plugin.
  |  |-typesense.php                        <- Typesense plugin.
  |-results                                 <- Test results directory. The results shown on https://db-benchmarks.com/ are found here. You can also use `./test --save` to visualize them locally.
  |-tests                                   <- Directory containing test suites.
  |  |-hn                                   <- Hackernews test suite.
  |  |  |-clickhouse                        <- Directory for "Hackernews test -> ClickHouse".
  |  |  |  |-inflate_hook                   <- Engine initialization script. Handles data ingestion into the database.
  |  |  |  |-post_hook                      <- Engine verification script. Ensures the correct number of documents have been ingested and verifies data consistency.
  |  |  |  |-pre_hook                       <- Engine pre-check script. Determines if tables need to be rebuilt, starts the engine, and ensures availability.
  |  |  |-data                              <- Prepared data collection for the tests.
  |  |  |-elasticsearch                     <- Directory for "Hackernews test -> Elasticsearch".
  |  |  |  |-logstash_tuned                 <- Logstash configuration directory for the "tuned" type.
  |  |  |  |  |-logstash.conf
  |  |  |  |  |-template.json
  |  |  |  |-elasticsearch_tuned.yml
  |  |  |  |-inflate_hook                   <- Engine initialization script for data ingestion.
  |  |  |  |-post_hook                      <- Verifies document count and data consistency.
  |  |  |  |-pre_hook                       <- Pre-check script for table rebuilding and engine initialization.
  |  |  |-manticoresearch                   <- Directory for testing Manticore Search in the Hackernews test suite.
  |  |  |  |-generate_manticore_config.php  <- Script for dynamically generating Manticore Search configuration.
  |  |  |  |-inflate_hook                   <- Data ingestion script.
  |  |  |  |-post_hook                      <- Verifies document count and consistency.
  |  |  |  |-pre_hook                       <- Pre-check for table rebuilds and engine availability.
  |  |  |-meilisearch                       <- Directory for "Hackernews test -> Meilisearch".
  |  |  |  |-inflate_hook                   <- Data ingestion script.
  |  |  |  |-post_hook                      <- Ensures correct document count and data consistency.
  |  |  |  |-pre_hook                       <- Pre-check for table rebuilds and engine start.
  |  |  |-mysql                             <- Directory for "Hackernews test -> MySQL".
  |  |  |  |-inflate_hook                   <- Data ingestion script.
  |  |  |  |-post_hook                      <- Ensures document count and consistency.
  |  |  |  |-pre_hook                       <- Pre-check for table rebuilds and engine start.
  |  |  |-postgres                          <- Directory for "Hackernews test -> Postgres".
  |  |  |  |-inflate_hook                   <- Data ingestion script.
  |  |  |  |-post_hook                      <- Verifies document count and data consistency.
  |  |  |  |-pre_hook                       <- Pre-check for table rebuilds and engine availability.
  |  |  |-prepare_csv                       <- Prepares the data collection, handled in `./tests/hn/init`.
  |  |  |-description                       <- Test description, included in test results and used during result visualization.
  |  |  |-init                              <- Main initialization script for the test.
  |  |  |-test_info_queries                 <- Contains queries to retrieve information about the data collection.
  |  |  |-test_queries                      <- Contains all test queries for the current test.
  |  |-taxi                                 <- Taxi rides test suite, with a similar structure.
  |  |-hn_small                             <- Test for a smaller, non-multiplied Hackernews dataset, similar structure.
  |  |-logs10m                              <- Test for Nginx logs, similar structure.
  |-.env.example                            <- Example environment file. Update the "mem" and "cpuset" values as needed.
  |-LICENSE                                 <- License file.
  |-NOTICE                                  <- Notice file.
  |-README.md                               <- You're reading this file.
  |-docker-compose.yml                      <- Docker Compose configuration for starting and stopping databases and search engines.
  |-important_tests.sh
  |-init                                    <- Initialization script. Handles data ingestion and tracks the time taken.
  |-logo.svg                                <- Logo file.
  |-test                                    <- The executable file to run and save test results.

So starten Sie eine bestimmte Datenbank / Suchmaschine mit einem bestimmten Datensatz

test=logs10m cpuset= " 0,1 " mem=32768 suffix=_tuned docker-compose up elasticsearch

Wille:

Starten Sie Elasticsearch, um "logs10m" mit den folgenden Einstellungen zu testen:
suffix=_tuned : maps ./tests/logs10m/es/data/idx_tuned als Datenverzeichnis
mem=32768 begrenzt den RAM auf 32 GB. Wenn nicht angegeben, wird der Standard aus der Datei verwendet .env
cpuset="0,1" : Der Container von Elasticsearch läuft nur auf CPU -Kernen 0 und 1 (was die erste ganze physische CPU sein kann)

Anhalten - nur CTRL-C .

Notizen

Das ursprüngliche Testergebnislayout der Benutzeroberfläche wurde stark von Clickhouse Benchmarks inspiriert - https://clickhouse.com/benchmark/dbms/. Vielen Dank, Alexey Milovidov und Click House Team!

❤️ beitragen

Möchten Sie sich in das Projekt einlassen? So können Sie dazu beitragen:

Weitere Datenbanken und Suchmaschinen

MySQL gegen Percona Server
Cassandra gegen Scylla
MySQL vs postgresql
MongoDB gegen Ferretdb
was auch immer sonst noch was auch immer

Diese warten alle auf Ihren Beitrag!

Funktionen Wunschliste:

Messen Sie nicht nur die Reaktionszeit, sondern auch den Ressourcenverbrauch, wie z. B.:
- RAM -Verbrauch für jede Abfrage
- CPU -Verbrauch
- IO -Verbrauch
Messen Sie nicht nur die Reaktionszeit, sondern auch den Durchsatz.
Machen Sie es einfach, in CI zu verwenden, damit jedes neue Commit getestet wird und wenn es langsamer ist als zuvor, wird der Test nicht bestanden.
Machen Sie es mobilfreundlich.
Verbessern Sie die Qualität von Kaltanfragetests (derzeit wird nur ein Kaltlauf pro Abfrage durchgeführt, wodurch die Metrik nur für Informationszwecke verwendet werden kann. Es ist nicht so hohe Qualität wie schnell).

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-03-12
Größe 6.41MB
Kommt von Github

Ähnliche Anwendungen

ip location db

2024-11-10
yugabyte db

2024-11-06
DB-Toolbox-App

2024-02-25
Beluga DB-System-App

2023-06-21
DB Mail Pro-Mailserver

2009-07-06
ASP-Paging-Klasse Kin_Db_Pager

2009-05-19

db benchmarks

Benchmarks • Intro • Warum dies wichtig ist • Merkmale • Testprinzipien • Installation • UI

Einführung

Warum ist das wichtig?

Druid gegen Clickhouse vs Rockset

Viele Datenbanken und Motoren

Klicken Sie auf andere und andere

Testprinzipien

Testframework

Installation

Fangen an

Test vorbereiten

Test durchführen

Speichern Sie in DB, um sich zu visualisieren

Pull -Anfrage stellen

Verzeichnisstruktur

So starten Sie eine bestimmte Datenbank / Suchmaschine mit einem bestimmten Datensatz

Notizen

❤️ beitragen

Weitere Datenbanken und Suchmaschinen

Funktionen Wunschliste:

ip location db

yugabyte db

DB-Toolbox-App

Beluga DB-System-App

DB Mail Pro-Mailserver

ASP-Paging-Klasse Kin_Db_Pager

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express