Скачать treeedb - Скачать исходный код treeedb

treeedb

Другие категории

v0.1.0

Скачать

Treeedb

treeedb облегчает написание анализа программы на уровне источника в Soufflé Datalog. Во -первых, treeedb генерирует типы и отношения суфле, которые представляют AST программы. Затем treeedb анализирует исходный код и издает факты, которые заполняют эти отношения.

treeedb в настоящее время поддерживает анализ этих языков:

В
C#
Ява
JavaScript
Ржавчина
Суфле
Быстрый

Парсеры и AST treeedb основаны на грамматике деревьев, и очень легко добавить поддержку любому языку с грамматикой дерева.

Название treeedb -это портманто «деревянного» с «EDB», где EDB означает «база данных расширения» и относится к набору фактов в программе Datalog.

Установка

Вам понадобится два артефакта для каждого языка программирования, который вы хотите проанализировать:

Файл суфле с типами и отношениями, определяющими AST
Исполняемый файл, который анализирует этот язык и издает факты

Например, для Java они называются treeedb-java.dl и treeedb-java , соответственно.

Чтобы фактически проанализировать код, вам также нужно установить Soufflé.

Установить из релиза

Перейдите к самому последнему выпуску на странице релизов и загрузите артефакты, связанные с языком, который вы хотите проанализировать. Предварительно построенные исполнители статически связаны, но в настоящее время доступны только для Linux.

Стройте из Crates.io

Вы можете создать выпущенную версию с crates.io. Вам понадобится компилятор ржавчины и инструмент для сборки груза. Rustup позволяет очень легко получить их. Затем, чтобы установить инструменты для языка <LANG> , запустить:

 cargo install treeedb-<LANG> treeedbgen-souffle-<LANG>

Это установит двоичные файлы в ~/.cargo/bin . Чтобы сгенерировать файл datalog, запустите treeedbgen-souffle-<LANG> .

К сожалению, двукратные двоичные файлы, связанные с Java, еще не доступны на Crates.io.

Строить из источника

Чтобы построить из источника, вам понадобится компилятор ржавчины и инструмент для сборки груза. Rustup позволяет очень легко получить их.

Затем получите источник:

git clone https://github.com/langston-barrett/treeedb
cd treeedb

Наконец, постройте все:

cargo build --release

Вы можете найти двоичные файлы treeedb-<LANG> в target/release . Чтобы сгенерировать файл datalog, запустите соответствующую treeedbgen-souffle-<LANG> Binary.

Пример: анализ кода Java

Чтобы следовать этим примеру, следуйте инструкциям по установке для Java. Затем создайте файл Java с именем Main.java :

 class Main {
    public static void main ( String [] args ) {
        int x = 2 + 2 ;
    }
}

(Файлы, показанные в этом разделе, также доступны в examples/java/ .)

Создайте файл datalog с именем const-binop.dl , который включает в себя treeedb-java.dl и имеет правило, чтобы найти постоянные бинарные выражения:

 #include "treeedb-java.dl"

.decl const_binop(expr: JavaBinaryExpression)

const_binop(expr) :-
  java_binary_expression(expr),
  java_binary_expression_left_f(expr, l),
  java_binary_expression_right_f(expr, r),
  java_decimal_integer_literal(l),
  java_decimal_integer_literal(r).

.decl show_const_binop(text: JavaNodeText)

show_const_binop(text) :-
  const_binop(expr),
  java_node_text(expr, text).

.output const_binop(IO=stdout)
.output show_const_binop(IO=stdout)

Сгенерируйте входные файлы ( node.csv и field.csv ):

treeedb-java Main.java

Наконец, запустите анализ с Soufflé:

souffle const-binop.dl

Вы увидите что -то вроде этого:

 ---------------
const_binop
===============
94001952741472
===============
---------------
show_const_binop
===============
2 + 2
===============

Копать глубже

Чтобы увидеть, какие имена типа и отношения доступны, посмотрите на treeedb-<LANGUAGE>.dl . Если не очевидно, какая часть языка соответствует данному типу или соотношению, взгляните на грамматику деревьев (например, грамматика.

Мотивация и сравнение с другими инструментами

Прежде чем написать анализ программы в Datalog, вам нужно выяснить (1) как представить программу как отношения, и (2) как проглатывать программы в это представление. Современные проекты Datalog делают все это «вручную»:

CCLEZER ++ имеет каталог «схемы» (1) и FactGenerator (2).
Doop имеет большой файл Imports.dl (1) и различные генераторы (2).
ddisasm имеет Gtirb-Decoder (2).
Secureify имеет analysis-input.dl (1).

Написание этих представлений и инструментов приема проглатывания занимает ценное время и отвлекает от работы по написанию анализа. treeedb стремится автоматизировать его, вписываясь в ту же нишу, что и эти инструменты.

Структура репозитория

treeedb : генерируйте факты Datalog от деревьев деревьев
treeedb-c : генерируйте факты Datalog из исходного кода C
treeedb-csharp : генерировать факты Datalog из исходного кода C#
treeedbgen :
treeedbgen-souffle : генерируйте суфле типы и отношения от грамматики деревьев
treeedbgen-souffle-c : генерируйте типы суфле и отношения из грамматики C Tree-Stiter
treeedbgen-souffle-csharp : генерируйте типы суфле и отношения из грамматики C# Tree-Sitter
treeedbgen-souffle-java : генерируйте типы суфле и отношения из грамматики Java Tree-Stiter
treeedbgen-souffle-javascript : генерируйте типы суфле и отношения из грамматики дерева JavaScript
treeedbgen-souffle-rust : генерируйте типы суфле и отношения из грамматики деревья-деревья
treeedbgen-souffle-souffle : генерируйте типы суфле и отношения из грамматики суфле
treeedbgen-souffle-swift : генерируйте типы суфле и отношения из гимнатики Swift Tree-Stiter
treeedb-java : генерировать факты Datalog из исходного кода Java
treeedb-javascript : генерируйте факты Datalog из исходного кода JavaScript
treeedb-rust : генерировать факты Datalog из исходного кода Rust
treeedb-souffle : генерируйте факты Datalog из исходного кода Soufflé
treeedb-swift : генерируйте факты Datalog из исходного кода Swift

Внося

Спасибо за интерес к treeedb ! Мы приветствуем и ценим все виды вкладов. Пожалуйста, не стесняйтесь подать и выпускать или открывать запрос на вытяжение.

Добавление языка

Как объяснено в установке, есть два инструмента, связанные с поддержкой анализа каждого языка программирования: один для создания типов и отношений суфле (например, treeedbgen-souffle-c ), а другой, чтобы анализировать анализируемый язык и испускание фактов (например, treeedb-c ).

Чтобы добавить новый язык:

Создайте новые каталоги treeedb-<LANG> и treeedbgen-souffle-<LANG> с той же структурой, что и существующая (может быть легче всего просто повторить копировать существующие).
Добавьте новые каталоги в верхний уровень Cargo.toml .
Добавьте язык в .github/workflows/release.yml , копируя и изменяя существующие строки для других языков.

Смотрите PR #9 для полного примера.

Сценарий ./scripts/add-language.sh автоматизирует несколько из этих шагов, но это не обязательно решение для ключей. Пример использования:

bash scripts/add-language.sh python Python

Расширять

Дополнительная информация

Версия v0.1.0
Тип Другие категории
Время обновления 2025-06-21
размер 50.05KB
От Github

Связанные приложения

IDArling

2025-06-25
hextor

2025-01-03
intellij tai e

2025-06-18
microavx

2025-03-20
cwe_checker

2025-06-25
pyt

2025-06-21

treeedb

Treeedb

Установка

Установить из релиза

Стройте из Crates.io

Строить из источника

Пример: анализ кода Java

Копать глубже

Мотивация и сравнение с другими инструментами

Структура репозитория

Внося

Добавление языка

IDArling

hextor

intellij tai e

microavx

cwe_checker

pyt

chat.petals.dev

GPT Prompt Templates

GPTyped

IDArling

hextor

intellij tai e

Google Dorks

shepherd

mongo express