Das Skript archive_reader.py (oder die ArchiveReader -Klasse innen) liest in Ihrem Mastodon Archiv -optimal.json (speziell Beiträge, die Sie gemacht haben) und erstellt eine main.db SQLite3 -Datenbank.
Die Datenbank enthält zwei Tabellen und eine Ansicht:
search_data . Dies ist eine virtuelle Tabelle, die mit FTS5 erstellt wurde, die eine vollständige Texte durch Ihre Beiträge ermöglicht.full_data . Dies ist jede Spalte aus dem Archiv, die ein object_id enthält.combined . Dies ist eine Ansicht, die die beiden oben genannten Tabellen in der extrahierten int_id -Spalte kombiniert.Das Erstellen der SQLite -Datenbank erfordert Pandas und HTML2Text.
Ich füge auch eine Plotly -Dash app.py hinzu, damit die GUI -Suche des Archivs mit der SQLite Volltextsuche (FTS5) auf dem Inhalt der archivierten Beiträge verwendet wird. Sie benötigen Plotly Dash, um dies auszuführen. Es ist nicht für die Bereitstellung gedacht, sondern lokal auszuführen, um die von Ihnen erstellte Datenbank zu untersuchen.
Verwendung
$ python archive_reader.py archive_folder_name
Dadurch wird die SQLite -Datenbank main.db erstellt.
Ausführen von App.py
python app.py
Starten Sie eine einfache Plotly -Dash -App, um Ihr Archiv zu durchsuchen.

attachments der JSON -Datei heraus und verbringen Sie Medienanhänge in die Dash -App.