O script archive_reader.py (ou a classe ArchiveReader interior) lê no seu Mastodon Archive Outbox.json (especificamente postagens que você fez) e cria um banco de dados main.db sqlite3.
O banco de dados contém duas tabelas e uma visualização:
search_data . Esta é uma tabela virtual criada com FTS5 que permite a pesquisa completa de texto de suas postagens.full_data . Esta é todas as colunas do arquivo que contém um object_id .combined . Esta é uma visão que combina as duas tabelas acima na coluna int_id extraída.Criar o banco de dados SQLite requer pandas e html2text.
Também incluo um plotly Dash app.py para permitir a pesquisa da GUI do arquivo, usando a pesquisa de texto completo do SQLite (FTS5) no conteúdo das postagens arquivadas. Você precisará do Plotly Dash instalado para executar isso. Não se destina à implantação, mas para executar localmente como uma maneira de explorar o banco de dados que você criou.
Uso
$ python archive_reader.py archive_folder_name
Isso criará o banco de dados sqlite main.db
Executando app.py
python app.py
Iniciará um aplicativo simples de plotly Dash para pesquisar seu arquivo.

attachments do arquivo json e incorpore anexos de mídia no aplicativo DASH.