Dieses Projekt bietet eine Reihe von Skripten und Tools zum Konvertieren von XML -Dateien in JSON -Format. Es ist so konzipiert, dass es mit verschiedenen XML -Datenquellen arbeitet und vollständig anpassbar ist und mehrere Conversion -Module unterstützt. Das Projekt ist in separate Python -Module unterteilt, um verschiedene Arten von Daten zu behandeln, einschließlich Dokumenten, Personen und Archiven.
Die Lösung umfasst:
convert/
archiveLinkConvert.py # Handles conversion of archive link XMLs
artworkConvert.py # Handles artwork XML data
commonConvert.py # Contains common conversion utilities
personConvert.py # Handles conversion of person-related XMLs
docs/
pictures/ # Picture documentation related to the project
Analyza_SP.md # Analysis related documentation
documentaria_rudolphina.md # Project-specific documentation
model/
ArchiveLink.py # Data model for archive links
Document.py # Data model for documents
Person.py # Data model for person records
scripts/
main_convert.py # Main script to execute conversion
.gitignore # Git ignore configuration
README.md # This documentation file Um dieses Tool zu verwenden, benötigen Sie Python und Pip installiert.
Führen Sie dann den folgenden Befehl aus:
pip install -r requirements.txt Dadurch werden die erforderlichen Bibliotheken installiert, um das Skript auszuführen. Führen Sie dann einfach das Skript main_convert.py mit den entsprechenden Optionen aus. Hier sind die Hauptbefehle, um das Programm aus dem XMLtoJSON -Verzeichnis auszuführen:
Hilfsinformationen anzeigen:
python3 scripts/main_convert.py --helpoder
python3 scripts/main_convert.py --hKonvertieren Sie alle Arten von XML -Dateien:
python3 scripts/main_convert.py --type all --input_path " path_for_input_data " --output_path " path_for_output_data "Konvertieren Sie die XML-Dateien im Zusammenhang mit Namen:
python3 scripts/main_convert.py --type names --input_path " path_for_input_data " --output_path " path_for_output_data "Register-bezogene XML-Dateien konvertieren:
python3 scripts/main_convert.py --type registers --input_path " path_for_input_data " --output_path " path_for_output_data "Konvertieren Sie archivbezogene XML-Dateien:
python3 scripts/main_convert.py --type archive --input_path " path_for_input_data " --output_path " path_for_output_data "Der Eingabedatenordner sollte wie folgt strukturiert sein:
input_data/
Archiv/ # Archive-related XML files
Regesten/ # Register-related XML files
Namen/ # Name-related XML files
Indicies/ # Index-related XML files git clone https://github.com/VandlJ.git
cd XMLtoJSONVerwenden Sie das Hauptkonvertierungsskript, um die Konvertierung zu beginnen. Zum Beispiel um alle XML -Dateien umzuwandeln:
python3 scripts/main_convert.py --type all --input_path " ../test_data " --output_path " ../test_data/output "Sie können auch alle verfügbaren Optionen überprüfen und detaillierte Informationen erhalten, indem Sie ausführen:
python3 scripts/main_convert.py --help Dieser Befehl beginnt mit der Verarbeitung der XML -Dateien im angegebenen Verzeichnis --input_path und gibt die Ergebnisse in das Verzeichnis --output_path aus.
Dieses Projekt wurde von einem anderen Team geerbt, und wir haben mehrere bedeutende Verbesserungen und Korrekturen vorgenommen, um seine Funktionalität und Zuverlässigkeit zu verbessern:
Fehlerbehandlung: Leerzeichen/leere Zeichen für die Eindrücke im Text - in Regime -Dateien
display : Dieses Feld wird zum Anzeigen von Text im Frontend verwendet, um sicherzustellen, dass die ursprüngliche Formatierung zur Lesbarkeit beibehält.processable : Dieses Feld enthält eine sauberere Version des Textes, die für die Computerverarbeitung und -analyse optimiert ist.Handhabung der Metadaten: Problemmetadaten in Regenzeit
.p in den Regime -Dateien. Einige Elemente fehlten oder fälschlicherweise erfasst. Wir haben eine gründliche Überprüfung durchgeführt und dafür gesorgt, dass alle Metadatenelemente in unserer Iteration des Programms jetzt genau erfasst und verarbeitet werden. Verbesserte Interaktivität: Informationen hinzufügen onmouseover="highlightWords(event, '...')" in Regime
onmouseover -Attribut wurde hinzugefügt, um Wörter zu markieren, wenn sie umgehalten wurden. Die verarbeiteten Daten umfassen jetzt: "names" : [
{
"Aichholz_Johann" : " Johann Aichholz " ,
"alias" : " Johann Aichholz Ehrzney doctor "
},
{
"Strauben_Franz" : " Franz Strauben " ,
"alias" : " Frannzen Strauben "
}
]Name Verarbeitung: Teilen vor Vorname und Nachname über externes Tool - Gettyulan
Einheitliches Hauptskript für die Konvertierung
--type , --input_path und --output_path angeben können. Diese Änderung vereinfacht die Ausführung und verbessert die Flexibilität des Konvertierungsprozesses.Verbesserte Dokumentations- und Setup -Anweisungen
Leistungsverbesserungen und Fehlerbehebungen
Korrekturen in Archiv Typ JSON Ausgang
hasSublink , linkTo und next_link -Variablen in den Ausgabe -JSON -Dateien für den Archiv -Typ. Dies stellt sicher, dass diese Variablen genau im JSON -Ausgang dargestellt und verknüpft sind.Diese Verbesserungen haben die Funktionalität, Benutzerfreundlichkeit und Zuverlässigkeit des XML-zu-JSON-Konverterprojekts erheblich verbessert, was es robuster und benutzerfreundlicher macht.