Mit dem CSVComparetool können Sie Unterschiede zwischen zwei CSV -Dateien ermitteln, die auf einer angegebenen Spaltenkennung basieren. Es bietet eine einfache Möglichkeit, den Inhalt von zwei CSV -Dateien zu vergleichen und zu ermitteln, welche Datensätze in einer Datei vorhanden sind, jedoch nicht in der anderen.
Notiz
Stellen Sie beim Vergleich von CSV -Dateien für Unterschiede sicher, dass Sie dem CSV mehr Einträge an zweitens angeben. Wenn CSV-1 beispielsweise eine Liste von 34 Namen hat und CSV-2 eine Liste von 40 enthält, sollte CSV-2 als der zweite CSV-Pfad festgelegt werden, damit die Unterschiede wie erwartet angezeigt werden müssen.
Sie können CSV-Compare mit pip installieren:
pip install csv-compare-toolBefolgen Sie diese Schritte, um CSV-Compare in Ihrem Python-Projekt zu verwenden.
Wichtig
Entfernen Sie beim Import als Paket in einem Python -Projekt unbedingt die Bindestriche, damit das Paket csvcomparetool liest (Weitere Informationen finden Sie unter PEP 8).
import csvcomparetool Optional können Sie die CSVComparer -Klasse allein importieren
from csvcomparetool import CSVComparerCSVComparer -Objekt csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column ) if not comparer . validate_paths ():
print ( "CSV file paths are invalid. Please check the file paths and try again." )
return if not comparer . validate_columns ():
print ( "Provided column not found in CSV. Check the columns and try again." )
return differences = comparer . find_differences () for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." ) from csvcomparetool import CSVComparer
csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column )
if not comparer . validate_paths () or not comparer . validate_columns ():
print ( "CSV file paths are invalid, or the column identifier does not exist. Check the file paths and columns and try again." )
else :
differences = comparer . find_differences ()
for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." )Klonen Sie zunächst dieses Repository in ein lokales Verzeichnis auf Ihrer Maschine
git clone https://github.com/liquidz00/csv-compare.gitNavigieren Sie zum Cloned Repo -Standort (lokales Verzeichnis, in dem Sie das Repository speichern)
cd /path/to/repo/src/csvcomparetool/Führen Sie schließlich den folgenden Befehl aus
python cli.py /csv/path/one /csv/path/two columnidentifier