Le CSVCompareTool vous permet de trouver des différences entre deux fichiers CSV basés sur un identifiant de colonne spécifié. Il fournit un moyen simple de comparer le contenu de deux fichiers CSV et d'identifier les enregistrements présents dans un fichier mais pas dans l'autre.
Note
Lorsque vous comparez les fichiers CSV pour les différences, assurez-vous de fournir au CSV plus les entrées en deuxième position. Par exemple, si CSV-1 a une liste de 34 noms et que CSV-2 a une liste de 40, CSV-2 devrait être défini comme le deuxième chemin CSV passé pour que les différences se manifestent comme prévu.
Vous pouvez installer CSV-compare à l'aide de pip :
pip install csv-compare-toolPour utiliser CSV-Compare dans votre projet Python, suivez ces étapes.
Important
Lors de l'importation en tant que package dans un projet Python, assurez-vous de supprimer les traits de traits afin que le package lit csvcomparetool (voir PEP 8 pour plus d'informations)
import csvcomparetool Facultativement, vous pouvez importer la classe CSVComparer seule
from csvcomparetool import CSVComparerCSVComparer csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column ) if not comparer . validate_paths ():
print ( "CSV file paths are invalid. Please check the file paths and try again." )
return if not comparer . validate_columns ():
print ( "Provided column not found in CSV. Check the columns and try again." )
return differences = comparer . find_differences () for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." ) from csvcomparetool import CSVComparer
csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column )
if not comparer . validate_paths () or not comparer . validate_columns ():
print ( "CSV file paths are invalid, or the column identifier does not exist. Check the file paths and columns and try again." )
else :
differences = comparer . find_differences ()
for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." )Tout d'abord, clonez ce référentiel à un répertoire local sur votre machine
git clone https://github.com/liquidz00/csv-compare.gitAccédez à l'emplacement du référentiel cloné (répertoire local où vous avez choisi de sauvegarder le référentiel)
cd /path/to/repo/src/csvcomparetool/Enfin, exécutez la commande suivante
python cli.py /csv/path/one /csv/path/two columnidentifier