El CSVComparetool le permite encontrar diferencias entre dos archivos CSV basados en un identificador de columna especificado. Proporciona una manera simple de comparar el contenido de dos archivos CSV e identificar qué registros están presentes en un archivo pero no en el otro.
Nota
Al comparar los archivos CSV para las diferencias, asegúrese de proporcionar al CSV más entradas en segundo lugar. Por ejemplo, si CSV-1 tiene una lista de 34 nombres, y CSV-2 tiene una lista de 40, CSV-2 debería establecerse como la segunda ruta CSV aprobada para que las diferencias se muestren como se esperaba.
Puede instalar CSV-Compare usando pip :
pip install csv-compare-toolPara usar CSV-Compare en su proyecto Python, siga estos pasos.
Importante
Al importar como un paquete en un proyecto de Python, asegúrese de eliminar los guiones para que el paquete lea csvcomparetool (consulte Pep 8 para obtener más información)
import csvcomparetool Opcionalmente, puede importar la clase CSVComparer solo
from csvcomparetool import CSVComparerCSVComparer csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column ) if not comparer . validate_paths ():
print ( "CSV file paths are invalid. Please check the file paths and try again." )
return if not comparer . validate_columns ():
print ( "Provided column not found in CSV. Check the columns and try again." )
return differences = comparer . find_differences () for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." ) from csvcomparetool import CSVComparer
csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column )
if not comparer . validate_paths () or not comparer . validate_columns ():
print ( "CSV file paths are invalid, or the column identifier does not exist. Check the file paths and columns and try again." )
else :
differences = comparer . find_differences ()
for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." )Primero, clone este repositorio a un directorio local en su máquina
git clone https://github.com/liquidz00/csv-compare.gitNavegue a la ubicación de repositorio clonado (directorio local donde eligió guardar el repositorio)
cd /path/to/repo/src/csvcomparetool/Por último, ejecute el siguiente comando
python cli.py /csv/path/one /csv/path/two columnidentifier