CSVComparetool позволяет вам найти различия между двумя файлами CSV на основе указанного идентификатора столбца. Он предоставляет простой способ сравнения содержимого двух файлов CSV и определения того, какие записи присутствуют в одном файле, но не в другом.
Примечание
Сравнивая файлы CSV для различий, обязательно предоставьте CSV больше записей второй. Например, если CSV-1 имеет список из 34 имен, а CSV-2 имеет список из 40, CSV-2 должен быть установлен в качестве второго пройденного пути CSV, чтобы различия показали, как ожидалось.
Вы можете установить CSV-Compare с помощью pip :
pip install csv-compare-toolЧтобы использовать CSV-компонент в вашем проекте Python, выполните следующие действия.
Важный
При импорте в качестве пакета в проекте Python, обязательно удалите дефиса, чтобы пакет считывал csvcomparetool (см. PEP 8 для получения дополнительной информации)
import csvcomparetool При желании вы можете импортировать только класс CSVComparer
from csvcomparetool import CSVComparerCSVComparer csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column ) if not comparer . validate_paths ():
print ( "CSV file paths are invalid. Please check the file paths and try again." )
return if not comparer . validate_columns ():
print ( "Provided column not found in CSV. Check the columns and try again." )
return differences = comparer . find_differences () for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." ) from csvcomparetool import CSVComparer
csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column )
if not comparer . validate_paths () or not comparer . validate_columns ():
print ( "CSV file paths are invalid, or the column identifier does not exist. Check the file paths and columns and try again." )
else :
differences = comparer . find_differences ()
for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." )Во -первых, клонировать этот репозиторий в локальный каталог на вашей машине
git clone https://github.com/liquidz00/csv-compare.gitПерейдите в клонированное местоположение репо (локальный каталог, где вы решили сохранить репозиторий)
cd /path/to/repo/src/csvcomparetool/Наконец, запустите следующую команду
python cli.py /csv/path/one /csv/path/two columnidentifier