csv compare
v1.0.3
CSVCompareToolを使用すると、指定された列識別子に基づいて2つのCSVファイルの違いを見つけることができます。 2つのCSVファイルの内容を比較し、1つのファイルに存在するレコードを特定する簡単な方法を提供しますが、もう1つのファイルには存在しません。
注記
違いについてCSVファイルを比較する場合は、CSVに2番目のより多くのエントリを提供してください。たとえば、CSV-1に34の名前のリストがあり、CSV-2が40のリストを持っている場合、CSV-2は予想どおりに違いを示すために2番目の渡されたCSVパスとして設定する必要があります。
pipを使用してCSV-Compareをインストールできます。
pip install csv-compare-toolPythonプロジェクトでCSV-Compareを使用するには、次の手順に従ってください。
重要
Pythonプロジェクトでパッケージとしてインポートするときは、パッケージがcsvcomparetoolを読むようにハイフンを削除してください(詳細についてはPEP 8を参照)
import csvcomparetoolオプションで、 CSVComparerクラスのみをインポートできます
from csvcomparetool import CSVComparerCSVComparerオブジェクトを作成します csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column ) if not comparer . validate_paths ():
print ( "CSV file paths are invalid. Please check the file paths and try again." )
return if not comparer . validate_columns ():
print ( "Provided column not found in CSV. Check the columns and try again." )
return differences = comparer . find_differences () for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." ) from csvcomparetool import CSVComparer
csv1_path = "path/to/first.csv"
csv2_path = "path/to/second.csv"
column = "identifier_column"
comparer = CSVComparer ( csv1_path , csv2_path , column )
if not comparer . validate_paths () or not comparer . validate_columns ():
print ( "CSV file paths are invalid, or the column identifier does not exist. Check the file paths and columns and try again." )
else :
differences = comparer . find_differences ()
for difference in differences :
print ( f"Record ' { difference } ' is present in CSV2 but not in CSV1." )まず、このリポジトリをマシン上のローカルディレクトリにクローンします
git clone https://github.com/liquidz00/csv-compare.gitクローン化されたリポジトリの場所(リポジトリを保存することを選択したローカルディレクトリ)に移動します
cd /path/to/repo/src/csvcomparetool/最後に、次のコマンドを実行します
python cli.py /csv/path/one /csv/path/two columnidentifier