公式ウェブサイトからCookidooのレシピを簡単に捨ててください
このプログラムを使用すると、オフラインおよび任意の読書のために、すべてのレシピをCookidoo Webサイト(さまざまな国で利用可能)にダンプすることができます。これらのレシピは、特にThermomix/Bimbyデバイスで有効です。レシピをダンプするには、有効なサブスクリプションが必要です。
このプログラムの最初の概念は、Jakubszalaty/Cookidoo-Parserに基づいていました。
Cookidumpを科学的に調査または拡張するつもりなら、次の論文を引用することを検討してください。
@article{cambiaso2022cookidump,
title = {Web security and data dumping: The Cookidump case},
journal = {Software Impacts},
volume = {14},
pages = {100426},
year = {2022},
issn = {2665-9638},
doi = {https://doi.org/10.1016/j.simpa.2022.100426},
url = {https://www.sciencedirect.com/science/article/pii/S2665963822001105},
author = {Enrico Cambiaso and Maurizio Aiello},
keywords = {Cyber-security, Data dump, Database security, Browser automation},
abstract = {In the web security field, data dumping activities are often related to a malicious exploitation. In this paper, we focus on data dumping activities executed legitimately by scraping/storing data shown on the browser. We evaluate such operation by proposing Cookidump, a tool able to dump all recipes available on the Cookidoo© website portal. While such scenario is not relevant, in terms of security and privacy, we discuss the impact of such kind of activity for other scenarios including web applications hosting sensitive information.}
}
詳細については、https://www.sciencedirect.com/science/article/pii/s2665963822001105をご覧ください。
nix run github:auino/cookidump -- <outputdir> [--separate-json]
Nixはchromedriverと一緒にgoogle-chrome提供します。 <outputdir>および[--separate-json]引数のみが予想されます。
git clone https://github.com/auino/cookidump.git
ダウンロードフォルダーにcd
Python要件のインストール:
pip install -r requirements.txt
まだインストールされていない場合は、Google Chromeブラウザをインストールします
Chrome WebDriverをダウンロードして、 cookidumpフォルダーに保存します
レシピを捨てる準備ができています
次のコマンドを実行してプログラムを開始するだけです。このプログラムは、使用法を簡素化するためのインタラクティブです。
python cookidump.py [--separate-json] <webdriverfile> <outputdir>
どこ:
webdriverfileダウンロードしたChrome WebDriverへのパスを識別します(たとえば、Windowsホスト用のchromedriver.exe 、 ./chromedriver for LinuxおよびMacOSホスト)outputdir出力ディレクトリのパスを識別します(まだ存在していないにしても作成されます)--separate-json 、すべてのレシピを含む1つの集計ファイルではなく、各レシピに個別のJSONファイルを生成できますこのプログラムは、Google Chromeウィンドウを開き、Cookidooアカウントにログインするまで待ちます(さまざまな国がサポートされています)。
その後、スクリプト自体によって提供されたイントラクションに従って、ダンプを続行します。
スクリプトの指示に従って、選択したレシピをエクスポートするためにカスタムフィルターを適用することもできます(たとえば、皿、タイトルと材料、Thermomix/Bimbyバージョンなどのベースで)。
出力は、 outputdirに含まれるindex.htmlファイルと、構造化されたフォルダー内の一連のレシピで表されます。ブラウザで生成されたindex.htmlファイルを開くことにより、レシピのリストをダウンロードして、目的のレシピにサーフィンすることができます。
エクスポートされたレシピの数は、実行ごとに約1000に制限されています。したがって、この場合、フィルターの使用は、エクスポートされるレシピの数を減らすのに役立つ場合があります。
以前に採用された別のアプローチは、レシピ上の構造化されたデータの検索に基づいています。詳細については、DataStructureブランチをご覧ください。この場合、出力は別の(構造化された)形式で表されるため、解釈する必要があります。このような解釈は、リンクされた以前のコミットでは実装されていません。
このプログラムの著者は、その使用について責任を負いません。このプログラムは、研究と普及の目的でのみリリースされます。また、このプログラムは、正当なサブスクリプションを介してアクセス可能なレシピをローカルおよび一時的に保存する機能をユーザーに提供します。このプログラムを使用する前に、悪用されたサブスクリプションに関連する国によると、Cookidooサブスクリプション利用規約を確認してください。得られたレシピの共有は合法的な活動ではなく、このプログラムの著者は、ユーザーが達成した違反および共有活動について責任を負いません。
Twitterで@auinoとして私を見つけることができます。