chad скачать - загрузка исходного кода chad

Чад

Поиск Google Dorks, как Чад. Основано на Иване-Синсеке/Нагейл-Исследовании.

Протестировано на Kali Linux V2024.2 (64-бит).

Сделано для образовательных целей. Надеюсь, это поможет!

Планы на будущее:

Экстрактор Чада:
- Проверьте, установлен ли браузер без головы драума драматурга, или нет,
- добавить опцию, чтобы остановиться на ограниченном уровне,
- Найдите способ обойти аут. стена для linkedin-user .

Как установить
- Установить драматург и хром
- Стандартная установка
- Стройте и установите из источника
Кратчайший возможный
Файл Скачать
Чед -экстрактор
Сломанная ссылка угон
- Одиночный сайт
- Несколько сайтов
- Анализ отчета
- Ограничение скорости
Использование
Изображения

Как установить

Установить драматург и хром

pip3 install --upgrade playwright

playwright install chromium

Убедитесь, что каждый раз, когда вы обновляете свою драматурную зависимость, чтобы переустановить хром; В противном случае вы можете получить ошибку, используя безголовный браузер в экстракторе Chad.

Стандартная установка

pip3 install --upgrade google-chad

Стройте и установите из источника

git clone https://github.com/ivan-sincek/chad && cd chad

python3 -m pip install --upgrade build

python3 -m build

python3 -m pip install dist/google_chad-7.0-py3-none-any.whl

Кратчайший возможный

chad -q ' intitle:"index of /" intext:"parent directory" '

Файл Скачать

Вы сказали метагофил?!

mkdir downloads

chad -q " ext:pdf OR ext:docx OR ext:xlsx OR ext:pptx " -s * .example.com -tr 200 -dir downloads

Функция загрузки файла Chad основана на зависимости Python.

Чед -экстрактор

Chad Extractor - это мощный инструмент, основанный на веб -гусенике Scrapy и безголовом браузере Playwright, предназначенный для эффективного сохранения веб -контента; В отличие от запросов на Python, которая не может отображать HTML, кодируемый JavaScript и легко блокируется анти-ботскими решениями.

В первую очередь, chad Extractor предназначен для извлечения и проверки данных из файлов результатов Chad. Тем не менее, его также можно использовать для извлечения и проверки данных из файлов с открытым текстом с помощью опции -pt .

Если используется опция -pt , файлы открытого текста будут рассматриваться как ответы серверов, а логика извлечения будет применена, а затем проверка. Это также полезно, если вы хотите повторно испытать предыдущие отчеты экстрактора Chad, например, с помощью -res report.json -pt -o retest.json .

Сломанная ссылка угон

Подготовьте Google Dorks как файл social_media_dorks.txt:

 intext:"t.me/"
intext:"discord.com/invite/" OR intext:"discord.gg/invite/"
intext:"youtube.com/c/" OR intext:"youtube.com/channel/"
intext:"twitter.com/" OR intext:"x.com/"
intext:"facebook.com/"
intext:"instagram.com/"
intext:"tiktok.com/"
intext:"linkedin.com/in/" OR intext:"linkedin.com/company/"

Подготовьте шаблон как файл social_media_template.json:

{
   "telegram" :{
      "extract" : " t \ .me \ /(?:(?!(?:share)(?:(?: \ /| \ ?| \\ | " | \ <)*$|(?: \ /| \ ?| \\ | \" | \ <)[ \ s \ S]))[ \ w \ d \ . \ _ \ - \ + \ @]+)(?<! \ .) " ,
      "extract_prepend" : " https:// " ,
      "validate" : " <meta property= " og:title " content= " Telegram: Contact .+? " > "
   },
   "discord" :{
      "extract" : " discord \ .(?:com|gg) \ /invite \ /[ \ w \ d \ . \ _ \ - \ + \ @]+(?<! \ .) " ,
      "extract_prepend" : " https:// " ,
      "validate" : " Invite Invalid " ,
      "validate_browser" : true ,
      "validate_browser_wait" : 6
   },
   "youtube" :{
      "extract" : " youtube \ .com \ /(?:c|channel) \ /[ \ w \ d \ . \ _ \ - \ + \ @]+(?<! \ .) " ,
      "extract_prepend" : " https://www. " ,
      "validate" : " <iframe.+?src= "\ /error \ ?src=404.+? " > " ,
      "validate_cookies" :{
         "SOCS" : " CAESEwgDEgk2OTk3ODk2MzcaAmVuIAEaBgiAn5S6Bg "
      }
   },
   "twitter" :{
      "extract" : " (?<=(?<!pic \ .)twitter|(?<!pic \ .)x) \ .com \ /(?:(?!(?:[ \ w]{2} \ /)*(?:explore|hashtag|home|i|intent|library|media|personalization|privacy|search|share|tos|widgets \ .js)(?:(?: \ /| \ ?| \\ | " | \ <)*$|(?: \ /| \ ?| \\ | \" | \ <)[ \ s \ S]))[ \ w \ d \ . \ _ \ - \ + \ @]+)(?<! \ .) " ,
      "extract_prepend" : " https://x " ,
      "validate" : " This account doesn.?t exist " ,
      "validate_browser" : true ,
      "validate_cookies" :{
         "night_mode" : " 2 "
      }
   },
   "facebook" :{
      "extract" : " facebook \ .com \ /(?:(?!(?:about|dialog|gaming|groups|public|sharer|share \ .php|terms \ .php)(?:(?: \ /| \ ?| \\ | " | \ <)*$|(?: \ /| \ ?| \\ | \" | \ <)[ \ s \ S]))[ \ w \ d \ . \ _ \ - \ + \ @]+)(?<! \ .) " ,
      "extract_prepend" : " https://www. " ,
      "validate" : " This (?:content|page) isn't available " ,
      "validate_browser" : true
   },
   "instagram" :{
      "extract" : " instagram \ .com \ /(?:(?!(?:about|accounts|ar|explore|p)(?:(?: \ /| \ ?| \\ | " | \ <)*$|(?: \ /| \ ?| \\ | \" | \ <)[ \ s \ S]))[ \ w \ d \ . \ _ \ - \ + \ @]+)(?<! \ .) " ,
      "extract_prepend" : " https://www. " ,
      "extract_append" : " / " ,
      "validate" : " Sorry, this page isn't available \ . " ,
      "validate_browser" : true
   },
   "tiktok" :{
      "extract" : " (?<!vt \ .)tiktok \ .com \ / \ @[ \ w \ d \ . \ _ \ - \ + \ @]+(?<! \ .) " ,
      "extract_prepend" : " https://www. " ,
      "validate" : " Couldn't find this account "
   },
   "linkedin-company" :{
      "extract" : " linkedin \ .com \ /company \ /[ \ w \ d \ . \ _ \ - \ + \ @ \ &]+(?<! \ .) " ,
      "extract_prepend" : " https://www. " ,
      "validate" : " Page not found " ,
      "validate_cookies" :{
         "bcookie" : " v=2 " ,
         "lang" : " v=2&lang=en-us "
      }
   },
   "linkedin-user" :{
      "extract" : " linkedin \ .com \ /in \ /[ \ w \ d \ . \ _ \ - \ + \ @ \ &]+(?<! \ .) " ,
      "extract_prepend" : " https://www. " ,
      "validate" : " An exact match for .+ could not be found \ . "
   }
}

Убедитесь, что ваши обычные выражения возвращают только одну группу захвата, например, [1, 2, 3, 4] ; и не Touple, например, [(1, 2), (3, 4)] .

Убедитесь, что правильно ускользнуть от регулярных выражений в конкретных символах в вашем шаблоне, например, убедитесь, что выберите DOT . как \. и вперед Слэш / как \/ и т. Д.

Все регулярные поиски выражения нечувствительны.

Веб -контент, извлеченный из URL -адресов в результатах Chad, будут сопоставлены со всеми регулярными выражениями (определяемыми атрибутами extract ) в файле шаблона, чтобы найти как можно больше соответствующих данных.

Чтобы извлечь данные без проверки, просто опустите атрибуты validate из файла шаблона по мере необходимости.

Объем	Имя	Тип	Необходимый	Описание
извлечение	извлекать	стр	да	Запрос регулярного выражения.
извлечение	extract_prepend	стр	нет	Строка для подготовки ко всем извлеченным данным.
извлечение	extract_append	стр	нет	Строка для добавления для извлечения данных.
валидация	проверять	стр	нет	Запрос регулярного выражения.
валидация	validate_browser	буль	нет	Использовать ли без головы браузер или нет.
валидация	validate_browser_wait	плавать	нет	Время ожидания за несколько секунд, прежде чем получить контент со страницы браузера без головы.
валидация	validate_headers	Дикт [str, str]	нет	Заголовки HTTP-запроса в формате ключевой стоимости. Заголовок `Cookie` игнорируется.
валидация	validate_cookies	Дикт [str, str]	нет	Http-запрос файлов cookie в формате ключа.

Таблица 1 - Атрибуты шаблона

Одиночный сайт

chad -q social_media_dorks.txt -s * .example.com -tr 200 -pr 100 -o results.json

chad-extractor -t social_media_template.json -res results.json -o report.json

Несколько сайтов

Подготовьте домены / субдомены в качестве файла sites.txt , так же, как вы используете их с site: опция в Google:

 *.example.com
*.example.com -www

Бегать:

mkdir chad_results

IFS= $' n ' ; count=0 ; for site in $( cat sites.txt ) ; do count= $(( count + 1 )) ; echo " # ${count} | ${site} " ; chad -q social_media_dorks.txt -s " ${site} " -tr 200 -pr 100 -o " chad_results/results_ ${count} .json " ; done

chad-extractor -t social_media_template.json -res chad_results -o report.json -v

Анализ отчета

Вручную убедиться, что разбитые URL -адреса социальных сетей в results[summary][validated] уязвимы для поглощения:

{
   "started_at" : " 2023-12-23 03:30:10 " ,
   "ended_at" : " 2023-12-23 04:20:00 " ,
   "summary" :{
      "validated" :[
         " https://t.me/does_not_exist " // might be vulnerable to takeover
      ],
      "extracted" :[
         " https://discord.com/invite/exists " ,
         " https://t.me/does_not_exist " ,
         " https://t.me/exists "
      ]
   },
   "failed" :{
      "validation" :[],
      "extraction" :[]
   },
   "full" :[
      {
         "url" : " https://example.com/about " ,
         "results" :{
            "telegram" :[
               " https://t.me/does_not_exist " ,
               " https://t.me/exists "
            ],
            "discord" :[
               " https://discord.com/invite/exists "
            ]
         }
      }
   ]
}

Ограничение скорости

Период охлаждения Google может варьироваться от нескольких часов до целого дня.

Чтобы избежать достижения пределов скорости Google с помощью Chad, увеличьте минимальный и максимальный сон между Google запросами и/или страницами; или использовать бесплатные или платные прокси. Тем не менее, свободные прокси часто блокируются и нестабильны.

Чтобы загрузить список бесплатных прокси, запустите:

curl -s ' https://proxylist.geonode.com/api/proxy-list?limit=50&page=1&sort_by=lastChecked&sort_type=desc ' -H ' Referer: https://proxylist.geonode.com/ ' | jq -r ' .data[] | "(.protocols[])://(.ip):(.port)" ' > proxies.txt

Если вы используете прокси, вы можете увеличить тайм -аут запроса, так как ответы потребуется больше времени для прибытия.

Кроме того, чтобы избежать ограничений на достижение скорости на платформах, таких как Instagram во время использования экстрактора Chad, рассмотрите возможность уменьшения количества одновременных запросов на на домен и увеличения времени сна и ожидания.

Использование

 Chad v7.0 ( github.com/ivan-sincek/chad )

Usage:   chad -q queries     [-s site         ] [-x proxies    ] [-o out         ]
Example: chad -q queries.txt [-s *.example.com] [-x proxies.txt] [-o results.json]

DESCRIPTION
    Search Google Dorks like Chad
QUERIES
    File containing Google Dorks or a single query to use
    -q, --queries = queries.txt | intext:password | "ext:tar OR ext:zip" | etc.
SITE
    Domain[s] to search
    -s, --site = example.com | sub.example.com | *.example.com | "*.example.com -www" | etc.
TIME
    Get results not older than the specified time in months
    -t, --time =  6 | 12 | 24 | etc.
TOTAL RESULTS
    Total number of unique results
    Default: 100
    -tr, --total-results = 200 | etc.
PAGE RESULTS
    Number of results per page - capped at 100 by Google
    Default: randint(70, 100)
    -pr, --page-results = 50 | etc.
MINIMUM QUERIES
    Minimum sleep time in seconds between Google queries
    Default: 75
    -min-q, --minimum-queries = 120 | etc.
MAXIMUM QUERIES
    Maximum sleep time between Google queries
    Default: minimum + 50
    -max-q, --maximum-queries = 180 | etc.
MINIMUM PAGES
    Minimum sleep time between Google pages
    Default: 15
    -min-p, --minimum-pages = 30 | etc.
MAXIMUM PAGES
    Maximum sleep time between Google pages
    Default: minimum + 10
    -max-p, --maximum-pages = 60 | etc.
USER AGENTS
    User agents to use
    Default: random-all
    -a, --user-agents = user_agents.txt | random(-all) | curl/3.30.1 | etc.
PROXIES
    File containing web proxies or a single web proxy to use
    -x, --proxies = proxies.txt | http://127.0.0.1:8080 | etc.
DIRECTORY
    Downloads directory
    All downloaded files will be saved in this directory
    -dir, --directory = downloads | etc.
THREADS
    Number of files to download in parallel
    Default: 5
    -th, --threads = 20 | etc.
OUT
    Output file
    -o, --out = results.json | etc.
NO SLEEP ON START
    Disable the safety feature to prevent triggering rate limits by accident
    -nsos, --no-sleep-on-start
DEBUG
    Enable debug output
    -dbg, --debug

 Chad Extractor v7.0 ( github.com/ivan-sincek/chad )

Usage:   chad-extractor -t template      -res results      -o out         [-s sleep] [-rs random-sleep]
Example: chad-extractor -t template.json -res chad_results -o report.json [-s 1.5  ] [-rs             ]

DESCRIPTION
    Extract and validate data from Chad results or plaintext files
TEMPLATE
    File containing extraction and validation details
    -t, --template = template.json | etc.
RESULTS
    Directory containing Chad results or plaintext files, or a single file
    If a directory is specified, files ending with '.report.json' will be ignored
    -res, --results = chad_results | results.json | urls.txt | etc.
PLAINTEXT
    Treat all the results as plaintext files / server responses
    -pt, --plaintext
EXCLUDES
    File containing regular expressions or a single regular expression to exclude content from the page
    Applies only for extraction
    -e, --excludes = regexes.txt | "<div id="seo">.+?</div>" | etc.
PLAYWRIGHT
    Use Playwright's headless browser
    Applies only for extraction
    -p, --playwright
PLAYWRIGHT WAIT
    Wait time in seconds before fetching the page content
    Applies only for extraction
    -pw, --playwright-wait = 0.5 | 2 | 4 | etc.
CONCURRENT REQUESTS
    Number of concurrent requests
    Default: 15
    -cr, --concurrent-requests = 30 | 45 | etc.
CONCURRENT REQUESTS PER DOMAIN
    Number of concurrent requests per domain
    Default: 5
    -crd, --concurrent-requests-domain = 10 | 15 | etc.
SLEEP
    Sleep time in seconds between two consecutive requests to the same domain
    -s, --sleep = 1.5 | 3 | etc.
RANDOM SLEEP
    Randomize the sleep time between requests to vary between '0.5 * sleep' and '1.5 * sleep'
    -rs, --random-sleep
AUTO THROTTLE
    Auto throttle concurrent requests based on the load and latency
    Sleep time is still respected
    -at, --auto-throttle = 0.5 | 10 | 15 | 45 | etc.
RETRIES
    Number of retries per URL
    Default: 2
    -r, --retries = 0 | 4 | etc.
REQUEST TIMEOUT
    Request timeout in seconds
    Default: 60
    -rt, --request-timeout = 30 | 90 | etc.
USER AGENTS
    User agents to use
    Default: random-all
    -a, --user-agents = user_agents.txt | random(-all) | curl/3.30.1 | etc.
PROXY
    Web proxy to use
    -x, --proxy = http://127.0.0.1:8080 | etc.
OUT
    Output file
    -o, --out = report.json | etc.
VERBOSE
    Create additional supporting output files that end with '.report.json'
    -v, --verbose
DEBUG
    Enable debug output
    -dbg, --debug