Популярная поисковая система Zeronet. Kaffiene.bit или 1mr5rx9tauvagreb4rjcae6d37fjqay5ba для доступа на Zeronet.
Экспериментальный 0git Repo здесь: 1dup5jrszgvvzbc2nq4b57qb6zxk4sstkd
Grab.py
Функция grab.py довольно проста, однако самое сложное для настройки и запуска. Сценарий требует, чтобы селен был установлен для Python («PIP установить Selenium» должен работать). Это также требует, чтобы вы скачали Phantomjs. Я скачал версию Mac с phantomjs.org. При этом вам нужно отредактировать сценарий Python, чтобы указать на Phantomjs. И вы также можете при желании изменить, из какой прокси вы захватываете. Как только вся эта настройка будет сделана, просто запустите сценарий. Через короткое время, «сделано?» появится. Подождите несколько секунд (я жду около 3-5) и нажмите Enter. Три числа должны появиться. Это схватываемые количество адресов, имен и сверстников. Все они должны быть равными. Затем grab.py выводит peerlist.txt, который ожидает merge.py.
merge.py
Это новый инструмент merge.py. Он используется для обновления записей Siterank. Он принимает существующий индекс сайта вместе с новым «Peerlist», который содержит список адресов и сверстников сайта, сгенерированных grab.py. Peerlist.txt должен иметь по одному адресу на каждой строке, за которым следует место, а затем Siterank, за которым следует место и название сайта. Merge.py затем найдет все сайты в индексе и объединит новый Siterank со старым. Если один из них отсутствует, он будет использовать тот, который доступен. Если нет ни одного, это будет держать '-'. Любые сайты, которые являются уникальными для Peerlist, разделены на файл newsites.txt, для облегчения помечения. Запуск инструмента несколько раз добавит в Newsites.txt, а не перезаписать. Новые сайты все еще добавляются в Data.txt вручную в данный момент (после того, как автоматизированная генерация тегов будет на месте, это больше не будет).
MERGEOLD.PY
MERGEOLD.PY принимает существующий индекс сайта, такой как ранее использовался Kaffiene, наряду с новым «Peerlist», который содержит список адресов и коллег сайта (как получено из /статистики). Peerlist.txt должен иметь по одному адресу в каждой строке без описательной информации, а затем пространство, а затем количество сверстников. Или любое значение, которое вы хотите присвоить сайту. «Ситранк», если хотите. MergeOld.py затем найдет все сайты в индексе и добавят ранг сайта на конец записи (опять же, с пространственным сепаратором). Если сайт не находится в Peerlist, он назначен манекен '-' 'Значение. Любые сайты, которые являются уникальными для Peerlist, разделены на файл newsites.txt, для облегчения помечения.
Стоит отметить, что MergeOld.py работает только с data.txt, который еще не применяется. Кроме того, новый index.html будет ожидать Data.txt с Siterank. Пожалуйста, имейте это в виду.
check.py
Это оригинальный инструмент для проверки дубликатов. Он отлично работает и даже позволяет выбрать файл без изменения сценария. Это просто показывает, сколько уникальных сайтов находится в индексе и каковы дубликаты, если есть. Это простой и прямой инструмент.