個人鏈接數據庫,鏈接聚合器,具有RSS功能。
用例
- RSS閱讀器
- 書籤經理
- YouTube Link Manager,前端
- 非常簡單的搜索引擎
- 數據分析 - 分析鏈接腐爛,其他來源引用了多少頁,分析鏈接域等。
特徵
一般的
- 書籤管理,標籤和評論支持
- 支持“空間”。您可以定義自己的空間,例如“音樂”,“視頻”,“電影”等。
- 關鍵字輸入分析以找到趨勢
- 光模式和黑暗模式
- 自動出口
- 訪問多個用戶
- 信息亭模式。將URL附加到param“ auto-refresh”時,自動刷新設置為毫秒
服務
- RSS提要支持:支持YouTube RSS,Reddit RSS,Odysee,OpenRSS
- 通過Internetharch或任何配置的存檔介質支持存檔頁面
- GitHub支持。出口。例如互聯網域,用戶,項目
- YouTube通過YT-DLP項目下載支持
爬行
- 一些互聯網爬行功能
- 鏈接搜索。簡單實現,不使用彈性搜索
- 不支持代理旋轉。這是道德的網絡刮板,不應隨請求垃圾郵件
- 可配置的用戶代理,爬行者,硒,請求,未發現的鉻,crawlee,易於擴展
隱私
- 本地數據,沒有算法,沒有廣告,自我託管
- 用戶操作跟踪。您可以觀察和分析“觀點”,“搜索”,“評論”,“瀏覽歷史”的歷史
項目套件
- 書籤鏈接
- 互聯網域,用戶,項目
- 2024年的每日RSS GIT存儲庫
- 2023年的每日RSS GIT存儲庫
- 2022年的每日RSS GIT存儲庫
- 2021年的每日RSS GIT存儲庫
- 2020年的每日RSS GIT存儲庫
鏈接
- 屏幕截圖
- 安裝,配置
- https://renegat0x0.ddns.net/apps/catalog/-實例看起來像YouTube替代品
- https://renegat0x0.ddns.net/apps/various/-演示實例,其中包含各種內容
- 有關搜索行業的註釋
- 數據分析
- 發展
替代方案
確實存在用於鏈接書籤的替代程序。
ho積,grimoire,bookmarkos,Raindrop,linkace,ggather,Zotero,Onekey,lasso,carterlinks,zlinky,wakelet,wakelet,booky,booky,webtag,歷史悠久,知識
Github的Awasome列表。
它如何工作?
- 系統定期讀取“來源”
- 定期檢查每個“源”以獲取新數據。 RSS提要是一種源
- 新鏈接插入數據庫
- 如果配置,您的書籤每天都可以導出到存儲庫
- 新鏈接用於填充流行的“關鍵字”
排名算法
每個頁面都由幾個因素進行排名。
- 內容排名。 [0..100]範圍
- 用戶投票。 [-100..100]範圍
根據計算,結果相等
內容排名
要獲得良好的頁面評級,希望遵循良好的標準:
- 模式驗證器
- W3C驗證器
- 提供HTML元信息。開放圖協議中的更多信息
- 提供有效的標題,這是簡潔的,但不是太短
- 提供有效的描述,這是簡潔的,但不是太短
- 提供有效的出版日期
- 提供有效的縮略圖,媒體圖像
- 提供有效的HTML狀態代碼。沒有花哨的重定向,JavaScript重定向
- 提供RSS提要。為其提供html元信息https://www.petefreitag.com/blog/rss-autodiscovery/
- 提供搜索引擎關鍵字標籤
您的頁面與其他成千上萬的頁面一起存在。想像一下,您的元數據會影響您的識別和頁面排名。
請記住:一個好的頁面總是排名更高。
您可能想知道,如果Google不需要它們,為什麼我要寫有關搜索引擎“關鍵字”元字段的信息。好吧,我不喜歡Google。如果我們希望使用替代解決方案,則應該可以輕鬆地從簡單的搜索引擎找到您的頁面。如果支持打開網絡,請提供關鍵字字段。
選票排名
數據庫由RSS鏈接數據庫和用戶投票管理。計算每個鏈接的平均投票。
出口
有幾種導出類型。每天都可以導出數據。
導出支持JSON文件結構。
我們維護一些數據,但這不是Archive.org替換。我們僅存儲有關網頁的元數據:標題,描述,縮略圖。
大多數視圖包含“顯示JSON”按鈕,該按鈕將視圖數據作為JSON。這可以由腳本用於導入,導出。
出口類型:
- 每日數據 - 每天都有自己的目錄
- 年度數據 - 每年單獨持有信息
- 數據與時間無關 - 數據在單獨的目錄中,並且與時間無關
進口
由管理面板完成。 JSON數據文件可用於導入或其他DJANGO-LINK-ARCHIVE應用程序[正在構建]。
API鍵
管理員可以創建API鍵,以供未記錄的用戶訪問內容。
格式:
https://yourpage.com/your-app/index?key=yourgeneratedkey
歷史
您可以在本地保持自己的網絡瀏覽歷史記錄。忘記瀏覽器歷史記錄或書籤。
使用這種自我託管解決方案,您無需同步任何東西,因為所有服務器都存在於該服務器上。
忘記YouTube視頻瀏覽歷史記錄或訂閱。您可以控制自己看到的東西以及何時!
腳本
如果沒有Django,也可以使用網絡搭化功能。
沒有Django應用程序可以使用一些腳本:
- yafr.py-另一個提要閱讀器,命令行客戶端
- page_props.py-命令行工具顯示頁面屬性
- example_page_crawler.py-可以通過網頁爬網的示例腳本
- example_compare_crawlers.py-顯示執行不同爬網需要多少時間
- converter.py-將json文件轉換為sqlite表
- dataAnalyzer.py-分析JSON文件 / sqlite表中的數據。您可以查詢數據
- script_server.py-可用於派遣某些URL的服務器,以獲取元數據
- script_client.py-可用於連接到服務器的客戶端,並調試爬網腳本
- workspace.py-工作區管理。可用於更新項目
- backup.py-腳本到備份PostgreSQL數據
易於導航
該項目的創建是為了發揮導航性。因此,從鏈接中應該有導航到其他地方:
- Google
- 其他搜索引擎,Wikipedia等
- 鏈接到Internet檔案,等等。
即使Google實現了互聯網存檔的鏈接,或者介紹了大多數這些功能,我們也應該繼續對此進行工作,因為我們永遠不知道公司何時決定不支持它。
聯邦[正在建設]
該項目聯合起來。因此,您可以依靠來自其他DJ-Link-Archive實例的數據。
你可以:
- 從其他鏈接存檔實例定義自動導入的代理來源
- 手動從另一個鏈接存檔實例導入鏈接,或
代理來源[正在建設]
首先讓我們定義一個方案。您有實例A和實例B。實例B已定義了一個源。
您不希望實例a從Internet獲取相同的數據。您想從實例B中獲取數據。
這樣做:
- 導航到實例B源。
- 找到您想要的來源。
- 單擊“顯示JSON”(複製該地址的位置)
- 在實例A到源。
- 添加新來源
- 粘貼實例B地址,JSON地址鏈接
- 該系統應建議源類型為JSON
用戶管理[正在建設]
項目使用默認用戶驗證模塊。
最終遊戲的路線圖。
- 起初,只有管理員才能添加新用戶。用於運行實例聯繫人管理員
- 您沒有創建密碼,它們是為您生成的,具有適當的複雜性。請寫下來
- 如果業力允許,請聯繫其他用戶,其他用戶也可以添加新用戶
業力對用戶的影響:
- 如果您的業力低於0,則禁止您的帳戶
- 一定的閾值後,您可以提交新鏈接
- 一定的閾值後,您可以提交評論
- 一定的閾值後,您可以投票和降價評論
- 一定的閾值後,您創建用戶(每天1)
導致業力變化的是什麼:
- 管理員或主持人
- 添加鏈接的投票
- 在評論中高投票或下跌投票
- 您邀請的其他用戶的禁令
僅當系統配置時,用戶操作是由系統跟踪的:
- 用戶可以發布條目的評論
- 用戶可以標記條目
- 用戶可以投票給條目
- 系統存儲有限的搜索查詢,用戶可以從ComboBox中選擇以前的查詢
- 系統將訪問訂單存儲在條目上。這允許為每個條目提供“相關”部分。例如,如果您在“ y”之後捕獲“ x”,則“ x”將出現在“ y”相關部分上
理由
存在許多程序,但其中大多數都有一些局限性。
- 許可證:某些客戶不是開源的,也不是完全開源的(例如Reddit)。某些程序不是從用戶角度來看的程序,而是服務:餵食,口袋,讀者。他們需要帳戶。他們的條款和服務可以改變
- 界面:大多數RSS程序是GUI:Thunderbird,Feeder。我想要一個網頁,一個可以從任何地方訪問的應用程序
- 缺少搜索能力(NextCloud“ News”應用程序,Thunderbird,Feeder Android應用程序,新聞船Linux應用程序)
- 缺少標籤支持(Thunderbird,Android饋線應用程序)
- 有些程序不提供鏈接評級
- 導入 /導出:大多數程序都不提供簡單的方法(我想要JSON文件!)
- 規模:有些項目很大。該項目著重於提供“單用戶”體驗。我在這裡不想要很多依賴
- 目標:Reddit,Lemmy的目標是提供社交媒體體驗,該項目旨在授予創建鏈接數據庫的能力
附加說明
是什麼磨我的齒輪?
- Google並不提供簡單的觀看緩存網站的方法,例如Archive.org。他們有,他們只是不讓您訪問它
- 在互聯網上發現新地方並不容易。您什麼時候發現任何值得一看的“新”網站?部落格?個人網站? Google有數十億頁的索引,但互聯網看上去很空
- 舊網頁永遠不會在Google搜索中排名第一
- Google搜索中沒有按鈕可以翻譯目標鏈接
- YouTube為視頻提供了“相關”部分。為什麼Google在搜索中不提供“相關”鏈接列表?
- 很難找到有關Amiga或舊技術的任何東西
- 第一頁謬論。第二個Google搜索結果確實很重要。第二個Google搜索頁面也很重要。如果我搜索“ PHP”,則有成千上萬的框架,值得一看的項目。為什麼我無法使用Google搜索輕鬆找到它們?我們給Google搜索太多信用
Archive.org:
- 不可靠。有時它會變得痛苦慢。它仍然總比沒有好
- 涵蓋了大多數主流媒體RSS,但覆蓋範圍很廣。並非所有的日子都涵蓋
- Internet Archive(Archive.org)並未為所有RSS來源提供每天的快照。有時很慢。我們想確保發生這樣的快照。因此,我們需要將鏈接導出到每日回購。 Django RSS應用程序還提出了檔案的請求以製作快照
合法的
- 我不認可數據庫中每個鏈接的任何鏈接。我可能有些鏈接很重要,因為內容有多糟。我經常使用諷刺,因此要當心!
- 每個人都有被遺忘的權利。如果應從數據庫中刪除任何鏈接,請與我聯繫
- 我沒有從鏈接或有關它的數據獲得任何形式的貨幣補償。數據鏈接信息已經由RSS來源提供。 RSS來源負責他們免費提供的產品
結局筆記
所有鏈接都屬於我們!