該存儲庫將在不久的將來取代新的實施:
請訪問https://github.com/noscrape/noscrape-node以獲取更多信息
noscrape背後的主要機制是使用任何真實型字體。由此, noscrape生成了一個帶有改組的Unicodes的新版本,以確保無法對其進行反向計算。這意味著兩個字符串和整數都被混淆,只能使用產生的混淆font進行解密。
儘管字體內部的字形路徑不能完全刪除,但它們會通過稍微稍微移動它們來混淆。這使得對它們進行反向計算,但這並非完全不可能,尤其是對於機器學習算法而言。開發人員對改善這一方面的建議開放。
在這個時代,人工智能越來越多地成為我們日常生活不可或缺的時代,重要的是要記住,AI在數據上蓬勃發展,您的數據是一種寶貴的商品,不應輕易散佈。
noscrape ,以防止網絡刮板。這對於您網站獨有的內容特別有用,因此您希望在未經許可的情況下防止複製或使用它。noscrape來混淆敏感信息,例如個人標識符,財務詳細信息或機密文本,以視覺上訪問但可以保護,但可以防止刮擦和自動化數據提取工具。noscrape的保護,刮擦它們就沒有意義,並且可以減少機器人交互的數量,從而降低成本。noscrape以安全的方式顯示信息。要安裝@noscrape/noscrape軟件包,只需在項目目錄中運行以下命令:
npm install @noscrape/noscrape const { Noscrape } = require ( '@noscrape/noscrape' ) ;
// create noscrape instance
const noscrape = new Noscrape ( 'path/to/font.ttf' , { options } )
// obfuscate data
const number = noscrape . obfuscate ( 123 ) ;
const string = noscrape . obfuscate ( "noscrape" ) ;
const object = noscrape . obfuscate ( { title : "noscrape" , text : "obfuscation" } ) ;
// generate obfuscation font buffer after all obfuscation is done
const font = noscrape . getFont ( ) ;然後向客戶端/前端提供font和data
< style >
@font-face {
font-family: 'noscrape-obfuscated';
src: url('data:font/truetype;charset=utf-8;base64,${font.toString("base64")}');
}
</ style >該字體以緩衝格式傳遞。要在我們的網頁中使用它,我們將其轉換為base64 URL,然後將其嵌入自定義@font-face聲明中。完成此操作後,我們可以使用我們的樣式中指定的font-family顯示混淆的數據。
< span style = "font-family: noscrape-obfuscated" >
< div > { object . title } < / div>
< div > { object . text } < / div>
< / span > 機器人可能無法處理混淆的文本,這可能會導致不可預測的分析結果。因此,建議不要將此技術用於索引頁面必不可少的內容。混淆過程需要一些時間(標準機上約50-60ms)。對於API請求,建議將混淆邏輯放入計劃的任務並重複使用結果,而不是為每個請求重新計算所有內容。

角色範圍
這定義了用於加密的字符範圍。選項包括:
低內存
此選項適用於有限內存的情況,其中noscrape無法加載所提供的字體文件。默認值為false。
開發人員歡迎貢獻,問題和功能請求。如果您使用了此軟件包並修復了錯誤,他們鼓勵您提交PR。
該軟件包是由BernhardSchönberger獲得MIT許可證的。