guess下載 - guess源代碼下載

guess

其他源碼

1.0.0

下載

Guess.js（alpha）

庫和工具，用於在網絡上啟用數據驅動的用戶體驗。

Quickstart

對於WebPack用戶：

⚫數據驅動的捆綁

安裝和配置猜測Pluesplugin-猜測。

如果您希望嘗試單獨提供的模塊，則packages目錄包含三個包：

ga一個用於從Google Analytics（分析）API獲取結構化數據的模塊，以了解用戶導航模式。
parser - 提供JavaScript框架解析的模塊。這為在Guess Webpack插件中實現的路由功能提供動力。
webpack用於在應用程序中設置預測性獲取的WebPack插件。它消耗了ga和parser模塊，並提供了大量選項，用於配置預測性獲取在應用程序中的工作方式。

對於非webpack用戶：

⚫數據驅動的加載

我們對網站工作流程的預測性提示提供了一組步驟，您可以遵循使用Google Analytics（分析）API集成預測性提取的步驟。

此存儲庫使用Google Analytics（分析）數據來確定用戶主要可能從給定頁面訪問哪個頁面。客戶端腳本（您將添加到應用程序中）將請求發送到服務器以獲取該頁面的URL，以獲取該請求，然後預取資源。

了解更多

什麼是猜測。

Guess.js提供了庫和工具，以簡化預測性數據分析驅動的方法來改善網絡上的用戶體驗。這些數據可以從任何數量的來源驅動，包括分析或機器學習模型。 Guess.js旨在降低消費和將這種思維應用於所有現代站點和應用程序的摩擦，包括為流行工作流構建庫和工具。

將預測性數據分析思維應用於網站可以在多種情況下應用：

預測用戶可能會訪問並預取這些頁面的下一頁（或頁面），從而改善感知到的頁面負載性能和用戶幸福感。
- 頁面級：Prerender/預摘要頁面，該頁面最有可能下一步訪問
- 束級別：將與頂部n頁相關的捆綁包。在每個頁面上，導航在當前頁面的所有鄰居中，按訪問的概率按降序排序。根據當前連接有效類型，取得頂部N頁面的資產（JavaScript塊）。
預測用戶可能要查看和調整或過濾用戶體驗以解決此內容的下一個內容（文章，產品，視頻）。
預測單個用戶可能會與更多（例如游戲）進行交互的小部件類型，並使用此數據來量身定制更多的自定義體驗。

通過在可以輕鬆應用數據驅動方法的生態系統中的不同接觸點之間進行協作，我們希望概括常見的基礎架構，以最大程度地利用它們在不同技術堆棧中的適用性。

我們想解決的問題

開發人員使用<link rel=prefetch>用於將來導航的開發人員在很大程度上依靠手動閱讀描述性分析來告知他們的預摘要的決策。
這些決定通常是在某個時間點做出的。
- （1）通常不會隨著數據趨勢的變化而被重新審視
- （2）使用它們的使用方式非常有限。實現通常只會從主頁或很小的英雄頁面進行預取內容，但否則，對於網站上的所有可能的入口點，都不會這樣做。這可以在桌上留下性能機會。
- （3）對用於使用預取的數據的數據需要一定的信心，這意味著開發人員可能不會因為擔心它們會浪費帶寬而採用它。 <link rel=prefetch>目前用於總鉻pageloads的5％，但這可能更高。
對於普通的Web開發人員而言，實施預測分析太複雜了。
- 大多數開發人員不熟悉如何利用Google Analytics（分析）API來確定接下來將訪問頁面的概率。我們缺乏：
- （1）頁面級別的解決方案：用於預取頁的訪問客戶端解決方案，用戶可能會訪問
- （2）捆綁級別的解決方案：一組與當今JavaScript捆綁包（例如WebPack）一起使用的插件/工具，以聚集並生成捆綁包/塊，特定的導航路徑可能會更快地加載它們，如果它們可以提前預取。
大多數開發人員尚不熟悉機器學習的工作方式。它們通常是：
- （1）不確定如何（以及為什麼）ML可以集成到其現有（Web）技術堆棧中
- （2）TensorFlow的價值主張是什麼或諸如CloudMl Engine（例如CloudMl Engine）的位置。我們有機會簡化與利用某些解決方案相關的間接費用。
在這個領域，最佳的 /低摩擦方法仍在緩慢地出現，並且沒有ML或數據科學背景的Web開發人員尚未訪問。
- 機器學習遇到雲：智能預摘要IIH北歐
  - 諸如Google標籤管理器之類的標籤管理器可用於從代碼跟踪內容的使用方式中解釋頁面內容。這使Web分析師可以實時升級跟踪代碼，而無需停機時間。標籤管理人員允許使用代碼注入的一般解決方案，可用於部署智能預取。優點：用於構建模型的分析來自標籤管理器。我們還可以無需其他跟踪器開銷即可將數據直播發送到預測變量。在為GTM安裝中添加了一些（IIH Nordic的）標籤後，站點可以開始預取下下一個頁面的資源，並跟踪加載時間節省的機會。
  - IIH Nordic將預測性預取模型移至Web服務時，當用戶訪問新頁面時，瀏覽器查詢。該服務響應每個請求，並利用Google Cloud，App Engine和Cloud ML。他們的解決方案選擇了最準確的模型，選擇包括馬爾可夫模型，或者通常是張量的深神經網。
  - 隨著用戶行為的變化，預測模型需要不時更新（培訓）。訓練模型涉及收集和轉換數據並相應地擬合模型的參數。 IIH北歐使用Google Cloud將數據從客戶的分析服務中吸收到BigQuery的私人數據存儲庫中。他們處理此數據，訓練和測試預測模型，無縫更新預測服務。
  - IIH北歐建議小/慢網站每月更新其模型。較大的網站可能需要每天或每小時為新聞網站進行重新訓練。
  - 由於可以根據需要添加其他機器，GPU和處理器，因此在雲中訓練ML模型的好處是易於擴展。
  - 機器學習驅動的捆綁。 Minko的JavaScript工具的未來

最初優先級：通過數據驅動的預取改進性能

Guess.js的第一個大型優先級將通過預測的內容提高Web性能。

通過構建用戶可能會訪問的頁面模型，鑑於任意輸入頁，解決方案可以計算用戶將在用戶仍在查看其當前頁面時訪問給定的下一頁或一組頁面的可能性。這有可能改善以後的頁面訪問的頁面加載性能，因為在用戶的緩存中，頁面很有可能。

預測提取的可能方法

為了預測用戶可能會訪問的下一頁，解決方案可以使用Google Analytics（分析）API。 Google Analytics（分析）會話數據可用於創建模型，以預測用戶將要在網站上訪問的最可能的頁面。本會話數據的好處是它可以隨著時間的推移而發展，因此，如果特定的導航路徑發生變化，預測也可以保持最新。

有了這些數據的可用性，引擎可以插入<link rel="[prerender/prefetch/preload]">標籤，以加快下一頁請求的加載時間。在某些測試中，例如馬克·埃德蒙森（Mark Edmondson）使用R的增壓頁面載荷，這導致頁面加載時間提高了30％。他的研究中使用的方法標記涉及使用GTM標籤和機器學習來訓練模型以進行頁面預測。這是機器學習中持續的想法標記，符合雲 - 智能預取。

儘管這種方法是正確的，但所使用的方法可以認為有些複雜。可以採用的另一種方法（更簡單）是嘗試從Google Analytics（分析）API獲取準確的預測數據。如果您運行了頁面和上一頁路徑維度的報告，並結合了頁面瀏覽量和退出指標，則應提供足夠的數據來連接大多數流行頁面的預取。

用於預測提取的機器學習

ML可以幫助提高解決方案預測的總體準確性，但不需要初始實施。可以通過在用戶可能會隨著時間的推移訪問和改進的頁面上的模型來實現預測性提取。

深度神經網絡特別擅長挑逗可能導致用戶選擇一個頁面而不是另一個頁面的複雜性，如果我們想嘗試嘗試迎合個人用戶可能訪問的頁面的解決方案版本，而“通用/中位數”用戶可能會訪問接下來。固定的頁面序列（上一個，當前，下一個）可能是最初開始處理的最簡單的。這意味著建立一個模型，該模型是您一組文檔的獨特模型。

模型更新往往會定期進行，因此可能會根據新的用戶行為設置每晚/每週工作以刷新。這可能是實時完成的，但可能很複雜，因此定期這樣做可能就足夠了。可以想像一個通用模型代表站點上用戶的行為模式，該模型可以由訓練有素的狀態集，Google Analytics（分析）或您使用新層插入路由器中的自定義描述來驅動，從而使網站能夠預測地獲取未來頁面，從而提高頁面負載性能。

推測預取的可能方法

頁面上的投機性預取

投機性預取的可能會在頁面加載上導航。這假設存在有關概率的知識的存在，一個頁面將需要某個下一頁或一組頁面，或者可以提供數據驅動方法來確定此類概率的方法。

從延期到UA，可以通過多種方式來完成頁面加載的預摘要，以決定何時預取資源（例如，在<link rel=prefetch>的<link rel = prefetch>），在頁面空閒時間（通過requestIdlecallback（））或其他某些間隔。用戶不需要進一步的互動。

當鏈接進入視口時推測性預取

當頁面中的鏈接在視口中可見時，一個頁面可以推測開始預摘要內容，這表明用戶可能有更高的機會需要單擊它們。

這是Gatsby（使用React和React路由器）使用的一種方法。他們的具體實現如下：

在支持IntersectionObserver的瀏覽器中，每當A <Link>組件變得不可見時，鏈接到預取票的頁面的鏈接“投票”每次都值得較小，因此頁面頂部的鏈接優先於較低的鏈接。
例如，如果一個頁面多次鏈接到頂級NAV，則其投票計數較高，預摘要佔據頂頁並開始預取資源。
它僅限於一次預取一頁，以減少與頁面內容的競爭（在快速網絡上不是問題上的問題）。如果用戶訪問頁面且資源尚未完全下載，請預取停止，直到加載頁面以確保用戶等待盡可能少的時間。

對用戶互動的推測預取

當用戶表明他們對某些內容感興趣時，頁面可以開始推測預取資源。這可以採用多種形式，包括當用戶選擇懸停在鏈接或UI的某些部分時，將它們導航到單獨的頁面。一旦有清楚的跡象表明，瀏覽器可以立即開始獲取鏈接的內容。這是JavaScript庫（例如InstantClick）採用的一種方法。

風險

數據消耗

與提前預取內容的任何機制一樣，需要非常仔細地接觸此內容。在受限制的數據計劃上的用戶可能不會從提前獲取頁面中欣賞或受益，尤其是如果他們開始吞噬數據。站點/解決方案可能需要注意這種問題，例如尊重保存數據標頭。

預取不良頁面

預取向“註銷”頁面的鏈接可能是不可取的。對於觸發頁面載荷措施的任何頁面也可以說（例如，一鍵式購買）。解決方案可能希望包含一個從未預拿的URL的黑名單，以增加預取頁頁面有用的可能性。

網絡標準

Rel = Prerender的未來

過去實現類似建議的一些嘗試依賴於<link rel=prerender> 。 Chrome團隊目前正在探索RER = Prerender，以支持NostatePrefetch-這種機制的更輕版本，該機制僅預取到HTTP緩存，但沒有使用Web平台的其他狀態。解決方案應考慮是否依靠替代品來替換rel = prerender或使用預摘要/預緊/其他方法。

Nostateprefetch和預摘要之間有兩個關鍵區別：

Nostate-prefetch是一種機制， <link rel=prefetch>是一個API。可以通過其他入口點請求Nostate-prefetch：OmniBox預測，自定義選項卡， <link rel=prerender> 。
實現是不同的： <link rel=prefetch>預拿一個資源，但在此基礎上，nostate-prefetch在資源上運行了預加載掃描儀（在新的新渲染器中），發現了子資源並將其預摘（不再重新填充預裝掃描儀）。

研究評論

下一節中引用的許多論文圍繞Markov模型，協會規則和聚類。我們的重點是強調與模式發現相關的相關工作的論文，這是我們的重點。

Sarukkai [2000]“使用馬爾可夫鏈的鏈接預測和路徑分析”。

使用一階馬爾可夫模型來建模用戶要求的網頁序列，以預測他們可能訪問的下一頁。馬爾可夫鏈使系統能夠根據先前狀態在導航日誌中動態建模URL訪問模式。為每個用戶培訓了“個性化”馬爾可夫模型，並用於預測用戶的未來會議。實際上，為每個用戶構建一個獨特的模型非常昂貴，並且當網站擁有大型用戶基礎時，擴展的成本變得更具挑戰性。

Chun-Jung Lin [2005]”使用Hidden Markov模型來預測用戶在網絡上購買網絡購買的意圖”

第一張紙，研究隱藏的馬爾可夫模型（HMM）。作者收集了Web服務器日誌，修剪了數據並修補了通過的路徑。基於HMM，作者構建了一個用於Web瀏覽的特定模型，該模型可以預測用戶是否有意實時購買。相關措施，例如研究在購買模式時加快操作及其影響。

Elli Voudigari [2010-2011]“網頁排名預測的框架”。

提出了一個框架，以根據其先前的排名來預測頁面的排名位置。假設一組連續的TOP-K排名，作者根據不同的方法來確定預測因子。預測質量被量化為預測和實際排名之間的相似性。詳盡的實驗是在全球和基於查詢的TOP-K排名的現實世界大型數據集上進行的。用於比較Top-K排名列表的各種現有相似性措施，包括在論文中捕獲的新穎列表。

Mogul [1996]“使用預測性預摘要來改善萬維網潛伏期”。

建議使用N-Hop Markov模型來預測下一個網頁用戶可能訪問的網頁。模式將用戶的當前訪問順序與用戶的歷史Web訪問序列相匹配，以提高預取預約準確性。

Borges，Levene [2007]“評估可變長度的馬爾可夫鏈模型，用於分析用戶網絡導航會話”。

提出了基於動態聚類的方法，以提高Markov模型的準確性，以表示代表Web導航會話的集合。使用狀態克隆概念以一種將相應二階概率差異的鏈接分開的方式來複製狀態。提出的方法包括一種聚類技術，該聚類技術確定了一種分配與同一克隆相似的二階概率的鏈接的方法。

Banu Deniz Gunel [2010]“研究持續時間，頁面大小和頻率在下一頁建議使用頁面等級算法的影響”。

擴展了具有許多導航屬性的頁面級算法的使用：頁面的大小，頁面的持續時間，過渡持續時間（依次兩個頁面訪問），頁面的頻率和過渡。定義基於持續時間的等級（DPR）和基於受歡迎程度的頁面等級（PPR）。作者使用持續時間信息，使用頁面大小和訪問頻率來研究過渡和頁面的普及。使用頁面的普及值，本文試圖改善傳統的頁面級算法，並在給定的TOP-N值下建模下一頁預測。