guess下载 - guess源代码下载

guess

其他源码

1.0.0

下载

Guess.js（alpha）

库和工具，用于在网络上启用数据驱动的用户体验。

Quickstart

对于WebPack用户：

⚫数据驱动的捆绑

安装和配置猜测Pluesplugin-猜测。

如果您希望尝试单独提供的模块，则packages目录包含三个包：

ga一个用于从Google Analytics（分析）API获取结构化数据的模块，以了解用户导航模式。
parser - 提供JavaScript框架解析的模块。这为在Guess Webpack插件中实现的路由功能提供动力。
webpack用于在应用程序中设置预测性获取的WebPack插件。它消耗了ga和parser模块，并提供了大量选项，用于配置预测性获取在应用程序中的工作方式。

对于非webpack用户：

⚫数据驱动的加载

我们对网站工作流程的预测性提示提供了一组步骤，您可以遵循使用Google Analytics（分析）API集成预测性提取的步骤。

此存储库使用Google Analytics（分析）数据来确定用户主要可能从给定页面访问哪个页面。客户端脚本（您将添加到应用程序中）将请求发送到服务器以获取该页面的URL，以获取该请求，然后预取资源。

了解更多

什么是猜测。

Guess.js提供了库和工具，以简化预测性数据分析驱动的方法来改善网络上的用户体验。这些数据可以从任何数量的来源驱动，包括分析或机器学习模型。 Guess.js旨在降低消费和将这种思维应用于所有现代站点和应用程序的摩擦，包括为流行工作流构建库和工具。

将预测性数据分析思维应用于网站可以在多种情况下应用：

预测用户可能会访问并预取这些页面的下一页（或页面），从而改善感知到的页面负载性能和用户幸福感。
- 页面级：Prerender/预摘要页面，该页面最有可能下一步访问
- 束级别：将与顶部n页相关的捆绑包。在每个页面上，导航在当前页面的所有邻居中，按访问的概率按降序排序。根据当前连接有效类型，取得顶部N页面的资产（JavaScript块）。
预测用户可能要查看和调整或过滤用户体验以解决此内容的下一个内容（文章，产品，视频）。
预测单个用户可能会与更多（例如游戏）进行交互的小部件类型，并使用此数据来量身定制更多的自定义体验。

通过在可以轻松应用数据驱动方法的生态系统中的不同接触点之间进行协作，我们希望概括常见的基础架构，以最大程度地利用它们在不同技术堆栈中的适用性。

我们想解决的问题

开发人员使用<link rel=prefetch>用于将来导航的开发人员在很大程度上依靠手动阅读描述性分析来告知他们的预摘要的决策。
这些决定通常是在某个时间点做出的。
- （1）通常不会随着数据趋势的变化而被重新审视
- （2）使用它们的使用方式非常有限。实现通常只会从主页或很小的英雄页面进行预取内容，但否则，对于网站上的所有可能的入口点，都不会这样做。这可以在桌上留下性能机会。
- （3）对用于使用预取的数据的数据需要一定的信心，这意味着开发人员可能不会因为担心它们会浪费带宽而采用它。 <link rel=prefetch>目前用于总铬pageloads的5％，但这可能更高。
对于普通的Web开发人员而言，实施预测分析太复杂了。
- 大多数开发人员不熟悉如何利用Google Analytics（分析）API来确定接下来将访问页面的概率。我们缺乏：
- （1）页面级别的解决方案：用于预取页的访问客户端解决方案，用户可能会访问
- （2）捆绑级别的解决方案：一组与当今JavaScript捆绑包（例如WebPack）一起使用的插件/工具，以聚集并生成捆绑包/块，特定的导航路径可能会更快地加载它们，如果它们可以提前预取。
大多数开发人员尚不熟悉机器学习的工作方式。它们通常是：
- （1）不确定如何（以及为什么）ML可以集成到其现有（Web）技术堆栈中
- （2）TensorFlow的价值主张是什么或诸如CloudMl Engine（例如CloudMl Engine）的位置。我们有机会简化与利用某些解决方案相关的间接费用。
在这个领域，最佳的 /低摩擦方法仍在缓慢地出现，并且没有ML或数据科学背景的Web开发人员尚未访问。
- 机器学习遇到云：智能预摘要IIH北欧
  - 诸如Google标签管理器之类的标签管理器可用于从代码跟踪内容的使用方式中解释页面内容。这使Web分析师可以实时升级跟踪代码，而无需停机时间。标签管理人员允许使用代码注入的一般解决方案，可用于部署智能预取。优点：用于构建模型的分析来自标签管理器。我们还可以无需其他跟踪器开销即可将数据直播发送到预测变量。在为GTM安装中添加了一些（IIH Nordic的）标签后，站点可以开始预取下下一个页面的资源，并跟踪加载时间节省的机会。
  - IIH Nordic将预测性预取模型移至Web服务时，当用户访问新页面时，浏览器查询。该服务响应每个请求，并利用Google Cloud，App Engine和Cloud ML。他们的解决方案选择了最准确的模型，选择包括马尔可夫模型，或者通常是张量的深神经网。
  - 随着用户行为的变化，预测模型需要不时更新（培训）。训练模型涉及收集和转换数据并相应地拟合模型的参数。 IIH北欧使用Google Cloud将数据从客户的分析服务中吸收到BigQuery的私人数据存储库中。他们处理此数据，训练和测试预测模型，无缝更新预测服务。
  - IIH北欧建议小/慢网站每月更新其模型。较大的网站可能需要每天或每小时为新闻网站进行重新训练。
  - 由于可以根据需要添加其他机器，GPU和处理器，因此在云中训练ML模型的好处是易于扩展。
  - 机器学习驱动的捆绑。 Minko的JavaScript工具的未来

最初优先级：通过数据驱动的预取改进性能

Guess.js的第一个大型优先级将通过预测的内容提高Web性能。

通过构建用户可能会访问的页面模型，鉴于任意输入页，解决方案可以计算用户将在用户仍在查看其当前页面时访问给定的下一页或一组页面的可能性。这有可能改善以后的页面访问的页面加载性能，因为在用户的缓存中，页面很有可能。

预测提取的可能方法

为了预测用户可能会访问的下一页，解决方案可以使用Google Analytics（分析）API。 Google Analytics（分析）会话数据可用于创建模型，以预测用户将要在网站上访问的最可能的页面。本会话数据的好处是它可以随着时间的推移而发展，因此，如果特定的导航路径发生变化，预测也可以保持最新。

有了这些数据的可用性，引擎可以插入<link rel="[prerender/prefetch/preload]">标签，以加快下一页请求的加载时间。在某些测试中，例如马克·埃德蒙森（Mark Edmondson）使用R的增压页面载荷，这导致页面加载时间提高了30％。他的研究中使用的方法标记涉及使用GTM标签和机器学习来训练模型以进行页面预测。这是机器学习中持续的想法标记，符合云 - 智能预取。

尽管这种方法是正确的，但所使用的方法可以认为有些复杂。可以采用的另一种方法（更简单）是尝试从Google Analytics（分析）API获取准确的预测数据。如果您运行了页面和上一页路径维度的报告，并结合了页面浏览量和退出指标，则应提供足够的数据来连接大多数流行页面的预取。

用于预测提取的机器学习

ML可以帮助提高解决方案预测的总体准确性，但不需要初始实施。可以通过在用户可能会随着时间的推移访问和改进的页面上的模型来实现预测性提取。

深度神经网络特别擅长挑逗可能导致用户选择一个页面而不是另一个页面的复杂性，如果我们想尝试尝试迎合个人用户可能访问的页面的解决方案版本，而“通用/中位数”用户可能会访问接下来。固定的页面序列（上一个，当前，下一个）可能是最初开始处理的最简单的。这意味着建立一个模型，该模型是您一组文档的独特模型。

模型更新往往会定期进行，因此可能会根据新的用户行为设置每晚/每周工作以刷新。这可能是实时完成的，但可能很复杂，因此定期这样做可能就足够了。可以想象一个通用模型代表站点上用户的行为模式，该模型可以由训练有素的状态集，Google Analytics（分析）或您使用新层插入路由器中的自定义描述来驱动，从而使网站能够预测地获取未来页面，从而提高页面负载性能。

推测预取的可能方法

页面上的投机性预取

投机性预取的可能会在页面加载上导航。这假设存在有关概率的知识的存在，一个页面将需要某个下一页或一组页面，或者可以提供数据驱动方法来确定此类概率的方法。

从延期到UA，可以通过多种方式来完成页面加载的预摘要，以决定何时预取资源（例如，在<link rel=prefetch>的<link rel = prefetch>），在页面空闲时间（通过requestIdlecallback（））或其他某些间隔。用户不需要进一步的互动。

当链接进入视口时推测性预取

当页面中的链接在视口中可见时，一个页面可以推测开始预摘要内容，这表明用户可能有更高的机会需要单击它们。

这是Gatsby（使用React和React路由器）使用的一种方法。他们的具体实现如下：

在支持IntersectionObserver的浏览器中，每当A <Link>组件变得不可见时，链接到预取票的页面的链接“投票”每次都值得较小，因此页面顶部的链接优先于较低的链接。
例如，如果一个页面多次链接到顶级NAV，则其投票计数较高，预摘要占据顶页并开始预取资源。
它仅限于一次预取一页，以减少与页面内容的竞争（在快速网络上不是问题上的问题）。如果用户访问页面且资源尚未完全下载，请预取停止，直到加载页面以确保用户等待尽可能少的时间。

对用户互动的推测预取

当用户表明他们对某些内容感兴趣时，页面可以开始推测预取资源。这可以采用多种形式，包括当用户选择悬停在链接或UI的某些部分时，将它们导航到单独的页面。一旦有清楚的迹象表明，浏览器可以立即开始获取链接的内容。这是JavaScript库（例如InstantClick）采用的一种方法。

风险

数据消耗

与提前预取内容的任何机制一样，需要非常仔细地接触此内容。在受限制的数据计划上的用户可能不会从提前获取页面中欣赏或受益，尤其是如果他们开始吞噬数据。站点/解决方案可能需要注意这种问题，例如尊重保存数据标头。

预取不良页面

预取向“注销”页面的链接可能是不可取的。对于触发页面载荷措施的任何页面也可以说（例如，一键式购买）。解决方案可能希望包含一个从未预拿的URL的黑名单，以增加预取页页面有用的可能性。

网络标准

Rel = Prerender的未来

过去实现类似建议的一些尝试依赖于<link rel=prerender> 。 Chrome团队目前正在探索RER = Prerender，以支持NostatePrefetch-这种机制的更轻版本，该机制仅预取到HTTP缓存，但没有使用Web平台的其他状态。解决方案应考虑是否依靠替代品来替换rel = prerender或使用预摘要/预紧/其他方法。

Nostateprefetch和预摘要之间有两个关键区别：

Nostate-prefetch是一种机制， <link rel=prefetch>是一个API。可以通过其他入口点请求Nostate-prefetch：OmniBox预测，自定义选项卡， <link rel=prerender> 。
实现是不同的： <link rel=prefetch>预拿一个资源，但在此基础上，nostate-prefetch在资源上运行了预加载扫描仪（在新的新渲染器中），发现了子资源并将其预摘（不再重新填充预装扫描仪）。

研究评论

下一节中引用的许多论文围绕Markov模型，协会规则和聚类。我们的重点是强调与模式发现相关的相关工作的论文，这是我们的重点。

Sarukkai [2000]“使用马尔可夫链的链接预测和路径分析”。

使用一阶马尔可夫模型来建模用户要求的网页序列，以预测他们可能访问的下一页。马尔可夫链使系统能够根据先前状态在导航日志中动态建模URL访问模式。为每个用户培训了“个性化”马尔可夫模型，并用于预测用户的未来会议。实际上，为每个用户构建一个独特的模型非常昂贵，并且当网站拥有大型用户基础时，扩展的成本变得更具挑战性。

Chun-Jung Lin [2005]”使用Hidden Markov模型来预测用户在网络上购买网络购买的意图”

第一张纸，研究隐藏的马尔可夫模型（HMM）。作者收集了Web服务器日志，修剪了数据并修补了通过的路径。基于HMM，作者构建了一个用于Web浏览的特定模型，该模型可以预测用户是否有意实时购买。相关措施，例如研究在购买模式时加快操作及其影响。

Elli Voudigari [2010-2011]“网页排名预测的框架”。

提出了一个框架，以根据其先前的排名来预测页面的排名位置。假设一组连续的TOP-K排名，作者根据不同的方法来确定预测因子。预测质量被量化为预测和实际排名之间的相似性。详尽的实验是在全球和基于查询的TOP-K排名的现实世界大型数据集上进行的。用于比较Top-K排名列表的各种现有相似性措施，包括在论文中捕获的新颖列表。

Mogul [1996]“使用预测性预摘要来改善万维网潜伏期”。

建议使用N-Hop Markov模型来预测下一个网页用户可能访问的网页。模式将用户的当前访问顺序与用户的历史Web访问序列相匹配，以提高预取预约准确性。

Borges，Levene [2007]“评估可变长度的马尔可夫链模型，用于分析用户网络导航会话”。

提出了基于动态聚类的方法，以提高Markov模型的准确性，以表示代表Web导航会话的集合。使用状态克隆概念以一种将相应二阶概率差异的链接分开的方式来复制状态。提出的方法包括一种聚类技术，该聚类技术确定了一种分配与同一克隆相似的二阶概率的链接的方法。

Banu Deniz Gunel [2010]“研究持续时间，页面大小和频率在下一页建议使用页面等级算法的影响”。

扩展了具有许多导航属性的页面级算法的使用：页面的大小，页面的持续时间，过渡持续时间（依次两个页面访问），页面的频率和过渡。定义基于持续时间的等级（DPR）和基于受欢迎程度的页面等级（PPR）。作者使用持续时间信息，使用页面大小和访问频率来研究过渡和页面的普及。使用页面的普及值，本文试图改善传统的页面级算法，并在给定的TOP-N值下建模下一页预测。