ダウンロードをguess - ソースコードのダウンロードをguess

guess

その他のソースコード

1.0.0

ダウンロード

yess.js（alpha）

ウェブ上でデータ駆動型のユーザーエンペアを有効にするためのライブラリとツール。

クイックスタート

Webpackユーザーの場合：

dataデータ駆動型バンドル

yesuentPlugin -dise.js Webpackプラグインをインストールして構成します。これは、できるだけ多くのセットアッププロセスを自動化します。

個別に提供するモジュールを試してみたい場合は、 packagesディレクトリには3つのパッケージが含まれています。

ga -Google Analytics APIから構造化データを取得するためのモジュールで、ユーザーナビゲーションパターンについて学びます。
parser -JavaScriptフレームワークの解析を提供するモジュール。これにより、推測Webpackプラグインに実装されているルートパージング機能を促進します。
webpackアプリケーションで予測フェッチをセットアップするためのWebpackプラグイン。 gaおよびparserモジュールを消費し、アプリケーションで予測フェッチングがどのように機能するかを構成するための多数のオプションを提供します。

非ウェブパックユーザーの場合：

dataデータ駆動型の読み込み

Workflowの予測フェッチングは、Google Analytics APIを使用して予測フェッチをサイトに統合するために従うことができる一連の手順を提供します。

このレポは、Google Analyticsデータを使用して、特定のページから次にアクセスする可能性が高いページを決定します。クライアント側のスクリプト（アプリケーションに追加）は、リクエストをサーバーに送信して、取得するページのURLを取得し、このリソースをプリフェッチします。

もっと詳しく知る

yess.jsとは何ですか？

besues.jsは、Web上のユーザー経験を改善するための予測データ分析駆動型アプローチを簡素化するためのライブラリとツールを提供します。このデータは、分析や機械学習モデルなど、任意の数のソースから駆動できます。 dise.jsは、人気のあるワークフロー用のライブラリやツールを構築するなど、この思考を消費して適用するという摩擦を下げることを目指しています。

予測データ - 分析の考え方をサイトに適用することは、多くのコンテキストで適用できます。

次のページ（またはページ）を予測するユーザーは、これらのページにアクセスしてプリフェッチする可能性が高く、知覚されたページの負荷パフォーマンスとユーザーの幸福を改善します。
- ページレベル：プレレンダー/次に訪問される可能性が最も高いページのプリフェッチ
- バンドルレベル：トップNページに関連付けられたバンドルをプリフェッチします。各ページナビゲーションでは、現在のページのすべての隣人で、訪問する確率によって下降順序でソートされます。現在の接続の有効タイプに応じて、上部Nページのアセット（JavaScriptチャンク）を取得します。
次のコンテンツ（記事、製品、ビデオ）を予測するユーザーは、これを説明するためにユーザーエクスペリエンスを表示および調整またはフィルタリングする可能性があります。
個々のユーザーがより多く（ゲーム）と対話する可能性が高いウィジェットの種類を予測し、このデータを使用してよりカスタムエクスペリエンスを調整する可能性があります。

データ駆動型のアプローチを簡単に適用できるエコシステムのさまざまなタッチポイントを越えて共同作業することにより、インフラストラクチャの一般的な部分を一般化して、異なる技術スタックでの適用性を最大化することを望んでいます。

私たちが解決しようとしている問題

<link rel=prefetch>を使用して、将来のナビゲーションを使用して、説明的な分析を手動で読むことに大きく依存して、プリフェッチを決定する決定を通知します。
これらの決定は、多くの場合、時点で行われます。
- （1）データの傾向が変化するにつれて、多くの場合、再検討されません
- （2）それらの使用方法は非常に限られています。実装は、多くの場合、ホームページまたはヒーローページの非常に小さなセットのコンテンツをプレイするだけですが、それ以外の場合は、サイト上のすべての可能なエントリポイントでこれを行いません。これにより、パフォーマンスの機会がテーブルに残る可能性があります。
- （3）プリフェッチを使用して決定を促進するために使用されているデータについてのある程度の信頼が必要です。つまり、開発者は帯域幅を無駄にする心配からそれを採用していない可能性があります。 <link rel=prefetch>は現在、クロムの合計パゲロードの5％で使用されていますが、これは高くなる可能性があります。
予測分析の実装は、平均的なWeb開発者にとって複雑すぎます。
- ほとんどの開発者は、Google Analytics APIを活用して、ページが次にアクセスする確率を判断する方法に慣れていません。私たちには欠けています：
- （1）ページレベルのソリューション：ページをプリフォームするためのドロップインクライアント側のソリューションユーザーが訪問する可能性が高い
- （2）バンドリングレベルのソリューション：今日のJavaScriptバンドラー（Webpackなど）で動作するプラグイン/ツールのセットは、バンドル/チャンクをクラスター化して生成する特定のナビゲーションパスのセットが、事前にプリフレットされると速くロードできます。
ほとんどの開発者は、機械学習の仕組みにまだ精通していません。それらは一般的にです：
- （1）MLを既存の（Web）技術スタックにどのように統合できるかわからない
- （2）Tensorflowの価値提案が何であるか、またはCloudMLエンジンのようなソリューションが適合する場所。これらのソリューションの一部を活用することに関連するオーバーヘッドを簡素化する機会があります。
この分野でのクラス最高 /低摩擦のアプローチは、まだゆっくりと出現しており、MLやデータサイエンスの背景なしでWeb開発者がまだアクセスできないものではありません。
- 機械学習はクラウドに出会う：IIH Nordicによるインテリジェントなプリフェッチ
  - Google Tag Managerなどのタグマネージャーを使用して、コンテンツの使用方法を追跡するコードのページコンテンツを切り離すことができます。これにより、Webアナリストは、サイトのダウンタイムなしでリアルタイムで追跡コードをアップグレードできます。タグマネージャーは、コードインジェクションの一般的なソリューションを許可し、インテリジェントなプリフェッチを展開するために使用できます。利点：モデルの構築に使用される分析は、タグマネージャーからのものです。また、追加のトラッカーオーバーヘッドなしで、データを予測子にライブで送信することもできます。 GTMインストールにいくつかの（IIH Nordicの）タグを追加した後、サイトは次のページのリソースを予定し始め、ロード時間節約の機会を追跡することができます。
  - IIH Nordicは、ユーザーが新しいページにアクセスしたときにブラウザが照会する予測プリフェッチモデルをWebサービスに移動しました。このサービスは各リクエストに応答し、Google Cloud、App Engine、Cloud MLを利用します。彼らのソリューションは、最も正確なモデルを選択します。選択肢には、マルコフモデル、または最も多くの場合Tensorflowの深いニューラルネットが含まれます。
  - ユーザーの動作が時間の経過とともに変化すると、予測モデルには随時更新（トレーニング）が必要です。モデルのトレーニングには、データの収集と変換、それに応じてモデルのパラメーターの適合が含まれます。 IIH NordicはGoogleクラウドを使用して、顧客の分析サービスからBigQueryのプライベートデータバケツにデータを引き出します。彼らはこのデータを処理し、予測モデルを訓練およびテストし、予測サービスをシームレスに更新します。
  - IIH Nordicは、小さな/スローサイトがモデルを毎月更新することをお勧めします。大規模なサイトは、ニュースWebサイトで毎日または1時間ごとに再訓練する必要がある場合があります。
  - クラウドでのMLモデルのトレーニングの利点は、追加のマシン、GPU、プロセッサを必要に応じて追加できるため、スケールが容易です。
  - 機械学習駆動型バンドル。 MinkoによるJavaScriptツールの未来

初期の優先事項：データ駆動型のプレッチングによるパフォーマンスの改善

yeas.jsの最初の最優先事項は、コンテンツの予測プリフェッチを通じてWebパフォーマンスを改善することです。

ページのモデルを構築することにより、ユーザーは任意のエントリページを考えると、ユーザーが訪問する可能性があります。ソリューションは、ユーザーが現在のページを表示している間に、特定のページまたはページのセットを訪問し、リソースをプリフェッチする可能性を計算できます。これは、ページがすでにユーザーのキャッシュにある可能性が高いため、後続のページ訪問のページロードパフォーマンスを改善する可能性があります。

予測フェッチングへの可能なアプローチ

次のページを予測するために、ユーザーがアクセスする可能性が高いため、ソリューションはGoogle Analytics APIを使用できます。 Google Analyticsセッションデータを使用して、ユーザーがサイトで次にアクセスする可能性の高いページを予測するモデルを作成できます。このセッションデータの利点は、時間の経過とともに進化する可能性があるため、特定のナビゲーションパスが変更された場合、予測も最新の状態に保つことができます。

このデータが可用性であるため、エンジンは<link rel="[prerender/prefetch/preload]">タグを挿入して、次のページリクエストのロード時間を高速化できます。 Rを使用したMark Edmondsonのスーパーチャージャーページロードなどの一部のテストでは、ページの読み込み時間が30％改善されました。彼の研究で使用されたアプローチマークには、GTMタグとマシンラーニングを使用して、ページ予測のモデルをトレーニングすることが含まれていました。これは、機械学習で続くマークマークであり、クラウド - インテリジェントなプリフェッチを満たしています。

このアプローチは健全ですが、使用される方法論は少し複雑であるとみなすことができます。取得できるもう1つのアプローチ（これはより簡単です）は、Google Analytics APIから正確な予測データを取得しようとすることです。ページと前のページパスディメンションのレポートをPageViewsとExitsメトリックと組み合わせて実行した場合、これは、最も人気のあるページのプレイティングを配線するのに十分なデータを提供するはずです。

予測フェッチのための機械学習

MLは、ソリューションの予測の全体的な精度を改善するのに役立つ可能性がありますが、最初の実装には必要ではありません。ページでモデルをトレーニングすることにより、予測フェッチを実現できます。ユーザーは、このモデルに訪問し、時間の経過とともに改善する可能性があります。

深いニューラルネットワークは、特に、個々のユーザーが「一般/中央値/中央値」ユーザーが次にアクセスする可能性のあるページに対応するページに対応したソリューションのバージョンを試みたい場合、ユーザーが1つのページを別のページよりも選択することにつながる可能性のある複雑さをからかうのに特に優れています。固定されたページシーケンス（前、現在、次へ）は、最初に対処を開始するのが最も簡単かもしれません。これは、ドキュメントのセットに固有のモデルを構築することを意味します。

モデルの更新は定期的に行われる傾向があるため、新しいユーザーの動作に基づいて毎晩/毎週のジョブを設定するためにリフレッシュする可能性があります。これはリアルタイムで行うことができますが、複雑である可能性が高いため、定期的に行うだけで十分かもしれません。トレーニングされたステータスセット、Googleアナリティクス、または新しいレイヤーを使用してプラグインを使用してルーターにプラグインを使用して、サイトに将来のページを予測し、ページの負荷パフォーマンスを向上させることができるカスタム説明によって駆動できるサイト上のユーザーの行動パターンを表す一般的なモデルを想像できます。

投機的なプリフェッチへの可能なアプローチ

ページロード上の投機的プリフェッチ

投機的なプリフェッチは、ページのロードに移動する可能性があります。これは、ページが特定の次のページまたはページのセット、またはそのような確率を決定するためのデータ駆動型のアプローチを提供できるトレーニングモデルを必要とする確率に関する知識の存在を想定しています。

ページのプリフェッチは、延期からUAに至るまで、リソースをプレイするタイミング（ <link rel=prefetch>の優先度が低い）、ページのアイドル時間（RequestIdLecallback（）（）（）を介して）、またはその他の間隔でいつ、いくつかの方法で実行できます。ユーザーはそれ以上の相互作用は必要ありません。

リンクがビューポートに入ったときに投機的なプリフェッチ

ページのリンクがビューポートに表示されている場合、ページはコンテンツのプリフェッチを投機的に開始でき、ユーザーがクリックしたい可能性が高いことを示しています。

これは、ギャツビーが使用するアプローチです（ReactおよびReactルーターを使用しています）。それらの特定の実装は次のとおりです。

IntersectionObserverをサポートするブラウザでは、A <Link>コンポーネントが見えなくなると、投票をプリフェッチするためにリンクされたページのリンク「投票」は毎回わずかに少ないポイントの価値があるため、ページ上部のリンクは下位に優先順位を付けます。
たとえば、ページが複数回リンクしている場合、その投票数が高くなり、プレフェッチャーがトップページを取得し、リソースのプリフェッチを開始します。
ページの帯域幅を介した競合を減らすために、一度に1ページをプリフレットすることに制限されています（高速ネットワークでは問題ではありません。ユーザーがページにアクセスし、そのリソースが完全にダウンロードされていない場合、ページがロードされるまで停止して、ユーザーができるだけ時間がかからないようにします。

ユーザーインタラクションに関する投機的なプリフェッチ

ユーザーがいくつかのコンテンツに興味があることを示すと、ページは投機的にリソースのプリフェッチを開始できます。これには、ユーザーがリンクまたはUIの一部を操作して別のページに移動する場合を含め、多くのフォームを使用できます。ブラウザは、関心を明確に示しているとすぐに、リンクのコンテンツの取得を開始できます。これは、InstantClickなどのJavaScriptライブラリが採用したアプローチです。

リスク

データ消費

コンテンツを事前にプリプリフするメカニズムと同様に、これは非常に慎重にアプローチする必要があります。制限されたデータプランのユーザーは、特にデータを食い尽くし始める場合、事前にフェッチされるページから感謝したり、利益を得たりすることはできません。 Save-Dataヘッダーを尊重するなど、サイト/ソリューションがこの懸念に留意するために取ることができるメカニズムがあります。

望ましくないページのプリフェッチ

「ログアウト」ページへのリンクをプレイするのは望ましくない可能性があります。同じことは、ページロードでアクションをトリガーするページ（ワンクリック購入など）についても同じことが言えます。ソリューションは、プリフェッチされたページが役立つ可能性を高めるためにプリフェッチされていないURLのブラックリストを含めることをお勧めします。

Web標準

rel = prerenderの未来

過去に同様の提案を達成する試みのいくつかは<link rel=prerender>に依存しています。 Chromeチームは現在、nostatePrefetchを支持してRel = Prerenderを非難しています。これは、HTTPキャッシュにのみプリフェッチするが、Webプラットフォームの他の状態を使用しないこのメカニズムの軽いバージョンです。ソリューションは、rel =プレレンダーへの交換に依存するか、prefetch/preload/otherアプローチを使用するかを考慮に入れる必要があります。

nostateprefetchとprefetchには2つの重要な違いがあります。

nostate-prefetchはメカニズムであり、 <link rel=prefetch>はAPIです。 Nostate-Prefetchは、Omnibox予測、カスタムタブ、 <link rel=prerender> 、他のエントリポイントで要求できます。
実装は異なります。 <link rel=prefetch> 1つのリソースをpretchedしますが、その上にノステートプロフェッチは、リソースでプリロードスキャナーを実行し（新鮮な新しいレンダラーで）実行し、サブリソースを発見してプリフェッチします（プリロードスキャナーに復帰することなく）。

研究レビュー

次のセクションで参照されている論文の多くは、マルコフモデル、関連ルール、クラスタリングを中心としています。進化するページの予測の精度のためのパターン発見に関連する関連する作業を強調する論文が私たちの焦点です。

Sarukkai [2000]「マルコフチェーンを使用したリンク予測とパス分析」。

1次マルコフモデルを使用して、アクセスする可能性のある次のページを予測するためにユーザーが要求したWebページのシーケンスをモデル化します。マルコフチェーンにより、システムは、以前の状態に基づいてナビゲーションログで観察されたURLアクセスパターンを動的にモデル化できます。「パーソナライズされた」マルコフモデルは、各ユーザー向けにトレーニングされ、ユーザーの将来のセッションを予測するために使用されます。実際には、ユーザーごとに一意のモデルを構築するのは非常に高価であり、サイトのスケーリングコストは、サイトに大きなユーザーベースがある場合、より困難になります。

Chun-Jung Lin [2005]「隠されたマルコフモデルを使用して、サーフィンユーザーのサイバー購入の意図をWebで予測する」

隠されたマルコフモデル（HMM）を調査する最初の論文。著者はWebサーバーログを収集し、データを剪定し、ユーザーが通り過ぎたパスにパッチを当てました。 HMMに基づいて、著者は、ユーザーがリアルタイムで購入する意図があるかどうかを予測するWebブラウジングの特定のモデルを作成しました。操作の高速化と、購買モードでの影響が調査されたときの影響などの関連測定。

Elli Voudigari [2010-2011]「Webページランクの予測のフレームワーク」。

以前のランキングに基づいて、ページのランキングポジションを予測するフレームワークを提案します。連続したTOP-Kランキングのセットを仮定すると、著者はさまざまな方法論に基づいて予測子を識別します。予測の品質は、予測ランキングと実際のランキングの類似性として定量化されます。グローバルおよびクエリベースのTOP-Kランキングの両方で、現実世界の大規模データセットで徹底的な実験が行われました。紙で撮影された新しいものを含む、Top-Kランクのリストを比較するためのさまざまな既存の類似性測定。

Mogul [1996]「World Wide Web Latencyを改善するために予測プリフェッチを使用する」。

N-Hop Markovモデルを使用して、次のWebページがアクセスする可能性が高いと予測することを提案します。パターンは、ユーザーの現在のアクセスシーケンスとユーザーの履歴Webアクセスシーケンスと一致して、プリフェッチの予測精度を向上させます。

Borges、Levene [2007]「ユーザーWebナビゲーションセッションの分析のための可変長マルコフ連鎖モデルの評価」。

Webナビゲーションセッションのコレクションを表す際にマルコフモデルの精度を高めるための動的なクラスタリングベースの方法を提案します。状態クローン概念を使用して、対応する2次確率が分岐するインリンクを分離する方法で状態を複製します。提案された方法には、同じクローンに同様の2次確率を持つインリンクを割り当てる方法を決定するクラスタリング手法が含まれます。

Banu Deniz Gunel [2010]「ページランクアルゴリズムを使用した次のページの推奨に対する期間、ページのサイズ、頻度の影響を調査する」。

多数のナビゲーション属性を備えたページランクアルゴリズムの使用を拡張します：ページのサイズ、ページの期間、遷移期間（2ページの訪問）、ページの頻度、およびトランジション。期間ベースのランク（DPR）と人気ベースのページランク（PPR）を定義します。著者は、ページサイズと訪問頻度でそれを使用して、期間情報を使用して移行とページの人気を見ました。ページの人気値を使用して、このペーパーでは、従来のページランクアルゴリズムを改善し、特定のTOP-N値の下で次のページの予測をモデル化しようとします。