ウェブ上でデータ駆動型のユーザーエンペアを有効にするためのライブラリとツール。
Webpackユーザーの場合:
yesuentPlugin -dise.js Webpackプラグインをインストールして構成します。これは、できるだけ多くのセットアッププロセスを自動化します。
個別に提供するモジュールを試してみたい場合は、 packagesディレクトリには3つのパッケージが含まれています。
ga -Google Analytics APIから構造化データを取得するためのモジュールで、ユーザーナビゲーションパターンについて学びます。parser -JavaScriptフレームワークの解析を提供するモジュール。これにより、推測Webpackプラグインに実装されているルートパージング機能を促進します。webpackアプリケーションで予測フェッチをセットアップするためのWebpackプラグイン。 gaおよびparserモジュールを消費し、アプリケーションで予測フェッチングがどのように機能するかを構成するための多数のオプションを提供します。非ウェブパックユーザーの場合:
Workflowの予測フェッチングは、Google Analytics APIを使用して予測フェッチをサイトに統合するために従うことができる一連の手順を提供します。
このレポは、Google Analyticsデータを使用して、特定のページから次にアクセスする可能性が高いページを決定します。クライアント側のスクリプト(アプリケーションに追加)は、リクエストをサーバーに送信して、取得するページのURLを取得し、このリソースをプリフェッチします。
besues.jsは、Web上のユーザー経験を改善するための予測データ分析駆動型アプローチを簡素化するためのライブラリとツールを提供します。このデータは、分析や機械学習モデルなど、任意の数のソースから駆動できます。 dise.jsは、人気のあるワークフロー用のライブラリやツールを構築するなど、この思考を消費して適用するという摩擦を下げることを目指しています。
予測データ - 分析の考え方をサイトに適用することは、多くのコンテキストで適用できます。
データ駆動型のアプローチを簡単に適用できるエコシステムのさまざまなタッチポイントを越えて共同作業することにより、インフラストラクチャの一般的な部分を一般化して、異なる技術スタックでの適用性を最大化することを望んでいます。
<link rel=prefetch>を使用して、将来のナビゲーションを使用して、説明的な分析を手動で読むことに大きく依存して、プリフェッチを決定する決定を通知します。<link rel=prefetch>は現在、クロムの合計パゲロードの5%で使用されていますが、これは高くなる可能性があります。yeas.jsの最初の最優先事項は、コンテンツの予測プリフェッチを通じてWebパフォーマンスを改善することです。
ページのモデルを構築することにより、ユーザーは任意のエントリページを考えると、ユーザーが訪問する可能性があります。ソリューションは、ユーザーが現在のページを表示している間に、特定のページまたはページのセットを訪問し、リソースをプリフェッチする可能性を計算できます。これは、ページがすでにユーザーのキャッシュにある可能性が高いため、後続のページ訪問のページロードパフォーマンスを改善する可能性があります。
次のページを予測するために、ユーザーがアクセスする可能性が高いため、ソリューションはGoogle Analytics APIを使用できます。 Google Analyticsセッションデータを使用して、ユーザーがサイトで次にアクセスする可能性の高いページを予測するモデルを作成できます。このセッションデータの利点は、時間の経過とともに進化する可能性があるため、特定のナビゲーションパスが変更された場合、予測も最新の状態に保つことができます。
このデータが可用性であるため、エンジンは<link rel="[prerender/prefetch/preload]">タグを挿入して、次のページリクエストのロード時間を高速化できます。 Rを使用したMark Edmondsonのスーパーチャージャーページロードなどの一部のテストでは、ページの読み込み時間が30%改善されました。彼の研究で使用されたアプローチマークには、GTMタグとマシンラーニングを使用して、ページ予測のモデルをトレーニングすることが含まれていました。これは、機械学習で続くマークマークであり、クラウド - インテリジェントなプリフェッチを満たしています。
このアプローチは健全ですが、使用される方法論は少し複雑であるとみなすことができます。取得できるもう1つのアプローチ(これはより簡単です)は、Google Analytics APIから正確な予測データを取得しようとすることです。ページと前のページパスディメンションのレポートをPageViewsとExitsメトリックと組み合わせて実行した場合、これは、最も人気のあるページのプレイティングを配線するのに十分なデータを提供するはずです。
MLは、ソリューションの予測の全体的な精度を改善するのに役立つ可能性がありますが、最初の実装には必要ではありません。ページでモデルをトレーニングすることにより、予測フェッチを実現できます。ユーザーは、このモデルに訪問し、時間の経過とともに改善する可能性があります。
深いニューラルネットワークは、特に、個々のユーザーが「一般/中央値/中央値」ユーザーが次にアクセスする可能性のあるページに対応するページに対応したソリューションのバージョンを試みたい場合、ユーザーが1つのページを別のページよりも選択することにつながる可能性のある複雑さをからかうのに特に優れています。固定されたページシーケンス(前、現在、次へ)は、最初に対処を開始するのが最も簡単かもしれません。これは、ドキュメントのセットに固有のモデルを構築することを意味します。
モデルの更新は定期的に行われる傾向があるため、新しいユーザーの動作に基づいて毎晩/毎週のジョブを設定するためにリフレッシュする可能性があります。これはリアルタイムで行うことができますが、複雑である可能性が高いため、定期的に行うだけで十分かもしれません。トレーニングされたステータスセット、Googleアナリティクス、または新しいレイヤーを使用してプラグインを使用してルーターにプラグインを使用して、サイトに将来のページを予測し、ページの負荷パフォーマンスを向上させることができるカスタム説明によって駆動できるサイト上のユーザーの行動パターンを表す一般的なモデルを想像できます。
投機的なプリフェッチは、ページのロードに移動する可能性があります。これは、ページが特定の次のページまたはページのセット、またはそのような確率を決定するためのデータ駆動型のアプローチを提供できるトレーニングモデルを必要とする確率に関する知識の存在を想定しています。
ページのプリフェッチは、延期からUAに至るまで、リソースをプレイするタイミング( <link rel=prefetch>の優先度が低い)、ページのアイドル時間(RequestIdLecallback()()()を介して)、またはその他の間隔でいつ、いくつかの方法で実行できます。ユーザーはそれ以上の相互作用は必要ありません。
ページのリンクがビューポートに表示されている場合、ページはコンテンツのプリフェッチを投機的に開始でき、ユーザーがクリックしたい可能性が高いことを示しています。
これは、ギャツビーが使用するアプローチです(ReactおよびReactルーターを使用しています)。それらの特定の実装は次のとおりです。
<Link>コンポーネントが見えなくなると、投票をプリフェッチするためにリンクされたページのリンク「投票」は毎回わずかに少ないポイントの価値があるため、ページ上部のリンクは下位に優先順位を付けます。ユーザーがいくつかのコンテンツに興味があることを示すと、ページは投機的にリソースのプリフェッチを開始できます。これには、ユーザーがリンクまたはUIの一部を操作して別のページに移動する場合を含め、多くのフォームを使用できます。ブラウザは、関心を明確に示しているとすぐに、リンクのコンテンツの取得を開始できます。これは、InstantClickなどのJavaScriptライブラリが採用したアプローチです。
コンテンツを事前にプリプリフするメカニズムと同様に、これは非常に慎重にアプローチする必要があります。制限されたデータプランのユーザーは、特にデータを食い尽くし始める場合、事前にフェッチされるページから感謝したり、利益を得たりすることはできません。 Save-Dataヘッダーを尊重するなど、サイト/ソリューションがこの懸念に留意するために取ることができるメカニズムがあります。
「ログアウト」ページへのリンクをプレイするのは望ましくない可能性があります。同じことは、ページロードでアクションをトリガーするページ(ワンクリック購入など)についても同じことが言えます。ソリューションは、プリフェッチされたページが役立つ可能性を高めるためにプリフェッチされていないURLのブラックリストを含めることをお勧めします。
過去に同様の提案を達成する試みのいくつかは<link rel=prerender>に依存しています。 Chromeチームは現在、nostatePrefetchを支持してRel = Prerenderを非難しています。これは、HTTPキャッシュにのみプリフェッチするが、Webプラットフォームの他の状態を使用しないこのメカニズムの軽いバージョンです。ソリューションは、rel =プレレンダーへの交換に依存するか、prefetch/preload/otherアプローチを使用するかを考慮に入れる必要があります。
nostateprefetchとprefetchには2つの重要な違いがあります。
nostate-prefetchはメカニズムであり、 <link rel=prefetch>はAPIです。 Nostate-Prefetchは、Omnibox予測、カスタムタブ、 <link rel=prerender> 、他のエントリポイントで要求できます。
実装は異なります。 <link rel=prefetch> 1つのリソースをpretchedしますが、その上にノステートプロフェッチは、リソースでプリロードスキャナーを実行し(新鮮な新しいレンダラーで)実行し、サブリソースを発見してプリフェッチします(プリロードスキャナーに復帰することなく)。
この問題分野では、説明的、予測的、規範的な3つの主要なタイプのデータ分析があります。各タイプは関連しており、チームがさまざまな種類の洞察を活用するのに役立ちます。
記述分析は生データを要約し、それを人間が解釈できるものに変えます。イベントがいつ発生したかに関係なく、過去のイベントを見ることができます。記述分析により、チームは過去の行動から学ぶことができ、これは将来の結果に影響を与えるのに役立ちます。説明的な分析では、サイトユーザーのどのページが以前に表示されたか、どのエントリページに与えられたナビゲーションパスを取得したかを決定できます。
予測分析は、次に何が起こるかを「予測」します。予測分析は、未来を理解し、データを使用してチームに実用的な洞察を提供するのに役立ちます。将来の結果が有用である可能性の推定値を提供します。留意することは重要です。将来のイベントを完全に正確に予測できるアルゴリズムはほとんどありませんが、ベースラインの精度を向上させるために可能な限り利用できる信号をできるだけ多く使用できます。予測分析の基礎は、データから決定する確率に基づいています。予測分析は、任意のエントリページを考慮して、ユーザーが訪問する可能性が高いページの次のページまたはセットを予測できます。
規範的分析により、さまざまな可能なアクションを処方するために、ソリューションに向けて導くことができます。規範的分析はアドバイスを提供し、これらの決定が行われる前に、将来の決定が可能な結果について助言する必要がある影響を定量化しようとする試みを試みます。規範的分析は、何が起こるかを予測するだけでなく、さらに進むことを目的としています。なぜそれが起こるのかを知らせ、そのような予測を活用できる行動に関する推奨事項を提供します。規範的な分析は、ユーザーが訪問する次のページを予測することができますが、この知識を活用するために経験をカスタマイズできる方法を通知するなどのアクションも提案できます。
プリフェッチの問題スペースにおける予測モデルの重要な目的は、特定のページリクエストを考慮して、ユーザーが必要とするものが必要なものを特定することです。これにより、サーバーまたはクライアントが次のページのセットを事前に解放し、ページに直接ナビゲートする前にユーザーのキャッシュにあることを確認しようとします。アイデアは、全体的な負荷時間を短縮することです。これが慎重に実装されると、この手法はページアクセス時間と遅延を短縮し、ユーザーエクスペリエンス全体を改善できます。
マルコフモデルは、確率的(ランダム確率分布)プロセスの研究と理解に広く使用されています[Ref、Ref]。それらは、ユーザーの閲覧動作のモデリングと予測に適していることが実証されています。これらの問題の入力は、ユーザーまたはユーザーのセット(サイト全体)がアクセスするWebページのシーケンスである傾向があり、マルコフモデルを構築することを目標にして、ユーザーが次にアクセスする可能性が最も高いページをモデル化および予測することができます。マルコフプロセスには、分析ログの特定のシーケンスから計算される状態間の遷移確率を表すアクセスされたページとエッジを表す状態があります。訓練されたマルコフモデルを使用して、以前の状態のセットを考慮して次の状態を予測できます。
一部のアプリケーションでは、1次マルコフモデルは、ユーザーブラウジングの動作を予測する上で正確ではありません。これが、高次モデルがよく使用される理由の1つです。これらの高次モデルには、状態空間の複雑さ、幅広いカバレッジが少なく、時には予測精度が低下した制限があります。
この問題を克服する1つの方法は、さまざまなオーダーマルコフモデルをトレーニングすることです。これを予測段階で使用します。これは、この参考文献で提案されている全kth-orderマルコフモデルで試みられました。ただし、これにより、状態空間の複雑さが悪化する可能性があります。別のアプローチは、頻繁なアクセスパターン(最長の繰り返しサブシーケンス)を特定し、この一連のシーケンスを予測に使用することです。このアプローチは、状態空間の複雑さを数桁削減することができますが、予測の精度を低下させる可能性があります。
モデル内に一部の状態のみを保存する選択的マルコフモデル(SMM)も、状態空間の複雑さのトレードオフの解決策として提案されています。それらは、すべてのkth-orderマルコフモデルから始まります - 次に、正確な予測因子であるとは予想されない状態を剪定するために使用されます。これの結果は、スペースの複雑さが少なく、予測精度が高い全kthモデルと同じ予測力を持つモデルです。 DeshpaneとKarpisでは、予測の前にモデル内の状態を剪定するさまざまな基準(頻度、信頼性、エラー)が見られます。
Mabroukeh and Ezeifeでは、セマンティックリッチの1番目と2次マルコフモデルのパフォーマンスが研究され、高次SMMおよびセマンティックプルーヌSMMのパフォーマンスと比較されました。彼らは、セマンティック製のSMMのサイズが周波数を使用したSMMよりも16%小さく、ほぼ等しい精度を提供することを発見しました。
ナビゲーションパターンを観察すると、ユーザーの動作を分析できます。このアプローチでは、ユーザーセッションの識別、同様のクラスターへのセッションのクラスタリング、現在および以前のアクセスパターンを使用して予測のモデルを開発する必要があります。この分野での以前の研究の多くは、予測の信頼を改善するために、ユークリッド距離を備えたK-meansクラスタリング技術のようなクラスタリングスキームに依存しています。 K-Meansを使用することの欠点の1つは、クラスターの数を決定するのが難しいことです。初期のランダムセンターとページ訪問の順序を選択することは常に考慮されていません。 Kumarらはこれを調査し、修正されたLevenshtein距離を備えた階層的クラスタリング手法を提案し、予測のためにアクセス時間の長さ、周波数、および高次マルコフモデルを使用してPagerankを提案しました。
次のセクションで参照されている論文の多くは、マルコフモデル、関連ルール、クラスタリングを中心としています。進化するページの予測の精度のためのパターン発見に関連する関連する作業を強調する論文が私たちの焦点です。
1次マルコフモデルを使用して、アクセスする可能性のある次のページを予測するためにユーザーが要求したWebページのシーケンスをモデル化します。マルコフチェーンにより、システムは、以前の状態に基づいてナビゲーションログで観察されたURLアクセスパターンを動的にモデル化できます。 「パーソナライズされた」マルコフモデルは、各ユーザー向けにトレーニングされ、ユーザーの将来のセッションを予測するために使用されます。実際には、ユーザーごとに一意のモデルを構築するのは非常に高価であり、サイトのスケーリングコストは、サイトに大きなユーザーベースがある場合、より困難になります。
隠されたマルコフモデル(HMM)を調査する最初の論文。著者はWebサーバーログを収集し、データを剪定し、ユーザーが通り過ぎたパスにパッチを当てました。 HMMに基づいて、著者は、ユーザーがリアルタイムで購入する意図があるかどうかを予測するWebブラウジングの特定のモデルを作成しました。操作の高速化と、購買モードでの影響が調査されたときの影響などの関連測定。
以前のランキングに基づいて、ページのランキングポジションを予測するフレームワークを提案します。連続したTOP-Kランキングのセットを仮定すると、著者はさまざまな方法論に基づいて予測子を識別します。予測の品質は、予測ランキングと実際のランキングの類似性として定量化されます。グローバルおよびクエリベースのTOP-Kランキングの両方で、現実世界の大規模データセットで徹底的な実験が行われました。紙で撮影された新しいものを含む、Top-Kランクのリストを比較するためのさまざまな既存の類似性測定。
N-Hop Markovモデルを使用して、次のWebページがアクセスする可能性が高いと予測することを提案します。パターンは、ユーザーの現在のアクセスシーケンスとユーザーの履歴Webアクセスシーケンスと一致して、プリフェッチの予測精度を向上させます。
Webナビゲーションセッションのコレクションを表す際にマルコフモデルの精度を高めるための動的なクラスタリングベースの方法を提案します。状態クローン概念を使用して、対応する2次確率が分岐するインリンクを分離する方法で状態を複製します。提案された方法には、同じクローンに同様の2次確率を持つインリンクを割り当てる方法を決定するクラスタリング手法が含まれます。
多数のナビゲーション属性を備えたページランクアルゴリズムの使用を拡張します:ページのサイズ、ページの期間、遷移期間(2ページの訪問)、ページの頻度、およびトランジション。期間ベースのランク(DPR)と人気ベースのページランク(PPR)を定義します。著者は、ページサイズと訪問頻度でそれを使用して、期間情報を使用して移行とページの人気を見ました。ページの人気値を使用して、このペーパーでは、従来のページランクアルゴリズムを改善し、特定のTOP-N値の下で次のページの予測をモデル化しようとします。
![]() ミンコ・ゲチェフ | ![]() Addy Osmani | ![]() ケイティ・ヘンペニウス | ![]() カイル・マシューズ |