guess 다운로드 - guess 소스 코드 다운로드

guess

기타 소스코드

1.0.0

다운로드

추측 .js (alpha)

웹에서 데이터 중심의 사용자 경험을 활성화하기위한 라이브러리 및 도구.

QuickStart

웹 팩 사용자의 경우 :

data 데이터 중심 번들

PropessPlugin -The Propess.js Webpack 플러그인을 설치하고 구성하여 가능한 한 많은 설정 프로세스를 자동화합니다.

우리가 개별적으로 제공하는 모듈을 시험해 보려면 packages 디렉토리에는 세 가지 패키지가 포함되어 있습니다.

ga 사용자 탐색 패턴에 대해 알아보기 위해 Google Analytics API의 구조화 된 데이터를 가져 오는 모듈.
parser JavaScript 프레임 워크 구문 분석을 제공하는 모듈. 이것은 추측 웹 팩 플러그인에서 구현 된 경로 준비 기능을 전원으로 제공합니다.
webpack 응용 프로그램에서 예측 페치를 설정하기위한 웹 팩 플러그인. ga 및 parser 모듈을 소비하고 응용 프로그램에서 예측 페치가 작동하는 방법을 구성하기위한 많은 옵션을 제공합니다.

Webpack이 아닌 사용자의 경우 :

data 데이터 중심로드

사이트 워크 플로에 대한 예측 예측은 Google Analytics API를 사용하여 예측 페치를 통합하여 사이트에 따라 할 수있는 일련의 단계를 제공합니다.

이 repo는 Google Analytics 데이터를 사용하여 사용자가 주어진 페이지에서 다음을 방문 할 가능성이 높습니다. 클라이언트 측 스크립트 (응용 프로그램에 추가 할)는 서버에 요청을 보내어 가져와야하는 페이지의 URL을 가져온 다음이 리소스를 프리 페치합니다.

자세히 알아보십시오

추측은 무엇입니까?

Juess.js는 웹에서 사용자 경험을 향상시키기위한 예측 데이터 분석 중심 접근 방식을 단순화하기위한 라이브러리 및 도구를 제공합니다. 이 데이터는 분석 또는 기계 학습 모델을 포함한 여러 소스에서 구입할 수 있습니다. Juess.js는이 사고를 소비하고 적용하는 마찰을 줄이고이 사고를 모든 현대 사이트 및 앱에 인기있는 워크 플로우를위한 도구 및 도구를 포함하여 모든 현대 사이트 및 앱에 적용하는 것을 목표로합니다.

예측 데이터 분석을 사이트에 적용하는 것은 여러 가지 맥락에서 적용될 수 있습니다.

사용자 가이 페이지를 방문 하여이 페이지를 방문하여 프리 페치하여 인식 된 페이지로드 성능 및 사용자 행복을 향상시킬 가능성이있는 다음 페이지 (또는 페이지)를 예측하십시오.
- 페이지 수준 : Prerender/Prefetch 다음에 방문 할 가능성이 가장 높은 페이지
- 번들 레벨 : 상단 N 페이지와 관련된 번들을 프리 페치하십시오. 각 페이지 탐색에서 현재 페이지의 모든 이웃에서 방문 할 확률에 따라 내림차순으로 정렬되었습니다. 현재 연결 유효 유형에 따라 상단 N 페이지의 자산 (JavaScript 청크)을 가져옵니다.
다음 컨텐츠 (기사, 제품, 비디오)를 예측하여 사용자가이를 설명하기 위해 사용자 경험을보고 조정하거나 필터링하려고합니다.
개별 사용자가 더 많은 게임 (예 : 게임)과 상호 작용할 가능성이있는 위젯의 유형을 예측 하고이 데이터를 사용하여보다 사용자 정의 경험을 조정하십시오.

데이터 중심 접근 방식을 쉽게 적용 할 수있는 생태계에서 다른 터치 포인트를 통과함으로써, 다양한 기술 스택에서의 적용 가능성을 극대화하기 위해 일반적인 인프라를 일반화하기를 희망합니다.

우리가 해결하려는 문제

향후 탐색을 위해 <link rel=prefetch> 사용하는 개발자는 수동으로 설명 분석을 읽는 데 크게 의존하여 사전 프리치해야 할 것에 대한 결정을 알립니다.
이러한 결정은 종종 시점에서 이루어집니다.
- (1) 데이터 추세가 변경됨에 따라 종종 재검토되지 않습니다
- (2) 사용 방식이 매우 제한적입니다. 구현은 종종 홈페이지 나 매우 작은 영웅 페이지 세트에서만 컨텐츠를 선호하지만 사이트의 가능한 모든 진입 지점에 대해서는이 작업을 수행하지 않습니다. 이것은 성능 기회를 테이블에 남길 수 있습니다.
- (3) 프리 페치 사용을 사용하여 결정을 내리는 데 사용되는 데이터에 대해 약간의 신뢰가 필요하다는 것은 개발자가 대역폭을 낭비 할 걱정이 없다는 것을 의미 할 수 있음을 의미합니다. <link rel=prefetch> 는 현재 총 크롬 pageloads의 5%에 사용되지만 더 높을 수 있습니다.
예측 분석 구현은 평균 웹 개발자에게는 너무 복잡합니다.
- 대부분의 개발자는 Google Analytics API를 활용하는 방법에 익숙하지 않습니다. 우리는 부족합니다 :
- (1) 페이지 수준 솔루션 : 사용자가 방문 할 페이지 프리 페치를위한 드롭 인 클라이언트 측 솔루션
- (2) 번들링 레벨 솔루션 : 오늘날의 JavaScript Bundlers (예 : Webpack)와 함께 작동하는 플러그인/도구 세트는 특정 탐색 경로 세트를 더 빨리로드 할 수 있도록 번들/청크를 클러스터하고 생성합니다.
대부분의 개발자는 아직 기계 학습의 작동 방식에 익숙하지 않습니다. 그들은 일반적으로 :
- (1) ML이 기존 (웹) 기술 스택에 어떻게 통합 될 수 있는지 확실하지 않습니다.
- (2) Tensorflow의 가치 제안이 무엇인지 또는 CloudML 엔진과 같은 솔루션이 적합한 위치. 우리는 이러한 솔루션 중 일부를 활용하는 것과 관련된 오버 헤드를 단순화 할 수있는 기회가 있습니다.
이 공간에서 동급 최고의 / 저속 접근 방식은 여전히 천천히 떠오르고 있으며 ML 또는 데이터 과학 배경이없는 웹 개발자가 아직 액세스 할 수 없습니다.
- 머신 러닝은 클라우드를 만난다 : IIH Nordic의 지능형 프리 페치
  - Google 태그 관리자와 같은 태그 관리자는 콘텐츠 사용 방법을 추적하는 코드에서 페이지 컨텐츠를 해체하는 데 사용될 수 있습니다. 이를 통해 웹 분석가는 사이트 가동 중지 시간없이 추적 코드를 실시간으로 업그레이드 할 수 있습니다. 태그 관리자는 코드 주입을위한 일반적인 솔루션을 허용하며 지능형 프리 페치를 배포하는 데 사용할 수 있습니다. 장점 : 모델을 구축하는 데 사용되는 분석은 태그 관리자에서 나옵니다. 또한 추가 추적기 오버 헤드없이 데이터를 예측 자에게 라이브로 보낼 수도 있습니다. GTM 설치에 몇 가지 (IIH Nordic의) 태그를 추가 한 후 사이트는 다음 페이지의 리소스를 사전 프리치하고로드 시간 절약 기회를 추적하기 시작할 수 있습니다.
  - IIH Nordic은 사용자가 새 페이지를 방문 할 때 예측 프리 페치 모델을 웹 서비스로 브라우저 쿼리로 옮겼습니다. 이 서비스는 각 요청에 응답하고 Google Cloud, App Engine 및 Cloud ML을 활용합니다. 그들의 솔루션은 가장 정확한 모델을 선택합니다. 선택에는 Markov 모델 또는 가장 종종 Tensorflow의 깊은 신경망이 포함됩니다.
  - 시간이 지남에 따라 사용자 행동이 변경되면 예측 모델에는 때때로 업데이트 (교육)가 필요합니다. 모델 교육에는 데이터를 수집하고 변환하고 그에 따라 모델의 매개 변수를 맞추는 것이 포함됩니다. IIH Nordic은 Google Cloud를 사용하여 고객의 분석 서비스의 데이터를 BigQuery의 개인 데이터 버킷으로 가져옵니다. 그들은이 데이터를 처리하고, 예측 및 테스트 예측 모델을 처리하여 예측 서비스를 원활하게 업데이트합니다.
  - IIH Nordic은 작은/느린 사이트가 매달 모델을 업데이트 할 것을 제안합니다. 더 큰 사이트는 뉴스 웹 사이트를 위해 매일 또는 시간당 재교육을 받아야 할 수도 있습니다.
  - 클라우드에서 ML 모델을 훈련시키는 이점은 추가 기계, GPU 및 프로세서를 필요에 따라 추가 할 수 있으므로 스케일이 용이합니다.
  - 기계 학습 중심 번들. Minko의 JavaScript 툴링의 미래

초기 우선 순위 : 데이터 중심의 프리 페치를 통해 성능 향상

guess.js의 첫 번째 큰 우선 순위는 컨텐츠의 예측 프리 페치를 통해 웹 성능을 향상시키는 것입니다.

임의의 입력 페이지가 주어지면 사용자가 방문 할 페이지 모델을 구축함으로써 사용자가 현재 페이지를 보는 동안 사용자가 다음 페이지 나 페이지 세트를 방문하고 리소스를 프리 페치 할 가능성을 계산할 수 있습니다. 이는 페이지가 이미 사용자 캐시에있을 가능성이 높기 때문에 후속 페이지 방문의 페이지로드 성능을 향상시킬 수 있습니다.

예측 가져 오기에 대한 가능한 접근법

다음 페이지를 예측하기 위해 사용자가 방문 할 가능성이 높으면 Solutions는 Google Analytics API를 사용할 수 있습니다. Google Analytics 세션 데이터를 사용하여 사용자가 사이트에서 다음을 방문 할 가능성이 가장 높은 페이지를 예측하는 모델을 만들 수 있습니다. 이 세션 데이터의 이점은 시간이 지남에 따라 진화 할 수 있으므로 특정 탐색 경로가 변경되면 예측이 최신 상태로 유지 될 수 있다는 것입니다.

이 데이터의 가용성을 사용하면 엔진이 <link rel="[prerender/prefetch/preload]"> 태그를 삽입하여 다음 페이지 요청의로드 시간을 속도를 높일 수 있습니다. Mark Edmondson의 SuperQuarging Page-Loads와 같은 일부 테스트에서는 페이지로드 시간이 30% 향상되었습니다. 그의 연구에 사용 된 접근 마크는 GTM 태그와 기계 학습을 사용하여 페이지 예측 모델을 훈련시키는 것과 관련이있었습니다. 이것은 기계 학습에서 계속 된 아이디어 마크입니다.

이 접근법은 건전하지만 사용 된 방법론은 조금 복잡한 것으로 간주 될 수 있습니다. 더 간단하게 취할 수있는 또 다른 접근법은 Google Analytics API에서 정확한 예측 데이터를 얻으려고 시도하는 것입니다. 페이지 및 이전 페이지 경로 치수에 대한 보고서를 페이지 뷰 및 종료 메트릭과 결합한 경우 가장 인기있는 페이지의 프리 페치를 연결하기에 충분한 데이터를 제공해야합니다.

예측 가져 오기를위한 기계 학습

ML은 솔루션 예측의 전반적인 정확도를 향상시키는 데 도움이 될 수 있지만 초기 구현에는 필요하지 않습니다. 예측 페치는 사용자가 시간이 지남에 따라이 모델을 방문하고 개선 할 가능성이있는 페이지의 모델을 훈련시켜 달성 할 수 있습니다.

딥 신경망은 특히 사용자가 방문 할 수있는 페이지에 맞는 솔루션의 버전을 시도 할 수있는 솔루션의 버전을 시도 할 수있는 복잡성을 괴롭히는 데 특히 능숙합니다. 고정 페이지 시퀀스 (이전, 현재, 다음)가 처음에 처리하기가 가장 쉬울 수 있습니다. 이것은 문서 세트에 고유 한 모델을 구축하는 것을 의미합니다.

모델 업데이트는 정기적으로 수행되는 경향이 있으므로 새로운 사용자 동작에 따라 새로 고침하기 위해 야간/주간 작업을 설정할 수 있습니다. 이것은 실시간으로 수행 될 수 있지만 복잡 할 수 있으므로 주기적으로 수행하는 것만으로 충분할 수 있습니다. 훈련 된 상태 세트, Google 웹 로그 분석 또는 라우터에 새로운 계층을 사용하여 플러그인을 사용하여 현장에 플러그인을 사용하여 미래 페이지를 예측할 수있는 기능을 제공하여 페이지로드 성능을 향상시킬 수있는 사이트의 사용자가 행동 패턴을 나타내는 일반적인 모델을 상상할 수 있습니다.

투기 전 선약에 대한 가능한 접근법

페이지로드의 투기 프리 페치

Preculative Prefetch는 페이지로드에서 페이지를 탐색 할 수 있습니다. 이는 페이지가 특정 다음 페이지 또는 페이지 세트가 필요한 확률에 대한 지식의 존재 또는 그러한 확률을 결정하기위한 데이터 중심 접근 방식을 제공 할 수있는 교육 모델을 가정합니다.

페이지로드의 프리 페치는 UA를 연기하는 것부터 UA에 이르기까지 여러 가지 방법으로 달성 될 수 있습니다. 페이지 유휴 시간 (requestIdleCallback () ())을 통해 또는 다른 간격으로 페이지를 사전 리소스 (예 : <link rel=prefetch> 로 낮출 때) 결정하십시오. 사용자는 더 이상 상호 작용이 필요하지 않습니다.

투기 프리 페치 링크가 뷰포트에 들어올 때

페이지의 링크가 뷰포트에 표시되면 컨텐츠를 프리 페치하기 시작할 수 있으며, 이는 사용자가 클릭을 클릭하고 싶을 가능성이 더 높을 수 있음을 나타냅니다.

이것은 Gatsby (React 및 React 라우터를 사용하는)가 사용하는 접근법입니다. 특정 구현은 다음과 같습니다.

intersectionObserver를 지원하는 브라우저에서 <Link> 구성 요소가 보이지 않게 될 때마다 프리 페치 투표에 연결된 페이지의 "투표"링크는 매번 약간 적은 포인트의 가치가 있으므로 페이지 상단의 링크는 하단 하단으로 우선 순위를 지정합니다.
예 : 페이지가 여러 번 링크되면 최상위 NAV는 투표 수가 더 높아지면 Prefetcher가 상단 페이지를 가져 와서 리소스 프리 페치를 시작합니다.
오피 네트워크에서 대역폭에 대한 경합을 줄이기 위해 한 페이지 씩 한 페이지를 프리 페치하는 것으로 제한되어 있습니다 (빠른 네트워크에서는 문제가되지 않습니다. 사용자가 페이지를 방문하고 리소스가 완전히 다운로드되지 않은 경우 페이지가로드 될 때까지 프리 페치가 중지되어 사용자가 가능한 한 적은 시간을 기다릴 수 있습니다.

사용자 상호 작용에 대한 투기 프리 페치

페이지는 사용자가 일부 콘텐츠에 관심이 있음을 나타낼 때 리소스를 사전 프리 페치하기 시작할 수 있습니다. 이는 사용자가 링크 또는 UI의 일부를 개별 페이지로 탐색 할 때를 포함하여 여러 형태를 취할 수 있습니다. 브라우저는 분명한 관심을 나타내는 즉시 링크 컨텐츠를 가져올 수 있습니다. 이것은 InstantClick과 같은 JavaScript 라이브러리가 취한 접근법입니다.

위험

데이터 소비

컨텐츠를 미리 프리 페치하기위한 메커니즘과 마찬가지로, 이는 매우 신중하게 접근해야합니다. 제한된 데이터 플랜의 사용자는 특히 데이터를 먹기 시작하면 미리 가져 오는 페이지에서 많은 것을 인식하거나 혜택을받지 못할 수 있습니다. Save-Data 헤더를 존중하는 것과 같이이 문제를 염두에두기 위해 사이트/솔루션이 취할 수있는 메커니즘이 있습니다.

바람직하지 않은 페이지를 선사합니다

"로그 아웃"페이지에 대한 링크를 프리 페치하는 것은 바람직하지 않을 수 있습니다. Page-Load (예 : 원 클릭 구매)에서 조치를 유발하는 페이지에 대해서도 마찬가지입니다. 솔루션은 프리 페치 된 페이지가 유용 할 가능성을 높이기 위해 프리 페치되지 않은 URL의 블랙리스트를 포함 할 수 있습니다.

웹 표준

Rel = Prerender의 미래

과거에 유사한 제안을 달성하려는 시도 중 일부는 <link rel=prerender> 에 의존했습니다. Chrome 팀은 현재 NostatePrefetch를 선호하는 감가 상각 Rel = Prerender를 탐색하고 있습니다.이 메커니즘의 가벼운 버전은 HTTP 캐시에만 선호하지만 웹 플랫폼의 다른 상태를 사용하지 않습니다. 솔루션은 Rel = Prerender 대체 또는 Prefetch/Preload/기타 접근법을 사용하는지 의존하는지 여부를 고려해야합니다.

NostatePrefetch와 Prefetch 사이에는 두 가지 주요 차이점이 있습니다.

Nostate-Prefetch는 메커니즘이며 <link rel=prefetch> 는 API입니다. Nostate-Prefetch는 Omnibox Prediction, Custom Tabs, <link rel=prerender> 다른 진입 지점에서 요청할 수 있습니다.
구현은 다릅니다. <link rel=prefetch> 는 하나의 리소스를 프리칭하지만 그 위에있는 Nostate-Prefetch는 리소스에서 예비 스캐너를 실행하여 (신선한 새로운 렌더러에서) 하위 자원을 발견하고 (미리로드 스캐너로 재발하지 않음) 그것들을 선견합니다.

연구 검토

다음 섹션에서 언급 된 많은 논문은 Markov 모델, 협회 규칙 및 클러스터링을 중심으로합니다. 진화하는 페이지 예측 정확도를위한 패턴 발견과 관련된 관련 작업을 강조하는 논문이 우리의 초점입니다.

Sarukkai [2000]“Markov 체인을 사용한 링크 예측 및 경로 분석”.

1 차 Markov 모델을 사용하여 액세스 할 수있는 다음 페이지를 예측하기 위해 사용자가 요청한 일련의 웹 페이지를 모델링합니다. Markov 체인을 사용하면 시스템이 이전 상태를 기반으로 내비게이션 로그에서 관찰 된 URL 액세스 패턴을 동적으로 모델링 할 수 있습니다. "개인화 된"Markov 모델은 각 사용자를 위해 교육을 받고 사용자의 향후 세션을 예측하는 데 사용됩니다. 실제로, 각 사용자마다 고유 한 모델을 구성하는 데 너무 비싸고 스케일링 비용은 사이트에 사용자 기반이 큰 경우 더 어려워집니다.

Chun-Jung Lin [2005]”숨겨진 Markov 모델을 사용하여 웹에서 사이버 구매에 대한 서핑 사용자의 의도를 예측합니다. "

숨겨진 Markov 모델 (HMM)을 조사하는 첫 번째 논문. 저자는 웹 서버 로그를 수집하고 데이터를 잘라 내고 사용자가 통과 한 경로를 패치했습니다. HMM을 기반으로 저자는 사용자가 실시간으로 구매할 의도가 있는지 예측하는 웹 브라우징을위한 특정 모델을 구성했습니다. 구매 모드에서 운영 속도를 높이고 영향을 미치는 것과 같은 관련 조치가 조사됩니다.

Elli Voudigari [2010-2011] "웹 페이지 순위 예측을위한 프레임 워크".

이전 순위를 기반으로 페이지의 순위 위치를 예측하기위한 프레임 워크를 제안합니다. 연속적인 Top-K 순위 세트를 가정하면 저자는 다른 방법론을 기반으로 예측 변수를 식별합니다. 예측 품질은 예측 된 순위와 실제 순위 사이의 유사성으로 정량화됩니다. 전 세계 및 쿼리 기반 Top-K 순위 모두에 대한 실제 대규모 데이터 세트에서 철저한 실험이 수행되었습니다. 논문에 캡처 한 소설을 포함하여 Top-K 순위 목록을 비교하기위한 다양한 기존 유사성 측정.

Mogul [1996]“월드 와이드 웹 대기 시간을 개선하기 위해 예측 프리 페치 사용”.

다음 웹 페이지 사용자가 액세스 할 가능성이있는 N-Hop Markov 모델을 사용하여 제안합니다. 패턴은 사용자의 현재 액세스 시퀀스와 사용자의 히스토리 웹 액세스 시퀀스와 일치하여 프리 페치의 예측 정확도를 향상시킵니다.

Borges, Levene [2007]“사용자 웹 내비게이션 세션 분석을위한 가변 길이의 Markov 체인 모델 평가”.

웹 내비게이션 세션 모음을 나타낼 때 Markov 모델 정확도를 높이기 위해 동적 클러스터링 기반 방법을 제안합니다. 상태 클로닝 개념을 사용하여 해당 2 차 확률이 발산되는 링크를 분리하는 방식으로 상태를 복제합니다. 제안 된 방법에는 동일한 클론에 유사한 2 차 확률을 갖는 링크 내를 할당하는 방법을 결정하는 클러스터링 기술이 포함됩니다.

Banu Deniz Gunel [2010]”페이지 순위 알고리즘으로 다음 페이지 권장 사항에 대한 지속 시간, 페이지 크기 및 빈도의 영향을 조사합니다.

페이지의 크기, 페이지의 지속 시간, 전환 기간 (순차적으로 2 페이지 방문), 페이지 빈도 및 전환과 같은 수많은 탐색 속성과 함께 페이지 순위 알고리즘 사용을 확장합니다. 기간 기반 순위 (DPR) 및 인기 기반 페이지 순위 (PPR)를 정의합니다. 저자는 시간 정보를 사용하여 전환 및 페이지의 인기를보고 페이지 크기 및 방문 빈도와 함께 사용했습니다. 페이지의 인기 값을 사용 하여이 논문은 기존 페이지 순위 알고리즘을 개선하고 주어진 Top-N 값 하에서 다음 페이지 예측을 모델링하려고 시도합니다.