Библиотеки и инструменты для включения пользовательских экспертов, управляемых данными в Интернете.
Для пользователей WebPack:
Установите и настройте плагин alvingplugin - плагин vage.js webpack, который автоматизирует как можно больше процесса настройки.
Если вы хотите попробовать модули, которые мы предлагаем индивидуально, каталог packages содержит три пакета:
ga - модуль для извлечения структурированных данных из API Google Analytics, чтобы узнать о шаблонах навигации пользователей.parser - модуль, обеспечивающий диаграмму фреймворта JavaScript. Это способствует возможностям маршрута, реализованными в плагине Palling Webpack.webpack - плагин WebPack для настройки прогнозирующего извлечения в вашем приложении. Он потребляет модули ga и parser и предлагает большое количество опций для настройки того, как предсказательное извлечение должно работать в вашем приложении.Для пользователей без Webpack:
Наш прогнозирующий извлечение для сайтов Workflow предоставляет набор шагов, которые вы можете выполнить для интеграции прогнозного извлечения с использованием API Google Analytics на ваш сайт.
В этом репо используется данные Google Analytics, чтобы определить, какую страницу пользователь может посетить следующую с данной страницы. Скрипт на стороне клиента (который вы добавите в свое приложение) отправляет запрос на сервер, чтобы получить URL-адрес страницы, которую он должен получить, а затем предварительно выстраивать этот ресурс.
Raging.js предоставляет библиотеки и инструменты для упрощения подходов, управляемых предсказательными данными, для улучшения пользовательских экспериментов в Интернете. Эти данные могут быть извлечены из любого количества источников, включая аналитику или модели машинного обучения. Raging.js стремится снизить трение по потреблению и применению этого мышления на все современные сайты и приложения, включая строительство библиотек и инструментов для популярных рабочих процессов.
Применение прогнозного мышления данных-аналитиков к сайтам может применяться в ряде контекстов:
Сотрудничая различные точки сенсорных точек в экосистеме, где можно легко применять подходы, управляемые данными, мы надеемся обобщить общие части инфраструктуры, чтобы максимизировать их применимость в различных технических стеке.
<link rel=prefetch> для будущих навигаций, в значительной степени полагаются на вручную чтение описательной аналитики, чтобы сообщить свои решения о том, что предварительно выстраивать.<link rel=prefetch> в настоящее время используется на 5% от общей хромированной нагрузки, но это может быть выше.Первым большим приоритетом для ugply.js будет улучшать веб -производительность за счет прогнозирующего предварительного получения контента.
Создавая модель страниц, которую может посетить пользователь, учитывая произвольную страницу входной линии, решение может рассчитать вероятность того, что пользователь посетит данную следующую страницу или набор страниц и ресурсов с предварительным вычинением, в то время как пользователь все еще просматривает свою текущую страницу. Это имеет возможность улучшить производительность нагрузки на страницу для последующих посещений страницы, так как есть сильная вероятность, что страница уже будет в кэше пользователя.
Чтобы предсказать следующую страницу, на которую посетит пользователь, решения могут использовать API Google Analytics. Данные сеанса Google Analytics могут использоваться для создания модели для прогнозирования наиболее вероятной страницы, которую пользователь собирается посетить следующим на сайте. Преимущество данных этого сеанса заключается в том, что он может развиваться со временем, так что при изменении конкретных путей навигации прогнозы также могут оставаться в курсе.
С наличием этих данных двигатель может вставить <link rel="[prerender/prefetch/preload]"> теги, чтобы ускорить время загрузки для запроса следующей страницы. В некоторых тестах, таких как нагрузки Марка Эдмондсона, нагрузки с R, это привело к улучшению на 30% времени загрузки страниц. Марк подхода, используемый в его исследованиях, включал в себя использование тегов GTM и машинного обучения для обучения модели для прогнозов страниц. Это идея, продолжающаяся в машинном обучении, встречается с облаком - интеллектуальная предварительная выборка.
В то время как этот подход звучит, используемая методология может быть сочтена немного сложной. Другой подход, который можно использовать (что проще), - это попытка получить точные данные прогнозирования от API Google Analytics. Если вы запустили отчет для страницы и предыдущего размера пути страницы в сочетании с показателями просмотра страниц и выходов, это должно предоставить достаточно данных для подключения предварительных вычин для большинства популярных страниц.
ML может помочь повысить общую точность прогнозов решения, но не является необходимостью для первоначальной реализации. Прогнозирующее извлечение может быть достигнуто путем обучения модели на страницах, которые пользователи, вероятно, будут посещать и улучшать эту модель с течением времени.
Глубокие нейронные сети особенно хороши в том, чтобы дразнить сложности, которые могут привести к тому, что пользователь выбирает одну страницу над другой, в частности, если мы хотим попробовать версию решения, которое обслуживалось страницам, которые может посетить отдельный пользователь, против страниц, который может посетить «Общий/медиана». Фиксированные последовательности страниц (Prev, Current, Next) могут быть самыми простыми, чтобы начать заниматься изначально. Это означает создание модели, которая является уникальной для вашего набора документов.
Обновления моделей, как правило, выполняются периодически, поэтому можно настроить ночную/еженедельную работу, чтобы обновляться на основе нового поведения пользователей. Это может быть сделано в режиме реального времени, но, вероятно, является сложным, поэтому периодически это может быть достаточным. Можно представить себе общую модель, представляющую поведенческие шаблоны для пользователей на сайте, которая может либо управлять обученным набором статуса, Google Analytics или пользовательского описания, который вы используете новый уровень в маршрутизатор, дающий сайту возможность прогнозировать будущие страницы, улучшая производительность загрузки страницы.
Спекулятивная предварительная фиксация может предварительно выстраивать страницы, вероятно, перемещаться по загрузке страницы. Это предполагает существование знаний о вероятности, что странице потребуется определенная следующая страница или набор страниц или учебную модель, которая может обеспечить подход, управляемый данными, к определению таких вероятностей.
Предварительное получение на загрузке страницы может быть выполнено несколькими способами, от отложения до UA, чтобы решить, когда предварительно выберечь ресурсы (например, при низком приоритете с <link rel=prefetch> ), во время простоя страницы (через requestIdlecallback () ()) или в некотором другом интервале. Пользователь не требуется дальнейшего взаимодействия.
Страница могла бы спекулятивно начать предварительное получение контента, когда ссылки на странице видны в просмотре, что означает, что у пользователя может быть больше шансов на то, чтобы нажать на них.
Это подход, используемый Gatsby (который использует React и React Router). Их конкретная реализация заключается в следующем:
<Link> становится невидимой, ссылка «голоса» для страницы, связанной с предварительными голосами, стоит немного меньше баллов каждый раз, поэтому ссылки в верхней части страницы расставляются с приоритетом внизу.Страница может начать спекулятивно предварительно выставлять ресурсы, когда пользователь указывает, что он заинтересован в некотором контенте. Это может занять множество форм, в том числе, когда пользователь решает зависать по ссылке или какой -либо части пользовательского интерфейса, которая будет перемещаться по отдельной странице. Браузер может начать получать контент для ссылки, как только появится четкий показатель интереса. Это подход, используемый библиотеками JavaScript, такими как InstantClick.
Как и в случае с любым механизмом предварительного получения контента заранее, к нему нужно подходить очень тщательно. Пользователь с ограниченным планом данных может не оценить или пользоваться таким образом, чтобы страниц, которые были извлечены заранее, в частности, если они начнут съесть свои данные. Существуют механизмы, которые может потребовать сайта/решения, чтобы помнить об этой проблеме, например, к уважению заголовка Dave-Data.
Предварительное получение ссылок на страницы «вход», вероятно, нежелательно. То же самое можно сказать и о любых страницах, которые запускают действие на странице (например, покупка в один щелчок). Решения могут пожелать включить черный список URL -адресов, которые никогда не предварительно перебранные, чтобы увеличить вероятность того, что предварительно выбранная страница будет полезной.
Некоторые из попыток выполнить подобные предложения в прошлом полагались на <link rel=prerender> . Команда Chrome в настоящее время изучает выяснение REL = PRERENDER в пользу NOSTATEPRETCH - более легкой версии этого механизма, которая предварительно предварительно предварительно выстраивается в кэш HTTP, но не использует другое состояние веб -платформы. Решение должно учитывать, будет ли оно полагаться на замену на rel = prerender или использование предварительного переключения/предварительной нагрузки/других подходов.
Существует два ключевых различия между nostateprefetch и prefetch:
Nostate-Prefetch-это механизм, а <link rel=prefetch> -API. Запрошенные предъявители NOSTATE можно запросить другие точки входа: Omnibox Production, пользовательские вкладки, <link rel=prerender> .
Реализация отличается: <link rel=prefetch> предварительно выфетчатся на один ресурс, но ностат-предварительно переполняет, который запускает сканер предварительного нагрузки на ресурсе (в новом новом визуализаторе), обнаруживает подгруппы и также предварительно перефетширует их (без повторения в сканере предварительного нагрузки).
Существует три основных типа аналитики данных, о которых стоит знать в этом проблеме: описательный, прогнозирующий и предписывающий. Каждый тип связан, и команды помогают использовать различные виды понимания.
Описательная аналитика суммирует необработанные данные и превращает их в нечто, интерпретируемое людьми. Он может взглянуть на прошлые события, независимо от того, когда произошли события. Описательная аналитика позволяет командам учиться на прошлом поведении, и это может помочь им повлиять на будущие результаты. Описательная аналитика может определить, какие страницы на сайте пользователи просмотрели ранее и какие пути навигации они выбрали любую данную страницу записи.
Прогнозирующая аналитика «предсказывает», что может произойти дальше. Предсказательная аналитика помогает нам понять будущее и дает командам действенные идеи с использованием данных. Это обеспечивает оценки вероятности будущего результата полезного. Важно иметь в виду, что немногие алгоритмы могут предсказать будущие события с полной точностью, но мы можем использовать как можно больше сигналов, которые доступны для нас, чтобы помочь повысить базовую точность. Основа прогностической аналитики основана на вероятностях, которые мы определяем из данных. Прогнозирующая аналитика может предсказать следующую страницу или набор страниц, которые пользователь может посетить с учетом произвольной страницы входа.
Преданная аналитика позволяет назначать различные возможные действия для руководства решением. Предписательная аналитика дает советы, пытаясь количественно оценить влияние будущих решений, возможно, придется консультировать по возможным результатам до принятия этих решений. Предписательная аналитика направлена не только на предсказание того, что произойдет, но и идет дальше; Информировать, почему это произойдет, и предоставление рекомендаций о действиях, которые могут воспользоваться такими предсказаниями. Предписывающая аналитика может предсказать следующую страницу, которую посетит пользователь, но также предложить такие действия, как информирование вас о том, как вы можете настроить их опыт, чтобы воспользоваться этими знаниями.
Ключевой целью модели прогнозирования в задаче предварительного получения является определение того, какие последующие запросы могут потребоваться пользователю, с учетом конкретного запроса страницы. Это позволяет серверу или клиенту предварительно выбирать следующий набор страниц и попытаться убедиться, что они находятся в кэше пользователя, прежде чем они непосредственно перейдут на страницу. Идея состоит в том, чтобы сократить общее время загрузки. Когда это реализуется с осторожностью, этот метод может сократить время доступа и задержки, улучшая общий опыт пользователя.
Модели Маркова широко использовались для исследования и понимания стохастического (распределения случайных вероятностей) [Ref, Ref]. Было продемонстрировано, что они хорошо подходят для моделирования и прогнозирования поведения просмотра пользователя. Ввод для этих проблем, как правило, является последовательности веб-страниц, доступных пользователем или набором пользователей (по всему сайту) с целью создания моделей Маркова, которые мы можем использовать для моделирования и прогнозирования страниц, которые пользователь, скорее всего, получит доступ к следующему. Процесс Маркова имеет состояния, представляющие доступ к страницам и ребра, представляющие вероятности перехода между состояниями, которые вычисляются из данной последовательности в журнале аналитики. Обученная модель Маркова может использоваться для прогнозирования следующего состояния, учитывая набор K предыдущих состояний.
В некоторых приложениях модели Маркова первого порядка не так точны в прогнозировании поведения пользователя, как они не всегда рассматривают прошлое, чтобы провести различие между различными моделями, которые наблюдались. Это одна из причин, по которой модели высшего порядка часто используются. Эти модели более высокого порядка имеют ограничения со сложностью пространства состояний, менее широким охватом и иногда сниженной точностью прогноза.
Одним из способов преодоления этой проблемы является обучение различных моделей марковских моделей, которые мы затем используем на этапе прогнозирования. Это было предпринято в модели Маркова, предложенной в этом рефере, предложенной в этом рефере. Однако это может усугубить сложность пространства состояний. Другим подходом является определение частых шаблонов доступа (самые длинные повторяющиеся последующие) и использование этого набора последовательностей для прогнозов. Хотя этот подход может иметь порядок уменьшения сложности пространства состояний, он может снизить точность прогноза.
Селективные модели Маркова (SMM), которые хранят только некоторые состояния в рамках модели, также были предложены в качестве решения для компромиссов сложности пространства состояния. Они начинаются с модели Маркова с разумом-затем подход после сброса используется для обрезки состояний, которые, как ожидается, не будут точными предикторами. Результатом этого является модель, которая обладает одинаковой мощностью прогнозирования у моделей всех выпадений с меньшей сложностью пространства и более высокой точностью прогнозирования. В Deshpane и Karpis различные критерии для обрезки состояний в модели до прогнозирования (частота, уверенность, ошибка).
В Mabroukeh и Ezeife производительность моделей Markov 1-го и 2-го порядка, богатых семантикой, была изучена и сравнивалась с показателями SMM более высокого порядка и семантической SMM. Они обнаружили, что SMM с семантическим, имеет SMM на 16% меньше, чем SMM с частотой, и обеспечивает почти одинаковую точность.
Наблюдение за шаблонами навигации может позволить нам проанализировать поведение пользователей. Этот подход требует доступа к идентификации пользовательской сеансы, сеансов кластеризации в аналогичные кластеры и разработка модели для прогнозирования с использованием текущих и более ранних шаблонов доступа. Большая часть предыдущей работы в этой области опиралась на схемы кластеризации, такие как метод кластеризации K-средних с евклидовым расстоянием для улучшения уверенности в прогнозах. Одним из недостатков использования K-средних является трудности с выбором количества кластеров, выбор начального случайного центра и порядок посещений страницы не всегда рассматривается. Кумар и соавторы исследовали это, предлагая метод иерархической кластеризации с модифицированным расстоянием левенштейна, PageRank с использованием длины времени доступа, частоты и моделей более высокого порядка для прогнозирования.
Многие из документов, упомянутых в следующем разделе, сосредоточены вокруг модели Маркова, правил ассоциации и кластеризации. Документы, подчеркивающие соответствующую работу, связанную с обнаружением шаблона для развития точности прогнозирования страниц, являются нашим направлением.
Использует модели Маркова первого порядка для моделирования последовательности веб-страниц, запрашиваемых пользователем для прогнозирования следующей страницы, к которой они могут получить доступ. Цепочки Маркова позволяют системе динамически моделировать шаблоны доступа к URL -адресам, наблюдаемые в журналах навигации на основе предыдущего состояния. «Персонализированная» модель Маркова обучается для каждого пользователя и используется для прогнозирования будущих сеансов пользователя. На практике слишком дорого строить уникальную модель для каждого пользователя, и стоимость масштабирования становится более сложной, когда на сайте есть большая база пользователей.
Первая статья для исследования скрытых моделей Маркова (HMM). Автор собрал журналы веб -сервера, обрезал данные и исправил пути, пройденные пользователями. Основываясь на HMM, автор построил конкретную модель для просмотра веб-страниц, которая предсказывает, есть ли пользователи намерение приобрести в режиме реального времени. Связанные меры, такие как ускорение операции и их влияние в режиме покупки, исследуются.
Предлагает структуру для прогнозирования позиций ранжирования страницы на основе их предыдущих рейтингов. Предполагая набор последовательных рейтингов Top-K, автор идентифицирует предикторы на основе различных методологий. Качество прогноза определяется количественно как сходство между прогнозируемым и фактическим рейтингом. Исчерпывающие эксперименты были выполнены в реальном крупномасштабном наборе данных как для глобальных рейтингов на основе запросов. Разнообразие существующих мер сходства для сравнения списков Range Top-K, в том числе нового, который был запечатлен в статье.
Предлагает использование моделей N-HOP Markov для прогнозирования следующих пользователей веб-страницы, вероятно, доступны. Паттерн соответствует текущей последовательности доступа пользователя с историческими последовательностями веб -доступа пользователя, чтобы повысить точность прогнозирования для предварительных вычинений.
Предлагает динамические методы, основанные на кластеризации, для повышения точности модели Маркова при представлении коллекции сеансов веб-навигации. Использует концепцию клонирования состояния для дублирования состояний таким образом, чтобы разделить личины, чьи соответствующие вероятности второго порядка расходятся. Предложенный метод включает в себя метод кластеризации, определяющий способ назначения лиц с одинаковыми вероятностями второго порядка одному клону.
Расширяет использование алгоритма орандашера с помощью многочисленных навигационных атрибутов: размер страницы, время продолжительности страницы, продолжительность перехода (последовательно посещение двух страниц), частота страницы и перехода. Определяет ранг на основе продолжительности (DPR) и страницы на основе популярности (PPR). Автор посмотрел на популярность переходов и страниц, используя информацию о продолжительности, используя ее с размером страницы и частотой посещения. Используя стоимость популярности страниц, в этом документе пытается улучшить обычные алгоритмы ранга страницы и моделировать прогноз следующей страницы в соответствии с данным значением Top-N.
![]() Минко Гечев | ![]() Адди Османи | ![]() Кэти Хемпениус | ![]() Кайл Мэтьюз |