ログ統計システムは、サイトのユーザー行動分析、特に検索エンジンからのキーワード アクセス統計において重要な役割を果たします。ユーザー行動分析データの非常に効果的なソースです。長年にわたるインターネットの発展に伴い、WEB ログ統計ツールはますます成熟し、機能がますます増えています。それらの多くはオープンソースであり、AWStats は最も優れたものの 1 つです。
簡単なインストール手順は次のとおりです。
インストール
http://sourceforge.net/projects/awstats/ インストール パッケージをダウンロードした後:
GNU/Linux: tar zxf awstats-version.tgz
デフォルトでは、awstats のスクリプトと静的ファイルは wwwroot ディレクトリにあります。cgi-bin ディレクトリ内のすべてのファイルを cgi-bin/ ディレクトリにデプロイします: /home/apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
アイコンとその他のファイル ディレクトリを WEB HTML ファイル公開ディレクトリ (例: /home/apache/htdocs/) にコピーし、公開します。
さらに多くのバッチ更新スクリプトが tools ディレクトリにあり、cgi-bin/awstats/ ディレクトリに配置できます。
国内の主要な検索エンジンとスパイダーの定義をアップグレードし、GeoIP アプリケーション ライブラリをインストールします: C
http://www.maxmind.com/download/geoip/api/c/ 解凍、コンパイル、インストール
perl -MCPAN -e 'install "Geo::IP"' または純粋な Perl パッケージを使用します perl -MCPAN -e 'install "Geo::IP::PurePerl"'
GeoIP/GeoIPCityLite パッケージをダウンロードします。解凍して、awstats ディレクトリにデプロイします。
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
構成
デフォルトの awstats.model.conf に common.conf という名前を付けます。
これらの構成オプションの一部を変更します。
LoadPlugin="decodeutfkeys"
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
統計データ出力用のデータディレクトリをawstats配下に作成します。
次の例に従って構成ファイルを設定します。
「common.conf」を含める
LogFile="/home/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
サイトドメイン = "www.chedong.com"
HostAliases = "chedong.com"
デフォルトファイル = "インデックス.html"
DirData="/home/apache/cgi-bin/awstats/data/"
内容の概要: AWStats の使用法といくつかの設定改善手順の紹介。 AWStats バージョン 6.3 以降では、中国のユーザーは基本的に構成ファイルで LoadPlugin="decodeutfkeys" を有効にするだけで済みます。現在、中国の検索エンジンでは統計的な問題は発生しません。 .com」、「search.sina.com」、「search.sohu.com」、これら 3 つの検索エンジンです。国内の主要な検索エンジンおよびスパイダー定義のパッチが含まれています (解凍後、lib ディレクトリ内の元のプログラム ディレクトリに上書きするだけです)
[カットページ]
ログ統計システムは、サイトのユーザー行動分析、特に検索エンジンからのキーワード アクセス統計において重要な役割を果たします。ユーザー行動分析データの非常に効果的なソースです。長年にわたるインターネットの発展に伴い、WEB ログ統計ツールはますます成熟し、機能がますます増えています。それらの多くはオープンソースであり、AWStats は最も優れたものの 1 つです。
AWStats: 高度なウェブ統計
AWStats は、Sourceforge で急速に開発された Perl ベースの WEB ログ分析ツールです。別の優れたオープンソース ログ分析ツールである Webalizer と比較して、AWStats には次の利点があります。
フレンドリーなインターフェース:ブラウザに応じて、対応する言語インターフェースを直接呼び出すことができます(簡体字中国語バージョンも利用可能です)
参照出力サンプル: http://www.chedong.com/cgi-bin/awstats/awstats.pl? config=チェドン
Perl に基づいており、システム自体は GNU/Linux または Windows (ActivePerl のインストール後) で実行でき、分析されたログは Apache 形式 (結合) と IIS 形式 (変更が必要) を直接サポートします。 )。 Webalizer には Windows プラットフォーム バージョンもありますが、現時点ではメンテナンスが提供されていません。
AWStats は、1 つのシステムを完全に使用して、独自のサイトのさまざまな WEB サーバー (GNU/Linux/Apache および Windows/IIS サーバー) 上で統合統計を完了できます。
比較的高い効率: AWStats の出力統計項目は Webalizer よりもはるかに豊富で、毎日何百万ものアクセスがあるサイトの場合、速度は Webalizer の約 1/3 に達します。
便利な構成/カスタマイズ: システムは、十分に柔軟性がありながら合理的なデフォルト構成ルールを提供しており、実行を開始するために変更する必要があるデフォルト構成は 3 つまたは 4 つだけです。また、変更および拡張できるプラグインも多数あります。
AWStats の設計者は正確な「人間による訪問」を考慮して設計されているため、多くの検索エンジン ロボットによる訪問がフィルタリングされて除外されるため、他のログ統計ツールよりも数値が低くなる可能性があります。また、社内からの訪問も IP フィルタリング設定を通過してフィルタリングされます。 。
多くの拡張パラメーター統計関数を提供します。ExtraXXXX シリーズ構成を使用してアプリケーション固有のパラメーター分析を生成すると、製品分析に非常に役立ちます。
他のツールとの詳細な比較については、Webalizer、アナログを参照してください。
http://awstats.sourceforge.net/#COMPARISON
[カットページ]
AWStats インストールのリマインダー
AWStats の動作モードは次のとおりです。
ログの分析: 実行後、そのようなログ統計結果を AWStats データベース (プレーンテキスト) にアーカイブします。
次に、出力が 2 つの形式で表示されます。
1 つは、CGI プログラムを通じて出力された統計結果データベースを読み取る方法です。
1 つは、バックグラウンド スクリプトを実行して出力を静的ファイルにエクスポートする方法です。
以下は、単一サイトのログ統計の 2 つの例です。
1 つは GNU/Linux 上の CGI を介して出力されます。
1 つは Windows 2000 での静的ページのエクスポートに基づいています
ダウンロード/インストール
http://sourceforge.net/projects/awstats/ インストール パッケージをダウンロードした後:
GNU/Linux: tar zxf awstats-version.tgz
awstats のスクリプトと静的ファイルはデフォルトで wwwroot ディレクトリにあります。cgi-bin ディレクトリの awstats.pl プログラムを /home/apache/cgi-bin/awstats/ にデプロイします。
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
#アイコンとその他のファイル ディレクトリを WEB HTML ファイル公開ディレクトリ /home/apache/htdocs/ にコピーし、以下に公開します。
さらに多くのバッチ更新スクリプトが tools ディレクトリにあり、cgi-bin/awstats/ ディレクトリにまとめて配置できます。
Windows 2000: バックグラウンド スクリプト モードで実行し、直接解凍して、D:AWStats ディレクトリに移動します。
アイコン ディレクトリを IIS リリース ディレクトリ (inetpub/icon) にコピーします。
[カットページ]
データソースのログ形式と日別の切り捨てルール
Apache の場合: ログ形式の設定は簡単です。結合形式に設定するだけです。ログの切り捨ては少し面倒です。cronolog ツールをインストールし、ログを日ごとに切り捨てるように設定する必要があります。
CustomLog "|/usr/local/sbin/cronolog /path/to/apache/logs/access_log.%Y%m%d" を結合
例: logs/access_log.20030326
ログは圧縮形式なので、 gzip -d < /home/apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz | を使用して統計を動的に解凍できます。
IIS の場合: デフォルトでは、日ごとに適切なログ切り捨てルールがありますが、IIS のログ形式は AWStats 統計には適していません。
したがって、単純にすべてのログフィールドを削除し、次のリストに従って厳密に設定することが最善です。
日付 日付
時間 時間
顧客の IP アドレス c-ip
ユーザー名cs-ユーザー名
Methodcs-メソッド
URI リソース cs-uri-stem
プロトコルステータス sc-status
送信されたバイト数 sc-byte
プロトコルバージョン cs-version
ユーザーエージェント cs (ユーザーエージェント)
参照(リファラー)
IIS のデフォルト設定との比較:
削減には次のものが含まれます。
サーバーのIPアドレス
サーバーポート
URIクエリ
追加されたのは次のとおりです。
送信されたバイト数
プロトコルのバージョン
参照
設定ファイルの命名規則: awstats.sitename.conf
AWStats のメイン プログラムである awstats.pl は、サイト名に従って、対応するサイトの設定ファイル (awstats.sitename.conf) を自動的に呼び出します。
たとえば、./awstats.pl -config=chedong を実行すると、同じディレクトリ内の awstats.chedong.conf 設定ファイルが呼び出されます。
-config が指定されていない場合は、現在のディレクトリ内の awstats.conf または /etc/awstats.conf もデフォルト設定ファイルとして検索されます。
したがって、デフォルトの awstats.model.conf の名前を awstats.yoursite.conf に変更するのが最善です。たとえば、awstats.chedong.conf、
複数のサイトの統計の場合、AWStats の設定ファイルのインクルード機能は依然として非常に便利です。共通の設定を 1 つのドキュメントに含めてから、インクルード設定 (バージョン 5.4 以降でサポート) を使用して、共通の設定を各特定の設定ファイルに含めることができます。 . ヘッダーを使用して、次のような一般構成内の対応するプロパティをオーバーライドします。
インクルード = "common.conf"
LogFile="/path/to/bbs/access_log"
サイト名 = "bbs.chedong.com"
最小限の構成ファイルの変更: LogFile SiteDomain LogFormat
GNU/Linux で Apache ログをカウントするには、次の 2 つのオプションを変更するだけです: LogFile SiteDomain
GNU/Linux LogFile="/path/to/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
Windows 2000 ログファイル = "d:iis_logsW3SV3ex%YY-24%MM-24%DD-24.log"
この構成は、24 時間前の年、月、日付を含むログ ファイル名を意味します。
サイトドメイン = "www.chedong.com"
サイトの名前。デフォルトでは空です。空の場合、AWStats は実行を拒否します。
統計 IIS ログの場合は、さらに 1 つの変更が必要です。
ログ形式=2
デフォルト値は、1: Apache ログ、2: IIS ログです。
[カットページ]
その他の注意事項:
AWStats はデフォルトでは swf ファイルをフィルタリングせず、.swf を PageView としてカウントするため、サイト上の swf ファイルが主に広告である場合は、それらをフィルタリングして除外することをお勧めします。
ログ分析
./awstats.pl -update -config=サイト名 -lang=cn
例: ./awstats.pl -update -config=chedong
設定ファイル awstats.chedong.conf が自動的に呼び出されます。
統計出力
GNU/Linux http://localhost/cgi-bin/awstats/awstats.pl? config=チェドン
Windows 2000 http://localhost/awstats/awstats.chedong.html
ログ統計は自動的に実行されます
GNU/Linux の場合: crontab -e: 毎日 8:10 に実行
#updateawstats
10 8 * * * (cd /path/to/apache/cgi-bin/awstats/; ./awstats.pl -update -config=chedong)
Windows 2000 の場合: 毎日 8:10 に実行されるように設定します。
D:Perlbinperl.exe d:AWStatstoolsawstats_buildstaticpages.pl -update -config=chedong -lang=cn -dir=c:inetpubawstats -awstatsprog=d:awstatswwwroot cgi-binawstats.pl
マルチサイトログ統計
AWStats にはバッチ処理ツール tools/awstats_updateall.pl が付属しており、ディレクトリ内のすべての設定ファイルをバッチで走査し、統計を実行できます。したがって、残りの作業は主にログの同期になります。
複数のサイトの場合、多くの設定オプションが繰り返されると、それぞれの設定ファイルを変更して維持するのは非常に面倒になります。AWStats では、バージョン 5.4 から設定ファイルに含まれる機能を提供しているため、共通の設定を行うことができます。会議
次に、他のサイトの構成が次のように設定されます。次のオプションを使用して、デフォルトと一致しない構成をオーバーライドできます。
awstats.bbs.chedong.conf
「chedong.common.conf」を含める
ログファイル「/path/to/bbs_log」
サイト名「bbs.chedong.com」
awstats.www.chedong.conf
「chedong.common.conf」を含める
ログファイル「/path/to/www_log」
サイト名「www.chedong.com」
HostAliases = "chedong.com"
統計指標の説明
訪問者: 訪問者の一意の IP アドレスに基づく統計。1 つの IP が 1 人の訪問者を表します。
訪問数: 訪問者は 1 日に複数回訪問する可能性があるため (例: 午前 1 回、午後 1 回)、訪問者の訪問数は一定期間内の固有 IP の数に基づいて計算されます。時間 (例: 1 時間);
Web ページの数: 画像、CSS、JavaScript ファイルなどを除いた純粋なページ訪問の総数。ただし、ページで複数のフレームが使用されている場合、各フレームはページ リクエストとしてカウントされます。
ファイル数: 画像、CSS、JavaScript などを含む、ブラウザ クライアントからのファイル リクエストの合計数。ページに画像などが含まれている場合、複数のファイル リクエストがサーバーに対して行われます。ファイルの数は通常、ファイルの数よりもはるかに大きくなります。
バイト: クライアントに送信されたデータの総量。
REFERER からのデータ: ログの参照 (REFERER) フィールドには、対応する Web ページにアクセスする前のアドレスが記録されるため、ユーザーが検索エンジンの検索結果をクリックして Web サイトにアクセスすると、ユーザーのクエリが表示されます。ログ内の対応する検索エンジンのアドレス。このアドレスから、ユーザーのクエリで使用されたキーワードを解析によって抽出できます。
例えば:
2003-03-26 15:43:58 123.123.123.123 - GET /index.html 200 192 HTTP/1.1 Mozilla/4.0+(互換性; +MSIE+5.01; +Windows+NT+5.0) http://www.google .com/検索? q=チェドン
AWStats は、検索エンジンのキー フレーズとキーワード統計に関して比較的完全な機能を備えています。世界中の 300 以上のマシン クローラーを識別でき、多くの地域で最も主流の国際検索エンジンと現地言語の検索エンジンを識別できます。
[カットページ]
AWStats のハッキング
地理情報に基づいたプラグインのインストール:
GeoIP および Geo::IPfree (awstats 5.5 以降)
GeoIP と Geo::IPfree はどちらも無料の国/IP マッピング テーブルであり、DNS 逆ドメイン名解決によって取得される統計よりも正確かつ高速です。 GeoIP API は無料、デフォルト ライブラリは無料、データ更新サービスは有料です。 Geo::IPfree のコードが公開されているだけでなく、ライブラリ データも公開されています。
GeoIP のインストール:
最初に C ライブラリをダウンロードします: 解凍後、GeoIP C
%./configure;
#メイクインストール
次に、Perl ライブラリをダウンロードします: 解凍後、GeoIP Perl
%perl MakeFile.PL;
#メイクインストール
Geo::IPfree インストール:
Geo::IPfree をダウンロードして解凍した後
%perl メイクファイル
%作る
#メイクインストール
構成: 構成ファイルで GEOIP 関連のプラグインを有効にすることにより、次のようになります。
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
MaxMind は現在、GeoIP および GeoIPCityLite データ パッケージを無料で提供しています。これらは次のアドレスから毎月定期的にダウンロードできます。
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
[カットページ]ログ統計システムは、サイトのユーザー行動分析、特に検索エンジンからのキーワード アクセス統計において重要な役割を果たします。ユーザー行動分析データの非常に効果的なソースです。長年にわたるインターネットの発展に伴い、WEB ログ統計ツールはますます成熟し、機能がますます増えています。それらの多くはオープンソースであり、AWStats は最も優れたものの 1 つです。
AWStats: 高度なウェブ統計
AWStats は、Sourceforge で急速に開発された Perl ベースの WEB ログ分析ツールです。別の優れたオープンソース ログ分析ツールである Webalizer と比較して、AWStats には次の利点があります。
フレンドリーなインターフェース:ブラウザに応じて、対応する言語インターフェースを直接呼び出すことができます(簡体字中国語バージョンも利用可能です)
参照出力サンプル: http://www.chedong.com/cgi-bin/awstats/awstats.pl? config=チェドン
Perl に基づいており、システム自体は GNU/Linux または Windows (ActivePerl のインストール後) で実行でき、分析されたログは Apache 形式 (結合) と IIS 形式 (変更が必要) を直接サポートします。 )。 Webalizer には Windows プラットフォーム バージョンもありますが、現時点ではメンテナンスが提供されていません。
AWStats は、1 つのシステムを完全に使用して、独自のサイトのさまざまな WEB サーバー (GNU/Linux/Apache および Windows/IIS サーバー) 上で統合統計を完了できます。
比較的高い効率: AWStats の出力統計項目は Webalizer よりもはるかに豊富で、毎日何百万ものアクセスがあるサイトの場合、速度は Webalizer の約 1/3 に達します。
便利な構成/カスタマイズ: システムは、十分に柔軟性がありながら合理的なデフォルト構成ルールを提供しており、実行を開始するために変更する必要があるデフォルト構成は 3 つまたは 4 つだけです。また、変更および拡張できるプラグインも多数あります。
AWStats の設計者は正確な「人間による訪問」を考慮して設計されているため、多くの検索エンジン ロボットによる訪問がフィルタリングされて除外されるため、他のログ統計ツールよりも数値が低くなる可能性があります。また、社内からの訪問も IP フィルタリング設定を通過してフィルタリングされます。 。
多くの拡張パラメーター統計関数を提供します。ExtraXXXX シリーズ構成を使用してアプリケーション固有のパラメーター分析を生成すると、製品分析に非常に役立ちます。
他のツールとの詳細な比較については、Webalizer、アナログを参照してください。
http://awstats.sourceforge.net/#COMPARISON