DotNetExpose
1.0.0
DotNetExpose は、Web ページのスクラップに役立つ .Net ライブラリです。ページに関する多くの情報が表示されます。
バージョン 1.0.5:
パッケージマネージャーを使用してインストールします。
Install-Package DotNetExpose -Version 1.0.5パッケージをインストールした後:
using Expose . Main ;ExposeHtmlDocument のインスタンスを作成します。コンストラクターには URL が必要です。この URL はスクレイピングされます。
const string URL = "https://www.google.com.br/"
ExposeHtmlDocument expose = new ExposeHtmlDocument ( URL ) ;HTML ページ内で参照されている CSS ファイルの合計を返します。
int countCSS = expose . CountCSSAsync ( ) ;HTMLページ内で参照されているJSファイルの合計を返します。
int countJS = expose . CountJSAsync ();HTML 要素の合計を返す
int countHtmlElements = CountHtmlElementsAsync ( ) ;META要素の合計を返します
int countMetaTags = expose . CountMetaAsync ( ) ;すべての JS コンテンツを返します
HashSet < string > hsJS = expose . GetJSContentAsync ( ) ;すべての CSS コンテンツを返します
HashSet < String > hsCSS = expose . GetCSSContentAsync ( ) ;HTML内のすべての要素のonclickイベントの合計を返します。
int countOnclickEvents = expose . CountOnclickEventsAsync ( ) ;HTMLページ内のフォームの合計を返します。
int countForms = expose . CountFormsAsync ( ) ;フォームからアクションと HttpMethod を返す
Dictionary < string , string > dicFormInfo = expose . FormsInfoAsync ( ) ;ページのサイズを Kb 単位で返します
long ? pageSize = expose . GetSizeOfPageAsync ( ) ;見つかった情報量を含む JSON を返します。
string report = expose . GetReportAsync ( ) ;真/偽を返します
bool hasAjaxCall = expose . HasAjaxCallAsync ( ) ; プルリクエストは大歓迎です。大きな変更の場合は、まず問題を開いて、変更したい内容について話し合ってください。
必要に応じてテストを更新してください。
マサチューセッツ工科大学