usaddressダウンロードusaddressソースコードのダウンロード

usaddress

その他のソースコード

1.0.0

ダウンロード

Usaddress

USADDRESSは、非構造化された米国のアドレス指定を解析するためのPythonライブラリであり、高度なNLPメソッドを使用してアドレスコンポーネントに文字列をアドレス指定します。

これができること：確率論的モデルを使用して、ルールベースのパーサーが通常壊れる場合でも、アドレスコンポーネントを識別する際に（非常に教育を受けた）推測を行います。

これができないこと：アドレスコンポーネントを完全な精度で識別することも、特定のアドレスが正しい/有効であることを確認することもできません。

また、アドレスを正規化しません。ただし、Usaddressの上に構築されたこのライブラリはそうです。

UsAddressで構築されたツール

パーセレーターAPI

Pythonを使用していないプログラマーのために、UsAddressの上に構築されたRESTFUL API。 APIキーが必要であり、最初の1,000個のパージは無料です。

パーセレーターGoogleシートアプリ

パーセレーター：解析および分割アドレスを使用すると、Googleシートで通り、市、州、Zipcodeなど、通り、都市、州、Zipcodeなどの別々の列にアドレスを簡単に分割できます。

USADDRESS Pythonライブラリの使用方法

Pythonパッケージをインストールして管理するためのツールであるPIPとUSADDRESSをインストールします（初心者向けガイドはこちら）。

ターミナルで、

pip install usaddress

いくつかのアドレスを解析してください！

parseとtag異なる方法であることに注意してください。

 import usaddress
addr = '123 Main St. Suite 100 Chicago, IL'

# The parse method will split your address string into components, and label each component.
# expected output: [(u'123', 'AddressNumber'), (u'Main', 'StreetName'), (u'St.', 'StreetNamePostType'), (u'Suite', 'OccupancyType'), (u'100', 'OccupancyIdentifier'), (u'Chicago,', 'PlaceName'), (u'IL', 'StateName')]
usaddress . parse ( addr )

# The tag method will try to be a little smarter
# it will merge consecutive components, strip commas, & return an address type
# expected output: (OrderedDict([('AddressNumber', u'123'), ('StreetName', u'Main'), ('StreetNamePostType', u'St.'), ('OccupancyType', u'Suite'), ('OccupancyIdentifier', u'100'), ('PlaceName', u'Chicago'), ('StateName', u'IL')]), 'Street Address')
usaddress . tag ( addr )

この開発コードの使用方法（オタク用）

USADDRESSは、確率的パーサーを作成および改善するためのライブラリ、特にPython -CRFSUITEの条件付きランダムフィールドの実装を使用するパーサーを使用します。 Parseratorを使用すると、ラベル付きトレーニングデータでUSADDRESSパーサーのモデル（.CRFSUITE設定ファイル）をトレーニングでき、新しいラベル付きトレーニングデータを追加するためのツールを提供できます。

このレポのコードの構築とテスト

マシンにUSADDRESSの開発バージョンを構築するには、コマンドラインで次のコードを実行します。

 git clone https://github.com/datamade/usaddress.git  
cd usaddress  
pip install -r requirements.txt  
python setup.py develop  
parserator train training/labeled.xml usaddress

次に、テストスイートを実行して、すべてが適切に機能していることを確認します。

 nosetests .

コードの構築に問題がありますか？問題を開くと、トラブルシューティングを手伝ってくれてうれしいです。

新しいトレーニングデータの追加

USADDRESSが特定のアドレスパターンで一貫して失敗している場合、モデルに新しいトレーニングデータを追加することにより、パーサーの動作を調整できます。トレーニングディレクトリでガイドをフォローし、次のリリースに貢献を組み込むことができるように、必ずプルリクエストを行います！

重要なリンク

Webインターフェイス：https：//parserator.datamade.us/usaddress
Pythonパッケージの配布：https：//pypi.python.org/pypi/usaddress
Pythonパッケージドキュメント：https：//usaddress.readthedocs.io/
APIドキュメント：https：//parserator.datamade.us/api-docs
リポジトリ：https：//github.com/datamade/usaddress
問題：https：//github.com/datamade/usaddress/issues
ブログ投稿：http：//datamade.us/blog/parsing-addresses-with-usaddress

チーム

フォレストグレッグ、データメイド
キャシー・デン、データメイド
サセックス大学Miroslav Batchkarov
Jean Cochrane、Datamade

悪いパージ /バグ

問題トラッカーの問題を報告します

アドレスが誤って解析された場合は、お知らせください！問題を開くか（冒険好きな場合）、新しいトレーニングデータを追加してパーサーのモデルを改善できます。可能であれば、データのソースに関するいくつかの情報とともに、同様のアドレスパターンのいくつかの実際の例を送信してください。これは、パーサーの訓練とパフォーマンスの向上に役立ちます。

ライブラリ内の何かが直感的に動作していない場合、それはバグであり、報告する必要があります。

パッチ/プルリクエストに注意してください

プロジェクトをフォークします。
機能を追加またはバグ修正します。
プルリクエストを送信してください。トピックブランチのボーナスポイント！

著作権

著作権（c）2014アトランタジャーナル憲法。 MITライセンスの下でリリースされました。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-04-17
サイズ 4.25MB
から Github

usaddress

Usaddress

UsAddressで構築されたツール

パーセレーターAPI

パーセレーターGoogleシートアプリ

USADDRESS Pythonライブラリの使用方法

この開発コードの使用方法（オタク用）

このレポのコードの構築とテスト

新しいトレーニングデータの追加

重要なリンク

チーム

悪いパージ /バグ

パッチ/プルリクエストに注意してください

著作権

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express