Cyanokhojは、世界中の水域での効果的なCyanohab検出と監視を目的とした、Google Earth Engineでのツイートとその後のデータ分析を追跡することにより、市民科学プログラムを採用するWebアプリです。目的は、Twitterのデータ分析と場所抽出に基づいて、潜在的なシアノの寄生的な場所を特定し、Google Earth Engineの衛星データを使用してこれらの場所をさらに分析することです。
これは、リアルタイムフィードを削減し、プロジェクト固有のキーワードとハッシュタグ(NLPテクニックを使用)に基づいてそれらをフィルタリングすることで行われ、藻類のブルームが感染した水素に関するツイートを特定するのに役立ちます。その後、ロケーションタグはフィルター処理されたツイートから抽出され、ジオコードされます。これらの場所は、Google MapとGoogle Earthエンジンに送信され、潜在的なCyanobloomの場所を強調するマップがあります。
以下のリポジトリには、詳細なワークフローと情報のツイート分析と場所抽出タスクが含まれています。
| ツイート | 余弦 | ソフトコサイン | WMD | WMDレラックス |
|---|---|---|---|---|
| 2つの有毒な水プルームと、宇宙の中央に藻類が咲くように見えるものを見ることができます。 https://t.co/wqshykyio4 | 0.0012850764 | 0.04648514 | 0.57122673946974 | 0.594367796798155 |
| @julianamwatson @bergsham @hkrassenstein @realdonaldtrump oh crap red藻類の波の波に感謝します | 0.0012786512 | 0.046485145 | 0.525980177763364 | 0.51406903154577 |
| @RealdonaldTrump Toxic Red Algae Bloomはそれに似ています | 0.007476028 | 0.04648514 | 0.68321624849994 | 0.451862241456097 |
| @gwsuperfan @RealdonaldTrump有毒な藻類のような咲く。 | 0.008209193 | 0.04648514 | 0.747027618034671 | 0.474957523799558 |
| 大きな水域から藻類の洗浄を専門とするイスラエルの科学者は、フロリダのオキーチョビー湖の有毒藻類を抑えるのを助けるために持ち込まれました。 @jerusalem_post経由。 https://t.co/atdgg6jres | 0.00074861257 | 0.013163705 | 0.55591127109817 | 0.489181017595289 |
推論:ツイートは、最初にトークン化、停止単語、hastags、ユーザー名などを削除し、グローブTwitter-25埋め込みを使用してベクターに埋め込まれたことによって前処理されます。 4つの類似点 - コサイン、ソフトコサイン、WMD(ワードモーバー距離)、およびWMDリラックスは、ツイートとフィルターキーワードを含むクエリの間で計算されます。見られるように、COSINEおよびソフトな類似性メトリックと比較して、WMDとWMD-Relaxの場合のクエリとツイートの間の類似性が増加します。
その後、疑わしい場所は、Sentinel-3衛星データを使用して分析され、フラグ付きの水域が藻類の花に苦しんでいるかどうかを判断します。画像の各ピクセルのデータ指標を定量化するために、さまざまな画像処理手法とインデックスが実装されています。
このWebAppは、ApacheサーバーのGCPに展開されています。技術には、PHPコア環境からの社内Python機能呼び出し、API要求の管理、タイムリーな機能の更新による展開の維持などがあります。
ここでプロジェクトチャネルに参加してください:
問題を提起し、既存の問題を修正してください。詳細については、私たちの行動規範に記載されています。