Cyanokhoj é um aplicativo da web que emprega o Programa de Ciência do Cidadão, rastreando seus tweets e subsequente análise de dados no Google Earth Engine, destinado a detecção e monitoramento eficazes de cianohab em corpos de água em todo o mundo. O objetivo é identificar possíveis locais infestados de cianohab com base na análise de dados do Twitter e na extração de localização e analisar ainda mais esses locais usando dados de satélite no Google Earth Engine.
Isso é feito raspando os tweets de feed em tempo real e filtrando-os com base nas palavras-chave e hashtags específicas do projeto (usando técnicas de PNL) que ajudam a identificar tweets sobre os corpos de água infestados de algas. Depois disso, as tags de localização são extraídas dos tweets filtradas e são geocodificadas. Esses locais são enviados ao Google Map e Google Earth Engine e um mapa destacando os possíveis locais de cianogulo.
Os repositórios a seguir contêm fluxo de trabalho e informações detalhadas da análise de análise e extração de tweet:
| Tweets | Cosseno | Cosseno macio | WMD | Wmd-relax |
|---|---|---|---|---|
| Você pode ver duas das plumas de água tóxica e o que parece ser uma alga florescendo no meio do espaço. https://t.co/wqshykyio4 | 0,0012850764 | 0,04648514 | 0,57122673946974 | 0,594367796798155 |
| @Julianamwatson @bergsham @hkrassenstein @realdonaldtrump oh porcaria a alga vermelha onda o tóxico, obrigado pela informação, vou obter o alvejante | 0,0012786512 | 0,046485145 | 0,525980177763364 | 0,514069031544577 |
| @RealDonaldTrump Toxic Red Algas Bloom é mais parecido | 0,007476028 | 0,04648514 | 0,68321624849994 | 0,451862241456097 |
| @GWSUPERFAN @RealDonaldTrump como uma flor de algas tóxicas. | 0,008209193 | 0,04648514 | 0,747027618034671 | 0,474957523799558 |
| Cientistas israelenses especializados em limpeza de algas de grandes corpos de água foram trazidos para ajudar a conter as algas tóxicas no lago Okeechobee, da Flórida. Via @jerusalem_post. https://t.co/atdgg6jres | 0,00074861257 | 0,013163705 | 0,55591127109817 | 0,489181017595289 |
Inferência: Os tweets são primeiro pré-processados pela tokenizando, removendo palavras de parada, hastags, nomes de usuário etc. e incorporados a vetores usando a incorporação do Twitter-25 da luva . Quatro semelhanças - cosseno, cosseno macio, WMD (distância de movimentação de palavras) e WMD Relax são calculados entre os tweets e a consulta que contém as palavras -chave do filtro. Como pode ser visto, a similaridade aumenta entre a consulta e os tweets em caso de WMD e WMD-relax em comparação com as métricas de cosseno e similaridade suave.
Os locais suspeitos são então analisados usando os dados do satélite Sentinel-3 para determinar se os corpos d'água sinalizados estão sofrendo de uma flor de algas. Várias técnicas e índices de processamento de imagens são implementados para quantificar as indicações de dados em cada pixel da imagem.
Este WebApp foi implantado no GCP no servidor Apache. Os técnicos incluem chamadas de função interna do Python do ambiente PHP Core, gerenciamento de solicitações de API e manutenção da implantação com atualizações oportunas de recursos.
Junte -se ao canal do projeto aqui:
Sinta -se à vontade para levantar problemas e corrigir os existentes. Mais detalhes podem ser encontrados em nosso código de conduta.