CyanoKhoj
1.0.0
Cyanokhoj是一个网络应用程序,它通过跟踪其推文以及对Google Earth Engine的随后数据分析来采用公民科学计划,旨在有效的Cyanohab检测和监测世界各地的水体。目的是根据Twitter数据分析和位置提取来鉴定潜在的氰基侵染的位置,并使用Google Earth Engine中的卫星数据进一步分析这些位置。
这是通过将Tweet实时提要刮除并根据项目特定的关键字和主题标签(使用NLP技术)进行过滤完成的,从而可以识别有关藻类开花感染的水体的推文。此后,将位置标签从过滤的推文中提取并进行地理编码。这些位置被发送到Google Map和Google Earth Engine,以及一张地图,突出显示了潜在的Cyanobloom位置。
以下存储库包含详细的工作流程和信息的推文分析和位置提取任务:
| 推文 | 余弦 | 软余弦 | WMD | WMD-Relax |
|---|---|---|---|---|
| 您可以看到两个有毒的水羽,看起来像是藻类在空间中间开花的东西。 https://t.co/wqshykyio4 | 0.0012850764 | 0.04648514 | 0.57122673946974 | 0.594367796798155 |
| @julianamwatson @bergsham @hkrassenstein @realdonaldtrump oh oh prap the Red Algae Bloom Wave有毒,感谢您提供的信息,我将获得漂白剂 | 0.0012786512 | 0.046485145 | 0.525980177763364 | 0.514069031544577 |
| @RealDonaldTrump有毒红藻花更像是它 | 0.007476028 | 0.04648514 | 0.68321624849994 | 0.451862241456097 |
| @gwsuperfan @RealDonaldTrump像有毒的藻类开花一样。 | 0.008209193 | 0.04648514 | 0.747027618034671 | 0.474957523799558 |
| 派出专门从大量水中清洁藻类的以色列科学家被带进来,以帮助遏制佛罗里达湖Okeechobee的有毒藻类。通过@jerusalem_post。 https://t.co/atdgg6jres | 0.00074861257 | 0.013163705 | 0.55591127109817 | 0.489181017595289 |
推理:首先通过令牌化,删除停止单词,Hastags,用户名等来预处理推文,并使用Glove Twitter-25嵌入将其嵌入到向量中。四个相似之处 - 余弦,软余弦,wmd(单词搬运距离)和WMD松弛是在推文和包含过滤器关键字的查询之间计算的。可以看出,与余弦和软相似性指标相比,在WMD和WMD-Relax的情况下,查询和推文之间的相似性增加。
然后,使用Sentinel-3卫星数据对可疑位置进行分析,以确定标记的水体是否患有藻华。实现了各种图像处理技术和索引,以量化图像的每个像素中的数据指示。
此WebApp已在Apache服务器中的GCP上部署。技术性包括来自PHP核心环境的内部Python函数调用,管理API请求并使用及时的功能更新维护部署。
在此处加入项目频道:
请随时提出问题并解决任何现有问题。可以在我们的行为准则中找到更多细节。