Cyanokhoj es una aplicación web que emplea el Programa de Ciencias Ciudadanas mediante el seguimiento de sus tweets y el análisis de datos posterior en Google Earth Engine, dirigido a una detección y monitoreo efectivos de Cyanohab en cuerpos de agua de todo el mundo. El objetivo es identificar posibles ubicaciones infestadas de cianohab basadas en el análisis de datos de Twitter y la extracción de ubicación y analizar aún más estas ubicaciones utilizando datos satelitales en Google Earth Engine.
Esto se realiza raspando tweets en tiempo real y filtrándolos en función de las palabras clave y hashtags específicos del proyecto (utilizando técnicas de PNL) que ayudan a identificar tweets sobre los cuerpos de agua infestados de la floración de algas. Posteriormente, las etiquetas de ubicación se extraen de los tweets filtrados y se geocodifican. Estas ubicaciones se envían a Google Map y Google Earth Engine y un mapa que destaca las posibles ubicaciones de Cyanobloom.
Los siguientes repositorios contienen flujo de trabajo e información detallados La tarea de análisis de tweets y extracción de ubicación:
| Tweets | Coseno | Coseno suave | WMD | WMD-Relax |
|---|---|---|---|---|
| Puedes ver dos de las columnas de agua tóxica y lo que parece una floración de algas en el medio desde el espacio. https://t.co/wqshykyio4 | 0.0012850764 | 0.04648514 | 0.57122673946974 | 0.594367796798155 |
| @Julianamwatson @bergsham @hkrassenstein @realDonaldTrump oh mierda Las algas rojas Bloom Wave The Toxic. | 0.0012786512 | 0.046485145 | 0.525980177763364 | 0.514069031544577 |
| @realDonaldTrump Bloom de algas rojas tóxicas es más parecido | 0.007476028 | 0.04648514 | 0.68321624849994 | 0.451862241456097 |
| @GWSuperfan @realDonaldTrump como una floración de algas tóxicas. | 0.008209193 | 0.04648514 | 0.747027618034671 | 0.474957523799558 |
| Los científicos israelíes que se especializan en la limpieza de algas de grandes cuerpos de agua fueron traídos para ayudar a frenar las algas tóxicas en el lago Okeechobee de Florida. Via @Jerusalem_Post. https://t.co/atdgg6jres | 0.00074861257 | 0.013163705 | 0.55591127109817 | 0.489181017595289 |
Inferencia: los tweets se preprocesan primero mediante la tokenización, eliminando las palabras de detención, los aceleras, los nombres de usuarios, etc. e incrustados a los vectores utilizando la incrustación de Glove Twitter-25 . Se calculan cuatro similitudes: coseno, coseno suave, WMD (distancia de mudanzas de palabras) y relajación de WMD entre los tweets y la consulta que contiene las palabras clave del filtro. Como se pudo ver los aumentos de similitud entre la consulta y los tweets en caso de WMD y WMD-Relax en comparación con las métricas de coseno y similitud suave.
Las ubicaciones sospechosas se analizan luego utilizando los datos de satélite Sentinel-3 para determinar si los cuerpos de agua marcados sufren de una floración de algas. Se implementan varias técnicas e índices de procesamiento de imágenes para cuantificar las indicaciones de datos en cada píxel de la imagen.
Esta aplicación web se ha implementado en GCP en el servidor Apache. Los tecnicismos incluyen llamadas a la función de Python interna del entorno PHP Core, la gestión de solicitudes de API y el mantenimiento de la implementación con actualizaciones de funciones oportunas.
Únase al canal del proyecto aquí:
No dude en plantear problemas y solucionar los existentes. Se pueden encontrar más detalles en nuestro código de conducta.