Cyanokhoj-это веб-приложение, в котором используется программа «Гражданская наука», отслеживая свои твиты и последующий анализ данных по двигателю Google Earth, направленной на эффективное обнаружение и мониторинг Cyanohab в водоемах по всему миру. Цель состоит в том, чтобы идентифицировать потенциальные зараженные Cyanohab, основанные на анализе данных в Твиттере и извлечении местоположения, а также проанализировать эти местоположения с использованием спутниковых данных в двигателе Google Earth.
Это делается путем соскабливания твитов в реальном времени и фильтрации их на основе ключевых слов и хэштегов, специфичных для проекта (с использованием методов NLP), которые помогают определить твиты о расцвете водорослей. После этого теги местоположения извлекаются из фильтрованных твитов и геокодируются. Эти местоположения отправляются в Google Map и Google Earth Engine и карту, подчеркивающую потенциальные места Cyanobloom.
Следующие репозитории содержат подробный рабочий процесс и информацию. Задача анализа твитов и извлечение местоположения:
| Твиты | Косинус | Мягкий косинус | Омд | WMD-RELAX |
|---|---|---|---|---|
| Вы можете увидеть две токсичные водные перья и то, что похоже на цветение водорослей посередине из космоса. https://t.co/wqshykyio4 | 0,0012850764 | 0,04648514 | 0,57122673946974 | 0,594367796798155 |
| @Julianamwatson @bergsham @hkrassenstein @realdonaldtrump Oh Crap | 0,0012786512 | 0,046485145 | 0,525980177763364 | 0,514069031544577 |
| @RealdonAldTrump Токсичные красные водоросли цветение больше похоже на это | 0,007476028 | 0,04648514 | 0,68321624849994 | 0,451862241456097 |
| @gwsuperfan @realdonaldtrump, как токсичное цветение водорослей. | 0,008209193 | 0,04648514 | 0,747027618034671 | 0,474957523799558 |
| Израильские ученые, которые специализируются на чистке водорослей из больших водоемов, были привлечены, чтобы помочь обуздать токсичные водоросли в озере Флориды океано. Через @jerusalem_post. https://t.co/atdgg6jres | 0,00074861257 | 0,013163705 | 0,55591127109817 | 0,489181017595289 |
Вывод: твиты сначала предварительно обрабатываются токенизацией, удаляя остановские слова, гастаги, имена пользователей и т. Д. И встроены в векторы с использованием встраивания перчатки Twitter-25 . Четыре сходства - косинус, мягкий косинус, WMD (расстояние с ноглом) и WMD расслабляются между твитами и запросом, содержащим ключевые слова фильтра. Как видно, сходство увеличивается между запросом и твитами в случае WMD и WMD-Relax по сравнению с косинусными показателями и мягкими показателями сходства.
Затем подозреваемые местоположения анализируются с использованием спутниковых данных Sentinel-3, чтобы определить, страдают ли помечаемые водоемы от расцвета водорослей. Различные методы обработки изображений и индексы реализованы для количественной оценки показаний данных в каждом пикселе изображения.
Это веб -приложение было развернуто на GCP на сервере Apache. Технические детали включают в себя собственные вызовы функций Python из среды PHP Core, управление запросами API и поддержание развертывания с помощью своевременных обновлений функций.
Присоединяйтесь к каналу проекта здесь:
Пожалуйста, не стесняйтесь поднимать проблемы и исправлять любые существующие. Более подробную информацию можно найти в нашем кодексе поведения.