Коморан 3.0
Английский | корейский
Коморан выступает за KO Rean Mor Phologicar , который является корейским морфологическим анализатором, воплощенным в Java.
Основные особенности
- Реализовано с чистой Java
- Поскольку он был разработан только как 100% Java, его можно использовать в любой точке среды, где установлен Java.
- Внешняя библиотека независимо
- Нет проблем с зависимостью с внешней библиотекой, использующей только свою собственную библиотеку.
- Легкий вес
- Он также может работать примерно на 50 МБ памяти, обрабатывая обработку самообучения и словаря Trie.
- Легкое использование
- После применения библиотеки вы можете использовать только одну строку в исходном коде для использования морфологического анализатора.
- Легко управлять
- Он состоит из обычного текстового файла, поэтому он очень читабелен и может быть отредактирован немедленно.
- Новые результаты анализа
- В отличие от других морфологических анализаторов, его можно проанализировать в виде пространств, содержащих пространства.
Демонстрация и пример
- Вы можете заранее проверить результаты анализа на сайте Komoran.
- Входное предложение: Корея - демократическая республика.
установка
Пожалуйста, обратитесь к документу «Установка».
Быстрое использование
Пожалуйста, обратитесь к документу: «Следуйте по утреннему анализу за 3 минуты».
Примеры использования
- Пример анализа
- Пример обучения модели
- Пример анализа Spark2 (Scala)
Коморан справочный материал
Это ссылка, предоставленная Shineware, которая разработала Komoran.
- Вы можете увидеть введение Komoran и демонстрацию на домашней странице Shineware.
- Вы можете обратиться к установке Komoran и использовать в официальном документе Komoran.
- Пожалуйста, посетите Komoran Slack и поделитесь тем, как использовать и советы.
Официальные данные обертки
Это официальные данные обертки, разработанные Shineware.
- Вы можете использовать Komoran для Python в Pykomoran.
Другие справочные материалы
Это ссылка, которую сделали пользователи.
- Hyunjoong Kim выпустила версию Python Komoran3py (/lovit/komoran3py).
цитата
@misc{komoran,
author = {Junsoo Shin, Junghwan Park, Geunho Lee},
title = {komoran},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {url{https://github.com/shineware/KOMORAN}}
Справочный документ (2019 ~ 2020)
Домашний тезис
[2020]
- Ву Юн -Хи и Ким Хён -Хи. «Петиция о прогнозировании темах национальной петиции и ответов на основе глубокого обучения». Журнал обработки информации. Программное обеспечение и проектирование данных 9.2 (2020): 45-52.
- Choi Byung -seo, Lee Ik -Hoon и Lee Sang -gu. «Последовательность, сильная в новых словах и ошибках между корейскими морфологическими анализаторами на основе последовательности». 47.1 (2020): 70-77.
- Ли Хён -Сеоп и Ким Джин -Док. «Аналогичная дизайн системы видео рекомендаций с использованием извлеченной морфологии из кластеров больших данных». Корейское информационное и коммуникационное Общество. Тезис 24.2 (2020): 172-178.
[2019]
- Парк Чон и Ким Нам -кеу. «Несколько векторных документов посредством значимого разложения композитных документов». Интеллектуальная информационная исследование 25.3 (2019): 19-41.
- Ан Юнг -Вон, Кан Йе -ми и Ким Гун -Донг. «Изучите предпочтения пользователя в соответствии с типом ответа при разговоре с динамиками ИИ». Конференция Корейского дизайна Общества конференции (2019): 227-228.
- Ву Кёнг -джин и Су -Хён. «Сравнение анализа плесени Hangul в соответствии с типом предложения». Книга конференции Корейского информационного общества (2019): 1388-1390.
- Ким Си -Эун и Ким Мин -су. «Консультирование дизайна чат -бота для выявления эмоций». Процедуры конференции Kiit. 2019.
- Ли Мин -Джунг и Ким Юн -Хён. «Автоматическая классификация типа VOC». Корейское промышленное инженерное общество осенней конференции (2019): 2756-2780.
- Kim Hyun -Ji, et al. «Изменения в социальном восприятии с помощью анализа новостных кадров шизофрении и шизофрении». Корейская литература Информационная общество, журнал 53.4 (2019): 285-307.
- SAE -MI LEE и HONG SOS SOP -GU. «Анализ трендов блокчейна с использованием техники моделирования тем». Корейская информационная и коммуникационная конференция Общества Информации и коммуникации (2019): 44-47.
- Хан Юнг -Хун, гу -хён и Ли Хан -Джу. «Анализ прессы гендерного равенства мужчин и женщин -спортсменов». Журнал Корейского общества социального спорта 78 (2019): 217-229.
- Lee Hyun -seop, et al. «Разработанные слова и системы морфологических экстрактов для анализа ключевых слов». Бар Корейского информационного общества и коммуникации 23.2 (2019): 538-539.
- Yoon Jae -yeon. Сводка обзора продукта с учетом дополнительной информации. 2019. PhD Themis. Школа Сеуульского национального университета.
- Shin Jin -seop, et al. «Сколько я должен сохранить документ? Коллекция академических презентаций Корейского общества информационных наук (2019): 850-852
- Heo kwang -ho, Ko Young -Joogn и Seo Jung -yeon. «Машинный перевод с низким содержанием мультипликации для улучшения перевода языка ресурсов». Книга Корейского конференции Общества информационных наук (2019): 649-651.
- Park Chan -Min, et al. «Корейское решение Эльмо встраиваю решение». Книга Корейского конференции Общества информационных наук (2019): 608-610.
- Choi Min -sung и Ond Hospital. «Сравнение эмоционального анализа модели BI-LSTM в соответствии с качествами морфологии». Процедуры конференции Kiit. 2019.
- Ли в -AH и Ким Хе -Джин. «Анализ исследований тенденций, связанных с внутренним и зарубежным местом с использованием методов добычи текста». Корейское библейское общество 30.2 (2019): 189-209.
- Hong Ki -Hye, и Choi Min -Ji. «Сравнительный анализ школьных тенденций в области социального обеспечения и обучения в области обучения с использованием анализа текстовой сети». Школа социального обеспечения 46 (2019): 25-51.
- Kim, Soohyon, et al. «Майнация текста для экономического анализа». Доступно по адресу SSRN 3405781 (2019).
- Baejin. «Методы написания гуманитарных наук с использованием написания колледжа и больших данных». Литература 143 (2019): 395-421.
- Jung Ji -soo, et al. «Исследование соответствующей системы классификации документов посредством сходства документов». Вещательный инженерный журнал 24.1 (2019): 77-86.
- KO Myung -Hyun, et al. «Исследование названия индивидуального названия для прогнозирования эффективной информации диалога». Вещательный инженерный журнал 24.1 (2019): 58-66.
Зарубежные документы
[2020]
- Jee, H., M. Tamariz и R. Shillcock. «Систематичность смысла, также обнаруженная на корейском языке».
- Парк, Сеунгсу и Манхи Ли. «Артас: автоматическая система анализа трендов исследований для информационной безопасности». Процедуры 35 -го годового симпозиума ACM на прикладных вычислениях. 2020.
- Choi, Nong Suk, Hansung Kim и Dongyoung Sohn. «Картирование социального бедствия: вычислительный подход к пространственно -временному распределению тревоги». Обзор компьютера Social Science (2020): 0894439320914505.
- Джин, Хун и Донг-Вон Джу. «Метод и шаги для диагностики возможности корпоративного банкротства с использованием массовых новостей». Транзакции IEIE на интеллектуальной обработке и вычислениях 9.1 (2020): 13-21.
[2019]
- Хео, Юнсеок, Сангву Кан и Донгён Ю. «Многомодальная нейронная машина с слабо маркированными изображениями». IEEE Access 7 (2019): 54042-54053.
- Нам, Чунг-Хён и Кён-Сик Джанг. «KNE: Метод расширения автоматического словаря с использованием CASES для морфологического анализа». Журнал информационной и коммуникационной конвергенции 17.3 (2019): 191-197.
- Ли, Джуохонг, Донгён Сон и Юн Сук Чой. «Инструмент для пространственно-временного анализа социальной тревоги с данными Twitter». Процедуры 34 -го симпозиума ACM/SIGAPP на прикладных вычислениях. 2019.
- IHM, Sun-Young, Ji-Hye Lee и Young-Ho Park. «Skip-Gram-Kr: корейское слово встраивание для семантической кластеризации». IEEE Access 7 (2019): 39948-39961.
- Kwon, Sunjae, Youngjoong Ko и Jungyun Seo. «Эффективное векторное представление для корейского признания по имени». Письма о распознавании шаблонов 117 (2019): 52-57.
- Ким, Jayong и Y. И Мун. «Гибридное приложение для моделирования для автоматизированной системы оценивания текстов для подростков». Европейская конференция по поиску информации. Springer, Cham, 2019.
- Эдмистон, Даниэль и Тэук Ким. «Внутренняя оценка грамматической информации в вставках Word». (2019).
- Сюй, Гуангхао, Янгджонг Ко и Джунген Сео. «Улучшение перевода нейронной машины путем фильтрации синтетических параллельных данных». Энтропия 21.12 (2019): 1213.
- Kim, Tae-Ho, et al. «Эмоциональное преобразование голоса с использованием многозадачного обучения с текстом в речь». Arxiv Preprint arxiv: 1911.06149 (2019).
- Yoo, Kang Min, Taeuk Kim и Sang-Go Lee. «Не просто царапайте поверхность: улучшение представлений о слов для корейского с Ханджей». Arxiv Preprint Arxiv: 1908.09282 (2019).
- Ли, пел Юп и Мин Хо Рю. «Изучение характеристик онлайн -комментариев и комментаторов с подходами машинного обучения». Телематика и информатика 43 (2019): 101249.
- Jae-yon, Lee и Kim Hyunjoo. «Текстовое устранение Мунхва (культура): случай популярного журнала в 1930-х годах Кореи». Acta Koreana 22.2 (2019).
- Конг, Хезу и Вуджу Ким. «Создание сводных предложений с использованием состязаний регуляризованных автоэкодоров с условным контекстом». Экспертные системы с приложениями 130 (2019): 1-11.
- Джо, Вонкванг и Мюнсун тебя. «Создание политики в области здравоохранения в средствах массовой информации и ее последствия для государственного общения: анализ текста страхования новостей в Южной Корее». Политика здравоохранения 123.11 (2019): 1116-1124.
Справочный документ (2019 ~ 2020)
- X-Project, стремясь развивать науку и технику в общественном участии
- Сравнение отдельных показателей предложений корейским спортивным анализатором
- Добыча текста (добыча текста Иран (01)
- [1 человек] Я сделал дневное приложение ..!
- Текстовая компания приложения приложений
- Корейский морфологический анализатор Komoran
- Давайте сделаем анализ настроений в среде Spark (1)