Komoran 3.0
Inglés | coreano
Komoran significa Ko Rean Mor Phologicar , que es un analizador morfológico coreano encarnado en Java.
Características principales
- Implementado con Java puro
- Dado que se desarrolló solo como 100% Java, se puede usar en cualquier lugar del entorno donde se instale Java.
- Biblioteca externa independiente
- No hay problema de dependencia con la biblioteca externa utilizando solo su propia biblioteca.
- Peso ligero
- También se puede operar en aproximadamente 50 MB de memoria al manejar el procesamiento de auto unidades y el diccionario TRIE.
- Uso fácil
- Después de aplicar la biblioteca, solo puede usar una línea en el código fuente para usar un analizador morfológico.
- Fácil de administrar
- Se compone de un archivo de texto regular, por lo que es altamente legible y se puede editar de inmediato.
- Nuevos resultados de análisis
- A diferencia de otros analizadores morfológicos, se puede analizar en una forma de espacios que contienen espacios.
Demostración y ejemplo
- Puede verificar los resultados del análisis con anticipación en el sitio de Komoran.
- Frase de entrada: Corea es una república democrática.
instalación
Consulte el documento 'Instalar'.
Uso rápido
Consulte el documento, "Siga el análisis Morner en 3 minutos".
Ejemplos de uso
- Ejemplo de análisis
- Ejemplo de aprendizaje del modelo
- Ejemplo de análisis Spark2 (Scala)
Material de referencia de Komoran
Esta es una referencia proporcionada por Shineware, que desarrolló Komoran.
- Puedes ver la introducción y demostración de Komoran en la página de inicio de Shineware.
- Puede consultar la instalación de Komoran y usar en el documento oficial de Komoran.
- Visite Komoran Slack y comparta cómo usar y consejos.
Datos oficiales de envoltura
Estos son los datos oficiales de envoltura desarrollados por Shineware.
- Puedes usar Komoran para Python en Pykomoran.
Otros materiales de referencia
Esta es una referencia que los usuarios han hecho.
- Hyunjoong Kim ha lanzado la versión Python de Komoran3py (/Lovit/Komoran3py).
cotización
@misc{komoran,
author = {Junsoo Shin, Junghwan Park, Geunho Lee},
title = {komoran},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {url{https://github.com/shineware/KOMORAN}}
Documento de referencia (2019 ~ 2020)
Tesis doméstica
[2020]
- Woo yun -hee y kim hyun -hee. "Petición de predicción de temas de petición nacional y respuestas basadas en el aprendizaje profundo". Revista de procesamiento de información. Ingeniería de software y datos 9.2 (2020): 45-52.
- Choi Byung -Seo, Lee Ik -hoon y Lee Sang -gu. "Una secuencia sólida en nuevas palabras y espaciamiento de errores a analizadores coreanos basados en la secuencia". 47.1 (2020): 70-77.
- Lee Hyun -seop y Kim Jin -deok. "Diseño de sistema de recomendación de video similar utilizando la morfología extraída de los grupos de big data". Tesis de la Sociedad de Información y Comunicación Coreana 24.2 (2020): 172-178.
[2019]
- Park Jong -in y Kim Nam -kyu. "Múltiples documentos vectoriales a través de la descomposición significativa de documentos compuestos". Inteligent Information Research 25.3 (2019): 19-41.
- Ahn Jung -won, Kang Ye -Mi y Kim Gun -Dong. "Estudie sobre preferencia del usuario de acuerdo con el tipo de respuesta al hablar con los altavoces de IA". Conferencia de la Sociedad de Diseño de Corea (2019): 227-228.
- Woo kyung -jin y soo -hyun. "Comparación del análisis de moho de Hangul según el tipo de oración". The Korean Information Science Society Conference Book (2019): 1388-1390.
- Kim Si -eun y Kim min -Soo. "Consejar el diseño de chatbot para identificar las emociones". Procedimientos de la Conferencia Kiit. 2019.
- Lee Min -Jung y Kim Yong -hyun. "Clasificación automática de tipo VOC". La Conferencia de Otoño de la Sociedad de Ingeniería Industrial de Corea (2019): 2756-2780.
- Kim Hyun -Ji, et al. "Cambios en la percepción social a través del análisis del marco de noticias de la esquizofrenia y la esquizofrenia". Korean Literature Information Society Journal 53.4 (2019): 285-307.
- Sae -Mi Lee y Hong pronto -gu. "Análisis de tendencias de blockchain utilizando la técnica de modelado de temas". El Libro de Conferencias ICT de las TIC de la Sociedad de Información y Comunicación de Corea (2019): 44-47.
- Han Jung -hoon, Gu So -hyun y Lee Han -Joo. "Análisis de prensa de la igualdad de género de los atletas de hombres y mujeres". Journal of the Korean Society of Social Sports 78 (2019): 217-229.
- Lee Hyun -seop, et al. "Palabras diseñadas y sistemas de extracto morfológico para el análisis de palabras clave". Bar 23.2 de la Sociedad de Información y Comunicación de Corea 23.2 (2019): 538-539.
- Yoon Jae -yeon. Técnica de resumen de revisión del producto considerando información adicional. 2019. PhD Themis. Escuela de Graduados de la Universidad Nacional de Seúl.
- Shin Jin -seop, et al. "¿Cuánto debo preservar el documento? La recopilación de presentación académica de la Sociedad de Ciencias de la Información de Corea (2019): 850-852
- Heo Kwang -ho, Ko Young -Joong y Seo Jung -yeon. "Traducción automática de baja lengua-lenguaje para mejorar la traducción del lenguaje de recursos". The Korean Information Science Society Conference Book (2019): 649-651.
- Park Chan -min, et al. "Decisión de ELMO coreano incrustando". The Korean Information Science Society Conference Book (2019): 608-610.
- Choi Min -Sung y Ond Hospital. "Comparación del análisis emocional del modelo BI-LSTM de acuerdo con las cualidades de la morfología". Procedimientos de la Conferencia Kiit. 2019.
- Lee en -Ah y Kim Hye -jin. "Análisis de tendencias de investigación relacionadas con el lugar nacional y extranjero utilizando técnicas de minería de texto". Corea Biblia Society 30.2 (2019): 189-209.
- Hong Ki -hye, y Choi min -ji. "Análisis comparativo del bienestar social escolar y las tendencias de investigación de bienestar educativo utilizando el análisis de la red de texto". Escuela Social Bienestar 46 (2019): 25-51.
- Kim, Soohyon, et al. "Minería de texto para análisis económico". Disponible en SSRN 3405781 (2019).
- BaeJin. "Métodos de escritura de humanidades utilizando escritura universitaria y big data". Literatura 143 (2019): 395-421.
- Jung Ji -Soo, et al. "Investigación sobre el sistema de clasificación de documentos relevante a través de la similitud de documentos". Broadcasting Engineering Journal 24.1 (2019): 77-86.
- Ko Myung -hyun, et al. "Investigación sobre el nombre del nombre individual para predecir la información eficiente del diálogo". Broadcasting Engineering Journal 24.1 (2019): 58-66.
Periódicos en el extranjero
[2020]
- Jee, H., M. Tamariz y R. Shillcock. "La sistematicidad de sonido significativo también se encuentra en el idioma coreano".
- Park, Seungsoo y Manhee Lee. "ARTAS: Sistema de análisis de tendencias de investigación automática para la seguridad de la información". Procedimientos del 35º Simposio ACM anual sobre computación aplicada. 2020.
- Choi, Nong Suk, Hansung Kim y Dongyoung Sohn. "Mapeo de angustia social: un enfoque computacional para la distribución espacio -temporal de la ansiedad". Social Science Computer Review (2020): 0894439320914505.
- Jin, Hoon y Dong-Won Joo. "Método y pasos para diagnosticar la posibilidad de bancarrota corporativa utilizando noticias masivas". Transacciones de IEIE en Smart Processing & Computing 9.1 (2020): 13-21.
[2019]
- Heo, Yoonseok, Sangwoo Kang y Donghyun Yoo. "Traducción de la máquina neuronal multimodal con imágenes débilmente etiquetadas". IEEE Access 7 (2019): 54042-54053.
- Nam, Chung-Hyeon y Kyung-Sik Jang. "Kne: un método de expansión de diccionario automático que utiliza casos de uso para el análisis morfológico". Journal of Information and Communication Convergence Engineering 17.3 (2019): 191-197.
- Lee, Joohong, Dongyoung Sohn y Yong Suk Choi. "Una herramienta para el análisis espacio-temporal de la ansiedad social con los datos de Twitter". Procedimientos del 34º Simposio ACM/SIGAPP en computación aplicada. 2019.
- Ihm, Sun-young, Ji-Hye Lee y Young-Ho Park. "Skip-gram-kr: palabra coreana incrustada para agrupación semántica". IEEE Access 7 (2019): 39948-39961.
- Kwon, Sunjae, Youngjoong Ko y Jungyun Seo. "Representación vectorial efectiva para el reconocimiento coreano nombrado". Letras de reconocimiento de patrones 117 (2019): 52-57.
- Kim, Jayong e Y. Yi Mun. "Una aplicación de modelado híbrido para un sistema automatizado de clasificación de letras para adolescentes". Conferencia europea sobre recuperación de información. Springer, Cham, 2019.
- Edmiston, Daniel y Taeuk Kim. "Evaluación intrínseca de la información gramatical dentro de las incrustaciones de palabras". (2019).
- Xu, Guanghao, Youngjoong Ko y Jungyun Seo. "Mejora de la traducción del automóvil neuronal filtrando datos paralelos sintéticos". Entropy 21.12 (2019): 1213.
- Kim, Tae-Ho, et al. "Conversión de voz emocional utilizando aprendizaje multitarea con texto a voz". Arxiv Preprint ARXIV: 1911.06149 (2019).
- Yoo, Kang Min, Taeuk Kim y Sang-Go Lee. "No solo raye la superficie: mejorando las representaciones de palabras para coreano con Hanja". Arxiv Preprint ARXIV: 1908.09282 (2019).
- Lee, Sang Yup y Min Ho Ryu. "Explorar las características de los comentarios de noticias en línea y los comentaristas con enfoques de aprendizaje automático". Telematics and Informatics 43 (2019): 101249.
- Jae-yon, Lee y Kim Hyunjoo. "La minería de texto de Munhwa (cultura): el caso de una revista popular en Corea de la década de 1930". Acta Koreana 22.2 (2019).
- Kong, Hyesoo y Wooju Kim. "Generación de oraciones resumidas utilizando autoencoders regularizados por adversarios con contexto condicional". Sistemas expertos con aplicaciones 130 (2019): 1-11.
- Jo, Wonkwang y Myoungsoon. "El encuadre de los medios de comunicación de la política de salud y sus implicaciones para la comunicación gubernamental: un análisis de minería de texto de la cobertura de seguro de noticias en Corea del Sur". Política de salud 123.11 (2019): 1116-1124.
Documento de referencia (2019 ~ 2020)
- X-Project, que busca desarrollar ciencia y tecnología en la participación pública
- Comparación del rendimiento separado de las oraciones por el analizador deportivo coreano
- Minería de texto (Irán de minería de texto (01)
- [1 persona] hice una aplicación de diario ..!
- Caso de aplicación de la compañía minera de texto
- Aplicación de analizador morfológico coreano de Komoran
- Hagamos análisis de sentimientos en el entorno Spark (1)