Use tecnología Golang+Goleveldb
Sistema de base de datos Xiaobai incorporado (sistema de base de datos de índice de texto completo a nivel de texto), "Índice de texto completo" incorporado, sin necesidad de segmentación de diccionario, pero nunca hay palabras que no se pueden buscar.
La investigación se ha mejorado gradualmente y mejoró con el "motor de búsqueda de Tripitaka de Qianlong" original y el "motor de búsqueda de Siku Quanshu".
Se puede utilizar para organizar una gran cantidad de información y tiene una función de búsqueda a nivel de nivel de texto.
También se puede usar solo como intermediario de búsqueda, como: búsqueda de sitios;
La tecnología de segmentación de palabras transversal desarrollada de forma independiente, una tecnología innovadora para los motores de búsqueda, no requiere segmentación de vocabulario, y la tasa de éxito de búsqueda es del 100%.
Thesaurus es el núcleo de los motores de búsqueda. La palabra segmentación es los ojos de los motores de búsqueda. Sin ojos, no puedes ver nada y no buscar nada.
Sin embargo, la base de datos de vocabulario es básicamente difícil de perfeccionar, y es imposible lograr la integridad. Por lo tanto, debe haber algunas palabras que no se pueden buscar.
Especialmente para nuevas palabras, es imposible buscar nuevas palabras por primera vez porque no hay en la biblioteca de vocabulario.
Si no se pueden buscar nuevas palabras, es equivalente a matar la fuerza impulsora de la innovación, especialmente en el campo de comercio electrónico.
Incluso si la gestión de la segmentación de palabras agrega nuevas palabras a la biblioteca lo antes posible, para buscar, es necesario pasar por el recorrido de todos los datos originales para obtener el resultado.
Cuanto mayor sea el volumen de datos del sistema, más cauteloso será agregar nuevas palabras y más lento es el tiempo.
Investigación, abandona el diccionario.
Si la biblioteca de segmentación de la palabra es los ojos de otros motores de búsqueda, este ojo es a simple vista. Los ojos que atraviesan el participio son los ojos celestiales.
Otras técnicas de segmentación de palabras conducirán a la probabilidad de no poder buscar resultados debido a la incompletitud de la base de datos de segmentación de palabras. En otras palabras, la tasa de éxito de la búsqueda es del 100%.
Para dar un ejemplo extremo:
Voltee todo un artículo al revés y busque con las palabras invertidas también.
Otras técnicas de participio de palabras probablemente no puedan buscar nada.
La tasa de éxito de búsqueda es del 100% en la tecnología de segmentación de palabras transversales.
Puede personalizar la granularidad de la búsqueda.
Motores de búsqueda comunes como Google y Baidu, la granularidad de la búsqueda es todo el artículo.
Investigación, puede personalizar a párrafos, oraciones, etc.
Por lo general, la granularidad precisa se define como una oración.
Decenas de miles de millones de datos, respuesta de milisegundos.
Debido a que no hay necesidad de segmentación de palabras y no es necesario analizar la segmentación de palabras, tiene un mayor rendimiento que los motores de búsqueda con otras tecnologías de segmentación de palabras.
Agregue búsquedas en tiempo real en tiempo real.
Los datos de texto de nivel de 10G solo requieren docenas de M de memoria.
Abra el archivo ejecutable del sistema correspondiente y luego ejecútelo.