Básicamente, NK-VEC es una red neuronal integrada con ideas de Word2Vec y tiene la misma tarea que todos los modelos integrados del presente, pero tiene una estructura mucho más simple. A través de la biblioteca NK-Vector, puede usar el modelo NK-VEC para construir el conjunto de vectores de acuerdo con sus propios datos de la manera más simple. Además, el vector NK también le proporciona algunas características y algoritmos útiles utilizados para resolver problemas de PNL.
Lo creé mientras investigaba un gran proyecto en la sala de informática de la Escuela Secundaria Nguyen Khuyen (Da Nang), por lo que NK fue la abreviatura del nombre de la escuela, esta impronta que quería salvar y lo merece.
| Mandíbula | Parámetro | Por ejemplo | Nota |
|---|---|---|---|
| Create_one_hot | <file_url, url_save> | "E: /project/data.txt", "e: /project/onehot.json" | En esto, el predeterminado se filtrará en inglés y caracteres especiales, excepto '_' |
| Create_window_words | <file_url, window_size, url_save> | "E: /project/data.txt", 5, "e: /project/window.txt" | En esto, el valor predeterminado para filtrar la palabra de parada en inglés y caracteres especiales, excepto '_'. Window_size debe ser un número impar |
| tren | <size_output, url_data_one_hot, url_data_window_words, url_save> | 512, "e: /project/onehot.json", "e: /project/window.txt", "e: /project/data_vector.json" | Size_output es el número de dimensiones vectoriales de salida y debe ser más pequeña que la primera dimensión de la entrada vectorial Onehot |
| edificio_vec_sentences | <"doc", url_vecs_of_words, url_save> | "Hola a todos", "e: /project/data_vector.json", "" " | Si URL_SAVE tiene una longitud de cero, entonces el valor predeterminado devuelve el vector sin guardar, si se guarda, deje que el formato JSON - Ejemplo: "E: /project/data_sentence_vector.json" |
| Search_word_similarity | <"Target", url_vecs_of_word, size_result> | "Rey", "e: /project/data_vector.json", 15 | Size_result corresponde al número de palabras con la misma más alta a baja de ser devuelta " |
| Tesorería | <"Target", Type_Distance, Data, K> | [7, 8], 'eculid', puntos, 4 | Ver ejemplos de uso de la función a continuación |
| Vn_segmation_tag | <"Documento"> | "Bienvenido a mi" | Asegúrese de que su versión de nodo sea una versión completa de 10.16.0 o más |
| claro_sentence_vn | <"Documento"> | "Bienvenido a mi" | Aquí su oración vietnamita se filtrará desde la palabra de parada vietnamita a caracteres especiales |
| clare_sentence_en | <"Documento"> | "Bienvenido a mi" | Aquí su oración en inglés se filtrará desde la palabra de parada en inglés a caracteres especiales |
| Remove_duplicate_words | <"Documento"> | "Bienvenido a mi" | Habrá palabras duplicadas en la oración y se usa para inglés y vietnamita |
| Fast_build_chatbot | <"Texto"> | "Qué tiempo hace hoy" | Aquí Bot devolverá una de las etiquetas: Química, General_Asking, Math, Good_Bye, Hola, Introducción, gracias, Ask_Weather, desconocido |
| Sentiment_vn | <"Texto"> | "Hoy es tan sombrío" | Aquí devolverá una de las etiquetas: triste, feliz, frustrado, normal, desconocido, como por ejemplo, el retorno del resultado es una cadena: triste " |
| Fix_telex | <"Texto"> | "Yh thatch Awn Busn Char Cas" | Aquí devolverá el resultado que ha sido Telex, como por ejemplo: me gusta comer Bun Fish Bun |
| Inglés_or_vietnamita | <"Texto"> | "Hola, ¿eh, tú?" | Devolverá el resultado como un objeto que incluye su_text, etiqueta, fix_text escuelas, como por ejemplo {your_text: 'hola, te tono?', Etiqueta: 'inglés', fix_text: 'Hola, ¿cómo estás?' |
| } |
- Instalar node.js
- Ejecutar: npm i nk-vector
let NKV = require ( 'nk-vector' )Ejemplo: use la función de la mandíbula
let NKV = require ( 'nk-vector' )
let points = [
[ 1 , 2 ] ,
[ 3 , 4 ] ,
[ 5 , 6 ] ,
[ 7 , 8 ]
] ;
let nearest = NKV . knn ( [ 7 , 8 ] , 'eculid' , points , 4 ) ;
console . log ( nearest ) ;
/*Result:
[ [ [ 7, 8 ], 0 ],
[ [ 5, 6 ], 8 ],
[ [ 3, 4 ], 32 ],
[ [ 1, 2 ], 72 ] ]
Giải thích kết quả mảng trả về: [<vector trong tập dữ liệu>, <khoảng cách từ vector đầu vào tới vector này>]
*/Ejemplo: use la función edificio_vec_sentences
let NKV = require ( 'nk-vector' )
let sentence = NKV . VN_segmentation_tag ( NKV . clear_sentence_vn ( 'cân bằng phương trình hóa học' ) )
let full_sentence = ''
for ( let word in sentence ) {
full_sentence += sentence [ word ] . replace ( ' ' , '_' ) + ' '
}
if ( full_sentence . length > 0 ) {
console . log ( full_sentence )
console . log ( NKV . build_vec_sentences ( full_sentence . trim ( ) , 'E:/<name_project>/data_vec.json' , '' ) )
}
/*Result:
{"cân_bằng phương_trình hóa học":[0.002338010428122218,...,0,0,0.00111962700489077,0.0009866701202071657,0.00111962700489077,0,0.00111962700489077,0,0,0.0009866701202071657,0,0.0010865777210490053,0,0.0010865777210490053,0,0,0,0,0,0.0009866701202071657,0,0,0,0,0,0,0.0010865777210490053,...0,0.0010865777210490053,...,0]}
*/Ejemplo: use clear_sentence_vn
let NKV = require ( 'nk-vector' )
let clear_sentence = NKV . clear_sentence_vn ( "Chào mừng các bạn lên trên trời, ở đây là trên trời" )
console . log ( clear_sentence ) ;
//Result: chào mừng trời trờiRojo : el error no puede continuar
Amarillo : este es solo un aviso normal, que sigue funcionando
Si encuentra un error que no encuentra el archivo de Word de archivo, busque la línea de error de acuerdo con la ruta en el terminal y revise en:
- Path.Join (__ Dirke, "/src/stop_word.txt"): Deje que la función Clear_Sentence_en
- Path.Join (__ directo, "/src/stop_word_vnt_vn.txt"): para la función clear_sentence_vn
O una ruta de filtro exactamente a tu maneraEste error se notifica al usuario a nivel rojo
Este error ocurre cuando el vocabulario, los caracteres que componen la oración en el filtro de la palabra de parada y los caracteres especiales eliminados durante el proceso de entrenamiento no deberían conducir a ningún vector de estos vocabulario, lo que resulta en que la oración de carga estará vacía y no se construya.
Este error se notifica al usuario con nivel amarillo
¡Gracias por usar NK-Vector, actualizaré nuevos algoritmos regularmente!
Gracias, vnb por desarrollar el paquete Soly Vntk
Búsqueda de código: https://code-search-vni.herokuapp.com/
Antes de que GPT-3 publique la clave para todos, todavía puedo crear un lugar para buscar a Python en la semántica del ejemplo de GPT-3