Por ejemplo, el título es: TENCENT QQ2006 POLYPS INTEGRADA Versión V4.5B
Después de la segmentación de palabras: [esta palabra clave de recursos: integración de pólipos de tencent QQ]
Y convierta las palabras clave en temas especiales, y puede generar conexiones relacionadas para cada página de contenido.
Use componente de segmentación de palabras chino CSW
Descargar: http://www.vgoogle.net/product_csw.asp
A continuación se muestra mi código ASP, que es relativamente simple, pero práctico
CodecSW obtiene todos los resultados de segmentación de palabras. Hay un archivo ASP en el ensamblaje. Puede saber cómo obtener resultados de segmentación de palabras de un vistazo. No entraré en detalles.
La copia del código es la siguiente:
fcon = split (htm, "")
fcs = ubund (fcon)
forfci = 0TOFCS
iffcimod2 = 0then
fcn = fcn & fcon (fci) y "$ fc^#$" 'Uso $ fc^#$ para dividir cada segmentación de palabras aquí
demás
fcw = fcw & fcon (fci) y "$ fc^#$"
endif
próximo
fcn = izquierda (fcn, len (fcn) -12) 'Eliminar el primer $ fc^#$
fcw = izquierda (fcw, len (fcw) -6) Elimine el último $ fc^#$
Don = Split (fcn, "$ fc^#$")
donn = split (fcw, "$ fc^#$")
dos = ubund (don)
Fordoi = 0Todos
fcname = don (doi) 'Obtener participio
fcsx = donn (doi) 'Obtenga el atributo de participio de la palabra
'Lo siguiente es juzgar que el participio está en línea con los atributos que he propuesto, como sustantivos, sustantivos, verbos, etc., excluyendo números, ámbitos y palabras de conjunción.
iffcsx = "/b" orfcsx = "/nz" orfcsx = "/n" orfcsx = "/an" orfcsx = "/nx" orfcsx = "/f" orfcsx = "/i" orfcsx = "/l" ofcsx = "/" ng "orfcsx ="/nr "orfcsx ="/nns "orfcsx ="/nt "orfcsx ="/nz "orfcsx ="/v "orfcsx ="/vn "orfcsx ="/s "ofcsx ="/g "luego
iflen (fcname)> 1
ifinstr (fcname1, fcname y "$") entonces
demás
iffcname <> "" yfcname <> "" entonces
fcname = reemplazar (reemplazar (reemplazar (trim (fcname), chr (10), ""), chr (13), ""), chr (10) y chr (13), ") 'Eliminar la línea de la línea del participio de la palabra e ingresar la tecla
iflen (fcname)> 1
'Esta es la biblioteca de segmentación de palabras. Mi biblioteca de segmentación de palabras tiene solo tres campos, identificación automática, nombre de segmentación de palabras e ID de contenido a la que pertenece la segmentación de palabras
SetRS = createObject ("ADODB.RecordSet")
sql = "selectTop1*fromfcwherefcname = '" & fcname & "'"
Rs.opensql, Conn, 1,3
IFRS.EOFTHEN
Rs.addnew
endif
rs ("fcname") = fcname
ifinstr (rs ("medio"), "," & id & ",") entonces
demás
RS ("Mid") = RS ("Mid") & "," & id & ",", "
endif
rs.
rs.
SETRS = nada
'La palabra participio termina
endif
endif
Response.Writefcname & "(" & fcsx & ") <br>"
mfc = mfc & fcname & ",",
endif
fcname1 = fcname1 & fcname y "$"
endif
endif
próximo
'Aquí está agregando participio a la tabla de contenido. En la tabla de contenido, solo agregué un campo de participio MFC
ifright (mfc, 1) = "$" thenmfc = izquierda (mfc, len (mfc) -1)
SetRS = createObject ("ADODB.RecordSet")