Por exemplo, o título é: TENCENT QQ2006 POLYPS Integrated Version V4.5b
Após a segmentação do Word: [esta palavra -chave do recurso: integração do TENCENT QQ POLYPS]
E transforme palavras -chave em tópicos especiais e você pode gerar conexões relacionadas para cada página de conteúdo.
Use o componente de segmentação de palavras chinesas CSW
Download: http://www.vgoogle.net/product_csw.asp
Abaixo está o meu código ASP, que é relativamente simples, mas prático
O codecsw obtém toda a saída de resultados da segmentação do Word. Existe um arquivo ASP na montagem. Você pode dizer como obter resultados de segmentação do Word de relance. Não vou entrar em detalhes.
A cópia do código é a seguinte:
fcon = split (htm, "")
fcs = ubund (fcon)
forfci = 0tofcs
iffcimod2 = 0then
fcn = fcn & fcon (fci) & "$ fc^#$" 'eu uso $ fc^#$ para dividir cada segmentação da palavra aqui
outro
fcw = fcw & fcon (fci) e "$ fc^#$"
endif
próximo
fcn = esquerda (fcn, len (fcn) -12) 'remova o primeiro $ fc^#$
fcw = esquerda (fcw, len (fcw) -6) remova o último $ fc^#$
DON = Split (FCN, "$ fc^#$")
Donn = Split (FCW, "$ fc^#$")
DOS = Ubund (DON)
Fordoi = 0todos
fcname = don (doi) 'Obtenha particípio
fcsx = donn (doi) 'Obtenha o atributo do particípio da palavra
'O seguinte é julgar que o particípio está alinhado com os atributos que propus, como substantivos, substantivos, verbos, etc., excluindo números, abacus e palavras conjunistas.
iffcsx = "/b" orfcsx = "/nz" orfcsx = "/n" orfcsx = "/an" orfcsx = "/nx" orfcsx = "/f" orfcsx = "/i" orfcsx = "/l" oufcsx = "/"/" ng "orfcsx ="/nr "orfcsx ="/nns "orfcsx ="/nt "orfcsx ="/nz "orfcsx ="/v "orfcsx ="/vn "orfcsx ="/s "oufcsx =/g"/"então
iflen (fcname)> 1hen
ifinstr (fcname1, fcname & "$") então
outro
iffcname <> "" efcname <> "" então
fcname = substituir (substituir (substituir (acabar (fcname), chr (10), ""), chr (13), ""), chr (10) e chr (13), "") 'remover a palavra quebrar a linha de particípio e inserir a tecla
iflen (fcname)> 1hen
'Esta é a biblioteca de segmentação de palavras. Minha biblioteca de segmentação de palavras tem apenas três campos, ID automática, nome da segmentação de palavras e ID de conteúdo para qual segmentação de palavras pertencem
Setrs = createObject ("adodb.recordset")
sql = "SelectTop1*defcwherefcname = '" e fcname & "'"
Rs.opensql, Conn, 1,3
ifrs.eofthen
Rs.Addnew
endif
rs ("fcname") = fcname
ifinstr (rs ("mid"), "," & id & ",") então
outro
rs ("mid") = rs ("mid") & "," & id & ","
endif
rs.update
rs.close
setrs = nada
'A palavra particípio termina
endif
endif
Response.WritefcName & "(" & fcsx & ") <br>"
mfc = mfc & fcname & ","
endif
fcname1 = fcname1 e fcname & "$"
endif
endif
próximo
'Aqui está adicionando particípio à tabela de conteúdo. Na tabela de conteúdo, eu só adicionei um campo de particípio MFC
Seright (mfc, 1) = "$" thenmfc = esquerda (mfc, len (mfc) -1)
Setrs = createObject ("adodb.recordset")