ตัวอย่างเช่นชื่อเรื่องคือ: Tencent QQ2006 Polyps Integrated Version V4.5B
หลังจากการแบ่งส่วนคำ: [คำหลักทรัพยากรนี้: การรวม Tencent QQ Polyps]
และสร้างคำหลักในหัวข้อพิเศษและคุณสามารถสร้างการเชื่อมต่อที่เกี่ยวข้องสำหรับแต่ละหน้าเนื้อหา
ใช้องค์ประกอบการแบ่งส่วนคำภาษาจีน CSW
ดาวน์โหลด: http://www.vgoogle.net/product_csw.asp
ด้านล่างนี้เป็นรหัส ASP ของฉันซึ่งค่อนข้างง่าย แต่ใช้งานได้จริง
CodecSW ได้รับผลลัพธ์การแบ่งส่วนคำทั้งหมด มีไฟล์ ASP ในแอสเซมบลี คุณสามารถบอกได้ว่าจะได้รับผลการแบ่งส่วนคำอย่างรวดเร็ว ฉันจะไม่เข้าไปดูรายละเอียด
การคัดลอกรหัสมีดังนี้:
fCon = split (htm, "")
fcs = ubund (fcon)
forfci = 0tofcs
iffcimod2 = 0 แล้ว
fcn = fcn & fcon (fci) & "$ fc^#$" 'ฉันใช้ $ fc^#$ เพื่อแบ่งการแบ่งส่วนคำแต่ละคำที่นี่
อื่น
fcw = fcw & fcon (fci) & "$ fc^#$"
endif
ต่อไป
fcn = ซ้าย (fcn, len (fcn) -12) 'ลบ $ fc^#$ แรก
fcw = ซ้าย (fcw, len (fcw) -6) ลบ $ fc^#$ สุดท้าย
don = split (fcn, "$ fc^#$")
donn = split (fcw, "$ fc^#$")
dos = ubund (ดอน)
fordoi = 0todos
fcname = don (doi) 'รับตำแหน่ง
fcsx = donn (doi) 'รับแอตทริบิวต์คำนาม
'ต่อไปนี้คือการตัดสินว่าคำกริยานั้นสอดคล้องกับคุณลักษณะที่ฉันเสนอเช่นคำนามคำนามคำกริยา ฯลฯ ไม่รวมตัวเลข abacus และคำร่วมกัน
iffcsx = "/b" orfcsx = "/nz" orfcsx = "/n" orfcsx = "/orfcsx ="/nx "orfcsx ="/f "orfcsx ="/i "orfcsx ="/l "orfcsx ="/"/"/ ng "orfcsx ="/nr "orfcsx ="/nns "orfcsx ="/nt "orfcsx ="/nz "orfcsx ="/v "orfcsx ="/vn "orfcsx ="/s "orfcsx ="/g "
iflen (fcname)> 1 จากนั้น
ifinstr (fcname1, fcname & "$") จากนั้น
อื่น
iffcname <> "" และ fcname <> ""
fcname = แทนที่ (แทนที่ (แทนที่ (trim (fcname), chr (10), ""), chr (13), ""), chr (10) & chr (13)
iflen (fcname)> 1 จากนั้น
'นี่คือไลบรารีการแบ่งส่วนคำ ไลบรารีการแบ่งส่วนคำของฉันมีเพียงสามฟิลด์ ID อัตโนมัติชื่อการแบ่งส่วนคำและรหัสเนื้อหาซึ่งการแบ่งส่วนคำของคำ
setRs = createObject ("ADODB.RecordSet")
sql = "selecttop1*fromfcwherefcname = '" & fcname & "'
Rs.opensql, Conn, 1,3
ifrs.eofthen
Rs.Addnew
endif
rs ("fcname") = fcname
ifinstr (rs ("mid"), ",", "& id &", ")
อื่น
RS ("mid") = rs ("mid") & "," & id & ","
endif
Rs.update
Rs.close
setrs = ไม่มีอะไร
'คำว่าคำกริยาสิ้นสุดลง
endif
endif
response.writefcname & "(" & fcsx & ") <br>"
mfc = mfc & fcname & ","
endif
fcname1 = fcname1 & fcname & "$"
endif
endif
ต่อไป
'นี่คือการเพิ่มคำกริยาลงในตารางเนื้อหา ในตารางเนื้อหาฉันได้เพิ่ม MFC ภาคพื้นดินเพียงหนึ่งเดียว
ifright (mfc, 1) = "$" thenmfc = ซ้าย (mfc, len (mfc) -1)
setRs = createObject ("ADODB.RecordSet")