nlprule nlprule

nlprule

ซอร์สโค้ดอื่น ๆ

Release 0.6.4

ดาวน์โหลด

nlprule

การประมวลผลภาษาธรรมชาติที่รวดเร็วและมีทรัพยากรต่ำและห้องสมุดการแก้ไขข้อผิดพลาดที่เขียนด้วยสนิม NLPRULE ใช้วิธีการตามกฎและการค้นหาตาม NLP โดยใช้ทรัพยากรจาก Languagetool

การใช้ Python

ติดตั้ง: pip install nlprule

ใช้:

 from nlprule import Tokenizer , Rules

tokenizer = Tokenizer . load ( "en" )
rules = Rules . load ( "en" , tokenizer )

 rules . correct ( "He wants that you send him an email." )
# returns: 'He wants you to send him an email.'

rules . correct ( "I can due his homework." )
# returns: 'I can do his homework.'

for s in rules . suggest ( "She was not been here since Monday." ):
    print ( s . start , s . end , s . replacements , s . source , s . message )
# prints:
# 4 16 ['was not', 'has not been'] WAS_BEEN.1 Did you mean was not or has not been?

 for sentence in tokenizer . pipe ( "A brief example is shown." ):
    for token in sentence :
        print (
            repr ( token . text ). ljust ( 10 ),
            repr ( token . span ). ljust ( 10 ),
            repr ( token . tags ). ljust ( 24 ),
            repr ( token . lemmas ). ljust ( 24 ),
            repr ( token . chunks ). ljust ( 24 ),
        )
# prints:
# 'A'        (0, 1)     ['DT']                   ['A', 'a']               ['B-NP-singular']       
# 'brief'    (2, 7)     ['JJ']                   ['brief']                ['I-NP-singular']       
# 'example'  (8, 15)    ['NN:UN']                ['example']              ['E-NP-singular']       
# 'is'       (16, 18)   ['VBZ']                  ['be', 'is']             ['B-VP']                
# 'shown'    (19, 24)   ['VBN']                  ['show', 'shown']        ['I-VP']                
# '.'        (24, 25)   ['.', 'PCT', 'SENT_END'] ['.']                    ['O']

การใช้สนิม

การตั้งค่าที่แนะนำ:

Cargo.toml

[ dependencies ]
nlprule = " <version> "

[ build-dependencies ]
nlprule-build = " <version> " # must be the same as the nlprule version!

build.rs

 fn main ( ) -> Result < ( ) , nlprule_build :: Error > {
    println ! ( "cargo:rerun-if-changed=build.rs" ) ;

    nlprule_build :: BinaryBuilder :: new (
        & [ "en" ] ,
        std :: env :: var ( "OUT_DIR" ) . expect ( "OUT_DIR is set when build.rs is running" ) ,
    )
    . build ( ) ?
    . validate ( )
}

src/main.rs

 use nlprule :: { Rules , Tokenizer , tokenizer_filename , rules_filename } ;

fn main ( ) {
    let mut tokenizer_bytes : & ' static [ u8 ] = include_bytes ! ( concat! (
        env! ( "OUT_DIR" ) ,
        "/" ,
        tokenizer_filename! ( "en" )
    ) ) ;
    let mut rules_bytes : & ' static [ u8 ] = include_bytes ! ( concat! (
        env! ( "OUT_DIR" ) ,
        "/" ,
        rules_filename! ( "en" )
    ) ) ;

    let tokenizer = Tokenizer :: from_reader ( & mut tokenizer_bytes ) . expect ( "tokenizer binary is valid" ) ;
    let rules = Rules :: from_reader ( & mut rules_bytes ) . expect ( "rules binary is valid" ) ;

    assert_eq ! (
        rules . correct ( "She was not been here since Monday." , & tokenizer ) ,
        String :: from ( "She was not here since Monday." )
    ) ;
}

nlprule และ nlprule-build จะถูกเก็บไว้ในการซิงค์

คุณสมบัติหลัก

การแก้ไขข้อผิดพลาดทางไวยากรณ์ตามกฎผ่านกฎหลายพันกฎ
ไปป์ไลน์การประมวลผลข้อความที่ทำเซ็กเมนต์ประโยคการติดแท็กส่วนหนึ่งของการพูดการเลมมาตาเมชั่นการถ่ายทำและความไม่ลงรอยกัน
สนับสนุนภาษาอังกฤษเยอรมันและสเปน
การสะกดคำ ( อยู่ระหว่างดำเนินการ )

เป้าหมาย

สถานที่เดียวที่จะใช้การตรวจการสะกดคำและการแก้ไขข้อผิดพลาดทางไวยากรณ์สำหรับงานดาวน์สตรีม
NLP ที่รวดเร็วและทรัพยากรต่ำเหมาะสำหรับการวิ่ง:
1. เป็นขั้นตอนก่อน / หลังการประมวลผลสำหรับแนวทางที่ซับซ้อนมากขึ้น (เช่น ML)
2. ในพื้นหลังของแอปพลิเคชันอื่นที่มีค่าใช้จ่ายต่ำ
3. ฝั่งไคลเอ็นต์ในเบราว์เซอร์ผ่าน WebAssembly
รหัสสนิม 100% และการพึ่งพา

เปรียบเทียบกับ languagetool

	\| กฎ disambiguation \|	\| กฎไวยากรณ์ \|	เวอร์ชัน LT	เวลา nlprule	เวลาภาษา
ภาษาอังกฤษ	843 (100%)	3725 (~ 85%)	5.2	1	1.7 - 2.0
ชาวเยอรมัน	486 (100%)	2970 (~ 90%)	5.2	1	2.4 - 2.8
เกี่ยวกับภาษาสเปน	การสนับสนุนการทดลอง ยังไม่ได้ทดสอบอย่างเต็มที่

ดูปัญหามาตรฐานสำหรับรายละเอียด

โครงการที่ใช้ NLPRULE

PROSEMD: เซิร์ฟเวอร์การพิสูจน์อักษรและผ้าสำลีสำหรับไฟล์ Markdown ด้วยการรวม VSCODE
การเก็บสินค้าแบบ spellcheck: เครื่องมือในการตรวจสอบเอกสารสนิมทั้งหมดของคุณสำหรับการสะกดคำและความผิดพลาดไวยากรณ์

กรุณาส่ง PR เพื่อเพิ่มโครงการของคุณ!

กิตติกรรมประกาศ

เครดิตทั้งหมดสำหรับทรัพยากรที่ใช้ใน NLPRULE ไปที่ Languagetool ที่ใช้ความพยายามของ Herculean ในการสร้างทรัพยากรคุณภาพสูงสำหรับการแก้ไขข้อผิดพลาดทางไวยากรณ์และ NLP ที่กว้างขึ้น

ใบอนุญาต

NLPRULE ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT หรือใบอนุญาต Apache-2.0 ตามตัวเลือกของคุณ

NLPRULE BINARIES ( *.bin ) มาจาก Languagetool V5.2 และได้รับใบอนุญาตภายใต้ใบอนุญาต LGPLV2.1 NLPRULE แบบคงที่และเชื่อมโยงไปยังไบนารีเหล่านี้แบบคงที่และแบบไดนามิก ภายใต้ LGPLV2.1 §6 (a) สิ่งนี้ไม่มีผลกระทบใด ๆ กับใบอนุญาตของ NLPRULE เอง

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน Release 0.6.4
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-15
ขนาด 137.46KB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด