download nlprule - download de código fonte nlprule

nlprule

Outro código-fonte

Release 0.6.4

Baixar

nlPrule

Uma biblioteca de processamento de linguagem e correção de erros rápida e de baixo resistência à resistência escrita em ferrugem. O NLPrule implementa uma abordagem baseada em regra e pesquisa para o PNL usando recursos da LanguageTool.

Uso do Python

Instale: pip install nlprule

Usar:

 from nlprule import Tokenizer , Rules

tokenizer = Tokenizer . load ( "en" )
rules = Rules . load ( "en" , tokenizer )

 rules . correct ( "He wants that you send him an email." )
# returns: 'He wants you to send him an email.'

rules . correct ( "I can due his homework." )
# returns: 'I can do his homework.'

for s in rules . suggest ( "She was not been here since Monday." ):
    print ( s . start , s . end , s . replacements , s . source , s . message )
# prints:
# 4 16 ['was not', 'has not been'] WAS_BEEN.1 Did you mean was not or has not been?

 for sentence in tokenizer . pipe ( "A brief example is shown." ):
    for token in sentence :
        print (
            repr ( token . text ). ljust ( 10 ),
            repr ( token . span ). ljust ( 10 ),
            repr ( token . tags ). ljust ( 24 ),
            repr ( token . lemmas ). ljust ( 24 ),
            repr ( token . chunks ). ljust ( 24 ),
        )
# prints:
# 'A'        (0, 1)     ['DT']                   ['A', 'a']               ['B-NP-singular']       
# 'brief'    (2, 7)     ['JJ']                   ['brief']                ['I-NP-singular']       
# 'example'  (8, 15)    ['NN:UN']                ['example']              ['E-NP-singular']       
# 'is'       (16, 18)   ['VBZ']                  ['be', 'is']             ['B-VP']                
# 'shown'    (19, 24)   ['VBN']                  ['show', 'shown']        ['I-VP']                
# '.'        (24, 25)   ['.', 'PCT', 'SENT_END'] ['.']                    ['O']

Uso da ferrugem

Configuração recomendada:

Cargo.toml

[ dependencies ]
nlprule = " <version> "

[ build-dependencies ]
nlprule-build = " <version> " # must be the same as the nlprule version!

build.rs

 fn main ( ) -> Result < ( ) , nlprule_build :: Error > {
    println ! ( "cargo:rerun-if-changed=build.rs" ) ;

    nlprule_build :: BinaryBuilder :: new (
        & [ "en" ] ,
        std :: env :: var ( "OUT_DIR" ) . expect ( "OUT_DIR is set when build.rs is running" ) ,
    )
    . build ( ) ?
    . validate ( )
}

src/main.rs

 use nlprule :: { Rules , Tokenizer , tokenizer_filename , rules_filename } ;

fn main ( ) {
    let mut tokenizer_bytes : & ' static [ u8 ] = include_bytes ! ( concat! (
        env! ( "OUT_DIR" ) ,
        "/" ,
        tokenizer_filename! ( "en" )
    ) ) ;
    let mut rules_bytes : & ' static [ u8 ] = include_bytes ! ( concat! (
        env! ( "OUT_DIR" ) ,
        "/" ,
        rules_filename! ( "en" )
    ) ) ;

    let tokenizer = Tokenizer :: from_reader ( & mut tokenizer_bytes ) . expect ( "tokenizer binary is valid" ) ;
    let rules = Rules :: from_reader ( & mut rules_bytes ) . expect ( "rules binary is valid" ) ;

    assert_eq ! (
        rules . correct ( "She was not been here since Monday." , & tokenizer ) ,
        String :: from ( "She was not here since Monday." )
    ) ;
}

As versões nlprule e nlprule-build são mantidas em sincronia.

Principais características

Correção de erro gramatical baseado em regras através de várias milhares de regras.
Um pipeline de processamento de texto fazendo segmentação de frases, marcação de parte da fala, lematização, chunking e desambiguação.
Apoio ao inglês, alemão e espanhol.
Verificação ortográfica. ( em andamento )

Metas

Um único local para aplicar a verificação ortográfica e a correção de erro gramatical para uma tarefa a jusante.
NLP rápido e de baixo recurso adequado para corrida:
1. como uma etapa de pré / pós-processamento para abordagens mais sofisticadas (ou seja, ML).
2. no fundo de outro aplicativo com baixa sobrecarga.
3. Lado do cliente no navegador via WebAssembly.
100% Código de ferrugem e dependências.

Comparação com LanguageTool

	\| Regras de desambiguação \|	\| Regras gramaticais \|	LT versão	tempo nlPrule	Tempo de LanguageTool
Inglês	843 (100%)	3725 (~ 85%)	5.2	1	1.7 - 2.0
Alemão	486 (100%)	2970 (~ 90%)	5.2	1	2.4 - 2.8
Espanhol	Suporte experimental. Ainda não foi totalmente testado.

Veja o problema de referência para obter detalhes.

Projetos usando NLPrule

Prosemd: um servidor de linguagem de revisão e linha para arquivos de marcação com integração do VSCode.
Carga-SpellCheck: Uma ferramenta para verificar toda a sua documentação de ferrugem quanto a erros de ortografia e gramática.

Envie um PR para adicionar seu projeto!

Agradecimentos

Todo o crédito pelos recursos utilizados no NLPrule vai para o LinguageTool, que fez um esforço hercúleo para criar recursos de alta qualidade para correção de erros gramaticais e PNL mais ampla.

Licença

O NLPRULE está licenciado sob a licença do MIT ou a licença Apache-2.0, por sua opção.

Os binários NLPRULE ( *.bin ) são derivados da LinguageTool v5.2 e licenciados sob a licença LGPLV2.1. NLPRULE ESTATICAL e dinamicamente se vincula a esses binários. Sob LGPLV2.1 §6 (a), isso não tem nenhuma implicação na licença do próprio NLPrule.

Expandir

Informações adicionais

Versão Release 0.6.4
Tipo Outro código-fonte
Data da Última Atualização 2025-04-15
tamanho 137.46KB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos