Download spacy models - spacy models download de código fonte

spacy models

Outro código-fonte

ca_core_news_lg-3.8.0

Baixar

Modelos de Spacy

Este repositório contém lançamentos de modelos para a biblioteca Spacy NLP. Para obter mais informações sobre como baixar, instalar e usar os modelos, consulte a documentação dos modelos.

️ Nota importante: como os modelos podem ser muito grandes e consistir principalmente em dados binários, não podemos simplesmente fornecer -os como arquivos em um repositório do GitHub. Em vez disso, optamos por adicioná -los a lançamentos como arquivos .whl e .tar.gz . Isso nos permite ainda manter um histórico de liberação pública.

Investir rápido

Para instalar um modelo específico, execute o seguinte comando com o nome do modelo (por exemplo, en_core_web_sm ):

python -m spacy download [model]

Diretório de modelos spacy v3.x
Comparação de modelo Spacy V3.x
Diretório de modelos spacy v2.x
Comparação de modelo Spacy V2.x
Notas de liberação individuais

Para os modelos Spacy V1.x, veja aqui.

Convenções de nomeação de modelos

Em geral, Spacy espera que todos os pacotes de modelos sigam a convenção de nomenclatura de [lang]_[name] . Para nossos oleodutos fornecidos, dividimos o nome em três componentes:

Tipo : Recursos de modelo:
- core : um modelo de uso geral com marcação, análise, lemmatização e reconhecimento de entidade nomeado
- dep : apenas marcação, análise e lematização
- ent : apenas reconhecimento de entidade nomeado
- sent : apenas segmentação de frases
Gênero : tipo de texto em que o modelo é treinado (por exemplo, web para texto da web, news para texto de notícias)
Tamanho : Indicador de tamanho do modelo:
- sm : Nenhum vetores de palavras
- md : Tabela de vetor de palavras reduzida com 20k vetores exclusivos para ~ 500k palavras
- lg : Tabela vetorial grande com ~ 500k entradas

Por exemplo, en_core_web_md é um modelo inglês de tamanho médio treinado em texto escrito da web (blogs, notícias, comentários), que inclui um tagger, um analisador de dependência, um lemmatizador, um reconhecedor de entidade nomeado e uma tabela de vetores de palavras com 20k Vetores exclusivos.

Versão do modelo

Além disso, o versão do modelo reflete tanto a compatibilidade com o Spacy quanto a versão do modelo. Uma versão modelo abc se traduz em:

a : versão principal do Spacy . Por exemplo, 2 para spacy v2.x.
b : Versão Minor Spacy . Por exemplo, 3 para spacy v2.3.x.
c : Versão do modelo. Diferente configuração de modelo: por exemplo, de ser treinado em diferentes dados, com diferentes parâmetros, para diferentes números de iterações, com diferentes vetores, etc.

Para uma visão geral detalhada da compatibilidade, consulte a compatibility.json . Esta também é a fonte da verificação de compatibilidade interna da Spacy, realizada quando você executa o comando download .

Suporte para versões mais antigas

Se você estiver usando uma versão mais antiga (v1.6.0 ou abaixo), ainda poderá baixar e instalar os modelos antigos de dentro do Spacy usando python -m spacy.en.download all ou python -m spacy.de.download all . Os arquivos .tar.gz também estão anexados à versão v1.6.0. Para baixar e instalar os modelos manualmente, descompacte o arquivo, solte o diretório contido em spacy/data e carregue o modelo via spacy.load('en') ou spacy.load('de') .

Download de modelos

Para aumentar a transparência e facilitar o uso do Spacy com seus próprios modelos, todos os dados agora estão disponíveis como downloads diretos, organizados em lançamentos individuais. O Spacy 1.7 também suporta a instalação e o carregamento de modelos como pacotes Python . Agora você pode escolher como e onde deseja manter os arquivos de dados e configurar "links de atalho" para carregar modelos por nome de dentro do Spacy. Para mais informações sobre isso, consulte a documentação dos novos modelos.

 # download best-matching version of specific model for your spaCy installation
python -m spacy download en_core_web_sm

# pip install .whl or .tar.gz archive from path or URL
pip install /Users/you/en_core_web_sm-3.0.0.tar.gz
pip install /Users/you/en_core_web_sm-3.0.0-py3-none-any.whl
pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.0.0/en_core_web_sm-3.0.0.tar.gz
pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.0.0/en_core_web_sm-3.0.0-py3-none-any.whl

Carregando e usando modelos

Para carregar um modelo, use spacy.load() com o nome do modelo, um link de atalho ou um caminho para o diretório de dados do modelo.

 import spacy
nlp = spacy . load ( "en_core_web_sm" )
doc = nlp ( u"This is a sentence." )

Você também pode import um modelo diretamente através de seu nome completo e depois chamar seu método load() sem argumentos. Isso também deve funcionar para modelos mais antigos em versões anteriores de Spacy.

 import spacy
import en_core_web_sm

nlp = en_core_web_sm . load ()
doc = nlp ( u"This is a sentence." )

Download manual e instalação

Em alguns casos, você pode preferir baixar os dados manualmente, por exemplo, para colocá -los em um diretório personalizado. Você pode baixar o modelo através do seu navegador a partir dos lançamentos mais recentes ou configurar seu próprio script de download usando o URL do arquivo de arquivo. O arquivo consiste em um diretório de modelo que contém outro diretório com os dados do modelo.

 └── en_core_web_md-3.0.0.tar.gz       # downloaded archive
    ├── setup.py                      # setup file for pip installation
    ├── meta.json                     # copy of pipeline meta
    └── en_core_web_md                # ? pipeline package
        ├── __init__.py               # init for pip installation
        └── en_core_web_md-3.0.0      # pipeline data
            ├── config.cfg            # pipeline config
            ├── meta.json             # pipeline meta
            └── ...                   # directories with component data

Para mais informações e exemplos, consulte a documentação dos modelos.

Spacy v1.x Lançamentos

Data	Modelo	Versão	Dep	Ent	VEC	Tamanho	Licença
`2017-06-06`	`es_core_web_md`	1.0.0	X	X	X	377 MB	CC BY-SA
`2017-04-26`	`fr_depvec_web_lg`	1.0.0	X		X	1,33 GB	CC By-NC
`2017-03-21`	`en_core_web_md`	1.2.1	X	X	X	1 GB	CC BY-SA
`2017-03-21`	`en_depent_web_md`	1.2.1	X	X		328 MB	CC BY-SA
`2017-03-17`	`en_core_web_sm`	1.2.0	X	X	X	50 mb	CC BY-SA
`2017-03-17`	`en_core_web_md`	1.2.0	X	X	X	1 GB	CC BY-SA
`2017-03-17`	`en_depent_web_md`	1.2.0	X	X		328 MB	CC BY-SA
`2016-05-10`	`de_core_news_md`	1.0.0	X	X	X	645 MB	CC BY-SA
`2016-03-08`	`en_vectors_glove_md`	1.0.0			X	727 MB	CC BY-SA

Convenções de nomeação de modelos para modelos V1.x

Tipo : Recursos de modelo (por exemplo, core para modelo de uso geral com vocabulário, sintaxe, entidades e vetores de palavras ou depent apenas para vocabulário, sintaxe e entidades)
Gênero : tipo de texto em que o modelo é treinado (por exemplo, web para texto da web, news para texto de notícias)
Tamanho : Indicador de tamanho do modelo ( sm , md ou lg )

Por exemplo, en_depent_web_md é um modelo inglês de tamanho médio treinado em texto escrito da web (blogs, notícias, comentários), que inclui vocabulário, sintaxe e entidades.

Problemas e relatórios de bugs

Para relatar um problema com um modelo, abra um problema no rastreador de edição do Spacy. Observe que nenhum modelo é perfeito. Como os modelos são estatísticos, seu comportamento esperado sempre incluirá alguns erros . No entanto, erros específicos podem indicar problemas mais profundos com o código de extração ou otimização do recurso de treinamento. Se você encontrar padrões no desempenho do modelo que parecem suspeitos, registre um relatório.

Expandir

Informações adicionais

Versão ca_core_news_lg-3.8.0
Tipo Outro código-fonte
Data da Última Atualização 2025-04-16
tamanho 7.59MB
Vindo de Github

Aplicativos Relacionados

llama models

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
models

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos