Download de HierarchyTransformers - HierarchyTransformers do download do código -fonte

HierarchyTransformers

Código-Fonte de IA

v0.1.1 - Refactor code and add customised HiT trainer

Baixar

Projeto | Huggingface | arxiv | Zenodo

Incorporar hierarquias com modelos de idiomas.

Notícias (Changelog)?

Refactor Código e adicione o treinador de sucesso personalizado ( v0.1.1 ).
Desenvolvimento significativo para se alinhar com sentence-transformers>=3.4.0.dev0 ( v0.1.0 ).
A página do projeto já está disponível (clique).
A liberação inicial deve funcionar com sentence-transformers<3.0.0 ) e correção de bug. ( v0.0.3 )

Sobre

O transformador de hierarquia (HIT) é uma estrutura que permite que os modelos de linguagem baseados em codificadores de transformadores (LMS) aprendam estruturas hierárquicas no espaço hiperbólico. A idéia principal é construir uma bola Poincaré que circunscreve diretamente o espaço que incorpora a saída do LMS, alavancando a expansão exponencial do espaço hiperbólico para organizar incorporações de entidades hierarquicamente. Além de apresentar essa estrutura (consulte o código no Github), estamos comprometidos com o treinamento e a liberação de modelos de sucesso em vários hierachiies. Os modelos e conjuntos de dados estarão acessíveis no HuggingFace.

Instalação

Principais dependências

Este repositório segue um layout semelhante à biblioteca sentence-transformers . O modelo principal estende diretamente a arquitetura do transformador de frases. Também utilizamos deeponto para extrair hierarquias dos dados de origem e construir conjuntos de dados a partir de hierarquias, e geoopt para aritmética no espaço hiperbólico.

A liberação atual de sentence-transformers=3.3.1 contém bugs durante a avaliação, que foram corrigidos em seu github dev versão sentence-transformers=3.4.0.dev0 , atualize a dependência manualmente até que o 3.4.0 oficial seja lançado.

Instale a partir de Pypi

 # requiring Python>=3.9
pip install hierarchy_transformers

Instale no github

pip install git+https://github.com/KRR-Oxford/HierarchyTransformers.git

Hub de huggingface

Nossos modelos de sucesso e conjuntos de dados são lançados no HUGGINGFACE HUB.

Comece

 from hierarchy_transformers import HierarchyTransformer

# load the model
model = HierarchyTransformer . from_pretrained ( 'Hierarchy-Transformers/HiT-MiniLM-L12-WordNetNoun' )

# entity names to be encoded.
entity_names = [ "computer" , "personal computer" , "fruit" , "berry" ]

# get the entity embeddings
entity_embeddings = model . encode ( entity_names )

Probing padrão para previsão de subsunção

Use as incorporações da entidade para prever as relações de subsumo entre elas.

 # suppose we want to compare "personal computer" and "computer", "berry" and "fruit"
child_entity_embeddings = model . encode ([ "personal computer" , "berry" ], convert_to_tensor = True )
parent_entity_embeddings = model . encode ([ "computer" , "fruit" ], convert_to_tensor = True )

# compute the hyperbolic distances and norms of entity embeddings
dists = model . manifold . dist ( child_entity_embeddings , parent_entity_embeddings )
child_norms = model . manifold . dist0 ( child_entity_embeddings )
parent_norms = model . manifold . dist0 ( parent_entity_embeddings )

# use the empirical function for subsumption prediction proposed in the paper
# `centri_score_weight` and the overall threshold are determined on the validation set
subsumption_scores = - ( dists + centri_score_weight * ( parent_norms - child_norms ))

Treine seus próprios modelos

Use os scripts de exemplo em nosso repositório para reproduzir modelos existentes e treinar/avaliar seus próprios modelos.

Licença

 Copyright 2023 Yuan He.
All rights reserved.

Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at *<http://www.apache.org/licenses/LICENSE-2.0>*

Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.

Citação

Se você achar útil este repositório ou os modelos lançados, cite nossa publicação:

Yuan ele, Zhangdie Yuan, Jiaoyan Chen, Ian Horrocks. Modelos de idiomas como codificadores de hierarquia. Para aparecer em Neurips 2024. /Arxiv / /neurips /

 @article{he2024language,
  title={Language Models as Hierarchy Encoders},
  author={He, Yuan and Yuan, Zhangdie and Chen, Jiaoyan and Horrocks, Ian},
  journal={arXiv preprint arXiv:2401.11374},
  year={2024}
}

Expandir

Informações adicionais

Versão v0.1.1 - Refactor code and add customised HiT trainer
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-10
tamanho 3.01MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos