Descarga de HierarchyTransformers - Descargar el código fuente HierarchyTransformers

HierarchyTransformers

Código Fuente de IA

v0.1.1 - Refactor code and add customised HiT trainer

Descargar

Proyecto | Huggingface | arxiv | Zenodo

Incrustación de jerarquías con modelos de idiomas.

Noticias (ChangeLog)?

Refactor de código y agregue el entrenador de éxito personalizado ( V0.1.1 ).
Desarrollo significativo para alinearse con sentence-transformers>=3.4.0.dev0 ( V0.1.0 ).
La página del proyecto ya está disponible (haga clic).
Liberación inicial (debe funcionar con sentence-transformers<3.0.0 ) y corrección de errores. ( V0.0.3 )

Acerca de

El transformador de jerarquía (HIT) es un marco que permite a los modelos de lenguaje (LMS) basados en el codificador de transformadores para aprender estructuras jerárquicas en el espacio hiperbólico. La idea principal es construir una pelota de Poinctaré que circunscribe directamente el espacio de incrustación de la producción de LMS, aprovechando la expansión exponencial del espacio hiperbólico para organizar las incrustaciones de entidades jerárquicamente. Además de presentar este marco (ver Código en GitHub), estamos comprometidos con la capacitación y la liberación de modelos de éxito en diversas aguas. Los modelos y conjuntos de datos estarán accesibles en Huggingface.

Instalación

Dependencias principales

Este repositorio sigue un diseño similar a la biblioteca sentence-transformers . El modelo principal extiende directamente la arquitectura del transformador de oraciones. También utilizamos deeponto para extraer jerarquías de los datos de origen y construir conjuntos de datos a partir de jerarquías, y geoopt para la aritmética en el espacio hiperbólico.

La liberación actual de sentence-transformers=3.3.1 contiene errores durante la evaluación, que se solucionaron en su versión GitHub Dev sentence-transformers=3.4.0.dev0 , actualice la dependencia manualmente hasta que se lance el oficial 3.4.0 .

Instalar desde PYPI

 # requiring Python>=3.9
pip install hierarchy_transformers

Instalar desde Github

pip install git+https://github.com/KRR-Oxford/HierarchyTransformers.git

Hub Huggingface

Nuestros modelos de éxito y conjuntos de datos se lanzan en el HuB Huggingface.

Empezar

 from hierarchy_transformers import HierarchyTransformer

# load the model
model = HierarchyTransformer . from_pretrained ( 'Hierarchy-Transformers/HiT-MiniLM-L12-WordNetNoun' )

# entity names to be encoded.
entity_names = [ "computer" , "personal computer" , "fruit" , "berry" ]

# get the entity embeddings
entity_embeddings = model . encode ( entity_names )

Probación predeterminada para la predicción de la subsunción

Use los incrustaciones de la entidad para predecir las relaciones de subsunción entre ellos.

 # suppose we want to compare "personal computer" and "computer", "berry" and "fruit"
child_entity_embeddings = model . encode ([ "personal computer" , "berry" ], convert_to_tensor = True )
parent_entity_embeddings = model . encode ([ "computer" , "fruit" ], convert_to_tensor = True )

# compute the hyperbolic distances and norms of entity embeddings
dists = model . manifold . dist ( child_entity_embeddings , parent_entity_embeddings )
child_norms = model . manifold . dist0 ( child_entity_embeddings )
parent_norms = model . manifold . dist0 ( parent_entity_embeddings )

# use the empirical function for subsumption prediction proposed in the paper
# `centri_score_weight` and the overall threshold are determined on the validation set
subsumption_scores = - ( dists + centri_score_weight * ( parent_norms - child_norms ))

Entrena tus propios modelos

Use los scripts de ejemplo en nuestro repositorio para reproducir los modelos existentes y entrenar/evaluar sus propios modelos.

Licencia

 Copyright 2023 Yuan He.
All rights reserved.

Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at *<http://www.apache.org/licenses/LICENSE-2.0>*

Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.

Citación

Si encuentra útil este repositorio o los modelos publicados, cite nuestra publicación:

Yuan He, Zhangdie Yuan, Jiaoyan Chen, Ian Horrocks. Modelos de idiomas como codificadores de jerarquía. Aparecer en Neurips 2024. /Arxiv / /neurips /

 @article{he2024language,
  title={Language Models as Hierarchy Encoders},
  author={He, Yuan and Yuan, Zhangdie and Chen, Jiaoyan and Horrocks, Ian},
  journal={arXiv preprint arXiv:2401.11374},
  year={2024}
}

Expandir

Información adicional

Versión v0.1.1 - Refactor code and add customised HiT trainer
Tipo Código Fuente de IA
Fecha de actualización 2025-09-10
tamaño 3.01MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo