Unduh onnxt5 - Unduh Kode Sumber onnxt5

onnxt5

Kode sumber lainnya

ve model

Unduh

Ringkasan, terjemahan, T&J, pembuatan teks dan lebih banyak lagi dengan kecepatan Blazing menggunakan versi T5 yang diimplementasikan dalam ONNX.

Paket ini masih dalam tahap alfa, oleh karena itu beberapa fungsi seperti pencarian balok masih dalam pengembangan.

Instalasi

ONNX-T5 tersedia di PYPI.

pip install onnxt5

Untuk versi dev Anda dapat menjalankan yang berikut.

git clone https://github.com/abelriboulot/onnxt5
cd onnxt5
pip install -e .

Penggunaan

Cara paling sederhana untuk memulai pembuatan adalah dengan menggunakan versi pra-terlatih default dari T5 pada ONNX yang termasuk dalam paket.

Catatan: Harap dicatat bahwa pertama kali Anda menelepon get_encoder_decoder_tokenizer, model sedang diunduh yang mungkin memakan waktu satu atau dua menit.

 from onnxt5 import GenerativeT5
from onnxt5 . api import get_encoder_decoder_tokenizer
decoder_sess , encoder_sess , tokenizer = get_encoder_decoder_tokenizer ()
generative_t5 = GenerativeT5 ( encoder_sess , decoder_sess , tokenizer , onnx = True )
prompt = 'translate English to French: I was a victim of a series of accidents.'

output_text , output_logits = generative_t5 ( prompt , max_length = 100 , temperature = 0. )
# output_text: "J'ai été victime d'une série d'accidents."

Tugas lain hanya perlu mengubah awalan di prompt Anda, misalnya untuk meringkas:

 prompt = 'summarize: <PARAGRAPH>'
output_text , output_logits = generative_t5 ( prompt , max_length = 100 , temperature = 0. )

Jika Anda ingin mendapatkan embeddings teks, Anda dapat menjalankan yang berikut

 from onnxt5 . api import get_encoder_decoder_tokenizer , run_embeddings_text

decoder_sess , encoder_sess , tokenizer = get_encoder_decoder_tokenizer ()
prompt = 'Listen, Billy Pilgrim has come unstuck in time.'
encoder_embeddings , decoder_embeddings = run_embeddings_text ( encoder_sess , decoder_sess , tokenizer , prompt )

Onnxt5 juga memungkinkan Anda mengekspor dan menggunakan model Anda sendiri. Lihat examples folder untuk contoh yang lebih rinci.

T5 bekerja dengan token seperti summarize: , translate English to German: atau question: ... context: . Anda dapat melihat daftar tugas dan token pretrained di Lampiran D dari kertas asli.

Fungsionalitas

Jalankan salah satu tugas terlatih T5 dalam satu baris (terjemahan, ringkasan, analisis sentimen, penyelesaian, generasi)
Ekspor model T5 Anda sendiri ke ONNX dengan mudah
Fungsi utilitas untuk menghasilkan apa yang Anda butuhkan dengan cepat
Hingga 4x speedup dibandingkan dengan eksekusi pytorch untuk konteks yang lebih kecil

Tolok ukur

Kinerja yang lebih besar bervariasi berdasarkan panjang konteksnya. Untuk konteks yang kurang dari ~ 500 kata, OnNX sangat mengungguli, naik ke speedup 4X dibandingkan dengan Pytorch. Namun, semakin lama konteksnya, semakin kecil speedup ONNX, dengan Pytorch lebih cepat di atas 500 kata.

Benchmark GPU, Tugas Menanamkan

Menempel benchmark

Benchmark GPU, Tugas Generasi

Generasi Benchmark

Berkontribusi

Proyek ini masih dalam masa pertumbuhan, jadi saya akan menyukai umpan balik Anda, untuk mengetahui masalah apa yang Anda coba selesaikan, dengarkan masalah yang Anda hadapi, dan mendiskusikan fitur yang akan membantu Anda. Oleh karena itu jangan ragu untuk menembak saya email (lihat profil saya untuk alamatnya!) Atau bergabunglah dengan komunitas Slack kami.

Ucapan Terima Kasih

This repo is based on the work of Colin Raffel and Noam Shazeer and Adam Roberts and Katherine Lee and Sharan Narang and Michael Matena and Yanqi Zhou and Wei Li and Peter J. Liu from Google, as well as the implementation of T5 from the huggingface team, the work of the Microsoft ONNX and onnxruntime teams, in particular Tianlei Wu, and the work of Thomas Wolf on generation of teks.

Kertas T5 asli

 @article{2019t5,
  author = {Colin Raffel and Noam Shazeer and Adam Roberts and Katherine Lee and Sharan Narang and Michael Matena and Yanqi Zhou and Wei Li and Peter J. Liu},
  title = {Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer},
  journal = {arXiv e-prints},
  year = {2019},
  archivePrefix = {arXiv},
  eprint = {1910.10683},
}

Repo Microsoft Onnxruntime

Implementasi huggingface dari T5

Memperluas

Informasi Tambahan

Versi ve model
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-19
ukuran 535.6KB
Berasal dari Github

Aplikasi Terkait

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua