?? Versión en español de este documento
Model AI kecil/khusus adalah pelengkap yang sering ada-atau alternatif-untuk penawaran "AI besar". Namun, infrastruktur untuk AI kecil cenderung tidak memuaskan, sehingga membangun dengan AI khusus bisa sulit, memakan waktu, dan bahkan mahal. Iterasi dengan model yang berbeda, dan khususnya dengan kombinasi yang berbeda dari model -model ini, dengan demikian dapat dianggap tidak layak.
Itu sebabnya kami di sini. Selamat datang di Krixik , di mana Anda dapat dengan mudah dan cepat bereksperimen, prototipe, dan dibangun dengan model AI kecil/khusus yang diurutkan atau berdiri sendiri melalui API yang aman. Model yang Anda manfaatkan melalui Krixik dapat berupa sumber terbuka atau dilatih/disesuaikan oleh Anda.
Krixik saat ini dalam beta, jadi akses ke klien Krixik Python hanya berdasarkan permintaan.
Jika Anda ingin berpartisipasi sebagai penguji beta, silakan lengkapi formulir Google singkat ini.
Jalankan perintah berikut untuk menginstal klien Krixik Python:
pip install krixik
Catatan: Python versi 3.8 atau lebih tinggi diperlukan.
Untuk menginisialisasi sesi klien Krixik Anda, Anda akan membutuhkan rahasia api_key dan api_url yang unik. Penguji beta akan menerima rahasia mereka dari admin Krixik.
Alih-alih menangani rahasia Anda secara langsung, kami sangat menyarankan untuk menyimpannya dalam file .env dan memuatnya melalui python-dotenv.
Setelah Anda memiliki rahasia, inisialisasi sesi Anda sebagai berikut:
from krixik import krixik
krixik . init ( api_key = MY_API_KEY ,
api_url = MY_API_URL ) ... di mana MY_API_KEY dan MY_API_URL adalah rahasia akun Anda.
Jika Anda salah menempatkan rahasia Anda, hubungi kami secara langsung.
Mari kita bangun pipa transkripsi sederhana yang terdiri dari modul transcribe tunggal. Kita dapat membuat pipa dengan satu baris kode:
# create a simple transcription pipeline
pipeline = krixik . create_pipeline ( name = 'my_transcribe-pipeline-1' ,
module_chain = [ "transcribe" ])Pipa sudah siap! Sekarang Anda dapat memproses file audio melalui itu untuk menghasilkan transkripnya.
pipeline . process ( local_file_path = './path/to/my/mp3' ) Output dari pipa ini akan menjadi transkrip waktu dari file audio input Anda, file_id untuk file yang diproses, dan request_id untuk proses itu sendiri.
Misalkan Anda ingin melakukan pencarian semantik (alias vektor) pada output modul transcribe .
Anda perlu melakukan hal berikut setelah transkripsi:
Secara lokal membuat dan menguji urutan langkah -langkah ini akan memakan waktu - mengaturnya dalam layanan produksi yang aman bahkan lebih dari itu. Dan itu tanpa mencoba membuat seluruh proses tanpa server.
Namun, dengan Krixik , Anda dapat dengan cepat memasukkan fungsionalitas ini ke pipa Anda sebelumnya dengan hanya menambahkan beberapa modul. Sintaks tetap seperti di atas, jadi membuat pipa baru masih mengambil satu baris:
# create pipeline with the above-alluded-to modules
pipeline = krixik . create_pipeline ( name = 'transcribe_vsearch' ,
module_chain = [ "transcribe" ,
"json-to-txt" ,
"parser" ,
"text-embedder" ,
"vector-db" ])Mari kita proses file melalui pipa baru Anda.
pipeline . process ( local_file_path = './path/to/my/mp3' ) Sekarang ada setidaknya satu file dalam pipa, Anda dapat menggunakan file_id file - yang dikembalikan pada akhir proses di atas - untuk melakukan pencarian semantik pada transkrip terkait dengan metode semantic_search :
pipeline . semantic_search ( query = "The text you wish to semantically search for goes here" ,
file_ids = [ 'the_file_id_from_above' ])Itu saja! Anda sekarang telah menyalin file, memproses transkrip, melakukan pencarian semantik (vektor) di atasnya, dan dapat menggunakan kembali pipa untuk sebanyak mungkin file dan pertanyaan yang Anda sukai ... semuanya dalam beberapa menit dan dengan beberapa baris kode.
Jika Anda ingin mengikuti contoh di atas, atau dengan skor lain dari contoh yang kami taruh dalam dokumentasi, maka cukup tarik seluruh repo Krixik Docs.
Melakukan hal itu akan memberi Anda setiap file yang Anda butuhkan, dan kode sudah akan dikonfigurasi untuk dijalankan dalam struktur direktori itu.
Kisaran contoh yang telah kami dokumentasikan untuk Anda menyertakan saluran pipa untuk:
Ini hanya puncak gunung es. Lebih banyak jalur pipa saat ini dimungkinkan (lihat di sini untuk lebih banyak contoh), dan Perpustakaan Modul/Model Krixik akan terus berkembang - mungkin bahkan untuk memasukkan modul dan model pengiriman Anda sendiri.
Di atas hanya mengintip kekuatan Krixik. Selain semua kemungkinan parameterisasi (yang bahkan tidak kami sentuh), Krixik Toolbox adalah kumpulan modul dan model yang terus tumbuh untuk Anda bangun.
Jika Anda ingin mempelajari lebih lanjut, silakan kunjungi dokumentasi Krixik, di mana kami membahas detailnya:
Bersemangat tentang Krixik lulus dari beta? Begitu juga kita! Kami yakin bahwa produk ini akan menendang keledai dalam jumlah monumental, dan kami akan senang memiliki Anda saat itu.
Jika Anda ingin berada di loop tentang peluncuran dan hal -hal lain (kami berjanji untuk tidak spam), silakan berlangganan korespondensi sesekali dari kami di sini.
Terima kasih telah membaca, dan selamat datang di Krixik!