?? Versión en Español de Este documento
Les modèles d'IA petits / spécialisés sont un complément souvent nécessaire - ou une alternative - à des offres «Big IA». Cependant, les infrastructures pour une petite IA ont tendance à être décevantes, donc la construction d'une IA spécialisée peut être difficile, chronophage et même coûteuse. L'itération avec différents modèles, et en particulier avec différentes combinaisons de ces modèles, peut donc être rendue irréalisable.
C'est pourquoi nous sommes ici. Bienvenue à Krixik , où vous pouvez facilement et rapidement expérimenter, prototype et construire avec des modèles d'IA petits / spécialisés séquencés ou unique via des API sécurisées. Les modèles que vous exploitez via Krixik peuvent être open source ou formés / affinés par vous.
Krixik est actuellement en version bêta, donc l'accès au client Krixik Python est uniquement par demande.
Si vous souhaitez participer en tant que testeur bêta, veuillez remplir ce bref formulaire Google.
Exécutez la commande suivante pour installer le client Krixik Python:
pip install krixik
Remarque: Python version 3.8 ou plus est requis.
Pour initialiser votre session Client Krixik, vous aurez besoin de vos secrets api_key et api_url UNIQUES. Les testeurs bêta recevront leurs secrets de l'administrateur Krixik.
Au lieu de gérer directement vos secrets, nous recommandons fortement les stocker dans un fichier .env et les charger via Python-Dotenv.
Une fois que vous avez vos secrets, initialisez votre session comme suit:
from krixik import krixik
krixik . init ( api_key = MY_API_KEY ,
api_url = MY_API_URL ) ... où MY_API_KEY et MY_API_URL sont vos secrets de compte.
Si vous avez égaré vos secrets, veuillez nous contacter directement.
Créons un pipeline de transcription simple composé d'un seul module transcribe . Nous pouvons créer le pipeline avec une seule ligne de code:
# create a simple transcription pipeline
pipeline = krixik . create_pipeline ( name = 'my_transcribe-pipeline-1' ,
module_chain = [ "transcribe" ])Le pipeline est prêt! Vous pouvez maintenant traiter les fichiers audio via lui pour en générer des transcriptions.
pipeline . process ( local_file_path = './path/to/my/mp3' ) Les sorties de ce pipeline seront une transcription horodomagie de votre fichier audio d'entrée, un file_id pour le fichier traité et une request_id pour le processus lui-même.
Supposons que vous souhaitiez effectuer une recherche sémantique (AKA Vector) sur la sortie du module transcribe .
Vous devrez faire ce qui suit après la transcription:
La création et le test localement de cette séquence d'étapes prendraient du temps - les ou plus encore plus dans un service de production sécurisé. Et c'est sans essayer de rendre l'intégralité du serveur de processus sans serveur.
Avec Krixik , cependant, vous pouvez rapidement incorporer cette fonctionnalité à votre pipeline antérieur en ajoutant simplement quelques modules. La syntaxe reste comme ci-dessus, donc la fabrication du nouveau pipeline prend toujours une ligne:
# create pipeline with the above-alluded-to modules
pipeline = krixik . create_pipeline ( name = 'transcribe_vsearch' ,
module_chain = [ "transcribe" ,
"json-to-txt" ,
"parser" ,
"text-embedder" ,
"vector-db" ])Traitons un fichier via votre nouveau pipeline.
pipeline . process ( local_file_path = './path/to/my/mp3' ) Maintenant qu'il y a au moins un fichier dans le pipeline, vous pouvez utiliser le fichier file_id - qui a été renvoyé à la fin du processus ci-dessus - pour effectuer une recherche sémantique sur la transcription associée à la méthode semantic_search :
pipeline . semantic_search ( query = "The text you wish to semantically search for goes here" ,
file_ids = [ 'the_file_id_from_above' ])C'est ça! Vous avez maintenant transcrit un fichier, traité la transcription, effectué une recherche sémantique (vecteur) et pouvez réutiliser le pipeline pour autant de fichiers et de requêtes que vous le souhaitez ... tout en quelques minutes et avec quelques lignes de code.
Si vous souhaitez suivre l'exemple ci-dessus, ou avec tout autre score d'exemples que nous disposons dans la documentation, tirez simplement l'intégralité du repo Krixik Docs.
Cela vous fournira chaque fichier dont vous avez besoin, et le code sera déjà configuré pour s'exécuter dans cette structure de répertoire.
La gamme d'exemples que nous avons documentés pour vous comprend des pipelines pour:
Ce n'est que la pointe de l'iceberg. Beaucoup plus de pipelines sont actuellement possibles (voir ici pour plus d'exemples), et le module / bibliothèque de modèle Krixik sera constamment en expansion, peut-être même pour inclure des modules et des modèles de votre propre soumission.
Ce qui précède est juste un aperçu de la puissance de Krixik. En plus de toute paramétrage possible (que nous n'avons même pas abordé), la boîte à outils Krixik est une collection en constante augmentation de modules et de modèles avec lesquels vous pouvez construire.
Si vous souhaitez en savoir plus, veuillez visiter la documentation Krixik, où nous allons dans les détails sur:
Excité à propos de Krixik diplômé de Beta? Nous sommes donc! Nous sommes convaincus que ce produit va donner un coup de pied à une quantité monumentale de cul, et nous serions ravis de vous avoir à bord quand il le fait.
Si vous souhaitez être dans la boucle sur le lancement et d'autres questions (nous promettons de ne pas spam), veuillez vous abonner à une correspondance occasionnelle de notre part ici.
Merci d'avoir lu, et bienvenue à Krixik!