?? VersiónEnEspañoldeeste Documento
小型/専門のAIモデルは、「ビッグAI」の提供物に対する、しばしば必要な補完、または代替案です。ただし、小さなAIのインフラストラクチャは圧倒的である傾向があるため、特殊なAIを備えた構築は困難で、時間がかかり、さらには高価です。したがって、異なるモデル、特にこれらのモデルの異なる組み合わせで反復することは、実行不可能になる可能性があります。
だから私たちはここにいます。 Krixikへようこそ。ここでは、安全なAPIを介してシーケンスされたまたは1つの小さな/専門的なAIモデルを使用して、簡単かつ迅速に実験、プロトタイプ、および構築できます。 Krixikを介して活用するモデルは、オープンソースまたはトレーニング/微調整されています。
Krixikは現在ベータ版であるため、Krixik Pythonクライアントへのアクセスはリクエストのみです。
ベータテスターとして参加したい場合は、この簡単なGoogleフォームに記入してください。
次のコマンドを実行して、Krixik Pythonクライアントをインストールします。
pip install krixik
注:Pythonバージョン3.8以上が必要です。
Krixikクライアントセッションを初期化するには、一意のapi_keyとapi_url秘密が必要になります。ベータテスターは、Krixik管理者から秘密を受け取ります。
秘密を直接処理する代わりに、 .envファイルに保存し、Python-Dotenvを介してロードすることを強くお勧めします。
秘密があれば、次のようにセッションを初期化します。
from krixik import krixik
krixik . init ( api_key = MY_API_KEY ,
api_url = MY_API_URL ) ... MY_API_KEYとMY_API_URLはあなたのアカウントの秘密です。
秘密を間違えた場合は、直接お問い合わせください。
単一のtranscribeモジュールで構成される単純な転写パイプラインを構築しましょう。単一のコードを使用してパイプラインを作成できます。
# create a simple transcription pipeline
pipeline = krixik . create_pipeline ( name = 'my_transcribe-pipeline-1' ,
module_chain = [ "transcribe" ])パイプラインの準備ができました!これで、オーディオファイルを処理して、それらのトランスクリプトを生成できます。
pipeline . process ( local_file_path = './path/to/my/mp3' )このパイプラインの出力は、入力オーディオファイルのタイムスタンプ付きトランスクリプト、処理されたファイルのfile_id 、およびプロセス自体のrequest_idです。
transcribe Module出力でSemantic(別名Vector)検索を実行したいとします。
転写後に次のことを行う必要があります。
この一連のステップをローカルに作成およびテストするのに時間がかかり、安全な生産サービスでそれらをさらに組み立てます。そして、それはプロセス全体をサーバーレスにしようとしないことです。
ただし、 Krixikを使用すると、いくつかのモジュールを追加するだけで、この機能を以前のパイプラインに迅速に組み込むことができます。構文は上記のままであるため、新しいパイプラインを作成するには、まだ1行が必要です。
# create pipeline with the above-alluded-to modules
pipeline = krixik . create_pipeline ( name = 'transcribe_vsearch' ,
module_chain = [ "transcribe" ,
"json-to-txt" ,
"parser" ,
"text-embedder" ,
"vector-db" ])新しいパイプラインを介してファイルを処理しましょう。
pipeline . process ( local_file_path = './path/to/my/mp3' )パイプラインに少なくとも1つのファイルがあるので、上記のプロセスの最後に返されたファイルのfile_idを使用して、 semantic_searchメソッドを使用して関連するトランスクリプトでセマンティック検索を実行できます。
pipeline . semantic_search ( query = "The text you wish to semantically search for goes here" ,
file_ids = [ 'the_file_id_from_above' ])それでおしまい!これで、ファイルを転写し、トランスクリプトを処理し、セマンティック(Vector)検索を実行し、好きなだけ多くのファイルとクエリのパイプラインを再利用できます...数分で数行のコードでそれをすべて使用できます。
上記の例をフォローしたい場合、またはドキュメントにレイアウトする他のスコアのスコアを使用する場合は、Krixik Docsリポジトリ全体を引くだけです。
そうすることで、必要なすべてのファイルが提供され、コードは既にそのディレクトリ構造で実行されるように構成されています。
私たちがあなたのために文書化した例の範囲には、次のようなパイプラインが含まれます。
これは氷山の一角にすぎません。現在、さらに多くのパイプラインが可能です(より多くの例についてはこちらを参照)、Krixikモジュール/モデルライブラリは常に拡大します。おそらく、あなた自身の提出のモジュールやモデルを含めることさえあります。
上記は、Krixikの力を覗くだけです。 Krixik Toolboxは、可能なすべてのパラメーター化(触れさえしませんでした)に加えて、モジュールとモデルのモデルとモデルのコレクションです。
詳細については、Krixikのドキュメントをご覧ください。
Krixikがベータを卒業することに興奮していますか?私たちもそうです!この製品は記念碑的な量のお尻を蹴ると確信しています。
打ち上げやその他の問題についてループになりたい場合(スパムはしないことを約束します)、ここで時折私たちからの通信を購読してください。
読んでくれてありがとう、そしてKrixikへようこそ!