? Versión en Español de Este documento
Os modelos de IA pequenos/especializados são um complemento frequentemente necessário-ou alternativo-às ofertas "grandes da IA". No entanto, a infraestrutura para a IA pequena tende a ser assombrosa; portanto, construir com IA especializada pode ser difícil, demorado e até caro. A iteração com modelos diferentes, e particularmente com diferentes combinações desses modelos, pode assim ser inviável.
É por isso que estamos aqui. Bem-vindo ao Krixik , onde você pode experimentar, protótipo e construir com facilidade e rapidez com modelos de IA pequenos/especializados em equipe sequenciada ou de um único, através de APIs seguras. Os modelos que você aproveita através do Krixik podem ser de código aberto ou treinado/ajustado por você.
Krixik está atualmente na versão beta, portanto, o acesso ao cliente Krixik Python é apenas mediante solicitação.
Se você quiser participar como testador beta, preencha este breve formulário do Google.
Execute o seguinte comando para instalar o cliente Krixik Python:
pip install krixik
NOTA: É necessária a versão Python 3.8 ou superior.
Para inicializar sua sessão do cliente Krixik, você precisará de seus segredos exclusivos api_key e api_url . Os testadores beta receberão seus segredos da Krixik Admin.
Em vez de lidar diretamente com seus segredos, recomendamos fortemente armazená-los em um arquivo .env e carregá-los via python-dotenv.
Depois de ter seus segredos, inicialize sua sessão da seguinte forma:
from krixik import krixik
krixik . init ( api_key = MY_API_KEY ,
api_url = MY_API_URL ) ... onde MY_API_KEY e MY_API_URL são seus segredos de conta.
Se você perdeu seus segredos, entre em contato conosco diretamente.
Vamos criar um pipeline de transcrição simples, composto por um único módulo transcribe . Podemos criar o pipeline com uma única linha de código:
# create a simple transcription pipeline
pipeline = krixik . create_pipeline ( name = 'my_transcribe-pipeline-1' ,
module_chain = [ "transcribe" ])O oleoduto está pronto! Agora você pode processar arquivos de áudio para gerar transcrições deles.
pipeline . process ( local_file_path = './path/to/my/mp3' ) As saídas deste pipeline serão uma transcrição de registro de data e hora do seu arquivo de áudio de entrada, um file_id para o arquivo processado e um request_id para o próprio processo.
Suponha que você deseja realizar pesquisas semânticas (também conhecidas como vetor) na saída do módulo transcribe .
Você precisaria fazer o seguinte após a transcrição:
Criar e testar localmente essa sequência de etapas seria demorada - orquestrando -as em um serviço de produção seguro ainda mais. E isso sem tentar tornar todo o processo sem servidor.
Com o Krixik , no entanto, você pode incorporar rapidamente essa funcionalidade ao seu pipeline anterior apenas adicionando alguns módulos. A sintaxe permanece como acima, portanto, fazer o novo pipeline ainda leva uma linha:
# create pipeline with the above-alluded-to modules
pipeline = krixik . create_pipeline ( name = 'transcribe_vsearch' ,
module_chain = [ "transcribe" ,
"json-to-txt" ,
"parser" ,
"text-embedder" ,
"vector-db" ])Vamos processar um arquivo através do seu novo pipeline.
pipeline . process ( local_file_path = './path/to/my/mp3' ) Agora que existe pelo menos um arquivo no pipeline, você pode usar o file_id do arquivo - que foi devolvido no final do processo acima - para realizar pesquisas semânticas na transcrição associada ao método semantic_search :
pipeline . semantic_search ( query = "The text you wish to semantically search for goes here" ,
file_ids = [ 'the_file_id_from_above' ])É isso! Agora você transcreveu um arquivo, processou a transcrição, realizou pesquisas semânticas (vetoriais) e pode reutilizar o pipeline para tantos arquivos e consultas quanto quiser ... tudo em alguns minutos e com algumas linhas de código.
Se você deseja acompanhar o exemplo acima, ou com qualquer outra pontuação de exemplos que estabelecemos na documentação, basta puxar todo o repo Krixik Docs.
Fazer isso fornecerá a você todos os arquivos necessários, e o código já estará configurado para executar nessa estrutura de diretório.
A gama de exemplos que documentamos para você incluir pipelines para:
Esta é apenas a ponta do iceberg. Atualmente, muitos outros oleodutos são possíveis (veja aqui mais exemplos), e a biblioteca de módulos/modelo Krixik estará em constante expansão - talvez até incluir módulos e modelos de sua própria submissão.
O exposto acima é apenas uma espiada no poder de Krixik. Além de toda a parametrização possível (na qual nem tocamos), a caixa de ferramentas Krixik é uma coleção cada vez maior de módulos e modelos para você construir.
Se você quiser saber mais, visite a documentação do Krixik, onde entramos em detalhes sobre:
Animado com o graduado de Krixik na Beta? Nós também! Estamos confiantes de que este produto vai chutar uma quantidade monumental de bunda, e gostaríamos de tê -lo a bordo quando o fizer.
Se você deseja estar informado sobre o lançamento e outros assuntos (prometemos não spam), assine uma correspondência ocasional de nós aqui.
Obrigado pela leitura e bem -vindo a Krixik!