Download de EdgeChains - Download do código -fonte EdgeChains

EdgeChains

Outro código-fonte

0.30.1

Baixar

Pacotes Edgechains

Junte -se à nossa discórdia - somos um dos grupos de desenvolvedores mais amigáveis e agradáveis da IA generativa!

Pule diretamente em nossos exemplos com vídeos !!

A produção de Edgechains está pronta?

Ao contrário de muitas estruturas - nós a construímos em cima do Honojs e da JSONNET, ambas construídas pelo Cloudflare e Google, respectivamente. Então, mesmo que você não confie em mim ... você pode confiar neles;)

Não construímos nosso próprio sabor de JSON ou um DSL específico (que é inerentemente frágil) e damos as etapas de compilação. Nossas bibliotecas subjacentes são sólidas e estáveis.

Entendendo Edgechains

Na Edgechains, adotamos uma abordagem única para a IA generativa - achamos que a IA generativa é um desafio de implantação e gerenciamento de configuração, em vez de um desafio de padrão de design de interface do usuário e biblioteca. Construímos em cima de uma tecnologia que resolveu esse problema em um domínio diferente - o Kubernetes Config Management - e trazemos isso para a IA generativa. A EdgeChains está construída no topo da JSONNET, originalmente construída pelo Google com base em sua experiência, gerenciando uma grande quantidade de código de configuração na infraestrutura da BORG.

Edgechains lhe dá:

Apenas um arquivo de script : Edgechains é projetado para ser extremamente simples - a execução de aplicativos Genai prontos para produção é apenas um arquivo de script e um arquivo JSONNET. Você ficará agradavelmente surpreso!
Versão para prompts : os avisos são escritos no JSONNET. Os torna facilmente versionáveis e difíceis.
Paralelismo automático : as edgechains paralelizam automaticamente as cadeias LLM e as tarefas de cadeia de pensamentos nas CPUs, GPUs e TPUs usando o tempo de execução do WebAssembly.
Tolerância a falhas : o Edgechains foi projetado para ser tolerante a falhas e pode continuar a tentar repetir e retirar, mesmo que algumas das solicitações do sistema falhem.
Escalabilidade : o Edgechains foi projetado para ser escalável e pode ser usado para escrever seus aplicativos de cadeia de pensamentos em grande número de APIs, comprimentos imediatos e conjuntos de dados vetoriais.

Por que você precisa de engenharia rápida e de cadeia

A maioria das pessoas que são novas na IA generativa pensa que a maneira de usar o OpenAI ou outros LLMs é simplesmente fazer uma pergunta e responder magicamente. A resposta é extremamente diferente e complexa.

Complexidade de engenharia imediata

A IA generativa, OpenAI e LLMs precisam que você escreva seu prompt de maneiras muito específicas. Cada uma dessas maneiras de escrever instruções é muito envolvida e altamente complexa - é de fato tão complexo que existem trabalhos de pesquisa publicados para isso. Por exemplo:

Razão e ACT - React Style Proot Corrents
Cadeias de promotos hyde - recuperação precisa de densa tiro zero sem rótulos de relevância
Frugalgpt: Como usar modelos de linguagem grandes, reduzindo o custo e melhorando o desempenho

Explosão imediata - muitos avisos para muitos LLMs

Além disso, essas técnicas imediatas funcionam em um tipo de LLMS, mas não funcionam em outros LLMs. Para o EG Prompts & Chains, que são escritos de uma maneira específica para o GPT-3.5, precisará ser reescrito para o LLAMA2 atingir o mesmo objetivo . Isso faz com que os avisos explodam em número, tornando -os desafiadores para a versão e gerenciamento.

Deriva pronta

Os avisos mudam com o tempo. Isso é chamado de desvio rápido. Há pesquisas publicadas o suficiente para mostrar como o comportamento do ChatGPT muda. Sua infraestrutura precisa ser capaz o suficiente para versões/alterar com esse desvio. Se você usar bibliotecas, onde os avisos estão ocultos em muitas camadas, você achará impossível fazer isso. Seu código de produção apodrece com o tempo, mesmo que você não fizesse nada.

-Como o comportamento do ChatGPT está mudando com o tempo?

Testabilidade na produção

Um dos grandes desafios da produção é como continuar testando suas instruções e correntes e itere -as rapidamente. Se seus avisos ficarem abaixo de muitas camadas de bibliotecas e abstrações, isso é impossível. Mas se seus avisos vivem fora do código e forem declarativos, isso é fácil de fazer. De fato, em Edgechains, você pode ter toda a sua lógica de prompt e cadeia sentar -se em S3 ou uma API.

Custos e medições de token

Cada prompt ou cadeia tem um custo de token associado a ele. Você pode pensar que um certo prompt é muito bom ... mas pode estar consumindo uma enorme quantidade de tokens. Por exemplo, os avisos de estilo de cadeia de pensamento consomem pelo menos 3x de tantos tokens de saída como um prompt normal. Você precisa ter rastreamento e medição de grão fino incorporados à sua estrutura para poder gerenciar isso. Edgechains tem isso embutido.

Configurar

Clone o repositório em um repositório público do github (ou fork https://github.com/arakoodev/edgechains/fork).

  git clone https://github.com/arakoodev/EdgeChains/

Vá para a pasta do projeto

  cd EdgeChains

Execute o exemplo de chatwithpdf

Esta seção fornece instruções para os desenvolvedores sobre como utilizar o chat com o recurso PDF. Seguindo essas etapas, você pode integrar a funcionalidade perfeitamente em seus projetos.

Vá para o chatwithpdFexample

  cd JS/edgechains/examples/chat-with-pdf/

Instale pacotes com NPM

  npm install

Configuração você segredos em secrets.jsonnet

  local SUPABASE_API_KEY = "your supabase api key here";


  local OPENAI_API_KEY = "your openai api key here";
    
  local SUPABASE_URL = "your supabase url here";
    
  {
    "supabase_api_key":SUPABASE_API_KEY,
    "supabase_url":SUPABASE_URL,
    "openai_api_key":OPENAI_API_KEY,
  }

Configuração do banco de dados

Certifique -se de ter um banco de dados Vector PostgreSQL configurado no SUPABASE.
Vá para a guia SQL Editor em Supabase.
Crie uma nova consulta usando o novo botão de consulta.
Cole a seguinte consulta no editor e execute -a usando o botão Executar no canto inferior direito.

 create table if not exists documents (
    id bigint primary key generated always as identity,
    content text,
    embedding vector (1536)
  );

create or replace function public.match_documents (
   query_embedding vector(1536), 
  similarity_threshold float, 
    match_count int
)
returns table (
  id bigint,
  content text,
  similarity float
)
language sql
as $$
  select
  id,
  content,
   1- (documents.embedding <=> query_embedding) as similarity
  from documents
  where 1 - (documents.embedding <=> query_embedding) > similarity_threshold
  order by documents.embedding <=> query_embedding
  limit match_count;
  $$;

Você deve ver uma mensagem de sucesso na guia Resultado.

Uso

Inicie o servidor:
```
npm run start
```

Bata no ponto GET .

http://localhost:3000/chatWithpdf ? question=who is nirmala sitarama

Em seguida, você pode executar o exemplo do chatwithpdf usando o NPM RUN START e continua conversando com o exemplo.pdf.

️ Lembre -se: comente a função Inserttosupabase se você estiver executando o código novamente; Caso contrário, os dados do PDF serão pressionados novamente para os dados do vetor supabase.

Diretrizes de contribuição

Se você deseja contribuir com Edgechains, leia o CLA de contribuição. Este projeto segue o Código de Conduta Edgechains. Ao participar, você deve defender este código.

Utilizamos problemas do GitHub para rastrear solicitações e bugs.

? Agradecimentos

Gostaríamos de expressar nossa sincera gratidão aos seguintes indivíduos e projetos por suas contribuições e inspiração:

Nós nos inspiramos no espírito dos NextJs.
Estendemos nosso apreço a todos os colaboradores que apoiaram e enriqueceram este projeto.
Responte a Langchain, Antrópico, Mosaic e o restante da comunidade LLM de código aberto. Somos profundamente gratos por compartilhar seu conhecimento e nunca afastar ninguém.

Licença

A Edgechains está licenciada sob a licença pública geral da GNU Affero v3.0 e como software comercial. Para licenciamento comercial, entre em contato conosco ou levante um problema neste github.

Expandir

Informações adicionais

Versão 0.30.1
Tipo Outro código-fonte
Data da Última Atualização 2025-03-01
tamanho 2.23MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos