semantic searchダウンロード - semantic searchソースコードのダウンロード

semantic search

その他のソースコード

v1.0.0

ダウンロード

@Beerose/Semantic-Search

MDXファイルからセマンティック検索インデックスを構築するためのOpenAIを搭載したCLI。コンテンツ全体で複雑な検索を実行し、プラットフォームと統合することができます。

？前提条件

このプロジェクトでは、OpenAIを使用してベクトル埋め込みと松ぼっくりを生成して埋め込みをホストします。つまり、OpenaiとPineconeに使用するにはアカウントが必要です。

Pineconeプロジェクトのセットアップ

Pineconeでアカウントを作成した後、ダッシュボードに移動し、 Create Indexボタンをクリックします。

Cleanshot 2023-02-17 at 16 10 32@2x

新しいインデックス名（ブログ名など）でフォームに記入し、寸法の数を1536に設定します。

Cleanshot 2023-02-17 at 16 11 54@2x

CLI使用

PineconeとOpenaiからEnvキーを入手する方法は？

松ぼっくり

Cleanshot 2023-02-17 at 16 15 32@2x Cleanshot 2023-02-17 at 16 13 22@2x

Openai

Cleanshot 2023-02-17 at 16 18 00@2x

CLIには4つのenvキーが必要です。

OPENAI_API_KEY=

PINECONE_API_KEY=
PINECONE_BASE_URL=
PINECONE_NAMESPACE=

使用する前に必ず追加してください！

？コマンド：

index <dir> - コンテンツでファイルを処理し、それらをPineconeにアップロードします。

例：

$ @beerose/semantic-search index ./posts

search <query> - 特定のクエリでセマンティック検索を実行します。

例：

$ @beerose/semantic-search search " hello world "

詳細については、 --helpフラグを使用してコマンドを実行します。

$ @beerose/semantic-search index --help
$ @beerose/semantic-search search --help
$ @beerose/semantic-search --help

projectプロジェクト統合

このライブラリからエクスポートされたsemanticQuery関数を使用して、Webサイトまたはアプリケーションに統合できます。

DEPSのインストール：

$ pnpm add pinecone-client openai @beerose/semantic-search

# or `yarn add` or `npm i`

使用例：

 import { PineconeMetadata , semanticQuery } from "@beerose/semantic-search" ;
import { Configuration , OpenAIApi } from "openai" ;
import { PineconeClient } from "pinecone-client" ;

const openai = new OpenAIApi (
  new Configuration ( {
    apiKey : process . env . OPENAI_API_KEY ,
  } )
) ;

const pinecone = new PineconeClient < PineconeMetadata > ( {
  apiKey : process . env . PINECONE_API_KEY ,
  baseUrl : process . env . PINECONE_BASE_URL ,
  namespace : process . env . PINECONE_NAMESPACE ,
} ) ;

const result = await semanticQuery ( "hello world" , openai , pinecone ) ;

Aleksandra.CodesのAPIルートの例：https：//github.com/beerose/aleksandra.codes/blob/main/api/search.ts

どのように機能しますか？

セマンティック検索では、ドキュメント内の単語の意味を理解し、ユーザーの意図により関連する結果を返すことができます。

このツールは、OpenAIを使用して、 text-embedding-ada-002モデルでベクトル埋め込みを生成します。

埋め込みは、数字シーケンスに変換された概念の数値表現であり、コンピューターがそれらの概念間の関係を簡単に理解できるようにします。 https://openai.com/blog/new-and-ifroved-embedding-model/

また、Vector検索のためにホストされたデータベースであるPineconeも使用します。生成された埋め込みを介してk-nn検索を実行できます。

MDXコンテンツの処理

@beerose/sematic-search index CLIコマンドは、特定のディレクトリ内の各ファイルに対して次の手順を実行します。

MDXファイルをRAWテキストに変換します。
タイトルを抽出します。
ファイルを最大100トークンのチャンクに分割します。
各チャンクのOpenai埋め込みを生成します。
埋め込みをPineconeに上げます。

コンテンツに応じて、プロセス全体には、OpenaiとPineconeへの多くの呼び出しが必要であり、時間がかかる場合があります。たとえば、約25のブログ投稿と平均6分間の読み取り時間を備えたディレクトリには約30分かかります。

セマンティック検索の実行

セマンティック検索をテストするには、 @beerose/sematic-search search CLIコマンドを使用できます。

提供されたクエリの埋め込みを作成します。
埋め込みで松ぼっくりにリクエストを送信します。

？デモ

？何が中にありますか？

 .
├── bin
│   └── cli.js
├── src
│   ├── bin
│   │   └── cli.ts
│   ├── commands
│   │   ├── indexFiles.ts
│   │   └── search.ts
│   ├── getEmbeddings.ts
│   ├── isRateLimitExceeded.ts
│   ├── mdxToPlainText.test.ts
│   ├── mdxToPlainText.ts
│   ├── semanticQuery.ts
│   ├── splitIntoChunks.test.ts
│   ├── splitIntoChunks.ts
│   ├── titleCase.ts
│   └── types.ts
├── tsconfig.build.json
├── tsconfig.json
├── package.json
└── pnpm-lock.yaml

bin/cli.js - CLIエントリポイント。
src ：
- bin/cli.ts - CLIコマンドと設定を見つけることができるファイル。このプロジェクトでは、CACを使用してCLIを構築します。
- commands/indexFiles.ts - MD/MDXコンテンツの処理を処理し、埋め込みを生成し、ベクターを松ぼっくりにアップロードするCLIコマンド。
- command/search.ts - セマンティック検索コマンド。特定の検索クエリの埋め込みを生成し、結果のPineconeを呼び出します。
- getEmbeddings.ts - 埋め込みロジックの生成。 AIを開くための呼び出しを処理します。
- isRateLimitExceeded.ts - エラー処理ヘルパー。
- mdxToPlainText.ts - MDXファイルをRAWテキストに変換します。備考とカスタムremarkMdxToPlainTextプラグインを使用します（そのファイルでも定義されています）。
- semanticQuery.ts - セマンティック検索を実行するためのコアロジック。 searchコマンドで使用されており、このライブラリからエクスポートされているため、プロジェクトと統合できます。
- splitIntoChunks.ts - 最大100トークンでテキストをチャンクに分割します。
- titleCase.ts - ファイルパスからタイトルを抽出します。
- types.ts - このプロジェクトで使用されるタイプとユーティリティ。
tsconfig.jsonタイプスクリプトコンパイラ構成。
tsconfig.build.json pnpm buildに使用されるタイプスクリプトコンパイラ構成。

テスト：

src/mdxToPlainText.test.ts
src/splitIntoChunks.test.ts

？‍ローカル開発

DEPSをインストールしてプロジェクトを構築します。

pnpm i

pnpm build

CLIをローカルに実行します：

node bin/cli.js

？実行中のテスト

pnpm test

？貢献

貢献、問題、機能のリクエストは大歓迎です。
貢献したい場合は、問題のページを自由に確認してください。

ライセンス

拡大する

追加情報

バージョン v1.0.0
タイプその他のソースコード
更新時間 2025-03-10
サイズ 69.44KB
から Github

semantic search

@Beerose/Semantic-Search

？前提条件

CLI使用

？コマンド：

projectプロジェクト統合

どのように機能しますか？

MDXコンテンツの処理

セマンティック検索の実行

？デモ

？何が中にありますか？

？‍ローカル開発

？実行中のテスト

？貢献

ライセンス

単語検索 800

azure search python samples

Word Search Word Puzzle Game最新版

子供向けゲームの Word Search 最新バージョン

ハンフォックス検索エンジン

リエフオ! 検索英語検索

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express