bocoelダウンロードbocoelソースコードのダウンロード

bocoel

AI ソースコード

1.0.0

ダウンロード

☂️ボコエル

大規模な言語モデルを評価するためのカバレッジツールとしてのベイズの最適化

？なぜボコエル？

大規模な言語モデルは高価で遅い巨人であり、巨大な最新のデータセットでそれらを評価することはそれを悪化させるだけです。

コーパスの意味のある（そして小さな）サブセットを選択して、非常に正確な評価を取得する方法がある場合にのみ.....

待って、ベイジアンの最適化のように聞こえます！

Bocoelは次の手順で動作します。

個々のエントリを埋め込みにエンコードします（LLMよりも安く /高速で再利用可能）。
ベイズの最適化を使用して、評価するクエリを選択します。
クエリを使用して、コーパス（エンコードされた埋め込みを使用）から取得します。
利益。

生成された評価は、提供されたマネージャーユーティリティによって簡単に管理できます。

私たちの知る限り、これは（おそらく動的な）予算で評価（ベンチマーク）中の計算コストを削減することを目的とした最初の作業です。

特徴

選択したコーパスから数十サンプルを使用して、大規模な言語モデルを正確に評価します。
？‍♂ ‍♂️ベイジアン最適化の能力を使用して、評価する言語モデルのサンプルの最適なサブセットを選択します。
？コーパスのモデルの評価に加えて、モデルのコーパスを評価します。
？ Huggingfaceトランスとデータセットとの統合を通じて、 GPT2 、 Pythia 、 LLAMAなどのサポート
？モジュラー設計。
？評価の質を強化するために、n-sphere表現や潜在空間のホワイトニングなど、コーパス /データセットの効率的な表現。

星をください！

あなたが見るもののように？これを星（★）にすることを検討してください！

Bayesian最適化

簡単に言えば、ベイジアンの最適化は、探索目標（画像の紫色の領域）または搾取オブジェクト（黒い点の高さ）のいずれかを最適化することを目的としています。ガウスプロセスを推論のためにバックボーンとして使用し、取得関数を使用して次にサンプリングする場所を決定します。より詳細な紹介については、こちらをご覧ください。

Bayesianの最適化は、高価なブラックボックスモデル（Paraphrase：LLM）でうまく機能するため、この特定のユースケースに最適です。 Bocoelは、コーパスから与えられた埋め込みスペースを探索するためのバックボーンとしてベイジアンの最適化を使用しています。これにより、コーパスのミニスナップショットとして機能する優れたサブセットを選択できます。

？§パフォーマンスへの影響

LLMは痛みを伴うほど遅く、特に生成的なもの（通常はLLMと呼ばれるものです）は、シーケンス生成は本質的に順次的であるためです。

bocoelが埋め込みを使用してコーパス全体をエンコードするという要件にもかかわらず、埋め込み剤はLLMよりも程度速く、LLMSの評価において実質的に節約することで時間が取り戻されます。

インストール

オプションの依存関係は必要ありません：

 pip install bocoel

完全なエクスペリエンス（すべてのオプションの依存関係）をください：

 pip install "bocoel[all]"

？使用法

フォルダーの例を参照してください/GetS_Startedライブラリの単純な使用法については、ほんの数行のコードで始めるために開始します。

Bocoelで開発します

使用例はフォルダーのexamplesの下にあります。 APIリファレンスはこちらをご覧ください。

？貢献

貢献者が欲しかった！恥ずかしがらないで。問題やPRをお気軽に提出してください。 PRSについては、貢献と行動規範に関するガイドに従ってください。開放性と包括性は非常に真剣に受け止められています。

？§ロードマップ：進行中の作業

？よりシンプルな使用。ライブラリ全体のST評価を1行で実行できます。
評価の視覚化モジュール。
？代替方法（ランダム、kmedoid ...）とガウスプロセスの統合。
？ VLLMやOpenaiのAPIなどのより多くのバックエンドとの統合。
？ Python 3.12+のサポート

？§ライセンスと引用

このコードは、BSD-3ライセンスで利用できます。

このプロジェクトがあなたの研究で役立つと思うなら、この作業をで引用してください

 @misc{bocoel2024,
    title = {BoCoEL: Bayesian Optimization as a Coverage Tool for Evaluating Large Language Models},
    url = {https://bocoel.rentruewang.com/research/},
    author = {Wang, RenChu},
    month = {January},
    year = {2024}
}

拡大する

追加情報