chameleon llmダウンロード-Chameleon chameleon llmソースコードのダウンロード

chameleon llm

その他のソースコード

v1.0

ダウンロード

？ Chameleon：GPT-4を使用したプラグアンドプレイの構成推論

論文のコード「カメレオン：大規模な言語モデルを使用したプラグアンドプレイ構成の推論」。

？ご質問や提案がある場合は、お気軽にお知らせください。電子メールアドレス[email protected]を使用してPan Luを直接メールで送信したり、Twitterにコメントしたり、このリポジトリに問題を投稿したりできます。

[プロジェクトページ] [紙] [Twitter] [LinkedIn] [YouTube] [スライド]

カメレオンの暫定ロゴ。

？ニュース？

[2023.05.06]私たちのカメレオンペーパーが、AlphasiNalによって1,682 AIペーパーのうち1位にランクされていることに興奮しています。
[2023.05.05] Pan LuがGoogle Brainの推論チームに講演を行うよう招待されたことを共有できることを楽しみにしています。ここでプレゼンテーションスライドを見る：[スライド]
[2023.04.24]私たちの作品は、MarkTechPostの記事で取り上げられています。
[2023.04.23]私たちの研究は、dair.aiによって「今週のトップの論文」の1つとして認識されています。
[2023.04.22]私たちの作品がWorldofaiのYouTubeチャンネルで紹介されていることを発表することに興奮しました！
[2023.04.21]私たちの仕事は、https：//trends.vercel.appのトレンドプロジェクトです。 [リンク]
[2023.04.20] Twitterで作品を共有してくれたJohn Nayに感謝します！
[2023.04.19]私たちの研究は現在、コードを使用した論文にリストされています。
[2023.04.19] Twitterでの作品をタイムリーに取り上げてくれたAran Komatsuzakiに感謝します！
[2023.04.19] Twitterで作品を速やかに共有してくれた@_akhaliqに感謝します！
[2023.04.19] Chameleon-LLMのプロジェクトのホームページをご覧ください。
[2023.04.19]私たちの論文は、https：//arxiv.org/abs/2304.09842でアクセスできるようになりました。

？カメレオンについて

Chameleonは、さまざまなタイプのツールでLLMを強化するプラグアンドプレイの構成推論フレームワークです。 Chameleonは、LLMモデル、既製のビジョンモデル、Web検索エンジン、Python関数、ユーザーの関心に合わせたルールベースのモジュールなど、さまざまなツールを作成するプログラムを統合します。自然言語プランナーとしてLLMの上に構築されたChameleonは、最終的な応答を生成するために構成および実行するための適切な一連のツールを推進します。

showcase_scienceqa

ScienceQAとTABMWPの2つのタスクでカメレオンの適応性と有効性を紹介します。特に、GPT-4のカメレオンは、ScienceQAで86.54％の精度を達成し、最高の公開された少数のショットモデルを11.37％大幅に改善します。 GPT-4を基礎となるLLMとして使用すると、 Chameleonは最先端のモデルで17.0％増加し、TABMWPで98.78％の全体的な精度をもたらしました。さらなる研究は、GPT-4をプランナーとして使用することで、より一貫した合理的なツール選択を示すことが示唆されており、CHATGPTのような他のLLMと比較して、指示を考慮して潜在的な制約を推測できることが示唆されています。

詳細については、プロジェクトページをご覧ください。

YouTubeビデオ

YouTubeで作品を紹介し、紹介してくれたWorldofaiに非常に感謝しています。

星の歴史

？要件

Openai APIキー
Bing Search API（Bing Searchモジュールを有効にしたいが、モジュールはオプションです）

必要なすべてのPython依存関係（ pipreqsによって生成）をインストールします。

 python==3.8.10
huggingface-hub
numpy==1.23.2
openai==0.23.0
pandas==1.4.3
transformers==4.21.1
requests==2.28.1

必要なすべてのPython依存関係をインストールします（以前に依存関係を設定したことがあり、バージョンが厳密に必要ではない場合は、この手順をスキップできます）：

 pip install -r requirements.txt

ショ和構成ショ和

Openai APIキー

https://platform.openai.com/account/api-keysからOpenai APIキーを入手してください。

ChameleonにOpenai APIキーを使用するには、請求をセットアップする必要があります（別名有料アカウント）。

https://platform.openai.com/account/billing/overviewで有料アカウントを設定できます。

Bing SearchAPIキー（オプション）

https://www.microsoft.com/en-us/apis/bing-web-search-apiからBing Search APIキーを取得します。

Bing Search APIキーはオプションです。このキーを設定できないと、ScienceQAタスクがわずかなパフォーマンスが低下します。

モジュールインベントリ

カメレオンのさまざまなツール

モジュールインベントリ内のさまざまなタイプのツール：

ツール

ツールサブセット

それぞれScienceQAとTABMWPで使用されるツール。 2つのタスクの再利用可能なツールは、緑色で強調表示されます。

tools_task

？ ScienceqaでCameleonを実行します

Science質問応答（ScienceQA）は、多様なコンテキストをめぐる幅広い科学的トピックをカバーするマルチモーダルの質問アンウェーのベンチマークです。 ScienceQAデータセットはdata/scienceqaで提供されています。詳細については、データセットを探索して、Exploreページをチェックしてページを視覚化できます。

現在のバージョンの場合、 Image CaptionerとText Detectorの結果は既製であり、 data/scienceqa/captions.jsonとdata/scienceqa/ocrs.jsonにそれぞれ保存されています。これらの2つのモジュールを呼び出すライブはまもなく登場します！

カメレオンを実行する（GPT-4）：

 cd run_scienceqa

python run.py 
--model chameleon 
--label chameleon_gpt4 
--policy_engine gpt-4 
--kr_engine gpt-4 
--qg_engine gpt-4 
--sg_engine gpt-4 
--test_split test 
--test_number -1

予測を生成し、 results/scienceqa/chameleon_gpt4_test.json 、およびresults/scienceqa/chameleon_gpt4_test_cache.jsonで結果results/scienceqa/chameleon_gpt4_test_cache.jsonl保存します。

実行することで、平均して、さまざまな質問クラスで精度メトリックを取得できます。

python evaluate.py 
--data_file ../data/scienceqa/problems.json 
--result_root ../results/scienceqa 
--result_files chameleon_chatgpt_test_cache.jsonl

Chameleonを実行する（chatgpt）：

python run.py 
--model chameleon 
--label chameleon_gpt4 
--policy_engine gpt-3.5-turbo 
--kr_engine gpt-3.5-turbo 
--qg_engine gpt-3.5-turbo 
--sg_engine gpt-3.5-turbo 
--test_split test 
--test_number -1

私たちのカメレオンは、COT（チェーンのチェーン）メソッドの一般化された形式であり、生成されたプログラムはSolution GeneratorとAnswer Generatorのシーケンスです。 cotとして--modelを通過することにより、 modules ["solution_generator", "answer_generator"]として設定されます。

コットを実行するには（考えられたチェーンプロンプト）GPT-4：

python run.py 
--model cot 
--label cot_gpt4 
--sg_engine gpt-4 
--test_split test 
--test_number -1

COT（考え方のチェーンプロンプト）を実行するには、ChatGPT：

python run.py 
--model cot 
--label cot_chatgpt 
--sg_engine gpt-4 
--test_split test 
--test_number -1

？ tabmwpでカメレオンを実行します

TABMWPデータセットには、38,431の表形式の数学ワードの問題が含まれています。 TABMWPの各質問は、画像、半構造化されたテキスト、および構造化されたテーブルとして表示される表形式のコンテキストと整合しています。 TABMWPデータセットは、 data/tabmwpで提供されています。詳細については、Datatatsetを探索して、Exploreページをご覧ください。ページを視覚化できます。

カメレオンを実行する（GPT-4）：

 cd run_tabmwp

python run.py 
--model chameleon 
--label chameleon_gpt4 
--test_split test 
--policy_engine gpt-4 
--rl_engine gpt-4 
--cl_engine gpt-4 
--tv_engine gpt-4 
--kr_engine gpt-4 
--sg_engine gpt-4 
--pg_engine gpt-4 
--test_number -1 
--rl_cell_threshold 18 
--cl_cell_threshold 18

それは予測を生成し、 results/tabmwp/chameleon_gpt4_test.json 、およびresults/tabmwp/chameleon_gpt4_test_cache.json results/tabmwp/chameleon_gpt4_test_cache.jsonl結果を保存します。

実行することで、平均して、さまざまな質問クラスで精度メトリックを取得できます。

python evaluate.py 
--data_file ../data/tabmwp/problems_test.json 
--result_root ../results/tabmwp 
--result_files chameleon_chatgpt_test_cache.jsonl

Chameleonを実行する（chatgpt）：

python run.py 
--model chameleon 
--label chameleon_chatgpt 
--test_split test 
--policy_engine gpt-3.5-turbo 
--rl_engine gpt-3.5-turbo 
--cl_engine gpt-3.5-turbo 
--tv_engine gpt-3.5-turbo 
--kr_engine gpt-3.5-turbo 
--sg_engine gpt-3.5-turbo 
--pg_engine gpt-3.5-turbo 
--test_number -1 
--rl_cell_threshold 18 
--cl_cell_threshold 18

コットを実行するには（考えられたチェーンプロンプト）GPT-4：

python run.py 
--model cot 
--label cot_gpt4 
--test_split test 
--sg_engine gpt-4 
--test_number -1

COT（考え方のチェーンプロンプト）を実行するには、ChatGPT：

python run.py 
--model cot 
--label cot_chatgpt 
--test_split test 
--sg_engine gpt-3.5-turbo 
--test_number -1

私たちのカメレオンは、一般化されたフォームのポット（プログラム）メソッドであり、生成されたプログラムは、 Program Generator 、 Program Executor 、およびAnswer Generatorのシーケンスです。 potとして--modelを渡すことにより、 modules ["program_generator", "program_executor", "answer_generator"]として設定されます。

ポットを走らせる（思考プログラムが促された）GPT-4：

python run.py 
--model pot 
--label pot_gpt4 
--test_split test 
--pg_engine gpt-4 
--test_number -1

ポット（思考プログラムプロンプト）を実行するには、chatgpt：

python run.py 
--model pot 
--label pot_chatgpt 
--test_split test 
--pg_engine gpt-3.5-turbo 
--test_number -1

？その他の例

ScienceQAデータセットのその他の例

showcase_scienceqa_more

Chameleon （GPT-4）は、さまざまなツールを構成するプログラムを生成し、正解を取得するためにそれらを順番に実行することにより、さまざまな入力クエリに適応することができます。

たとえば、上記のクエリには、「動物の生存が寒い場所で生存するためにどの動物の皮膚が適応されていますか？」と尋ねます。これには、動物の生存に関連する科学用語が含まれます。その結果、プランナーは、ドメイン固有の知識をBing検索エンジンに依存することを決定し、利用可能な多数のオンラインリソースの恩恵を受けます。

Tabmwpのその他の例

showcase_tabmwp_long

上の図の例に示すように、さまざまなクエリに対するカメレオンの適応性と汎用性もTabmwpで観察されます。

最初の例では、税務フォームの数学的推論が含まれます。 Chameleon （1）は、知識検索モデルを呼び出して、このようなドメイン固有のテーブルを理解するのに役立つ基本的な知識を思い出します。正確な計算。

2番目の例では、システムは、知識検索モデルによって提供される背景知識と密接に整合するPythonコードを生成します。

3番目の例では、入力クエリを考慮して、システムが大きな表形式のコンテキストでセルを特定する必要があります。 Chameleonは、プログラムベースのツールに依存するのではなく、関連する行を正確に見つけ、LLMモデルを介して言語ソリューションを生成するために行ルックアップモデルを呼び出します。

？カメレオンはどれくらい良いですか？

微調整されたモデルと少数のショットの両方のGPT-4/ChatGPTの両方でカメレオンの大幅な改善が観察されます。

Chameleonによって行われた予測を視覚化するには、特定のタスクに対応するJupyterノートブックを実行するだけです： notebooks/results_viewer_[TASK].ipynb 。これにより、モデルによって生成された結果を調査するためのインタラクティブでユーザーフレンドリーな方法が提供されます。または、詳細とオプションについては、プロジェクトページをご覧ください。

？カメレオン学習はどのような計画ですか？

ツールの使用

ScienceqaのChameleon （ChatGpt）とChameleon （GPT-4）から生成されたプログラムで呼ばれるツール：

tool_call_scienceqa

TabmwpのChameleon（ChatGpt）とChameleon（GPT-4）から生成されたプログラムで呼ばれるツール：

tool_call_tabmwp

遷移グラフ

notebooks/transition_[TASK]_[Model]_Engine.ipynbテストセットで生成されたプログラムのモジュールトランジショングラフを視覚化します。

ScienceqaでChameleon （GPT-4）によって生成されたプログラムのモジュール間の遷移。 StartはStart Symbol、Endは末端シンボル、その他は非末端シンボルです。

TabmwpqaでChameleon （GPT-4）によって生成されたプログラムのモジュール間の遷移。 StartはStart Symbol、Endは末端シンボル、その他は非末端シンボルです。

？新しいタスクを開発したいですか？

モジュールインベントリを構築します。DEMOS demos内でLLMベースのモデルのプロンプトを作成します。 model.pyの各モジュールの入力、実行、および出力を定義します。
LLMプランナーの開発：モジュールインベントリの包括的な説明を提供し、ターゲットプログラムにクエリをマッピングする方法を示すいくつかの例を含めます。
データローダーと評価方法を実装しますmodel.py内のデータローダーを定義します。評価方法を変更するには、 main.pyの対応するセクションを更新します。
プロセスをお楽しみください：基礎を所定の位置に置いて、楽しんで目の前のタスクに飛び込む時が来ました！

connection接続を維持してください！

素晴らしい！私は常に、議論、コラボレーション、または仮想コーヒーを共有することさえ魅了することにオープンです。連絡するために、連絡先情報についてはPan Luのホームページにアクセスしてください。

✅引用

Chameleonが研究やアプリケーションに役立つと思われる場合は、このbibtexを使用して親切に引用してください。

@article{lu2023chameleon,
  title={Chameleon: Plug-and-Play Compositional Reasoning with Large Language Models},
  author={Lu, Pan and Peng, Baolin and Cheng, Hao and Galley, Michel and Chang, Kai-Wei and Wu, Ying Nian and Zhu, Song-Chun and Gao, Jianfeng},
  journal={arXiv preprint arXiv:2304.09842},
  year={2023}
}

拡大する

追加情報

バージョン v1.0
タイプその他のソースコード
更新時間 2025-02-25
サイズ 295.03MB
から Github

chameleon llm

？ Chameleon：GPT-4を使用したプラグアンドプレイの構成推論

？ニュース？

？カメレオンについて

YouTubeビデオ

星の歴史

？要件

ショ和構成ショ和

Openai APIキー

Bing SearchAPIキー（オプション）

モジュールインベントリ

カメレオンのさまざまなツール

ツールサブセット

？ ScienceqaでCameleonを実行します

？ tabmwpでカメレオンを実行します

？その他の例

ScienceQAデータセットのその他の例

Tabmwpのその他の例

？カメレオンはどれくらい良いですか？

？カメレオン学習はどのような計画ですか？

ツールの使用

遷移グラフ

？新しいタスクを開発したいですか？

connection接続を維持してください！

✅引用

TensorRT LLM

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf

chameleon llm

？ Chameleon：GPT-4を使用したプラグアンドプレイの構成推論

？ニュース ？

？カメレオンについて

YouTubeビデオ

星の歴史

？要件

ショ和構成ショ和

Openai APIキー

Bing SearchAPIキー（オプション）

モジュールインベントリ

カメレオンのさまざまなツール

ツールサブセット

？ ScienceqaでCameleonを実行します

？ tabmwpでカメレオンを実行します

？その他の例

ScienceQAデータセットのその他の例

Tabmwpのその他の例

？カメレオンはどれくらい良いですか？

？カメレオン学習はどのような計画ですか？

ツールの使用

遷移グラフ

？新しいタスクを開発したいですか？

connection接続を維持してください！

✅引用

？ニュース？