視覚的に塗りつぶしのLLMプロンプトを比較して、学習したバイアスと関連性を明らかにします!
????

BertやGPT-3などの大規模な言語モデル(LLM)では、自然言語のタスクのパフォーマンスが大幅に改善されており、人々が質問に答え、エッセイを生成し、長い記事を要約するのを助けることができます。しかし、これらのモデルが何を学んだか、なぜ彼らが働くのかを理解することは、まだオープンな挑戦です。自然言語処理(NLP)のために、LLMSを「ブラックボックス」として訓練および展開する研究者とエンジニアについては、テキストを生成するために、ダウンストリームタスクでのトレーニングマニフェスト中に学習した動作がモデル開発を改善するのに役立つ方法を探ります。たとえば、有害なステレオタイプを浮上させることによって。
KnowledgeVisは、学習したテキスト表現からの関連性を明らかにするために、空間の充填プロンプトを比較するためのループ内の視覚分析システムです。 KnowledgeVisは、開発者が効果的なプロンプトのセットを作成し、単語間の複数のタイプの関係をプローブし、学習されたさまざまな関連性をテストし、BERTベースの言語モデルのいくつかの予測にわたる洞察を見つけます。
まとめて、これらの視覚化は、ユーザーが個々の予測の可能性と一意性を特定し、プロンプト間の予測のセットを比較し、すべてのプロンプトの予測間のパターンと関係を要約するのに役立ちます。
このコードには、研究論文が付属しています。
Knowledgevis:空白のプロンプトを比較することにより、言語モデルを解釈します
アダム・コシア、アレックス・エンテルト
視覚化とコンピューターグラフィックスに関するIEEEトランザクション(TVCG)、2023(表示する)
|論文|



完全なチュートリアルについては、デモビデオをご覧ください:https://youtu.be/hbx4rsumr_i
ライブデモについては、https://adamcoscia.com/papers/knowledgevis/demo/をご覧ください。
?いくつかの簡単な手順で、自分のLLMで視覚化をテストできます!
v3.9.x (最新リリース)をインストールするgit clone [email protected]:AdamCoscia/KnowledgeVIS.git
# use --depth if you don't want to download the whole commit history
git clone --depth 1 [email protected]:AdamCoscia/KnowledgeVIS.gitインターフェイスフォルダーに移動します。
cd interfacepy -3.9 -m http.serverpython3.9 -m http.serverLocalHost:8000に移動します。あなたはあなたのブラウザでnklewingvisが実行されているのを見るはずです:)
サーバーフォルダーに移動します。
cd server仮想環境を作成します:
# Start a virtual environment
py -3.9 -m venv venv
# Activate the virtual environment
. v env S cripts a ctivate # Start a virtual environment
python3.9 -m venv venv
# Activate the virtual environment
source venv/bin/activate依存関係をインストールします:
python -m pip install -r requirements.txt pytorch v2.0.x (手順)をインストールする
Pytorchは、一部のシステムがCUDAをサポートする可能性があるため、個別にインストールされています。
次に、サーバーを実行します。
python main.pyAdam Cosciaが率いるKnowledgeVisは、Georgia Techの人間の中心的なコンピューティングとインタラクションデザインの視覚化の専門家とのコラボレーションの結果です。 KnowledgeVisは、Adam CosciaとAlex Endertによって作成されています。
KnowledgeVisの詳細については、研究論文をお読みください(IEEE TVCGに掲載してください)。
@article { Coscia:2023:KnowledgeVIS ,
author = { Coscia, Adam and Endert, Alex } ,
journal = { IEEE Transactions on Visualization and Computer Graphics } ,
title = { KnowledgeVIS: Interpreting Language Models by Comparing Fill-in-the-Blank Prompts } ,
year = { 2023 } ,
volume = { } ,
number = { } ,
pages = { 1-13 } ,
doi = { 10.1109/TVCG.2023.3346713 }
}ソフトウェアはMITライセンスの下で利用できます。
ご質問がある場合は、お気軽に問題を開いたり、Adam Cosciaに連絡してください。