Microsoft Agent-Lightning 設定と活用ガイド
本ドキュメントは、
microsoft/agent-lightningを使用してGIIPエージェントのプロンプトを自動最適化する方法を説明します。
🚀 概要
Agent-Lightningは、強化学習(RL)を通じてエージェントのプロンプトをチューニングするフレームワークです。作業履歴をデータセットとして活用し、エージェントがより高いパフォーマンスを発揮できるよう、最適な指示を見つけ出します。
[!IMPORTANT] Windowsユーザーへの注意:
はUnix専用ライブラリを使用するため、必ず WSL2 または Linux 環境で実行する必要があります。agent-lightning
🛠️ インストール方法 (WSL2 / Linux基準)
-
Python環境の準備:
# Python 3.10+ 推奨 python3 -m venv venv source venv/bin/activate -
ライブラリのインストール:
pip install agentlightning -
APIキーの設定: 学習ループがLLMを呼び出せるように環境変数を設定します。
export AZURE_OPENAI_API_KEY="your-key" export AZURE_OPENAI_ENDPOINT="your-endpoint"
📈 活用フロー
ステップ1: 学習データの生成
Windows環境のターミナルで次のコマンドを実行し、プロジェクト内の作業記録をデータセットに変換します。
python giipdb/scripts/prompt_optimization/generate_dataset.py
成功すると
giipdb/scripts/prompt_optimization/giip_training_data.jsonl ファイルが生成されます。
ステップ2: 強化学習の開始 (WSL2)
生成されたデータセットを使用してエージェントの指示をチューニングします。
# WSLターミナルで実行 python giipdb/scripts/prompt_optimization/train_giip_role.py
ステップ3: 最適化結果の反映
学習が完了したら、導き出された Optimal Prompt を
.agent/roles/ フォルダ内の該当するマークダウンファイルに反映します。
📊 期待される効果
- 成功率の向上: 過去の失敗事例を学習し、類似のエラーを防止。
- 自動プロンプトエンジニアリング: 手作業によるチューニングの代わりに、データに基づいた客観的なパフォーマンス最適化。
- 自律的改善システム: プロジェクト全体の運営過程でエージェントの知能を向上。