giip

Microsoft Agent-Lightning 設定と活用ガイド

本ドキュメントは、

microsoft/agent-lightning
を使用してGIIPエージェントのプロンプトを自動最適化する方法を説明します。

🚀 概要

Agent-Lightning
は、強化学習(RL)を通じてエージェントのプロンプトをチューニングするフレームワークです。作業履歴をデータセットとして活用し、エージェントがより高いパフォーマンスを発揮できるよう、最適な指示を見つけ出します。

[!IMPORTANT] Windowsユーザーへの注意:

agent-lightning
はUnix専用ライブラリを使用するため、必ず WSL2 または Linux 環境で実行する必要があります。

🛠️ インストール方法 (WSL2 / Linux基準)

  1. Python環境の準備:

    # Python 3.10+ 推奨
    python3 -m venv venv
    source venv/bin/activate
  2. ライブラリのインストール:

    pip install agentlightning
  3. APIキーの設定: 学習ループがLLMを呼び出せるように環境変数を設定します。

    export AZURE_OPENAI_API_KEY="your-key"
    export AZURE_OPENAI_ENDPOINT="your-endpoint"

📈 活用フロー

ステップ1: 学習データの生成

Windows環境のターミナルで次のコマンドを実行し、プロジェクト内の作業記録をデータセットに変換します。

python giipdb/scripts/prompt_optimization/generate_dataset.py

成功すると

giipdb/scripts/prompt_optimization/giip_training_data.jsonl
ファイルが生成されます。

ステップ2: 強化学習の開始 (WSL2)

生成されたデータセットを使用してエージェントの指示をチューニングします。

# WSLターミナルで実行
python giipdb/scripts/prompt_optimization/train_giip_role.py

ステップ3: 最適化結果の反映

学習が完了したら、導き出された Optimal Prompt

.agent/roles/
フォルダ内の該当するマークダウンファイルに反映します。

📊 期待される効果

  • 成功率の向上: 過去の失敗事例を学習し、類似のエラーを防止。
  • 自動プロンプトエンジニアリング: 手作業によるチューニングの代わりに、データに基づいた客観的なパフォーマンス最適化。
  • 自律的改善システム: プロジェクト全体の運営過程でエージェントの知能を向上。