JMultiWOZ-TC

AIエージェントのツール呼び出しを評価するためのデータセットです。本データセットは，JMultiWOZを加工することで構築しており、4,246 対話に含まれるユーザ発話 31,303 発話に対して、合計 16,510 個のツール呼び出しが付与されています。

AIエージェント用評価データセット

jmultiwoz_tc_input.json をモデル入力に用い、モデルが生成したツール呼び出しを jmultiwoz_tc_ground.json と比較して評価します。

データ構成（展開後）

JMultiWOZ-TC_data.zip を解凍すると、以下のディレクトリが展開されます。

JMultiWOZ-TC_data/
├── jmultiwoz_tc_input.json   # 評価入力（ユーザ発話・コンテキスト）
└── jmultiwoz_tc_ground.json  # 正解ツール呼び出し（評価用アノテーション）

ファイル説明

jmultiwoz_tc_input.json: モデルがツール呼び出しを推定するための入力（ユーザ発話や対話コンテキスト）。
jmultiwoz_tc_ground.json: 対応する正解のツール呼び出しアノテーション（評価指標算出に使用）。

スクリプト

評価用のスクリプトは2026年3月上旬に公開予定です

ライセンス/クレジット

JMultiWOZ-TC データは Creative Commons Attribution 4.0 International (CC BY 4.0) で公開します。

詳細: https://creativecommons.org/licenses/by/4.0/

謝辞

JMultiWOZ-TCは、JMultiWOZ に基づく対話データをツール呼び出し形式へ再構築した評価用データセットです。

JMultiWOZ GitHub: https://github.com/nu-dialogue/jmultiwoz

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
JMultiWOZ-TC_data		JMultiWOZ-TC_data
JMultiWOZ-TC_data.zip		JMultiWOZ-TC_data.zip
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

JMultiWOZ-TC

AIエージェント用評価データセット

データ構成（展開後）

ファイル説明

スクリプト

ライセンス/クレジット

謝辞

About

Uh oh!

Releases

Packages

llm-jp/JMultiWOZ-TC

Folders and files

Latest commit

History

Repository files navigation

JMultiWOZ-TC

AIエージェント用評価データセット

データ構成（展開後）

ファイル説明

スクリプト

ライセンス/クレジット

謝辞

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Packages