System Info / 系統信息
Who can help? / 谁可以帮助到您?
@zRzRzRzRzRzRzR
Information / 问题信息
Reproduction / 复现过程
我们在web的实验中观察到GLM-4.1v存在大量(>80%)<think>时明确认为需要memory update,但是<answer>时Memory_Update中没有输出的情况,请问GLM team是否也观察到了这个现象?这是否因为官方在后训练的时候只使用了<answer>内的内容进行训练?我们使用与官方script完全一样的prompt与huggingface model。
Expected behavior / 期待表现
answer应与thinking保持consistent