# Inference generated_ids = model.generate(**inputs, max_new_tokens=512, temperature=temperature) 在这个温度设置好像并不起作用?使用的是这个模型:VideoChat-R1_7B