大佬些,我看到论文中预测的帧存在结果比较模糊的问题,请问是否考虑过类似RNN+GAN的模型来预测生成更清晰的未来帧? 关于基线数据集,除了移动MNIST,以及低像素的Human3.6M,是否尝试过更高分辨率的图像? 另,README.md中的图片挂了.