主要是两方面的问题: 一、识别到的文字错误,如何用户接入修正后,再合成剪辑视频,否则错了就错了,无法纠错 二、对于DEMO能剪辑,自己的视频大多时候剪辑失败,体验不好。即使不剪辑,也应该输出整个视频带字幕,现在很难实现 整体功能规划不错,就是BUG太多,这种产品最好能达到80%的体验度再发布出来吧