  如图所示,请问官方给例子是通过上传图片,通过提示词获取的坐标,再利用坐标进行的实际标注吗,我实际测下来效果并不好,有其他方法吗,类似于这种任务的