Visual7W 图像数据是一个图像内容理解的数据集。
通过对图像区域的文字描述和互相之间的关联,进行视觉问答(Visual Question Answering)任务,数据集中不仅包含图像本身,还包括图像内容的区域内容的问答。
官网已经打不开。
https://pan.baidu.com/s/1kVNUTrL 网盘密码:6wge