李飞飞又出手了!开源了1亿张授权图片数据集,重塑视觉生成基准 (opens in new tab)
近日,美国斯坦福大学李飞飞、吴佳俊团队发布了一个图片数据集,名字叫做 GPIC,该数据集包含了一亿张照片,总像素接近 28 万亿。每张图片都配有详细的文字描述,有的是一两个关键词,有的是五六句话的长段落。其最特别的地方在于所有图片都可免费用于商业和研究,无需担心版权问题。他们还提供了一个标准的测试方法,让不同公司的 AI 模型能够在同样的规则下比拼生图能力。GPIC 解决了 AI 生图领域的两个老大难问题:其一解决了版权问题,以前大公司训练模型使用的图片很多来路不明以至于惹上官司,而 GPIC 所有图片的许可证都清清楚楚,商用完全没问题;其二解决了可重复性问题,以前很多数据集给到是图片链接,时间久了链接就会失效,别人没法复现实验结果。GPIC 把图片打包成为固定的 tar 文件然后存在 Hugging Face 上,任何时候下载都是一样的。这意味着未来无论是手机里的修图软件、游戏里的场景生成器甚至是电影特效工具,都能用上更聪明的 AI 生图模型。训练模型需要大量的图片,以前的做法是从网上到处扒图,然而很多图片都有版权,很多时候不敢随便用。(来源: style="line-heig...
Read the original article