Google的Jeff Dean曾指出,多模态研究将是未来的一大趋势,这也引起了业界的广泛关注。在国内,阿里巴巴达摩院智能计算实验室也在积极深入探索中文多模态预训练及超大规模预训练,近期相继推出了百亿、千亿、万亿参数和十万亿参数模型M6模型。这些模型是目前全球规模最大的预训练模型,已经成功应用在各大下游任务中,如搜索、推荐、服饰设计、智能文案等真实场景中。同时,阿里巴巴达摩院联合阿里云发布了M6预训练平台,将大模型的能力以服务的形式对外提供,同时M6预训练平台是目前下游任务覆盖最广泛的平台,简洁易用,数行代码即可执行微调和预测等功能。
然而,目前多模态领域的评测基准和数据集多以英文为主,如MSCOCO的Image Captioning、VQA、textVQA、VCR等。缺乏一个统一的评测基准让研究人员可以全面评测自己的模型在不同场景以及不同任务类型的表现。当前中文领域的多模态公开数据集和榜单更是乏善可陈。
为了促进中文多模态领域的发展,达摩院智能计算实验室认知智能团队推出了大规模中文多模态评测基准MUGE,它是当前最大规模的中文多模态评测数据集。该数据集覆盖多种类型的任务,包括图文描述、基于文本的图像生成、跨模态检索等,对模型展开了全方位的评测,帮助研究人员对自己的模型得到更好的理解。这个评测基准提供了丰富的多模态数据和多种评测方法,旨在为多模态领域的研究人员提供更为全面和准确的评测手段。这对于中文多模态领域的研究和发展来说,无疑是一个重要的里程碑。
总之,中文多模态领域的评测基准和数据集的缺乏一直是制约该领域发展的主要瓶颈之一。MUGE的推出为中文多模态领域的发展提供了强有力的支持,也为众多研究人员提供了更为广阔的研究空间和更为全面的评测手段。相信在未来的发展中,MUGE评测基准还将不断得到优化和完善,为中文多模态领域的发展和创新提供更加坚实的保障。
今天的文章 为助力人工智能技术发展,中文多模态评测基准MUGE已推出分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/92083.html