中国对世界科技的贡献 ,工程科技和科技工程

2019第二届中国“AI+”创新创业大赛作品提交截止日期延期的通知

时间:2019-12-30 13:10:20 | 作者:爱科技网 | 点击: 160 次

根据部分参赛团队的要求,经研究决定,大赛组委会将各参赛团队网上提交作品的时间延期至2019年7月31日17:00结束,在提交及报送作品过程中如有问题,请及时与大赛组委会联系。

各相关单位:

2019第二届中国“AI+”创新创业大赛--大规模特征检索技术创新大赛(以下简称“大赛”)将于2019年5月至11月举行。

在信息时代,海量数据需要高效的检索算法进行归档。如何又快又好地检索数据库中与目标最相近的样本,是特征检索的主要目标。为了促进大规模特征检索技术的发展,中国人工智能学会特此主办本次特征检索技术大赛。为从事大规模特征检索研究的研究人员、产业界从业人员以及AI技术爱好者提供一个良好的沟通平台。

现将2019第二届中国“AI+”创新创业大赛--大规模特征检索技术创新大赛通知的有关事项通知如下:

一.大赛机构

1.主办单位

中国人工智能学会

2.组织单位

电子科技大学

3. 评测委员会

主席团:

宋井宽(电子科技大学)

王井东(微软亚洲研究院)

刘 丽(国防科技大学)

刘 力(Inception Institute of Artificial Intelligence)

二.参赛办法

1.参赛对象

本次大赛是面向全国高校,科研机构,和涉及特征检索、哈希、量化等技术的人工智能领域企业的赛事,欢迎各单位积极组织队伍申报参赛。

2.参赛组队形式

选手可在网上自行组队报名,每支队伍包含 3-5 名队员,选手的地区、年龄、职业不限,每队至少有一名中国国籍选手。

以公司为单位参赛,需已注册成立企业;高校以团队为单位参赛,需由指导教师带领。参赛个人及单位要求无不良记录;参赛项目的产品、技术及相关专利专属于参赛团队及个人,与其他任何单位或个人无产权纠纷,如在参赛期间发现有侵犯外单位知识产权或盗用成果等纠纷,一经核实,立即终止该参赛队参赛资格,取消其已获得的奖项。

3. 报名方式

2019年7月31日前,参赛队伍在大赛网站(https://aichina.caai.cn/)的报名系统中在线报名,完成相关信息录入,完成报名。(有特殊要求的各赛区自行确定后可以向大赛组委会提出需求)

4. 参赛选题

(1)竞赛背景

近年来随着大数据、数据挖掘以及深度学习在语音、图像、自然语言处理等人工智能任务中的高速发展,伴随这些生成的特征数据也极为庞大。在海量的特征中进行搜索对时间和精度尤其敏感。数据检索具有重要的实际意义,吸引了众多研究者的关注。目前,哈希技术和量化技术是特征检索中的主要技术。本赛题通过在大规模数据集上进行检索竞赛,检验检索技术的速度、压缩率和精度等多方面性能指标。

(2)赛题描述

比赛中分为模型训练,数据集编码和模型提交测试三个阶段。数据集分为训练集(Training Set)、检索集(Base Set)、测试集(Query Set)三个部分。选手首先使用训练集对模型训练,然后将检索集的数据压缩为二进制文件,最后使用二进制文件以及检索接口在测试集上进行检索,得到每条测试数据在检索集中最相近的前K个结果。

(a)初赛流程

我们将在公开数据集上进行评测,选手下载训练集并训练完成后,根据比赛要求提供测试接口,之后将代码、压缩后的检索集以及训练好的模型提交至服务器中用于评测,我们将会根据后述的评价指标进行排名。每组选手最多可提交15次,取最好的作为最终结果。

数据集详情:

SIFT1M:用于评价近似最近邻搜索算法性能的经典数据集,其中的样本来自于SIFT算法生成的128维正整数向量,取值范围在 [0, 255] 之间。训练集包含100,000条数据,检索集包含1,000,000条数据,测试集包含10,000条测试数据,训练集与检索集为同一分布。选手在本地测试代码时可以使用SIFT1M提供的数据来验证代码,但为避免作弊,我们将使用另外生成的测试数据而不是原始测试集。测试时,程序先对整个检索集进行编码得到压缩后的检索数据,再使用测试集的数据逐条检索,根据程序返回的前100个结果计算mAP@100、检索时间以及压缩率进行加权,得到评分,具体评价指标请见后述。Groundtruth的定义为:一个query在整个检索集中使用欧式距离遍历计算得到距离最小的样本。

下载:

(b)决赛流程

决赛将会提供由我们生成的数据集进行评测,评测方式与初赛大致相同。需要注意的是,我们将只提供训练集,而不会提供测试集(Query Set)、检索集(Base Set)以及groundtruth。

数据集详情: