算法设计模块数据集及作品提交说明
发布时间:2018-08-15 来源:江苏省研究生计算机视觉科研创新实践大赛

一、竞赛任务

本模块竞赛共分为两项任务,具体如下:

1)行人位置检测。对带行人的场景照片进行分析,通过设计相应的算法检测行人在该照片中的具体位置,并给出行人(可能是多个)矩形框区域坐标。

2)视频动作识别。利用提供的人工标注的人体动作视频,设计算法来自动识别未标注的动作视频中人体动作的种类。

二、提交说明

按照本次竞赛日程安排,参赛队伍需在20180920前提交算法设计竞赛模块作品材料,具体包括以下五个文件夹:【程序源代码】、【设计文档】、【可执行程序】、【运行文档】【答辩PPT】。此处五个文件夹分别作如下说明:

1)程序源代码。包括全部的源代码以及依赖库。

2)设计文档。描述如何处理大赛任务,提供其设计思想和实现细节,并提供主要文件的简洁功能说明。

3)可执行程序。包括可以直接运行的可执行文件结果输出文件(对于Ubuntu下基于深度框架的情况,需提供直接运行的脚本命令)。

4)运行文档。简明并准确地描述如何运行提供的可执行程序。

5答辩PPT。制作10分钟左右的PPT,展示所设计算法的思路及效果,若作品进入决赛将作为决赛答辩PPT使用。

说明:最后提交的结果应当严格按照上述四个文件夹命名方式命名,且上述五个文件夹应当统一压缩为一个压缩文件,且以【队伍编号.rar】命名(例如参赛队伍【0001】的提交文件应当为【0001.rar】)。另外,本次竞赛所提交的程序应当严格遵守以下原则:

l 请严格按照比赛环境配置提交相应程序。

l 若提交的程序无法运行或运行错误,按提交失败处理(建议参赛队伍提交前进行本地测试)。

l 组委会要求,每支队伍只有一次提交竞赛文档的机会,请各位参赛队伍切记谨慎、仔细整理所提交的文档。

三、训练集下载

行人检测训练数据集下载地址:

链接:https://pan.baidu.com/s/1JMM_RrR4bAnXZnFPN0plFA密码:zre8

动作识别训练数据集下载地址:

链接:https://pan.baidu.com/s/1aXaBtunhqI-iRCKcemQRBQ密码:i8r3

四、训练集数据说明

本次竞赛训练集包括两个部分:行人检测数据集、动作识别数据集

行人检测数据集为各种场景下拍摄的行人照片(灰度图),共205张。其特点是每张照片包含的行人数量不确定,而且由于行人的着装、姿态各不相同,行人与行人、行人与物体之间有部分遮挡等问题,使得行人的位置较难确定。

动作识别数据集为各种场景下拍摄的人体动作视频短片,共4039段,51种。这类视频的特点是一段视频确定地含有一种人体动作,每段视频的长度不一,这些视频已按动作种类为单位分好了类。

4.1行人检测数据集介绍

行人检测数据集,包括两个文件夹:AnnotationsBMPImagesBMPImages文件夹中为行人照片(灰度图,图片格式为BMP)。Annotations文件夹中为标注文件。其中,标注文件的文件名与行人照片一一对应,且标注文件的格式为xml格式。标注文件的主要格式为:

<ObjectList>

<Object>

       <Rect  x=”行人1位置左上角x坐标”  y=”行人1位置左上角y坐标”  width=”矩形框的宽度”  height=”矩形框的高度”  />

    </Object>

<Object>

       <Rect  x=”行人2位置左上角x坐标”  y=”行人2位置左上角y坐标”  width=”矩形框的宽度”  height=”矩形框的高度”  />

    </Object>

      ...

<Object>

       <Rect  x=”行人n位置左上角x坐标”  y=”行人n位置左上角y坐标”  width=”矩形框的宽度”  height=”矩形框的高度”  />

    </Object>

</ObjectList>

其中,行人位置的坐标系如下图:

      

下图是其中的一张训练照片及其行人位置矩形框(红色标注):

4.2动作识别数据集介绍

动作识别数据集,包括不同种类的人体动作视频,所有视频都已按照标准分类结果存放至相应种类的嵌套文件夹中。其中,动作具体的分类命名标准参照动作识别数据集中的【人体动作命名.xlsx】文件。

五、竞赛运行平台环境配置

本次竞赛的测试运行平台Ubuntu系统,具体配置如下:

5.1 Ubuntu测试平台环境配置(软件)

5.2 Ubuntu测试平台环境配置(硬件)

六、测试程序编写要求

6.1测试数据输入路径

任务一:行人位置检测

1)在Ubuntu平台下,测试程序中数据的输入路径请设为:“/home/jscvc2018/Task1/”;

2)检测任务的所有测试照片(照片为BMP格式)将置于服务器Task1目录下,用于大赛主办方测试参赛者提交的测试程序,测试集不对参赛者公开;

3)测试照片的命名规则是按照名称递增的(照片名称无规律)。

任务二:动作识别分类

1)在Ubuntu平台下,程序中数据的输入路径为:“/home/jscvc2018/Task2/”;

2)识别任务的所有测试视频(视频为AVI格式)将置于服务器Task2目录下,用于大赛主办方测试参赛者提交的测试程序,测试集不对参赛者公开;

3)测试视频的命名规则是按照名称递增的(视频名称无规律)。

6.2任务结果输出文件设置说明

任务一:行人位置检测

1)每个竞赛队伍需在可执行程序目录下新建一个【队伍编号_task1】文件夹,用于存放检测任务中每张测试图片的测试结果。

2)检测到行人位置后,输出矩形位置的左上角坐标和宽高等数据,数据之间用空格隔开(格式如下:x y w hx为左上角x坐标,y为左上角y坐标,w为矩形框宽度,h为矩形框高度)。

3)测试图片中可能会有多个行人共存的情形。

4)对于每张测试图片,检测到其中的行人位置后,将行人位置(若有多个行人,按从左到右的顺序按行)写入【队伍编号_task1】文件夹中测试程序所创建的【图片名.txt】文件中(例如编号为【0001】的队伍读取了一个名为9Cup11.bmp的测试图片后,将检测到的位置信息写入到【0001_task1】文件夹中的【9Cup11.txt】文件中)。写入方式设为覆盖式,以确保输出文件中数据为最后一次测试的结果。

 下图给出某张测试图片的输出样例,该张图为含多人情形,每个行人(从左到右顺序检测)检测数据占一行:

 

任务二:动作识别分类

1)每个竞赛队伍需在可执行程序目录下新建一个【队伍编号_task2】文件夹,用于存放识别任务的测试结果。

2)对测试视频中动作的种类进行分类后,应按照数据集文件夹中的【人体动作命名.xlsx】文件所规定的命名规则,依次将每段视频中的动作的种类字符串按行写入【队伍编号_task2】文件夹里由测试程序生成的【队伍编号_task2.txt】文件中,每段测试视频识别结果占一行。写入方式设为覆盖式,以确保输出文件中数据为最后一次测试的结果。

注意:每个任务处理完单张图片(或单段视频)后需在程序中输出该图片(或视频)的处理时间(可通过调用系统时间函数实现),并在处理完所有测试图片(或视频)后输出每张图片(或视频)的平均处理时间。具体输出格式参照下图:

                      

(输出单张图片处理时间,单位为秒)

                            

(输出图片平均处理时间,单位为秒)

七、评价指标

任务一:行人位置检测

检测任务的评价指标是预测框与真实框的平均交集除并集(mIOU,对于一张图片里出现的多个目标,按从左到右的顺序依次计算IOU。若一张图片里预测的边框数小于真实的边框数,则按从左到右的顺序依次计算后,后面未检测到的边框IOU记为0;若预测的边框数大于真实的边框数,则按从左到右的顺序依次计算后,多检测出的边框不参与计算。

任务二:动作识别分类

识别任务的评价指标是正确识别的视频个数除以测试总视频个数,我们将从【队伍编号_task2.txt】文件中按行依次读取预测结果并与真实结果进行比较。若预测结果数少于真实结果数,则按从上到下的顺序依次比较后,未预测出的结果按预测失败计算;若预测结果数多于真实结果数,则超出的预测结果不参与精度计算。

注意:程序的运行时间我们也将纳入评价指标,即每个任务的排名=精度排名×60% +效率排名×40%(其中精度是所有测试图片或视频测试的平均精度,效率是平均每张图片或每段视频的处理时间),我们最终将结合任务一、任务二排名平均加权的方式进行最终排名。

八、联系方式

说请各位参赛队员及时关注本次竞赛的网站以及发布的通知:

http://jscvc.ujs.edu.cn

如有任何本届竞赛相关疑问,请随时联系竞赛委员会,大赛交流QQ813325605

联系人:成科扬

联系电话:13094956326

通讯地址:江苏省镇江市学府路301

邮箱:kycheng@ujs.edu.cn

邮编:212013