2022年6月,我校计算机科学与技术学院青年教师刘坤良在《IEEE Conference on Computer Vision and Pattern Recognition》(简称CVPR)上发表了题为《CDGNet: Class Distribution Guided Network for Human Parsing》的研究成果。刘坤良老师是天津工业大学和韩国亚洲大学联合培养的博士生,为该论文的第一作者,我校汪剑鸣教授和亚洲大学的黄元俊教授为共同通讯作者。CVPR是人工智能领域国际公认的最顶级会议,是中国计算机学会(CCF)推荐的A类国际会议。据悉,在谷歌学术公布的2021年最新的学术期刊和会议影响力排名中,CVPR位居第4,而名列前3位的期刊依次为Nature、NEJM和Science。
人类的图片解析(human parsing)属于场景解析领域,主要功能是把图片中的人类识别为相关的组成部分,比如头,身体和衣物类别等。该领域的研究有助于神经网络对人类场景的理解,支持以人为中心的相关应用,比如:视频监控、动画人物编辑、虚拟穿衣,自动驾驶和人机交互等。由于衣物的纹理和风格各异、人体姿态的复杂变化和人体不同部位尺度的多样性,人类解析非常具有挑战性。由于人体是由具有层次结构的各部位组成,每个部位有其独特的空间分布特点,比如:人的胳膊大部分情况居于人体两侧。该论文充分利用了该特点提出了基于人体部位分布驱动的解析网络,在LIP、ATR和CIHP数据集上取得了State-of-the-art的性能。
刘坤良老师的研究工作得到了中国国家自然科学基金(No. 62072335)、天津市自然科学基金(19PTZWHZ00020)和韩国MSIT(No.2021-0-00951)基金、ITRC(IITP-2021-2018-0-01431)基金的支持。
该项科研成果依托学院的天津市自主智能与系统国际联合研究中心完成,自2018年获批以来,联合研究中心在人工智能领域发表了CCF B类以上或SCI 2区以上高水平学术论文数十篇,形成了一支在人工智能科研领域潜心研究、深入探索的教师队伍。该项成果在CVPR国际顶级会议论文的发表,显示出我校在计算机视觉相关研究领域的学术成果再一次得到了国际同行专家的认可。
撰稿人:刘坤良、柯永振;校对:王赜;审稿人:闫凡雷