数计学院两篇论文被CCF B类国际会议ICASSP2021录用

时间:2021.01.31       信息来源:数计学院        作者:喻仪       点击率:

近日,由数计学院青年老师和研究生合作完成的两篇论文被ICASSP2021(International Conference on Acoustics, Speech and Signal Processing)录用。其中,一篇论文涉及虚拟试衣,主要由彭涛副教授指导的2019级硕士研究生常源同学完成;另一篇论文涉及行人重识别,主要由青年博士熊明福老师完成。

ICASSP会议即国际声学、语音与信号处理会议,是全世界最大的,也是最全面的信号处理及其应用方面的顶级会议,是IEEE(电子技术与信息科学工程师协会)旗下的重要国际会议,近年来每年参会人数规模超三千人。它涵盖了音频和声学信号处理,图像、视频和多维信号处理,物联网的信号处理等多个方向,是中国计算机学会(CCF)推荐国际学术会议中的B类会议。以下是两篇论文的详细介绍:

论文一:DP-VTON: TOWARD DETAIL-PRESERVING IMAGE-BASED VIRTUAL TRY-ON NETWORK

(作者:常源(学生),彭涛,何儒汉,胡新荣,刘军平,张自力,姜明华)

该论文主要由数计学院可视计算与数字纺织团队中彭涛副教授指导的2019级硕士研究生常源同学完成。论文主要关注的是服装的虚拟试衣,其为虚拟现实领域研究的热点之一,有着广泛的应用前景。作者针对虚拟试穿过程中目标衣服细节和非目标区域细节生成与保持问题进行研究,提出了一种四阶段的深度学习网络结构。首先,结合像素和特别进行扭曲变化的扭曲衣服模块,然后使用扭曲衣服进行预测语义布局的语义分割预测模块,并使用手掌生成完整手臂的手臂生成模块,最后,将前三个模块输出融合的试穿合成模块。结果表明,相比于目前最新的方法,该方法显著提高虚拟试衣的效果。

图1:论文一中的主要模块

图2:论文一的实验结果对比

论文二:A Triplet Appearance Parsing Network for Person Re-Identification

(作者:熊明福,王中元,何儒汉,胡新荣,程铭(学生),秦啸,陈佳)

该论文主要由数计学院可视计算与数字纺织团队中的青年博士熊明福老师完成。论文主要关注的是行人重识别(Person Re-identification),其为通过匹配多个空间上无重叠的摄像机在不同视觉下的两个对象是否为同一目标的技术,是当前人工智能和多媒体等领域研究的热点之一,并广泛应用于智能刑事侦查等社会安全方面。作者针对当前行人重识别问题中由于行人背景杂乱而影响其识别精度的问题,提出了一种基于三元组行人外观解析模型。通过对行人的通道信息,局部空间位置信息和颜色信息的解析,以获取更为鲁棒的行人特征。实验结果表明,该方法在国际公共数据集上相对于当前最新算法有显著的提升。

图3:论文二的主要思路

ICASSP2021计划于2021年6月6日至11日在加拿大的多伦多举行,因受疫情影响,ICASSP2021已调整到线上举行,届时可视计算与数字纺织团队将在会上做口头报告,与全世界的相关学者分享团队的研究成果。

这也是近期继裴来凡同学和刘杰教授的论文被CHAOS期刊录用之后的又一佳绩,体现了数计学院研究生培养质量的逐步提升,同时激励更多同学和老师在科研的道路上不断前行,取得更多优异成果。

投稿单位审核:涂耀威        责任编辑:郑婷

下一条

新闻