(通讯员 李宇楠)3月13日,2024年国际人工智能顶级会议AAAI竞赛奖项正式颁布,来自计算机科学与技术学院大数据与视觉智能研究所博士研究生冯冠文、本科生钱之浩、硕士研究生程昊然、麻志远组成的BDIV Lab团队在苗启广和李宇楠两位老师的共同指导下,从中国科学技术大学、华南理工大学、中国平安科技、上海学深智能科技、VAST等海内外十多家单位的参赛队伍中脱颖而出,在AAAI2024 Workshop AI for Digital Human的任务3:Multi-modal Learning for Audio-driven Talking Head Generation夺冠。
比赛获奖证书
本专题的竞赛议程聚焦于AIGC(Artificial Intelligence Generated Content)中的数字人生成领域,从两个赛道进行综合评估,分别是单图像赛道(Single Image Setting)和视频赛道(Video Setting)。在单图像赛道中,团队的方法以3DMM 系数为媒介,通过特征提取、系数融合预测和渲染三个模块实现视频序列的生成。在视频赛道中,团队采用神经辐射场的基本框架,用辐射场分别建模生成头部和躯干部分,最后将头部与躯干融合形成最终视频。
单图像赛道方法框架 视频赛道方法框架
据悉,在苗启广教授的带领下,大数据与视觉智能研究所近年来在图像/视频处理及人体行为智能识别等领域开展了大量研究,在面向细粒度情感控制的面部生成方面取得了一定成果。
成果链接:https://peterfanfan.github.io/EmoSpeaker/