CSIG中国图象图形学会-青年委员风采-唐厂
发布时间:2024-09-06 16:09:55 人气: 作者:小编
【青年委员风采】-唐厂
1 委员基本情况:
姓名 | 唐厂 |
工作单位 | 中国地质大学(武汉) |
职务 | 教授,博士生导师,系主任 |
研究方向 | 模式识别、机器学习 |
(个人形象照)
2 委员简介:
唐厂,中国地质大学(武汉)计算机学院教授,博士生导师,2016年博士毕业于天津大学,2014年9月-2015年9月在澳大利亚卧龙岗大学联合培养学习一年,入选2019年湖北省“楚天学子”和武汉市青年科技朝阳计划,IEEE、ACM高级会员。从事模式识别和机器学习领域的多视图聚类分析方面的研究,发表学术论文100余篇(包括TPAMI、TKDE、TIP、CVPR、IJCAI、AAAI等),其中ESI高被引论文9篇,ESI热点论文1篇,谷歌学术总引6000余次,获授权中国发明专利20余项。主持国家自然科学基金项目3项,CAAI-华为MindSpore学术奖励基金研究课题以及山东省自然科学基金创新发展联合基金等项目。担任CCF-NCTCS和CCF-AI专委执行委员,CSIG青工委委员,VALSE执行领域主席委员会委员以及Neural Networks和CAAI Transactions on Intelligence Technology等期刊编委,国际数字图像处理大会ICDIP 2022/2023/2024程序主席。获2023年度湖北省自然科学三等奖(序1)和ACAIT 2021最佳论文奖。研究成果落地于亚马逊、京东健康等企业以及国防应用。
3 委员亮点工作介绍:
作为无监督跨媒体数据处理的典型方法,多视图聚类因其将复杂数据化繁为简、化无序为有序的强大能力而被广泛应用于计算机视觉、生物医学等领域,具有重要理论研究和应用价值,也是模式识别和机器学习领域的基础科学问题。虽然得到广泛关注并已有大量研究成果,多视图聚类仍面临特征表示困难、视图关联复杂、数据视图不全等挑战。
唐厂教授紧跟国家发展战略,面向世界科技前沿,围绕上述难题开展系统深入研究并在无监督多视图表示学习、复杂视图关联下多视图聚类融合机理、含缺失视图的非完整多视图聚类等方面取得了系列创新性成果。
n 无监督多视图表示学习统一理论
多视图数据在对原始对象进行多样化描述的同时,由于传感器以及数据采集过程的复杂性,不可避免地造成多视图数据的高维、高噪声和冗余等质量不稳定问题。这些问题会直接导致学习模型的过拟合、弱普适性以及欠适定性。因此,在无标注情况下,如何得到原始多视图数据的简约、高效统一表示对提升多视图数据聚类性能至关重要。唐厂团队构建了数据内蕴几何流形结构约束的特征提取和特征选择统一表示学习理论体系,提出了特征选择引导的多视图特征提取方法。在保持原始数据局部几何流形结构和关联关系的前提下,将多视图数据从原始高维特征空间映射到简洁的低维特征空间中。同时,在特征映射的过程中,通过过滤噪声和冗余特征维度来增强新特征空间的判别性,从而更好地揭示多视图数据的内在结构信息。
图1 多视图特征提取和特征选择统一表示学习
n 多视图自适应柔性协同融合方法
多视图数据高效融合的挑战在于不同视图间的一致性和差异性难以平衡,使得融合之后的特征表达完备性不足。最终导致的后果为学习后的结果可能比学习前的结果还差。此外,由于标签的缺失,多视图聚类分析中的超参数选择也是一大未被解决的难题。针对上述问题,唐厂团队提出了共生-隐私策略驱动的多视图数据柔性融合方法。通过揭示不同视图数据之间的耦合机理,引入视图间的多样性和一致性动平衡机制学习原始多视图数据的统一内在表示,突破了现有方法对多视图关联主观预设的传统范式,增强了多视图数据协同的灵活性,提升了具有复杂关联的多视图数据的聚类性能。
图2 多视图自适应柔性协同融合
n 非完整多视图聚类与缺失值恢复联合建模策略
前述多视图聚类的一个前提假设是不同样本在每个视图下都是完整的。然而,该假设在很多实际应用场景中并不成立。针对带缺失视图的多视图数据聚类,以往的方法通常先将具有残缺视图的样本丢弃或者按照视图缺失模式将样本进行填充,如零值填充或者均值填充,然后再利用常见的聚类算法进行聚类分析。但是,简单丢弃带残缺视图的样本往往造成信息的严重损失,尤其是在医学、军事等数据稀缺领域,样本不足及样本获取成本高昂使得该方式极不适用。而先填充后聚类的方式往往由于前端缺失视图填充和后端聚类任务的割裂而得不到最优的效果。因此,设计能够应对视图缺失的多视图聚类方法,使之能灵活有效地适应不同缺失模式成为多视图聚类能否有效应用于解决实际问题的关键。针对这一问题,唐厂团队提出了面向聚类任务的缺失样本填充以灵活应对非完整多视图数据的新思路。具体地,提出将多视图聚类与缺失视图填充两个过程整合到同一优化目标框架中,缺失视图填充在自适应聚类结构信息的引导下进行完善,填充后的“完整”视图进一步支撑多视图聚类结构信息的精准化。这两个过程交替进行,相互协同相互促进直至最优。较以往缺失视图填充和聚类相互割裂的多视图聚类算法,该类算法获取的填充结果能够更好地服务于后续聚类任务,从而极大地提升了非完整多视图聚类算法的性能。
图3 缺失多视图聚类与缺失值填充
4 委员专访:
1. 请向我们科普一下您研究领域相关的一项技术在应用中的具体体现。
我的部分研究成果分别应用于亚马逊、京东健康、海克斯康等企业以及国防实际场景中。(1)与亚马逊(Amazon)公司合作,将提出的多视图深度视觉特征聚类融合模块用于该公司的广告虚拟产品替换系统(Virtual Product Placement System, VPP)中,有效提升了广告场景中的目标定位精度。(2)与京东健康合作,将提出的缺失多视图聚类算法成功地用于CT影像病灶预分割,使得最终CT影像病灶分割的精度提升了5%,分割效率提升了20%,将人工工作量减少了26%。此外,本人团队将多视图聚类方法应用于生物信息学领域的多组学数据分析,在药物开发、疾病辅助诊断、细胞分化轨迹推断以及癌症亚型识别等方面也取得了一定的成效。
2. 对于希望进入图像图形领域的青年从业者,您希望他们加强那些方面的技能培养?
首先,我自己也是一名图像图形领域的青年从业者。我觉得第一个出发点就是服从国家战略需求,从国家重大战略需求的角度出发定位自己的研究方向。另外一个很重要的方面就是基础知识理论的巩固和加强,深度学习兴起之后,我们也要对之前的优化方法和理论体系有深入的了解,加强对数据先验知识的理解以及建模的可解释性。此外,研究过程中一定要围绕问题的本质出发,每一个工作开展之前要认真思考解决的问题是什么?方法的动机是什么?这样才能形成研究的闭环。最后,研究的过程贵在坚持,遇到失败和挫折是常有的事情,如何在失败和挫折中达到自我蜕变也是作为青年研究者需要具有的一种重要品质。
3. 请问如何在所在的研究领域里做出有影响力的工作,应该如何自我提升。
目前来讲,大家的研究都做的特别好特别优秀。我觉得在自己的研究领域中要做出有影响力的工作,首先要避免科研的同质化。如果一个问题或者研究方向和方案大家都在做,我觉得再继续做下去的必要性就不大了。要实现自我提升,我觉得很关键的一点就是需要做别人没有做过的事情或者别人做不了的研究,这样更容易从大众中凸显出来。另外一点,就是要回归问题的本质,研究工作是否真的解决了某个领域难题或者促使了某个领域的进步。
4. 在您招收研究生时,一般会倾向于招收具备什么技能的学生?
在招收研究生的过程中,我比较注重于学生的四个方面的品质和能力:
1)端正的人品和价值观。俗话说,要成才,先成人,我觉得培养学生的首要任务是培养其具有良好的品格和正确的人生价值观。这也是我招生过程中长期注重的首要品质,良好的品格、正确的价值观和乐观的心态,肯定不会有太差的结果。
2)踏实认真的态度。做研究是一个周期相对较长的过程,在这个过程中,能够以踏实的态度坚持去完成某一件事是我认为很重要的品质。当然,聪明的学生可能效率更高,但普通人还是占多数。我相信只要学生能够踏实认真坚持下来,都能交上自己满意的答卷。
3)对从事科学研究的兴趣与热情。科学研究需要内在的驱动力和热情,如果对某一个方向有自己的兴趣,就不需要太多导师和外界的压力。从自身的兴趣和爱好出发,自然会有很多的想法和见解。
4)与人沟通的能力。研究的过程中会不可避免的遇到很多难题和瓶颈,单单依靠个人的力量很难突破自己的思维边界,如果能有和别人沟通交流的能力,很容易从另外的角度找到答案。
图4 唐厂教授和其团队学生