新闻动态

喜报!恭喜计算机学院博士毕业生张培歆荣获2022年浙江省优秀博士学位论文

上传时间 :2024-01-02    浏览次数 :10    编辑 :胡舸

近日,浙江省研究生教育学会公布了2022年浙江省优秀博士学位论文评选结果,63篇博士学位论文被评为2022年浙江省优秀博士学位论文,浙江大学49篇论文获评浙江省优秀博士学位论文。

我院张培歆博士的学位论文《深度神经网络的公平性测试》被评为2022年浙江大学优秀博士学位论文,指导教师为王新宇教授!

祝贺张培歆博士!也让我们一起来欣赏张培歆博士及其导师王新宇教授的风采!


深度神经网络的公平性测试


论文作者:张培歆

指导教师:王新宇

01 博士论文简介

论文针对深度神经网络的公平性测试问题展开研究,公平性是发展负责任的人工智能的基本治理原则之一。论文从表格数据、文本数据以及图像数据三种常见输入数据类型入手,对深度神经网络的个体歧视样本生成方法、公平性测试充分性指标以及扩充训练技术等公平性测试关键要素展开研究。论文的创新点在于:提出了一种梯度引导的深度神经网络公平性测试算法;提出了一种基于梯度进行词条替换的文本分类深度神经网络公平性测试算法;提出了基于公平性测试充分性度量的深度图像分类模型的公平性测试框架。论文为深度神经网络公平性测试领域发展方向提供了新的思路,相关成果两次获得软件工程领域旗舰会议ICSEACM SIGSOFT Distinguished Paper Award以及一次2020年度ACM SIGSOFT Research Highlights

02 导师说


王新宇教授

张培歆同学具有扎实的计算机理论基础,具备敏锐的科研洞察力和很强的独立解决问题能力,其博士论文针对深度神经网络的个体公平问题首次提出了梯度引导的深度神经网络公平性测试算法,大幅提高了模型的公平性,为人工智能可信性研究提供了新的思路,为该领域做出了突出贡献。相关研究成果获得软件工程领域国际旗舰会议ICSE 2018杰出论文奖、ICSE 2020杰出论文奖。希望他在未来的学术研究道路上继续乘风破浪、砥砺前行!为可信人工智能的学术界和产业界做出更大贡献!


03作者说 

是在学术方向上有了自己感兴趣并且深入研究的领域,更重要的是在这五年里,我解决问题的方式以及对待事物的态度都获得了飞速成长。读博期间,我曾多次参加海外交流和会议,既结识了许多志同道合的朋友,也体验到了不同的科研和生活环境,这有助于激发我的灵感。


1读博的过程更像一个认识自我的过程

博士与之前的学习生涯大不相同,没有人再告诉你应该做什么。本科时,老师们会为你提供问题和答案,你知道自己知道什么。硕士时,导师会给出问题,但需要自己去探索答案,你知道自己不知道什么。博士则需要你自己去发掘问题,你甚至不知道自己不知道什么,需要自己深入探索和思考。因此,读博需要更高的自主性和独立思考的能力。最难的不是找bug,也不是赶DDL,而是不断地思考所解决问题的价值,反复的询问自己所从事项目的意义是什么。不断的迷茫和不断提出新问题,并反复推翻自己的想法。接受自己的不完美,承认自己的迷茫,不断学习,接触新的知识。我们之所以感到困难,是因为我们一直在向上走,不停地挑战自己,寻找新的发展机遇。


2优秀的导师与团队能让读博事半功倍

一个好的导师和团队,不仅会给你带来优秀的科研资源和指导,也会影响你的做事风格和处事态度。我很幸运遇到了我的导师王新宇教授, 他在计算机领域有着丰富的科研经验和卓越的学术成就,而且对我们非常关心和负责,给予了我充分的自由和支持。在外访问期间,我有幸成为SMU孙军教授团队的一员,孙老师总是可以提供非常有针对性的学术指导和意见,不光注重培养学生的研究能力, 还让我学习到了一个优秀的科研人员应该有的学术素养。团队中的王竟亦学长也一直在用自身的经历引导我少走弯路。我很荣幸,在读博期间能遇到这样优秀的导师和团队,这也是我能顺利完成学业并取得诸多成果的基础与核心。

除此之外,建立良好的研究习惯也很重要,包括时间管理、阅读、写作和数据处理等,这些都帮助我更好地完成研究任务。在读博过程中,我也遇到了各种挑战和困难,慢慢学会了主动寻求支持和帮助,包括导师和同学等。生活上也要劳逸结合,读博并不是让我们放弃自己的生活,而是为了让我们更好的生活。


04 学术成果 

深度神经网络公平性保证与提升框架

本文聚焦深度神经网络的公平性测试问题,具体研究:

1)针对现有方法在深度神经网络上表现不佳的问题,论文提出了基于梯度计算的轻量级深度神经网络公平性测试算法ADF。其通过全局生成和局部生成两个阶段来系统性地获取个体歧视样本。全局生成利用梯度符号来最大化相似样本对之间的输出差异以获得个体歧视样本。而局部生成则是基于梯度大小来搜索个体歧视样本的邻域。

基于表格数据的公平性测试算法ADF

2)针对文本词条上下文相关性和词嵌入预处理的挑战,论文提出了集成梯度引导搜索和语义保持扰动方法的文本分类网络公平性测试算法AFTT。其提供了两种全局生成策略:AFTT_ASC根据梯度大小及方向分别来确定被替换词和替换词;AFTT_HF利用梯度估算所有替换方案对输出结果的影响来确定最优方案。

基于文本数据的公平性测试算法AFTT

3)针对图像抽象语义和现有工作未提供公平性测试充分性标准的挑战,论文提出了图像分类网络公平性测试框架DeepFAIT。该框架首先利用GAN来转换图像的敏感属性;接着利用显著性检验来筛选公平性相关神经元;然后设计了5个层和神经元水平的公平性测试指标来评估测试的充分性;最后采用k多区间策略来采样个体歧视样本,以提高扩充训练的效果。

基于图像数据的公平性测试框架DeepFAIT


计算机学子披荆斩棘频传佳绩

热烈祝贺!

张培歆(左)与导师王新宇教授(右)