院况简介
1949年,伴随着新中国的诞生,中国科学院成立。
作为国家在科学技术方面的最高学术机构和全国自然科学与高新技术的综合研究与发展中心,建院以来,中国科学院时刻牢记使命,与科学共进,与祖国同行,以国家富强、人民幸福为己任,人才辈出,硕果累累,为我国科技进步、经济社会发展和国家安全做出了不可替代的重要贡献。 更多简介 +
院领导集体
创新单元
科技奖励
科技期刊
工作动态/ 更多
中国科学院学部
中国科学院院部
语音播报
近日,中国科学院软件研究所软件发展研究部智能化软件系统工程团队与中国科学院大学等单位研究人员合作,在代码审查意见自动生成方法研究方面取得进展。该研究提出了基于代码审查标记和预训练模型的代码审查意见自动生成方法,能够高效地对代码片段自动生成有意义的代码审查意见,帮助开发人员提高代码质量,缓解现有软件开发过程中严重依赖少数高水平程序员进行代码审查的难题,为提升软件开发过程中代码审查自动化能力起到重要支撑作用。
代码审查是保障软件质量的重要过程,然而在实际软件开发中,该过程往往严重依赖少数高水平程序员才能完成,一方面这可能造成多个软件(如被审查者和审查者正在参与开发的软件)开发过程中断并延迟,另一方面,即使是高水平程序员经验也是有限的,他们需要花费大量的时间进行代码审查,而且并不能保证审查出所有的代码错误或坏味。
针对此问题,研究团队提出一种基于代码审查标记和预训练模型的代码审查意见自动生成方法AUGER。他们从多个著名的Java项目中收集实际代码审查数据,通过代码审查标记嵌入技术构建了一个高质量数据集,利用T5预训练模型进行多策略多阶段训练。实验表明,该方法的ROUGE-L值相比于目前最好的方法提升了37.38%,而且整个模型推理过程平均可在20秒内完成。
相关成果以AUGER: Automatically Generating Review Comments withPre-training Models为题被软件工程领域学术会议ESEC/FSE 2022录用。该研究获国家重点研发计划、中科院战略性先导科技专项(A类)等项目支持。
基于代码审查标记和预训练模型的代码审查意见自动生成方法框架
对比实验结果
扫一扫在手机打开当前页
© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 中国科学院 版权所有
京ICP备05002857号-1
京公网安备110402500047号
网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话:86 10 68597114(总机)
86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn