网站大量收购独家精品文档,联系QQ:2885784924

基于深度学习的代码生成方法研究进展.pdf

基于深度学习的代码生成方法研究进展.pdf

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

*

基于深度学习的代码生成方法研究进展

111234

杨泽洲,陈思榕,高翠芸,李振昊,李戈,吕荣聪

1(哈尔滨工业大学(深圳)计算机科学与技术学院,广东深圳518055)

2(华为技术有限公司,广东深圳518129)

3(北京大学信息科学技术学院,北京100871)

4(香港中文大学计算机与工程系,香港沙田)

通讯作者:高翠芸,E-mail:gaocuiyun@hit.

摘要:代码生成(CodeGeneration),是指根据自然语言描述生成相关代码片段的任务.在软件开发过程中,常

常会面临大量重复且技术含量较低的代码编写任务,代码生成作为最直接辅助开发人员完成编码的工作受到学术

界和工业界的广泛关注.让机器理解用户需求,自行完成程序编写也一直是软件工程领域重点关注的问题之一.

近年来,随着深度学习在软件工程领域任务中的不断发展,尤其是预训练模型的引入使得代码生成任务取得了十

分优异的性能.本文系统梳理了当前基于深度学习的代码生成的相关工作,并将目前的基于深度学习的代码生成

方法分为三类:基于代码特征的方法,结合检索的方法以及结合后处理的方法.第一类是指使用深度学习算法利

用代码特征进行代码生成的方法,第二类和第三类方法依托于第一类方法进行改进.本文依次对每一类方法的已

有研究成果进行了系统的梳理,总结与点评.随后本文还汇总分析了已有的代码生成工作中经常使用的语料库与

主要的评估方法,以便于后续研究可以完成合理的实验设计.最后,本文对总体内容进行了总结,并针对未来值

得关注的研究方向进行了展望.

关键词:代码生成;深度学习;代码检索;后处理;机器翻译

中图法分类号:TP311

中文引用格式:杨泽洲,陈思榕,高翠芸,李振昊,李戈,吕荣聪.基于深度学习的代码生成技术研究进展.软件学报,2021,

32(7).http://www.jos.org.cn/1000-9825/0000.htm

英文引用格式:YangZZ,ChenSR,GaoCY,LiZH,LiG,LvRC.DeepLearningBasedCodeGenerationMethods:ALiterature

Review.RuanJianXueBao/JournalofSoftware,2021(inChinese).http://www.jos.org.cn/1000-9825/0000.htm

DeepLearningBasedCodeGenerationMethods:ALiteratureReview

111234

YANGZe-Zhou,CHENSi-Rong,GAOCui-Yun,LIZhen-Hao,LIGe,LVRong-Cong

1(SchoolofComputerScienceandTechnology,HarbinInstituteofTechnology,Shenzhen,518055,China)

2(HuaweiTechnologiesCo.,Ltd.,Shenzhen518129,China)

3(SchoolofElectronicsEngineeringandComputerScience,PekingUniversity,Beijing100871,China)

4(DepartmentofComp

文档评论(0)

数据相关的文档 + 关注
实名认证
服务提供商

数学毕业,从事大数据工作十几年,涉及二三十个行业

1亿VIP精品文档

相关文档