【论文笔记】An Extractive-and-Abstractive Framework for Source Code Summarization

本文介绍: 2. Model抽象器的训练通过六个步骤完成：➃ 提取重要语句(IState)，➄ 和 ➅ 生成重要语句和整个代码的嵌入表示(eExe^{Ex}eEx和eAbe^{Ab}eAb) ➆ 基于eExe^{Ex}eEx和eAbe^{Ab}eAb生成融合表示eFue^{Fu}eFu，➇ 生成预测摘要，以及 ➈ 根据预测摘要（PSummaries）和真实摘要（注释）计算损失 {L_Ab} 以更新模型参数。提取重要语句。

代码摘要可以细分为抽取式代码摘要（抽取方法）和抽象代码摘要（抽象方法）：

本文提出了一种用于代码摘要的提取和抽象框架，该框架继承了提取和抽象方法的优点并屏蔽了它们各自的缺点。具体来说，我们利用成对的代码片段和注释来训练提取器（提取方法）和抽象器（抽象方法）。训练有素的提取器可用于预测代码片段中的重要语句。这些重要的语句和整个代码片段被输入到抽象器中以生成简短的自然语言摘要。训练有素的抽象器首先利用两个单独的编码器将重要语句和整个代码片段转换为两个上下文向量。然后，将两个上下文向量融合以产生融合向量，该融合向量将被传递到解码器以生成自然语言摘要。与现有的抽象方法相比，我们的框架配备了提取器，基本上平衡了对重要信息和全局上下文信息的关注，降低了丢失重要事实细节的风险并提高了整体性能。

在这里插入图片描述