近日,色情网 郭宇锋教授团队在ACM International Conference on the Foundations of Software Engineering (FSE) 2026 发表创新研究成果“VerilogASTBench: Benchmark Construction of Verilog AST Dataset with Dual-Stage AST Semantic Enhancement Framework” 第一作者为张鲁萍博士,通讯作者为严大鹏老师。该研究针对Verilog代码生成过程中高质量、大规模训练数据集缺失导致语法与功能正确性不足的问题,提出了一种基于抽象语法树的语义增强技术,用于构建高质量的Verilog数据集。该研究从GitHub开源代码库中收集了1,035,777条Verilog代码样本,并对进行数据清洗,最终构建了包含318,021条高质量样本的Verilog数据集。实验结果表明,在该数据集上微调后,CodeQwen-7B在 Verilog 代码生成任务中的准确率提升9.02%,并在 VerilogEval 基准上优于 GPT-4。


FSE是软件工程领域国际顶级学术会议(CCF-A),面向学术界与工业界,聚焦需求与架构、程序分析与验证、测试与调试、DevOps与演化、可靠性与安全等方向的前沿研究与工程实践。会议采用严格的同行评审流程,每篇投稿至少由 3 名程序委员会成员评审,并由独立的 discussion lead 组织讨论并撰写 meta-review。最终在进入完整评审的 920 篇论文中直接录用 87 篇,直接录用率约 9.5%。
撰稿:严大鹏 编辑:吴中慧 审核:张吉良


