据新华社消息,十四届全国人大常委会第三十二次委员长会议10月25日上午在北京人民大会堂举行。赵乐际委员长主持会议。会议决定,十四届全国人大常委会第十二次会议11月4日至8日在北京举行。
报告主要介绍了豆包MarsCode编程助手在编程助手场景中的探索与实践,涵盖其起源、现状与发展以及未来展望,展示了如何利用先进技术提升编程效率和体验,为编程助手领域的发展提供了有价值的参考。
豆包MarsCode编程助手起源
1. IDE智能化探索历程
早期基于静态分析和规则预测代码,后经历机器学习时期(用机器学习提取特征进行缺陷分析)、深度学习时期(使用LSTM和Seq2Seq等模型预测),2022年开始使用预训练模型预测,Copilot在该年火爆全球。
2. 开发者对AI Coding的诉求
包括代码补全、自然语言生成代码、单测生成、注释生成、代码解释、评审、理解、总结、搜索、Debug Fix、问题修复、Lint Fix、Terminal Error Fix、通用研发知识问答、联网搜索、三方库问答等多种功能需求,其中编写代码、调试和获取帮助等方面需求较高。
3. 豆包MarsCode的历程
2022年初代码智能团队探索LLM驱动的代码补全产品,自研评测集和自动评测系统,构建数据链路和线上A/B测试体系,后续引入基于对话的编程助手、更高自动化编程能力、代码补全Pro编辑推荐功能等。
展开剩余82%豆包MarsCode的现状与发展
1. 代码补全 - Prompt工程
丰富上下文可提升代码生成质量,通过编辑历史、项目中类似代码片段等构造Prompt,进行Prompt裁剪、过滤(重复内容、敏感词、语法不正确结构等)、完善(Embedding召回、请求过滤等)、排序,在客户端和服务器端协同处理补全请求。
2. 代码补全 - 科学的测评体系
指出代码补全采纳率作为指标的局限性,介绍更科学的CPO指标,其计算涉及尝试率(AI提供建议的频率)、反馈率(建议传递给开发者的比例)、采纳率(开发者采纳建议的比例)、每次采纳平均token数(反映建议价值)、token平均字符长度(体现模型生成代码能力),通过离线测评、上线实验、A/B测试验证和迭代模型及Prompt策略。
3. 代码补全Pro
概述:针对研发中编辑已有代码(新增、删除、替换操作)场景,当前代码补全无法胜任,而代码补全Pro可预测下一次动作(光标位置、操作类型、编辑内容),如在函数参数修改场景中自动补齐调用处参数。
数据构建:利用Git仓库的commit历史记录,提取有关联的修改记录(需构造启发式规则处理噪音),通过CT和SFT模型理解diff格式数据。
新。
免责声明:我们尊重知识产权、数据隐私,只做内容的收集、整理及分享,报告内容来源于网络,报告版权归原撰写发布机构所有,通过公开合法渠道获得,如涉及侵权,请及时联系我们删除,如对报告内容存疑股票配资如何,请与撰写、发布机构联系
发布于:广东省