设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
Cursor 升级 Tab 模型,实时强化学习提升开发者建议精 ...
返回列表
发布新帖
查看:
7
|
回复:
0
[人工智能]
Cursor 升级 Tab 模型,实时强化学习提升开发者建议精准度
JQR1
JQR1
当前离线
UID
9
星火
贡献
奖金
发表于
3 小时前
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
Cursor 是一款基于人工智能的编程平台,最近宣布对其 Tab 模型进行了升级。Tab 模型是为开发者提供自动补全建议的系统。此次升级显著减少了低质量建议的数量,提高了建议的准确性。具体来说,新的 Tab 模型相比于之前的版本,建议数量减少了21%,而接受率提高了28%。
Cursor 在其博客中表示,实现高接受率不仅仅是让模型变得更智能,还需要懂得何时提供建议、何时不提供。为了应对这一挑战,Cursor 考虑了训练一个单独的模型,用于预测某个建议是否会被接受。该公司引用了一项2022年的研究,指出这种方法在 GitHub Copilot 中取得了成功。研究中采用了逻辑回归过滤器,分析编程语言、最近的接受历史和训练字符等特征,将那些得分较低的建议隐藏起来。
然而,Cursor 认为这种解决方案虽然可以预测用户接受建议的概率,但希望有一个更通用的机制,能够重用 Tab 模型学到的强大代码表示。Cursor 希望通过改变 Tab 模型的结构,避免在最初就产生低质量建议,而不是后续再进行过滤。
因此,Cursor 采用了策略梯度方法,这是一种强化学习的方法。当用户接受建议时,模型会得到奖励;当建议被拒绝时,模型会受到惩罚;而在选择保持沉默时则不会得到任何反馈。此方法需要 “在线” 数据,即从当前使用的模型收集的反馈。Cursor 通过每天多次向用户部署新的检查点,并迅速基于新交互对模型进行再训练,来解决这一问题。
Cursor 表示,当前从部署检查点到收集数据的过程仅需1.5到2小时,这在 AI 行业中已经算是较快,但仍有进一步加速的空间。该公司的 Tab 模型每天处理超过4亿个请求,Cursor 希望这一改进能够提升开发者的编码体验,并计划在未来进一步开发这些方法。
在线强化学习是该领域最令人兴奋的方向之一,一位在 OpenAI 从事后训练的工程师在社交媒体上对此表示赞赏,称 Cursor 似乎是第一个成功在大规模上实施该技术的公司。
不久前,Cursor 的母公司 Anysphere 宣布融资9亿美元,估值达99亿美元,并推出了一项月费200美元的 “超值” 计划,承诺提供20倍于20美元月费 “专业版” 的使用量。此外,Cursor 还在同月进行了平台更新,新增了自动代码审查、记忆功能和一键设置模型上下文协议服务器的功能。
来源:
AIbase
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2025
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.104939 second(s), 7 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表