设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
豆包文生图技术报告发布:数据处理、预训练、RLHF全流程 ...
返回列表
发布新帖
查看:
441
|
回复:
0
[人工智能]
豆包文生图技术报告发布:数据处理、预训练、RLHF全流程公开
as22
as22
当前离线
UID
12
星火
贡献
奖金
发表于 2025-3-12 14:25:11
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
3月12日消息,今天,豆包大模型团队正式发布文生图技术报告,首次公开Seedream 2.0图像生成模型技术细节,覆盖数据构建、预训练框架、后训练 RLHF 全流程,针对Seedream 2.0原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现,进行了具体介绍。
据悉,豆包大模型团队文生图模型Seedream 2.0于2024年12月初在豆包APP和即梦上线,已服务上亿C端用户,并成为国内许多专业设计师辅助创作的首选模型。
相比Ideogram 2.0、Midjourney V6.1、Flux 1.1 Pro等主流模型,该模型更好解决了文本渲染能力欠佳、对中国文化理解不足等诸多实际问题,支持原生中英双语,美感、指令遵循等能力有整体提升。
团队为了较全面客观地评估模型,围绕图文匹配度、结构准确率、美感等基础维度,严格构建了Bench-240评测基准。
通过测试,团队发现Seedream 2.0面向英文提示词,其生成内容的结构合理性、文本理解准确性高于主流模型。
中文综合能力同样突出,其生成与渲染文字可用率达78%,完美响应率为63%,高于业界目前其他模型。
此外,团队还从数据预处理、预训练、后训练维度介绍了模型技术细节。
最后,豆包大模型团队表示,此次技术报告的发布,旨在推动图像生成技术进一步发展,加强业内交流。展望未来,团队将持续探索更高效地Scaling模型参数及数据的创新技术,进一步提升模型的性能边界。
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2025
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.110918 second(s), 7 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表