12月1日消息,阿里云宣布开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio,目前已上线阿里魔搭社区。
本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向 72B、1.8B 对话模型提供了 4bit / 8bit 量化版模型,便于开发者们推理训练。
据了解,阿里云是国内最早开源自研大模型的科技企业,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单,得到中小企业和个人开发者的青睐,累计下载量超过150万,催生出150多款新模型、新应用。发布会现场,多位开发者伙伴现身说法,分享了他们用Qwen开发专属模型和特定应用的实践。
数据显示,2023年4月,阿里云“通义千问”大模型开放对外测试,目前已有超过20万企业用户申请接入,几乎覆盖所有新兴和传统行业。