这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要 登录 才可以下载或查看,没有账号?立即注册
×
11月27日消息,据阿里云消息,近日,新加坡国家人工智能计划(AISG)发布了一款名为Qwen-SEA-LION-v4的东南亚多语言大模型。
该模型的核心技术底座,是基于阿里巴巴的“通义千问”(Qwen)开源模型构建。发布后,这款由中新合作打造的模型迅速在“东南亚语言模型全面评估基准”(SEA-HELM)的开源模型榜单(参数量2000亿以下)中登顶。
此次合作中,阿里巴巴提供了最新的Qwen3-32B作为基座模型及先进的后训练技术支持,而AI Singapore则贡献了其在区域内积累的深厚经验,投入超过1000亿个覆盖缅甸语、印尼语、泰语等多种东南亚语言的本地化数据,对模型进行了针对性的二次训练和优化。
此次合作旨在解决一个长期困扰东南亚地区的AI发展难题。该地区拥有超过1200种语言,日常交流中普遍存在多种语言混用(语码转换)等复杂情况,而全球主流的AI模型大多以英语为中心,难以有效服务本地市场,形成了巨大的“AI鸿沟”。
为攻克这一难题,通义千问的基座模型能力起到了关键作用。Qwen3模型在预训练阶段就已涵盖119种语言,为理解东南亚小语种打下了坚实基础。通义千问团队还在后训练中增加了跨语言训练任务的比重,以更好地处理现实世界中的多语言混合输入。
最终发布的Qwen-SEA-LION-v4模型在多语言准确性和文化背景理解上实现了显著提升。技术细节显示,该模型拥有处理复杂文档分析所需的32k token长上下文能力,同时提供4位和8位量化版本,使其可在仅有32GB内存的消费级笔记本电脑上运行,极大地降低了本地开发者和中小企业的AI部署门槛。
目前,Qwen-SEA-LION-v4模型已通过AI Singapore官网和Hugging Face开源社区向全球免费提供下载。 |