国内AI大模型“安卓时刻”到来！阿里云通义千问免费、开源、可商用

大模型激战之际，继海外的Meta之后，阿里巴巴成为又一家推动人工智能（AI）大模型“安卓时刻”潮流的科技巨头。

8月3日周四，阿里云将70亿参数的通义千问模型开源，包括通用模型Qwen-7B和对话模型Qwen-7B-Chat。这两款模型均已上线国内首个“模型即服务”开放平台魔搭社区，开源、免费、可商用。

(资料图)

开源代码支持对Qwen-7B和Qwen-7B-Chat的量化，支持用户在消费级显卡上部署和运行模型。用户既可从魔搭社区直接下载模型，也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat，阿里云为用户提供包括模型训练、推理、部署、精调等在内的服务。

魔塔社区已有发帖，专门介绍通义千问上述模型的安装、创空间体验、模型推理、模型训练最佳实践，并附有模型链接及下载情况截图。

公开资料显示，Qwen-7B使用去重及过滤后超过2.2万亿tokens的数据进行预训练，是支持中、英等多种语言的基座模型，上下文窗口长度达到8k。它包含高质量中、英、多语言、代码、数学等数据，囊括全网文本、百科、书籍、代码、数学及各个领域垂类。

评测英文综合能力的基准评测之一MMLU的评测结果显示，在英文评测方面，Qwen-7B的效果超过了目前国内外其他同类开源预训练模型，对比更大规模版本的模型也具有较强竞争力。中文评测方面，在C-Eval验证集上，Qwen-7B在同等规模现有模型中取得了最高分数，甚至相比更大规模模型也具有较强竞争力。

以下为Qwen-7B的MMLU 5-shot准确率结果对比。

在Qwen-7B的基础上，阿里云使用对齐机制打造了基于基座模型的AI助手Qwen-7B-Chat。它是基于Transformer的中英文对话大语言模型，已实现与人类认知对齐。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。

无论是在C-Eval验证集上，还是在MMLU评测集上，Qwen-7B-Chat模型的zero-shot准确率均在同类对齐模型中表现较优。

以下为C-Eval测试集上的zero-shot准确率结果对比。

通义千问的开源后，阿里云成为国内首个加入大模型开源行列的大型科技企业。今年7月，微软宣布，联手Meta发布开源AI模型的可商用版本Llama 2，提供OpenAI和谷歌模型的平替产品。也是在7月，智谱AI及清华KEG实验室公布，中国顶尖开源大模型ChatGLM2-6B允许免费商用。

华尔街见闻此前文章提及，开源模型的好处包括用户的接受率更高，然后输入更多数据供人工智能处理。LLM拥有的数据越多，其功能就越强大。此外，开源模型使研究人员和开发人员能够发现和解决漏洞，同时提高技术和安全性。

今年4月的2023阿里云峰会上，阿里巴巴宣布向企业开放通义千问，企业可以调用通义千问的能力训练自己的大模型。

阿里云智能集团首席技术官（CTO）周靖人当时介绍，未来企业在阿里云上既可以调用通义千问的全部能力，也可以结合企业自身的行业知识和应用场景，训练自己的企业大模型。比如，每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

阿里巴巴集团CEO兼阿里云智能集团CEO张勇当时称，阿里巴巴所有产品未来都将接入通义千问大模型。

张勇表示，面向 AI 时代，所有产品都值得用大模型重做一次，而基于这一信念，阿里云也希望帮助更多企业用上大模型，让每家企业都能基于通义千问，拥有具备自己行业能力的专属大模型。

风险提示及免责条款市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

推荐内容

国内AI大模型“安卓时刻”到来！阿里云通义千问免费、开源、可商用

曾经最火爆的确定性交易“美债之年”，梦碎！

市场波动性骤增，这对美股来说可不是好消息

AI魅力多大？回购“失宠”，美国上市公司资本支出大增，二季度中位值增长15%

“预售”“公摊”之后，香港楼市又创新：拟推出“地花”模式！内地会借鉴吗？

“全球资产定价之锚”又飙升，美股承压再跌，美国超导盘中跌超10%，中概逆市大反弹

又见增收不增利，二线电池龙头的盈利困局 | 见智研究

“复活”的国联基金与“隐身”的葛小波

硅料暴跌的痛，传到龙头身上 | 见智研究

美国7月ISM非制造业指数降低至52.7

为何市场都错估了美国经济？达利欧：美国政府主导了一场“大规模财富转移”

欧元区6月PPI同比下降3.4%，降幅创2020年6月以来最大

英国央行加息25基点，紧缩步伐有所放缓

高盛：2025年全球人工智能投资有望增至2000亿美元

“黑色星期三”余波依旧，亚太市场收跌，欧股低开，美股盘前走低

接连拿下特斯拉、宁德长单，它凭什么？| 见智研究

韩国超导低温学会：LK-99不是常温超导体 没有表现出迈斯纳效应

本轮地产修复，和2014-2015年有何不同？

摩根士丹利：YCC“微调”将稳住利率 日特估还能继续

高盛唱多油价：市场已经走出悲观 油价还能再涨16%

公募基金首份半年业绩数据披露：营收同比增2%，利润同比增1.6%

2023年世界500强中的车企：比亚迪、特斯拉狂飙突进，东风、北汽大幅滑落

微信“小绿书”，闭环了

张忆东：警惕AI成黑天鹅，A股投资战略方向两个，港股要等“水”来

财报2023｜绑定蒙牛“得与失”：科拓生物摆脱依赖之战正酣

新网银行3%股权成功“换主”，成都本土企业奋勇“摘牌”

中金：失去流动性“助力”的美股会如何？

中国7月财新服务业PMI 54.1 员工人数4个月以来最快增长

A股医药、券商股拉升，超导概念股走低

在AI领域更进一步！Meta推出新款音频和音乐生成式AI工具AudioCraft

“最懂苹果的分析师”郭明錤：苹果Q2财报不会引人注目，料不会提太多AI内容

杀死所有实体恶性肿瘤的药物来了？真相：没那么简单

吓出全球股市“黑色星期三”！惠誉：降级是出于对美国政府治理能力的质疑

黑色星期三！这是压垮美股的“最后三根稻草”

高盛支持的“苹果版余额宝”持续火爆，推出仅三个多月存款余额已达100亿美元

这次跟十二年前美国被降级截然不同！“全球资产定价之锚”创九个月新高

一夜之间突然熄火！韩国室温超导论文爆出缺陷，美国超导概念股大跌近30%

惠誉降级刷屏，华尔街机构纷纷发声，美股美元美债会怎样？

美债发行海啸即将来袭，美财政部发债规模超预期，美债收益率飙升

手机市场仍拉垮，高通二季度营收超预期下降23%，指引逊于预期，盘后一度跌超8% | 财报见闻

“不安静”的券商股权

美国EIA原油库存骤降1704.9万桶，创历史最大单周降幅

解读央行下半年工作会议：降息动作可能提前，50BP降准可以期待

余承东“剧透”，华为大动作！

离岸人民币兑美元跌穿7.2元，日内目前下跌逾140点。中概指数跌超3.5%，成分股老虎证券目前跌超7%，小鹏汽车跌超6%，拼多多跌超5%，B站跌超4%，百度、京东等跌超3%，铜道控股则涨2.3%，是目前唯一上涨的成分股。

付鹏：年初的两个预期差，下半年会怎么变化？

财报｜2023 贵州茅台上半年营收、净利双增逾两成 渠道、新品改革承销待考

台股AI股、韩股电池股双双重挫！亚洲今年两大科技泡沫要破了？

财富世界500强揭晓：142家中国公司上榜，宁德时代美团等7家新晋级

美国7月ADP就业人数增加 32.4万人，预期 19万人，前值 49.7万人。

韩国超导低温学会：LK-99不是常温超导体没有表现出迈斯纳效应

摩根士丹利：YCC“微调”将稳住利率日特估还能继续

高盛唱多油价：市场已经走出悲观油价还能再涨16%

财报｜2023 贵州茅台上半年营收、净利双增逾两成渠道、新品改革承销待考