腾讯混元大模型向行业开放旗下超50个业务已接入

(资料图片)

9月7日，腾讯自主研发的通用大语言模型——混元，正式面向产业亮相。

腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超2万亿tokens，具有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力。

“腾讯混元大模型从第一个token开始从零训练，掌握了从模型算法到机器学习框架，再到AI基础设施的全链路自研技术。”腾讯集团副总裁蒋杰表示：“我们研发大模型的目标不是在评测上获得高分，而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”

目前，业界大模型在场景中的应用依然有限，主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新，提高了模型可靠性和成熟度。

针对大模型容易“胡言乱语”的问题，腾讯优化了预训练算法及策略，让混元大模型的幻觉相比主流开源大模型降低了30%~50%；通过强化学习的方法，让模型学会识别陷阱问题；通过位置编码优化，提高了超长文的处理效果和性能；提出思维链的新策略，让大模型能够像人一样结合实际的应用场景进行推理和决策。

此外，腾讯还自研了机器学习框架Angel，使训练速度相比业界主流框架提升1 倍，推理速度比业界主流框架提升1.3倍。

在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中，混元大模型共测评66个能力项，在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上，混元大模型均有优异的表现，特别是在中文的理科、高考题和数学等子项上表现突出。

据介绍，混元大模型将通过腾讯云对外开放。混元大模型将作为腾讯云MaaS服务的底座，企业不仅可以直接通过API调用混元，也可以将混元作为基底模型，为不同产业场景构建专属应用。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生说道：“以大模型生成技术为核心，人工智能正在成为下一轮数字化发展的关键动力，也为解决产业痛点，带来了全新的思路。大模型需要基于产业场景，与企业数据融合，才能释放出最大的价值。”

《中国经营报》记者注意到，在腾讯云行业大模型精选商店中，将不仅提供混元大模型，还上架了20多种行业最新、最流行的开源通用大模型，以及覆盖金融、文旅、零售、政务、医疗、教育等20多个领域的行业大模型。企业可以根据需要，选择合适的模型，然后借助腾讯云智能的TI平台，导入企业专有数据，做进一步的训练与精调，快速生成更有针对性的专属大模型，满足企业个性化需求。

目前，混元大模型已经接入腾讯50多个业务并取得初步效果，包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

在广告业务场景，腾讯混元大模型支持智能化的广告素材创作，能够适应行业与地域特色，满足千人千面的需求，实现文字、图片、视频的自然融合。此外，基于混元大模型的能力，广告智能导购能够帮助商家在企业微信等场景，提升服务质量和服务效率。

据汤道生透露，腾讯已经和11000家生态伙伴展开紧密合作，推出了覆盖100多个产业场景的行业解决方案，共同服务千行百业。去年，生态伙伴收入占到腾讯云整体收入的三分之一，收入增速是腾讯云增速的4倍。“在探索未来的道路上，腾讯愿与伙伴携手，共同探索大模型等全新行业机遇，持续拓展下沉市场，坚持打磨‘好产品’，拥抱‘被集成’，搭建‘数字化大舞台’，请伙伴当好主角，共建产业智能未来。”

（文章来源：中国经营网）