(资料图片)

9月7日,腾讯自主研发的通用大语言模型——混元,正式面向产业亮相。

腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。

“腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。”腾讯集团副总裁蒋杰表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”

目前,业界大模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。

针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%~50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。

此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。

在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现,特别是在中文的理科、高考题和数学等子项上表现突出。

据介绍,混元大模型将通过腾讯云对外开放。混元大模型将作为腾讯云MaaS服务的底座,企业不仅可以直接通过API调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生说道:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路。大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。”

《中国经营报》记者注意到,在腾讯云行业大模型精选商店中,将不仅提供混元大模型,还上架了20多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等20多个领域的行业大模型。企业可以根据需要,选择合适的模型,然后借助腾讯云智能的TI平台,导入企业专有数据,做进一步的训练与精调,快速生成更有针对性的专属大模型,满足企业个性化需求。

目前,混元大模型已经接入腾讯50多个业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

在广告业务场景,腾讯混元大模型支持智能化的广告素材创作,能够适应行业与地域特色,满足千人千面的需求,实现文字、图片、视频的自然融合。此外,基于混元大模型的能力,广告智能导购能够帮助商家在企业微信等场景,提升服务质量和服务效率。

据汤道生透露,腾讯已经和11000家生态伙伴展开紧密合作,推出了覆盖100多个产业场景的行业解决方案,共同服务千行百业。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的4倍。“在探索未来的道路上,腾讯愿与伙伴携手,共同探索大模型等全新行业机遇,持续拓展下沉市场,坚持打磨‘好产品’,拥抱‘被集成’,搭建‘数字化大舞台’,请伙伴当好主角,共建产业智能未来。”

(文章来源:中国经营网)

推荐内容