腾讯蒋杰：发挥 “比特”专长，加速大模型技术应用落地

速途网 2024年07月05日 21:10

速途网7月5日消息（报道：李楠）今日，在2024世界人工智能大会腾讯论坛上，腾讯集团副总裁蒋杰表示，未来通用模型会成为水、电、网络等基础设施一样存在，供业务和应用按需接入。

蒋杰表示，从行业和应用的角度来看，未来会出现更多不同尺寸、不同模态的模型，业务可以通过大小模型的协同，在提升性能的同时满足定制化需求。

腾讯集团副总裁蒋杰

自2023年9月首次亮相以来，经过多次迭代升级，腾讯混元大模型在国内率先采用MoE架构，实现性能大幅提升，模型整体参数量已达到万亿，tokens数量超过7万亿，居国内大模型第一梯队。目前，腾讯混元大模型已通过腾讯云向企业及个人开发者开放，包含万亿、千亿、百亿等不同参数尺寸，接下来，多种尺寸的腾讯混元MoE模型也将对外开源，可分别支持手机端、PC端、云以及数据中心等多样化的部署场景。

蒋杰表示，大模型行业正经历从单模态到多模态，再到全模态的演进。比如在文生图领域，最近效果比较好的是采用 DiT 架构的模型，它融合了早前主要用于文本生成的Transformer架构，并在图像和视频生成任务中展现出了显著的优势；在文生视频领域，视频生成正朝着更高分辨率、更长时长、更精细的方向发展，一些较好的模型已经能够生成长达数分钟高清的视频，带来了广阔的应用想象空间。

腾讯混元大模型正在积极部署多模态甚至全模态技术，在文生图方面，混元文生图打造了业界首个中文原生DiT架构生图模型效果超开源 Stable Diffusion 模型，发布一个多月Github 点赞数超过两千，是社区内最受欢迎的国产开源文生图模型；在3D生成方面，单图输入仅需30秒即可生成动漫、汽车、建筑等类型的3D模型；在视频生成方面，腾讯混元拥有文生视频、图生视频、图文生视频、视频生视频4大核心能力，支持视频风格化、视频重绘等多样化的产品玩法。

现场，蒋杰提到，场景应用会成为未来大模型的决胜要素。当前大模型的落地主要集中在生产工具和提效方面，距离真正的业务创新还有一定距离，缺少杀手级的应用，不过行业的探索一直没有停下。

腾讯很早就将腾讯混元定义为应用级的大模型，并积极在内部场景中打磨相关技术。腾讯内部已有接近 700 个业务场景接入了混元大模型，单日调用量近3亿次，通过包括微信输入法、微信读书、QQ浏览器AI助手等业务。接下来，基于这些实践沉淀下来的能力和经验，也将通过腾讯云对外开放，让大模型走入千行百业。

腾讯在5月30日发布面向C端用户的AI原生应用腾讯元宝，拥有看、听、说等多模态交互能力。针对效率场景的信息获取、处理和生产三大核心需求，腾讯元宝提供AI搜索、AI总结、AI写作一站式服务，可支持单文档最长1000万字的超长文处理，能够一次性解析最多50个文件，支持上传和解析包括 pdf、doc、txt、xlsx、pptx 在内的多种文件格式。在“腾讯元宝”深度搜索模式下，可以对用户提问进行扩展，从深度和广度两方面，提供更结构化、更丰富的回答，并可同步生成内容大纲、思维导图及相关人物事件梳理，帮助用户全景式了解搜索内容。

腾讯将人工智能视为公司长期战略，数十年来，从语音到图像，再到大模型，每一次人工智能的浪潮里，腾讯都始终坚持以自主技术创新为核心动力，结合场景推动AI的研究与落地。大模型方面，腾讯已经积累了从算力基础设施到机器学习平台以及上层应用的全链路自研技术。

蒋杰表示，未来，腾讯将发挥“专心致志、做好比特”的专长，将更多的“比特”转化成智能生产力，加速大模型等前沿人工智能技术在实体经济、文化保护、科学发现等领域的应用，为全社会的智能升级做好技术支持。

查看原文