中国的大语言模型终于到来，只有百度抓住了这波AI新浪潮

作者：三青时间：2023-05-02 阅读数：224人阅读

百度科技园（来源：钛媒体App编辑拍摄）

内容生产，特别是创意工作，一向被认为是人类的专属和智能的体现。

曾参与开发谷歌“AlphaGo”项目的牛津大学计算机学院院长迈克尔·伍尔德里奇（Michael Wooldridge），在其2019年著作《人工智能全传》一书中提到，“撰写有趣的故事”是 AI “远未实现”的任务之一。

如今，AI 技术正大步迈入数字内容生产领域。生成式人工智能（AIGC）技术不仅在写作、绘画、作曲多项领域达到“类人”表现，更展示出在大数据学习基础上的非凡创意潜能。

无论是60天月活超1亿、上知天文下知地理的ChatGPT，还是其背后考试接近满分、随手画个草图就能做出同款网页的生成式预训练模型GPT系列技术，美国OpenAI公司让人类离通用人工智能（AGI）更近了一步，并引爆了全球科技巨头与 AI 行业的新一轮大模型军备竞赛。

正如科学技术部部长王志刚所说，ChatGPT证明了 AI 是大方向。

随着ChatGPT和 AIGC 技术风靡全球，中国亟待需要符合本土的AI Chat GPT大模型。而今天，作为“全村的希望”、全球第一个做出对标ChatGPT产品科技大厂，百度集团最先发力，展示中国 AI 技术实力新力量。

北京时间3月16日下午，百度大模型新项目“文心一言”（ERNIE Bot）邀请测试”。

百度称，文心一言某种程度上具有了对人类意图的理解能力，回答的准确性、逻辑性、流畅性都逐渐接近人类水平。

百度表示，3月16日起，首批用户即可通过邀请测试码，在文心一言官网体验产品，后续将陆续开放给更多用户。此外，百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约，搜索“百度智能云”进入官网，可申请加入文心一言云服务测试。

百度集团创始人、董事长、CEO李彦宏在演讲中指出，百度在过去十几年当中，一直坚持 AI 技术研发投入，而文心大模型早在2019年就发布了第一个版本。所以从这个意义上说，“文心一言”只是百度过去多年努力的一个延续。

“未来，随着百度多模态统一大模型的能力增强，文心一言的多模态生成能力也会不断提升。”李彦宏亲临现场演讲。这是继2018年为自动驾驶平台“萝卜快跑”和智能视频音箱“小度在家”后，李彦宏时隔五年亲临活动现场，为单个产品站台。

在新一波 AI 热潮下，李彦宏下场，百度顶住了压力，尽管产品有诸多不完美的地方，但充分展现了百度作为一家互联网科技企业，在中国式现代化理念下的核心创新能力。

能打的百度又回来了？

刚刚过去的2022年，对于百度来说是不平凡的一年。

2月22日百度发布的2022年四季度及全年财报中，2022年百度实现营收1236.8亿元，归属百度的净利润为206.8亿元，同比增长了10%。其中，四季度百度营收330.8亿元，净利润49.53亿元，同比大涨189%，净利润率为19%。

在外部环境多变下，百度去年整体营收超市场预期。据了解，这是百度2022年连续四个季度核心业绩超市场预期，加上净利润的大幅增加，百度随后宣布了50亿美元的股票回购计划，意味着管理层对于百度未来发展的重要信心。

此次财报中，百度最大的看点还是百度智能云业务。财报显示，2022年前三季度，百度智能云营收127亿元，同比增长31%，在百度核心（Baidu Core）中占比18%，而该业务在百度总营收占比持续成长。

百度智能云业务的突出表现，与百度将 AI 技术与云计算相融合的理念有密切关系。其中，百度 AI 领域近几年主打的产品——大语言模型“文心一言”，已经成为行业关注的焦点。此前2月7日百度官宣“文心一言”，并随后宣布将通过百度智能云对外提供服务。

事实上，自1956年“达特茅斯”会议创造 AI 这个术语以来，全球共经历了三次 AI 浪潮。前两次 AI 浪潮中，不管是芯片“摩尔定律”速度跟不上 AI 的算力要求，还是数据量不够、算法不强、商业化不如预期，整个 AI 技术并未呈现机器特性。

直到2016年，谷歌DeepMind的“阿尔法狗”（AlphaGo）击败了韩国围棋世界冠军李世乭，以及机器学习、Transformer框架等新技术的诞生，让 AI 算法、算力、数据“三驾马车”获得突破性技术进展，标志着 AI 技术的爆发拐点。

如今，ChatGPT的诞生，使得 AI 技术迎来了新的“奇点”。ChatGPT不仅仅是新形态的搜索引擎工具、语音助手这些功能性产品，它还让 AI 技术带来新的发展路径，距离通用人工智能（AGI）越来越近。

那么，大模型究竟强在哪里？

从技术突破来说，利用Transformer框架机制，GPT的互联网海量数据训练，涌现出通用学习能力；从本质上来说，GPT使得全人类群体能力，替代了个体能力。目前，大数据、大算力、大模型已经成为 AI 行业发展的基本共识。

中国科学院院士鄂维南2月25日提到，ChatGPT没有太多底层的创新，更多是工程式的成功；开放原子基金会TOC副主席谭中意则直言，在 AI 工程化方面，ChatGPT对全球 AI 业是一个巨大的利好，它从各个底层给大家带来巨大的信心，打开了巨大的用户市场。

作为中国领先的 AI 技术公司，百度十几年间一直坚持进行 AI 大模型技术研发，厚积薄发，形成了如今的“文心一言”。

资料显示，早在2010年初，百度就对通用智能技术NLP（自然语言处理）进行了梳理与规划，并成立了自然语言处理部。2019年3月，百度推出的文心大模型ERNIE 1.0，首次突破90分大关，登顶全球权威数据集GLUE榜单，刷新榜单历史。

2021年9月，百度发布了全球首个百亿参数的对话大模型PLATO-XL，一举超过Facebook Blender、谷歌Meena和微软DialoGPT，成为全球首个百亿参数中英文对话预训练生成模型，再次刷新了开放域对话效果，打开了对话模型的想象空间。

在2022第四季度财报电话会上，李彦宏也表示：“百度的文心大模型，是中国市场非常本土化的大语言模型，这意味着百度现在正在研发的文心一言，将比国外开发的模型更适合中文和中国市场。”

“文心一言”技术负责人、百度首席技术官王海峰表示，文心一言，是新一代知识增强大语言模型，是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强，文心一言未来会越来越强大。

李彦宏指出：“无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积累，没法速成。”

“文心一言确实不能讲叫做完美，但是为什么今天要展示？因为有市场需求，因为百度的各个产品线，从搜索到智能云、到自动驾驶、到小度，大家都在等着要用这样的技术。更重要的是我们的客户、我们的合作伙伴在等着用这样的技术。我们需要尽早的把它展示出来。当然，大语言模型这种产品一旦展示出来，它就会获得真实的用户反馈，它的迭代速度、能力提升就会非常快。”李彦宏坦言，“文心一言”将尽快成长，能够尽早的给用户和客户带来价值，让所有的人都从中受益。

华尔街日报报道称，OpenAI 最新估值达290亿美元，预计2023年收入2亿美元。而百度现在的市值，大约为487亿美元。如果以OpenAI的估值对标文心一言，百度的市值上升空间极大。

可见，“文心一言”的推出已成为了百度商业模式升级、企业形象重塑、公司价值重估的重要机会，也是百度重新站回市场领先地位的重要起点。

底层进化是“文心一言”的核心引擎

目前，百度是国内大厂中第一个做出对标ChatGPT产品的企业。

3月16日现场，李彦宏展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

其中在文学创作场景中，文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结，并提出了五个续写《三体》的建议角度，并回答了很多事实性问题，解决了GPT的很多“胡编乱造”情况，大幅度提升了事实性问题的准确率，并体现出“文心一言”对话问答、总结分析、内容创作生成的综合能力。

在商业文案创作场景中，文心一言顺利完成了给公司起名、写新闻稿的创作任务，既能准确理解人类意图，又能清晰地表达，这是基于庞大数据规模而发生的“智能涌现”。文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等。

多模态生成方面，李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力，比如输入“猫”得到不同类型的几个反馈。其中，文心一言的视频生成能力则因成本较高，现阶段还未对所有用户开放，未来会逐步接入。

“多模态是生成式 AI 一个明确的发展趋势，”李彦宏表示。

实际上，无论是多模态生成，还是文学创作场景，底层进化是此轮 AIGC 浪潮中的核心。也就是说，2017年谷歌发布的Transformer框架是 AI 实现对自然语言“理解”和“运用”能力飞跃的原点。

简单来说，Transformer框架抛弃了传统的CNN（卷积神经网络）和RNN（循环神经网络），使整个网络结构完全由Attention机制组成，从而让机器同时学习大量的文字，训练速度效率大大提升。它的核心点是模型和参数数量。

后续的GPT、BERT等语言模型突飞猛进，不仅质量高、效率高，还能以大数据预训练+小数据微调的方式，摆脱了对大量人工调参的依赖，在手写、语音和图像识别、语言理解方面的表现大幅突破，所生成的内容也越来越准确和自然。

但这种大模型，意味着极高的研究和使用门槛。例如，GPT-3有 1750 亿参数量，需要大算力集群。而根据媒体报道，运行ChatGPT至少需要1万枚英伟达的A100芯片。然而，GPU芯片持有量超过1万枚的企业不超过5家。那么，云计算提供了强大、弹性扩展的计算资源，这对于GPT的训练和生成文本过程是至关重要的。

作为国内最大的云计算厂商之一，据了解，百度已经连续多日进行持续到凌晨的压力测试，为了支持“文心一言”，亚洲目前最大的单体智算中心山西阳泉百度智算中心，已经将算力提升到每秒可以完成400亿亿次浮点运算，将与百度在江苏盐城等地的其他几座智算中心一起，为“文心一言”提供算力支持。

李彦宏表示，大模型时代将产生三大产业机会：

第一类是新型云计算公司，其主流商业模式从IaaS变为MaaS（模型即服务）；

第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，为行业客户提供解决方案，目前文心大模型已经在电力、金融、媒体等领域，发布了10多个行业大模型；

第三类是基于大模型底座进行应用开发的公司，即应用服务提供商。基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，可能就是未来的新巨头。

相对于其他科技巨头来说，百度是中国最具前沿技术能力、最具价值潜力的 AI 技术企业。在全球范围内，很少有像百度这种拥有AI全栈布局的企业，能够在应用层、模型层、框架层、芯片层四层均有布局，这是百度非常独特的优势。

而文心一言位于模型层，后续，芯片、框架、大模型和终端应用场景可以形成高效的反馈闭环，帮助大模型不断调优迭代，从而升级用户体验。

李彦宏认为，百度 AI 全栈布局的优势在于，可以在技术栈的四层架构中实现端到端优化，大幅提升效率。尤其是框架层和模型层之间，有很强的协同作用，可以帮助构建更高效的模型，并显著降低成本。

基于强大的技术能力。自2月份百度官宣“文心一言”以来，已有超过650家企业宣布接入文心一言生态。这意味着很多企业已经理解到，文心一言和生成式AI代表了一个新的技术范式，它会影响到每一家公司。

百度表示，文心一言将通过百度智能云对外提供服务，帮助企业构建自己的模型和应用，农业、工业、金融、教育、医疗、交通、能源等重点领域。李彦宏预告称，百度智能云将于近期公布围绕文心一言的云服务和应用产品，既有公有云服务和也可以做私有化部署。

国际欧亚科学院院士李世鹏认为，百度从“芯片”到“基础软件”的技术架构，有效地扩展了人工智能技术的通用性，使得 AI 技术的开发和应用门槛不断降低。透过百度等头部公司的努力与取得的成果，大家看到了更多国产基础软件努力向上的动作。

下一挑战：向通用 AI 未来进发

十月怀胎，一朝分娩。“文心一言”只是百度追逐 AI 星辰大海之梦的起点。

钛媒体App此前了解到，此次“文心一言邀请测试”只是一个小小的时间点，是中国市场类ChatGPT产品空白的填充，今年4月、5月还会有下一个版本或者新功能的公布，后续以月或双月的频率展示“文心一言”新功能或新版本。

随着技术的不断演进、数据和算力的不断充实，“文心一言”将会呈现出更强大的 AI 能力，是值得大家期待的。

李彦宏表示，“我们大家都希望，‘文心一言’能够快一点成长，能够尽早的给用户和客户带来价值，让所有的人都从中受益。”

目前，百度各业务都有 AI 应用。在搜索方面，自2019年3月以来，文心大模型在改进搜索结果方面发挥了重要作用，带来排名改进和多模态搜索能力。在云方面，AI 专业知识为传统行业（如制造、能源和公用事业）提供特定AI解决方案和应用。智能驾驶业务是百度 AI 能力护城河又一证明，一项自动驾驶产业排名中，百度位居全球领导者之列，是中国唯一上榜企业。

通用人工智能（AGI）被认为是 AI 领域研究的主要目标，也是科幻小说和未来研究中的共同话题。

一些研究人员将通用人工智能称为强 AI 或者完全AI，或称机器具有执行通用智能行为能力。与弱 AI 相比，强 AI 可以尝试执行全方位的人类认知能力。

创造ChatGPT的OpenAI公司内部有一个堂吉诃德式的使命，即开发 AGI。公司CEO 山姆·阿尔特曼（Sam Altman）表示，“AGI 是人类生存必不可少的。我们面临的问题极其严峻，如果没有更好的工具将无法解决。”

无论是OpenAI、谷歌、微软，还是百度这类涉足 AI 技术的大型科技公司，都在不断发力 AI 的未来发展。在这其中，百度不仅有芯片、云计算、开源框架、软件，还有量子计算、量子云、医疗与新药研发等领域的全栈性布局，在全球通用 AI 技术目标竞争中拥有明显优势。

财报显示，2022年百度核心研发费用达214.16亿元，占百度核心收入比例达到22.4%。近十年，累计研发投入超过1000亿元。百度坚持压强式、马拉松式的研发投入，如此高的研发投入，在大厂中凤毛麟角。

美国贝尔实验室的Walter H. Brattain，于1947年在一个塑料支架上，放置了一个铜块，上面又安装了一大块半导体锗（Germanium）——诞生了世界上第一个晶体管，当时一颗芯片内部的晶体管只有个位数。而如今，晶体管全然不同，苹果最新发布的M2 Max芯片内部集成了670亿只晶体管。

那么，从ChatGPT来说，去年11月公布时的回答情况与现在已迥然不同，出现了明显的进步。因此，“文心一言”未来的发展成长值得期待。

“我们相信，AI 会彻底改变我们今天的每一个行业。AI 的长期价值，对各行各业的颠覆性改变，才刚刚开始。未来，将会有更多的杀手级应用、现象级产品出现，将会有更多的里程碑事件发生。”李彦宏说道。

（本文首发钛媒体App，作者｜林志佳）

很赞哦！ (5)

本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知我们删除。邮箱：dacesmiling@qq.com