顶部横幅广告
  • 微信
您当前的位置:首页 > 资讯

中国的大语言模型终于到来,只有百度抓住了这波AI新浪潮

作者:三青 时间:2023-05-02 阅读数:人阅读

 

百度科技园(来源:钛媒体App编辑拍摄)

内容生产,特别是创意工作,一向被认为是人类的专属和智能的体现。

曾参与开发谷歌“AlphaGo”项目的牛津大学计算机学院院长迈克尔·伍尔德里奇(Michael Wooldridge),在其2019年著作《人工智能全传》一书中提到,“撰写有趣的故事”是 AI “远未实现”的任务之一。

如今,AI 技术正大步迈入数字内容生产领域。生成式人工智能(AIGC)技术不仅在写作、绘画、作曲多项领域达到“类人”表现,更展示出在大数据学习基础上的非凡创意潜能。

无论是60天月活超1亿、上知天文下知地理的ChatGPT,还是其背后考试接近满分、随手画个草图就能做出同款网页的生成式预训练模型GPT系列技术,美国OpenAI公司让人类离通用人工智能(AGI)更近了一步,并引爆了全球科技巨头与 AI 行业的新一轮大模型军备竞赛。

正如科学技术部部长王志刚所说,ChatGPT证明了 AI 是大方向。

随着ChatGPT和 AIGC 技术风靡全球,中国亟待需要符合本土的AI Chat GPT大模型。而今天,作为“全村的希望”、全球第一个做出对标ChatGPT产品科技大厂,百度集团最先发力,展示中国 AI 技术实力新力量。

北京时间3月16日下午,百度大模型新项目“文心一言”(ERNIE Bot)邀请测试”。

百度称,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。

百度表示,3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。

百度集团创始人、董事长、CEO李彦宏在演讲中指出,百度在过去十几年当中,一直坚持 AI 技术研发投入,而文心大模型早在2019年就发布了第一个版本。所以从这个意义上说,“文心一言”只是百度过去多年努力的一个延续。

“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”李彦宏亲临现场演讲。这是继2018年为自动驾驶平台“萝卜快跑”和智能视频音箱“小度在家”后,李彦宏时隔五年亲临活动现场,为单个产品站台。

在新一波 AI 热潮下,李彦宏下场,百度顶住了压力,尽管产品有诸多不完美的地方,但充分展现了百度作为一家互联网科技企业,在中国式现代化理念下的核心创新能力。

能打的百度又回来了?

刚刚过去的2022年,对于百度来说是不平凡的一年。

2月22日百度发布的2022年四季度及全年财报中,2022年百度实现营收1236.8亿元,归属百度的净利润为206.8亿元,同比增长了10%。其中,四季度百度营收330.8亿元,净利润49.53亿元,同比大涨189%,净利润率为19%。

在外部环境多变下,百度去年整体营收超市场预期。据了解,这是百度2022年连续四个季度核心业绩超市场预期,加上净利润的大幅增加,百度随后宣布了50亿美元的股票回购计划,意味着管理层对于百度未来发展的重要信心。

此次财报中,百度最大的看点还是百度智能云业务。财报显示,2022年前三季度,百度智能云营收127亿元,同比增长31%,在百度核心(Baidu Core)中占比18%,而该业务在百度总营收占比持续成长。

百度智能云业务的突出表现,与百度将 AI 技术与云计算相融合的理念有密切关系。其中,百度 AI 领域近几年主打的产品——大语言模型“文心一言”,已经成为行业关注的焦点。此前2月7日百度官宣“文心一言”,并随后宣布将通过百度智能云对外提供服务。

事实上,自1956年“达特茅斯”会议创造 AI 这个术语以来,全球共经历了三次 AI 浪潮。前两次 AI 浪潮中,不管是芯片“摩尔定律”速度跟不上 AI 的算力要求,还是数据量不够、算法不强、商业化不如预期,整个 AI 技术并未呈现机器特性。

直到2016年,谷歌DeepMind的“阿尔法狗”(AlphaGo)击败了韩国围棋世界冠军李世乭,以及机器学习、Transformer框架等新技术的诞生,让 AI 算法、算力、数据“三驾马车”获得突破性技术进展,标志着 AI 技术的爆发拐点。

如今,ChatGPT的诞生,使得 AI 技术迎来了新的“奇点”。ChatGPT不仅仅是新形态的搜索引擎工具、语音助手这些功能性产品,它还让 AI 技术带来新的发展路径,距离通用人工智能(AGI)越来越近。

那么,大模型究竟强在哪里?

从技术突破来说,利用Transformer框架机制,GPT的互联网海量数据训练,涌现出通用学习能力;从本质上来说,GPT使得全人类群体能力,替代了个体能力。目前,大数据、大算力、大模型已经成为 AI 行业发展的基本共识。

中国科学院院士鄂维南2月25日提到,ChatGPT没有太多底层的创新,更多是工程式的成功;开放原子基金会TOC副主席谭中意则直言,在 AI 工程化方面,ChatGPT对全球 AI 业是一个巨大的利好,它从各个底层给大家带来巨大的信心,打开了巨大的用户市场。

作为中国领先的 AI 技术公司,百度十几年间一直坚持进行 AI 大模型技术研发,厚积薄发,形成了如今的“文心一言”。

资料显示,早在2010年初,百度就对通用智能技术NLP(自然语言处理)进行了梳理与规划,并成立了自然语言处理部。2019年3月,百度推出的文心大模型ERNIE 1.0,首次突破90分大关,登顶全球权威数据集GLUE榜单,刷新榜单历史。

2021年9月,百度发布了全球首个百亿参数的对话大模型PLATO-XL,一举超过Facebook Blender、谷歌Meena和微软DialoGPT,成为全球首个百亿参数中英文对话预训练生成模型,再次刷新了开放域对话效果,打开了对话模型的想象空间。

在2022第四季度财报电话会上,李彦宏也表示:“百度的文心大模型,是中国市场非常本土化的大语言模型,这意味着百度现在正在研发的文心一言,将比国外开发的模型更适合中文和中国市场。”

“文心一言”技术负责人、百度首席技术官王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强,文心一言未来会越来越强大。

李彦宏指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

“文心一言确实不能讲叫做完美,但是为什么今天要展示?因为有市场需求,因为百度的各个产品线,从搜索到智能云、到自动驾驶、到小度,大家都在等着要用这样的技术。更重要的是我们的客户、我们的合作伙伴在等着用这样的技术。我们需要尽早的把它展示出来。当然,大语言模型这种产品一旦展示出来,它就会获得真实的用户反馈,它的迭代速度、能力提升就会非常快。”李彦宏坦言,“文心一言”将尽快成长,能够尽早的给用户和客户带来价值,让所有的人都从中受益。

华尔街日报报道称,OpenAI 最新估值达290亿美元,预计2023年收入2亿美元。而百度现在的市值,大约为487亿美元。如果以OpenAI的估值对标文心一言,百度的市值上升空间极大。

可见,“文心一言”的推出已成为了百度商业模式升级、企业形象重塑、公司价值重估的重要机会,也是百度重新站回市场领先地位的重要起点。

底层进化是“文心一言”的核心引擎

目前,百度是国内大厂中第一个做出对标ChatGPT产品的企业。

3月16日现场,李彦宏展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

其中在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,并回答了很多事实性问题,解决了GPT的很多“胡编乱造”情况,大幅度提升了事实性问题的准确率,并体现出“文心一言”对话问答、总结分析、内容创作生成的综合能力。

在商业文案创作场景中,文心一言顺利完成了给公司起名、写新闻稿的创作任务,既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而发生的“智能涌现”。文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力,比如输入“猫”得到不同类型的几个反馈。其中,文心一言的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。

“多模态是生成式 AI 一个明确的发展趋势,”李彦宏表示。

实际上,无论是多模态生成,还是文学创作场景,底层进化是此轮 AIGC 浪潮中的核心。也就是说,2017年谷歌发布的Transformer框架是 AI 实现对自然语言“理解”和“运用”能力飞跃的原点。

简单来说,Transformer框架抛弃了传统的CNN(卷积神经网络)和RNN(循环神经网络),使整个网络结构完全由Attention机制组成,从而让机器同时学习大量的文字,训练速度效率大大提升。它的核心点是模型和参数数量。

后续的GPT、BERT等语言模型突飞猛进,不仅质量高、效率高,还能以大数据预训练+小数据微调的方式,摆脱了对大量人工调参的依赖,在手写、语音和图像识别、语言理解方面的表现大幅突破,所生成的内容也越来越准确和自然。

但这种大模型,意味着极高的研究和使用门槛。例如,GPT-3有 1750 亿参数量,需要大算力集群。而根据媒体报道,运行ChatGPT至少需要1万枚英伟达的A100芯片。然而,GPU芯片持有量超过1万枚的企业不超过5家。那么,云计算提供了强大、弹性扩展的计算资源,这对于GPT的训练和生成文本过程是至关重要的。

作为国内最大的云计算厂商之一,据了解,百度已经连续多日进行持续到凌晨的压力测试,为了支持“文心一言”,亚洲目前最大的单体智算中心山西阳泉百度智算中心,已经将算力提升到每秒可以完成400亿亿次浮点运算,将与百度在江苏盐城等地的其他几座智算中心一起,为“文心一言”提供算力支持。

李彦宏表示,大模型时代将产生三大产业机会:

第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS(模型即服务);

第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,为行业客户提供解决方案,目前文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型;

第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。

相对于其他科技巨头来说,百度是中国最具前沿技术能力、最具价值潜力的 AI 技术企业。在全球范围内,很少有像百度这种拥有AI全栈布局的企业,能够在应用层、模型层、框架层、芯片层四层均有布局,这是百度非常独特的优势。

而文心一言位于模型层,后续,芯片、框架、大模型和终端应用场景可以形成高效的反馈闭环,帮助大模型不断调优迭代,从而升级用户体验。

李彦宏认为,百度 AI 全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。

基于强大的技术能力。自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。这意味着很多企业已经理解到,文心一言和生成式AI代表了一个新的技术范式,它会影响到每一家公司。

百度表示,文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域。李彦宏预告称,百度智能云将于近期公布围绕文心一言的云服务和应用产品,既有公有云服务和也可以做私有化部署。

国际欧亚科学院院士李世鹏认为,百度从“芯片”到“基础软件”的技术架构,有效地扩展了人工智能技术的通用性,使得 AI 技术的开发和应用门槛不断降低。透过百度等头部公司的努力与取得的成果,大家看到了更多国产基础软件努力向上的动作。

下一挑战:向通用 AI 未来进发

十月怀胎,一朝分娩。“文心一言”只是百度追逐 AI 星辰大海之梦的起点。

钛媒体App此前了解到,此次“文心一言邀请测试”只是一个小小的时间点,是中国市场类ChatGPT产品空白的填充,今年4月、5月还会有下一个版本或者新功能的公布,后续以月或双月的频率展示“文心一言”新功能或新版本。

随着技术的不断演进、数据和算力的不断充实,“文心一言”将会呈现出更强大的 AI 能力,是值得大家期待的。

李彦宏表示,“我们大家都希望,‘文心一言’能够快一点成长,能够尽早的给用户和客户带来价值,让所有的人都从中受益。”

目前,百度各业务都有 AI 应用。在搜索方面,自2019年3月以来,文心大模型在改进搜索结果方面发挥了重要作用,带来排名改进和多模态搜索能力。在云方面,AI 专业知识为传统行业(如制造、能源和公用事业)提供特定AI解决方案和应用。智能驾驶业务是百度 AI 能力护城河又一证明,一项自动驾驶产业排名中,百度位居全球领导者之列,是中国唯一上榜企业。

通用人工智能(AGI)被认为是 AI 领域研究的主要目标,也是科幻小说和未来研究中的共同话题。

一些研究人员将通用人工智能称为强 AI 或者完全AI,或称机器具有执行通用智能行为能力。与弱 AI 相比,强 AI 可以尝试执行全方位的人类认知能力。

创造ChatGPT的OpenAI公司内部有一个堂吉诃德式的使命,即开发 AGI。公司CEO 山姆·阿尔特曼(Sam Altman)表示,“AGI 是人类生存必不可少的。我们面临的问题极其严峻,如果没有更好的工具将无法解决。”

无论是OpenAI、谷歌、微软,还是百度这类涉足 AI 技术的大型科技公司,都在不断发力 AI 的未来发展。在这其中,百度不仅有芯片、云计算、开源框架、软件,还有量子计算、量子云、医疗与新药研发等领域的全栈性布局,在全球通用 AI 技术目标竞争中拥有明显优势。

财报显示,2022年百度核心研发费用达214.16亿元,占百度核心收入比例达到22.4%。近十年,累计研发投入超过1000亿元。百度坚持压强式、马拉松式的研发投入,如此高的研发投入,在大厂中凤毛麟角。

美国贝尔实验室的Walter H. Brattain,于1947年在一个塑料支架上,放置了一个铜块,上面又安装了一大块半导体锗(Germanium)——诞生了世界上第一个晶体管,当时一颗芯片内部的晶体管只有个位数。而如今,晶体管全然不同,苹果最新发布的M2 Max芯片内部集成了670亿只晶体管。

那么,从ChatGPT来说,去年11月公布时的回答情况与现在已迥然不同,出现了明显的进步。因此,“文心一言”未来的发展成长值得期待。

“我们相信,AI 会彻底改变我们今天的每一个行业。AI 的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”李彦宏说道。

(本文首发钛媒体App,作者|林志佳)

本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知我们删除。邮箱:dacesmiling@qq.com

标签:
微信

三青

当你还撑不起你的梦想时,就要去奋斗。如果缘分安排我们相遇,请不要让她擦肩而过。我们一起奋斗!

微信
阿里云