2024：大模型应用落地

2024-01-22 09:13田丰

瞭望东方周刊 2024年1期

田丰

2023年10月31日，观众在杭州2023云栖大会“人工智能+”展馆参观人工智能产品及应用（黄宗治/ 摄）

当前，国产大模型科研创新加速，成为国家综合科技实力的体现；发展新一代人工智能，引领前沿发展，也成为每一家中国原创AI团队的责任使命。

“这场未来通信革命带来的好处与难题，将比上次个人计算机革命造成的好处与难题大得多。” 比尔·盖茨在《未来之路》一书中提到。他认为，大语言模型是“自图形用户界面以来最重要的技术进步”，应被视为新一代人机通信革命。

关于人机通信，早期，专业技术人员使用命令行界面，是让人说“机器的语言”；之后，Windows和iPhone让大众使用图形界面，是人类操作图形来控制机器；再到如今，众多模型、软件采用对话式交互界面，让机器、程序使用“人类母语”（自然语言、方言）交流，AI突破“图灵测试”，成为人类社会的“新成员”。

例如，美国互联网公司Meta推出的MetaAI在不同平台上与人类用户社交的有28位AI虚拟角色，包括舞蹈爱好者、高尔夫职业球手、手工艺专家和破案侦探搭档等。

众多模型、软件采用对话式交互界面，让机器、程序使用“人类母语”（自然语言、方言）交流，AI突破“图灵测试”，成为人类社会的“新成员”。

国内微博也上线了热门电视剧《长月烬明》《狂飙》中的AI虚拟人物，与粉丝进行微博、私信互动。终有一日，虚拟角色将从线上走入线下。

AI写作、AI绘画、AI编程等AIGC（生成式人工智能）应用，或将成为未来5年数字经济的新动能。可以预见的是，伴随爆款AIGC应用的出现，庞大的用户访问量持续推高推理计算成本，将带来算力分工与转移。

每一次模型应用都是一次推理计算，虽然单次推理算力成本很低，但数亿用户进行数亿次推理时，推理算力的总成本，将超过训练算力总成本。

现在，英伟达、英特尔和安谋等芯片厂商，都在积极投入终端AI芯片产品研发，预计2024年消费电子市场将会出现众多嵌入AI芯片的智能增强型个人电脑、手机、AR眼镜、家电等。“无所不在的AI”驱动的AI新终端，将会分担一部分推理算力任务，减轻AI云负载。

当新一代“应用软件”（AI模型）与新一代“硬件终端”（机器人、AR眼镜等）加速融合，新一轮工业革命将拉开大幕。

在供给侧，基于大模型的智能体将变成人类的“生产力遥控器”。伴随AI芯片嵌入智能车、智能机器人、智能AR眼镜、智能家电等所有终端，人类个体在“人机协同”模式下能够同时指挥的生产资料规模将大幅上升。

现在，特斯拉正在研发2万美元的擎天柱机器人，搭载大模型Grok，有望成为受工厂主、家庭主妇欢迎的“超级智能体”。美国斯坦福大学李飞飞教授团队的论文、中国智元机器人公司的机器人产品亦展示出，没有经过特定训练的工业机器手，能够通过视觉语言大模型，第一次就能实现复杂任务处理，体现出令人惊叹的“柔性操作”能力。

大模型提升生产力的同时，将与各国人口数量脱钩，与能源、AI研发实力挂钩，这可能将彻底改变发达国家与发展中国家的供需模式和生产分工。同时，人工智能产业也会从高端人力密集型转向重资产密集型。

事实上，大模型、大计算、大数据都具有重资产投入的特征。

1993年，美国宣布实施“信息高速公路计划”，总投资额4000亿美元，占年度GDP的5.8%，开启了全球互联网“数字经济2.0”浪潮。近年来，美国数字经济年均增速超过6%，占GDP比重已超过10%，年度产值高达2万亿美元，并带来了5%的就业岗位。

在我国，据国家发展改革委数据显示，2022年正式全面启动的中国“东数西算”工程项目总投资额超过4000亿元。

国际数据公司IDC预计，2022年至2027年，中国智能算力规模复合增长率将高达33.9%，是通用算力的2倍增速；用于行业应用的推理算力将从2024年出现拐点，首次超越训练算力规模；2025年，中国数字经济规模将首次超过实体经济。

2023年7月7日，上海世博展覽馆，2023世界人工智能大会上AIGC大模型应用火爆，商汤展区的AI 绘画生成艺术与观众互动火热

2023年11月24日，杭州，第二届全球数字贸易博览会前沿趋势馆内，首次汇聚的50个人工智能大模型同场竞技，热闹非凡

AI芯片已成为AI从业者的沉重“税负”，让AI算力成本回归社会公共服务的平民价格，是数字经济3.0可持续发展的关键。

市场上AI算力的稀缺为少数芯片制造商带来巨大的市场控制权和高额利润。据美国金融机构瑞杰金融集团透露，头部AI芯片公司的利润率可能高达1000%。在如此高额利润的刺激下，必将有更多低价格的竞争对手（含国产AI芯片）涌现，让AI芯片回归公共基础设施的本质，更多价值将从芯片释放出来，向算力服务、模型服务、AI2.0应用转移。

反之， AI芯片价格若长期运行在高位，会让面向大众市场的所有AIGC创新应用因昂贵的“芯片税”而衰败，无法形成“数字经济3.0”的创新浪潮。

一般而言，算力消耗的能源是AIGC创新应用必须分摊的成本，持续降低成本，对AI应用生态健康良性发展至关重要。

以Meta研发的语言大模型LLaMA为例，训练LLaMA-65B （650亿参数量，属于中等规模）一次的电力成本，以美国电价换算成人民币为0.87元/度估算，约需40万元。而OpenAI的GPT-3训练一次的电力成本超过100万元人民币。

大模型产业数据分析显示，大语言模型的训练成本中，电力费用占比高达65%。当“万亿参数量”的GPT-4，以及更大规模参数量的GPT-5到来时，能源与算力成本或让众多应用创业者望而却步。

目前，微软基于GPT-4推出的AI编程工具Copilot，用户每人每月需付费10美元，但微软需为此功能向每个用户每月倒贴20美元，因此微软全年亏损超过一亿美元——这是小型AI应用创业团队无法承受的。

目前，微软与OpenAI都投资了核聚变创新公司，如美国联邦聚变系统（CFS），同时与美国橡树岭国家实验室、欧洲实验室等多方共同研发核聚变技术，以求不断降低能源成本。

博古通今的大模型，将引发“知识大革命”。

11世纪毕昇发明的活字印刷术、15世纪古登堡发明的铅活字印刷术，让人类在千年历史中积累的庞大知识通过印刷书籍的形式推广传承，知识传播速度由此提升。

比尔盖茨在《未来之路》一书中提到，在谷登堡印刷革命之前，整个欧洲大陆大约只有3万册书，几乎都是圣经或圣经评注性著作，而到了公元1500年，各类题材的图书猛增到900多万册。宗教精英圈子以外的人士第一次有机会接触到书面信息。

鉴于大型语言模型远超人类的超高速学习能力，不少专家预计其将在2026 年学习完所有人类历史上的高质量文本数据。

据多方研究数据表明，大型语言模型能显著提高知识学习速度、知识检索速度、知识传播速度和知识推荐准确性，具有跨语言、跨学科领域、跨信源的独特优势。

在人机协同模式下，大型语言模型可将人类科学论文的阅读时间缩短40%，知识搜索时间缩短20%。而这仅仅是ChatGPT出现一周年的“起点”，鉴于大型语言模型远超人类的超高速学习能力，不少专家预计其将在2026年学习完所有人类历史上的高质量文本数据。

20世纪90年代，未来学家雷·库兹韦尔发现指数级发展的规律：“一旦技术变得数字化，即被编辑为0和1表示的计算机代码，它就能够脱离摩尔定律的束缚，开始呈指数级加速发展。”因此，数字经济中每一代超级平台企业都是软件创新型企业。

每一次软件大革新，都会诞生新的超级平台企业，颠覆原有的数字经济霸主。从Windows、AppStore到GPTs（一种预训练语言模型），都不例外。

当前，智能编程助手改变代码生产流程，大型语言模型成为新一代AGI（通用人工智能）服务入口和软件调度枢纽。新一代青少年将在新兴AI软件与MaaS（模型即服务）模型化创新思维逻辑上成长起来，并将新型生产力软件带入办公室和家庭。

AI算力基础设施即将迎来大量技术工程创新。随着持续的降本增效，AI将真正成为赋能千行百业的通用型基礎设施；同时，“百模大战”将走向AI产业专业化分工。

纽约大学AI Now研究所发布的《计算能力和人工智能》报告称，早期AI模型算力需求是每21.3个月翻一番，2010年深度学习后（小模型时代），模型对AI算力需求缩短至5.7个月翻一番，而2023年，大模型需要的AI算力需求每1至2个月就翻了一番。

摩尔定律的增速显著落后于社会对AI算力需求的指数级增长速度。换言之，“AI超级需求曲线”遥遥领先传统架构的AI算力供给，带来了AI芯片产能瓶颈、涨价等短期市场现象。

为此，许多国家均加大大规模智能基建资源投入，并力图在AI芯片、智能算力集群、大模型架构、专用模型加速等环节创新突破。

纵观国际格局，2023年7月中国国际数字和软件服务交易会中，科技情报大数据挖掘与服务系统平台AMiner联合智谱研究发布《全球人工智能最具创新力城市500强分析报告》显示，在全球AI创新力城市TOP100中，美国33个城市入选，中国有19个；在TOP500里，美国有143个城市入选，中国有42个。

要抓住AI大模型发展机遇，需从K12中小学生和社会职业培训两个方面入手——让大模型走进每一个课堂和家庭，让每一位中国人都能接触到学习调优、使用国产大模型的课程，以培养当前和未来的AI工程师。

商汤教育联合业界知名教育家，在中国出版了《人工智能基础》四册教材，以提升青少年AI技术应用开发能力，同时加强人文伦理教育。截至2023年12月，商汤教育已经为中国超过24个省区市、40个城市、3200多所学校带去了人工智能教育产品（课程、教材、教具、实验平台），覆盖22万名学生，培训出1万多名AI教师。

在不远的未来，我们将看到人人用得起AI算力，人人训得起AI数据，人人做得好AI模型。

（作者系商汤科技智能产业研究院院长）

2023年7月6日，人们在上海2023 世界人工智能大会上观看华为云盘古气象大模型（王翔/ 摄）