AI大模型百花齐放细看护城河与盈利困境

GasWhisperer

2025-07-10 10:53:16

AI领域群雄并起，百模大战如火如荼

上个月，AI界掀起了一场"动物之争"。

Meta推出的Llama凭借开源特性广受开发者欢迎。日本NEC研究Llama论文和代码后迅速开发出日语版ChatGPT，解决了日本AI发展瓶颈。

另一方是名为Falcon的大模型。5月问世的Falcon-40B力压Llama登顶开源LLM排行榜。该榜单由开源模型社区制作，提供LLM能力测算标准并排名。排行榜基本被Llama和Falcon轮番主导。

Llama 2推出后美洲驼家族反超，但9月初Falcon推出180B版本再次夺魁。

有趣的是，Falcon的开发者是阿联酋首都阿布扎比的科技创新研究所。政府人士表示，他们参与这个领域是为了颠覆核心玩家。

180B版本发布次日，阿联酋人工智能部长入选《时代周刊》"AI领域最具影响力的100人"，与"AI教父"辛顿、OpenAI的阿尔特曼等共同上榜。

如今，AI领域已进入百花齐放阶段。有实力的国家和企业纷纷打造自己的大模型。仅在海湾国家圈子内就不止一个玩家，8月沙特就为国内大学购买了3000多块H100用于训练LLM。

有投资人曾吐槽："当年看不起互联网的商业模式创新，觉得没有壁垒；没想到硬科技大模型创业，依然是百模大战..."

原本被认为高难度的硬科技，怎么就变成了人人都能搞的东西？

Transformer引领AI革命

美国初创公司、中国科技巨头、中东石油大亨能够进军大模型领域，都要归功于那篇著名的论文《Attention Is All You Need》。

2017年，8位谷歌计算机科学家在这篇论文中公开了Transformer算法。这篇论文是AI历史上被引用第三多的论文，Transformer的出现引发了此轮AI热潮。

目前所有大模型，包括轰动世界的GPT系列，都是建立在Transformer基础之上。

在此之前，"教机器阅读"一直是公认的学术难题。不同于图像识别，人类阅读时不仅关注当前词句，还会结合上下文理解。

早期神经网络输入相互独立，无法理解长文本甚至整篇文章，导致出现把"开水间"翻译成"open water room"等问题。

2014年，在谷歌工作后跳槽OpenAI的计算机科学家伊利亚首次取得突破。他使用循环神经网络(RNN)处理自然语言，使谷歌翻译性能大幅领先竞品。

RNN提出"循环设计"，让每个神经元同时接收当前和上一时刻的输入信息，赋予神经网络"结合上下文"的能力。

RNN点燃了学术界研究热情，Transformer论文作者沙泽尔也曾深入研究。但开发者很快发现RNN存在严重缺陷:

该算法使用顺序计算，虽然解决了上下文问题，但运行效率低下，难以处理大量参数。

RNN的繁琐设计很快让沙泽尔感到厌烦。因此从2015年开始，沙泽尔和7位同好着手开发RNN替代品，最终成果就是Transformer。

相比RNN，Transformer有两大变革：

一是用位置编码取代循环设计，实现并行计算，大幅提升训练效率，使AI能处理大数据，迈入大模型时代；二是进一步加强上下文能力。

Transformer一口气解决众多缺陷，逐渐成为NLP的不二之选，有种"天不生Transformer，NLP万古如长夜"的感觉。连伊利亚都抛弃了自己推崇的RNN，转投Transformer。

可以说，Transformer是当今所有大模型的祖师爷，它将大模型从理论研究转变为纯工程问题。

2019年，OpenAI基于Transformer开发出GPT-2，震惊学术界。谷歌迅速回应，推出性能更强的AI——Meena。

Meena相比GPT-2并无算法革新，仅是参数多了8.5倍、算力多了14倍。Transformer作者沙泽尔对这种"暴力堆砌"大受震撼，写了篇"Meena吞噬世界"的备忘录。

Transformer问世后，学术界底层算法创新速度大幅放缓。数据工程、算力规模、模型架构等工程要素日益成为AI竞赛的关键，只要有一定技术能力的科技公司都能开发大模型。

因此，计算机科学家吴恩达在斯坦福大学演讲时提出:"AI是一系列工具的集合，包括监督学习、无监督学习、强化学习以及现在的生成式人工智能。这些都是通用技术，与电力和互联网等其他通用技术类似。"

OpenAI虽仍是LLM风向标，但半导体分析机构认为，GPT-4的竞争力源自工程解决方案——若开源，任何竞争对手都能迅速复制。

该分析师预计，其他大型科技公司可能很快就能打造出与GPT-4性能相当的大模型。

脆弱的护城河

如今,"百模大战"已成为客观现实。

相关报告显示，截至今年7月，国内大模型数量已达130个，超过美国的114个，成功实现弯道超车，各种神话传说已不够国内科技公司取名用了。

在中美之外，许多较富裕国家也初步实现了"一国一模":除日本与阿联酋外，还有印度政府主导的Bhashini、韩国互联网公司Naver打造的HyperClova X等。

这种局面仿佛回到了互联网拓荒时代，到处是泡沫与"钞能力"的对抗。

如前所述，Transformer让大模型变成纯工程问题，只要有人有钱有显卡，剩下的就交给参数。但入场容易并不意味着人人都能成为AI时代的巨头。

开头提到的"动物之争"就是典型案例:Falcon虽然排名超越美洲驼，但很难说对Meta造成多大冲击。

众所周知,企业开源自身科研成果，既是为了与社会分享科技福祉，也希望调动群众智慧。随着各大学教授、研究机构、中小企业不断深入使用、改进Llama，Meta可以将这些成果应用到自己的产品中。

对开源大模型而言，活跃的开发者社群才是核心竞争力。

Meta早在2015年组建AI实验室时就确立了开源路线；扎克伯格又靠社交媒体起家，更善于"搞好群众关系"。

例如10月，Meta专门搞了个"AI版创作者激励"活动:使用Llama 2解决教育、环境等社会问题的开发者，有机会获得50万美元资助。

如今，Meta的Llama系列已成为开源LLM的风向标。

截至10月初，主流开源LLM排行榜前10名中有8个基于Llama 2打造，均使用其开源协议。仅在某平台上，使用Llama 2开源协议的LLM已超过1500个。

当然，像Falcon那样提高性能也未尝不可，但目前大多数LLM与GPT-4仍有明显差距。

例如不久前，GPT-4以4.41分成绩问鼎AgentBench测试榜首。AgentBench由清华大学与俄亥俄州立大学、加州大学伯克利分校共同推出，用于评估LLM在多维度开放式生成环境中的推理和决策能力，测试内容包括操作系统、数据库、知识图谱、卡牌对战等8个不同环境的任务。

测试结果显示，第二名Claude仅2.77分，差距明显。至于那些声势浩大的开源LLM，测试成绩多在1分左右，还不到GPT-4的1/4。

要知道，GPT-4发布于今年3月，这还是全球同行追赶大半年后的结果。造成这种差距的是OpenAI高水平的科学家团队与长期研究LLM积累的经验，因此能始终遥遥领先。

也就是说，大模型的核心能力并非参数，而是生态建设(开源)或纯粹的推理能力(闭源)。

随着开源社区日益活跃，各LLM性能可能趋同，因为大家都在使用相似的模型架构与数据集。

另一个更直观的难题是:除了Midjourney，似乎还没有哪个大模型能赚到钱。

价值锚点何在

今年8月，一篇题为"OpenAI可能会于2024年底破产"的文章引发关注。文章主旨几乎可用一句话概括:OpenAI的烧钱速度太快了。

文中提到，自开发ChatGPT以来，OpenAI亏损迅速扩大，仅2022年就亏损约5.4亿美元，只能等着投资方买单。

文章标题虽夸张，却也道出了众多大模型提供商的现状:成本与收入严重失衡。

过高的成本导致目前靠AI赚大钱的只有英伟达，顶多再加个博通。

据咨询公司估计，英伟达今年二季度卖出超30万块H100。这是一款AI芯片，训练AI效率极高，全球科技公司、科研机构都在抢购。如果将卖出的30万块H100叠在一起，重量相当于4.5架波音747飞机。

英伟达业绩随之起飞，同比营收暴涨854%，震惊华尔街。值得一提的是，目前H100在二手市场价格已炒至4-5万美元，但其物料成本仅约3000美元出头。

高昂的算力成本在某种程度上已成为行业发展阻力。红杉资本曾估算:全球科技公司每年预计将花费2000亿美元用于大模型基础设施建设；相比之下，大模型每年最多只能产生750亿美元收入，中间至少存在1250亿美元缺口。

此外，除Midjourney等少数例外，大多数软件公司在付出巨额成本后，还没想清楚如何盈利。尤其是行业两大领头羊微软和Adobe都走得有些踉跄。

微软和OpenAI曾合作开发AI代码生成工具GitHub Copilot，虽每月收取10美元费用，但由于设施成本，微软反而每月亏损20美元，重度用户甚至能让微软每月倒贴80美元。据此推测，定价30美元的Microsoft 365 Copilot可能亏损更多。

同样，刚发布Firefly AI工具的Adobe也迅速上线配套积分系统，防止用户重度使用导致公司亏损。一旦用户使用超过每月分配积分，Adobe就会降低服务速度。

要知道微软和Adobe已是业务场景明确、拥有大量付费用户的软件巨头。而大多数参数堆积如山的大模型，最大应用场景仍是聊天。

不可否认，若没有OpenAI和ChatGPT横空出世，这场AI革命可能根本不会发生；但目前，训练大模型带来的价值恐怕还有待商榷。

而且，随着同质化竞争加剧，以及市面上开源模型越来越多，单纯大模型供应商的生存空间可能会更加受限。

iPhone 4的成功不是因为45nm制程的A4处理器，而是因为它能玩植物大战僵尸和愤怒的小鸟。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

16人点赞了这条动态

赞赏
16
8
分享

0/400

半佛薅羊毛

· 14小时前

有钱真好油价自己定

LayerZeroEnjoyer

· 22小时前

羊驼输了好可惜

Liquidity_Hunter

· 07-10 11:22

原来石油土豪也玩大模型了呀

挖矿退役军人

· 07-10 11:22

搞这么多也就跟着玩玩说到底还不是割韭菜

rekt_but_vibing

· 07-10 11:17

又是割韭菜的新机会来了

QuorumVoter

· 07-10 11:12

阿联酋也来卷AI了？

just_here_for_vibes

· 07-10 11:01

阿联酋搞得还挺野

Frontrunner

· 07-10 10:54

动物大战看累了看看谁能活到最后

话题
BTC再创新高
87738 热度
ETH突破3000
40839 热度
VIP 专属空投嘉年华
13844 热度
4我的Gate时刻
11328 热度
5美联储6月会议纪要
4379 热度
6Gate首发Pump.Fun
3661 热度
7美加征关税
15571 热度
8Gate xStocks 交易体验
21920 热度
9香港稳定币条例
12802 热度
10TruthSocial加密蓝筹ETF
2221 热度

AI大模型百花齐放 细看护城河与盈利困境

AI领域群雄并起，百模大战如火如荼

Transformer引领AI革命

脆弱的护城河

价值锚点何在

AI大模型百花齐放细看护城河与盈利困境