ChatGPT中国变形记

admin

2年前

ChatGPT爆火后，中国AI公司如何逃出「美丽陷阱」？

1、压力、狂热和久违的“ALL In”

像一颗兴奋的火种，ChatGPT正在中国科技公司急速蔓延。

百度CEO李彦宏直接把自己2023年的OKR定为：“引领搜索体验的代际变革”。一位百度内部人士对36氪表示，李彦宏认为这次机会绝不能错过，不同于元宇宙火时他持怀疑态度，从没在公开场合讨论，但AIGC（人工智能生成内容）、ChatGPT却多次说过。

对这家中国搜索公司来说，这项火遍全球的突破性人工智能技术，为它带来了全新的想象力。2月7日，百度宣布将发布类似ChatGPT的项目“文心一言”后，其港股股价应声而涨12%。市场是如此期待中国也能尽快推出类ChatGPT产品。

多位百度人士告诉36氪，高层下了死命令，要在一个月时间内看到产品，“3月完成内测”。

一股自上而下的压力全面袭来。“所有OKR推迟，就搞文心一言。”多位百度员工向36氪描述了公司内部当前的紧绷状态：“技术琢磨怎么研发、产品经理思考怎么接入、销售在想怎么卖。”用来训练数据模型的稀缺资源——英伟达A100芯片，“全部调用给文心大模型，其他组都借不到”。

紧张的倒计时下，北京西二旗的科技园里，百度的算法工程师们迎来一个个封闭开发的不眠夜。由百度CTO王海峰担任总指挥，协调两大事业群、百度核心AI人才组队攻坚——百度在用一种最高级别的战备姿态来迎接这场“搜索代际变革”。

36氪获悉，字节跳动也已集结了几个核心部门，组成团队布局类ChatGPT产品。

“头部的平台公司里面，字节肯定是反应最快和投入最坚决的。”一位投资人评价，比如去年字节AI把人脸卡通化的应用已经火过一波。业内也对字节的表现充满期待。

“像ChatGPT这样的人工智能，与个人电脑、互联网同等重要。”连比尔盖茨都如此公开表示。微软在ChatGPT推出后，对孵化该产品的公司OpenAI又宣布追加100亿美元投资，让这家仅有500人的创业公司估值高涨至290亿美元。

中国股市情绪汹涌。2月上旬开始，“ChatGPT概念股”如雨后春笋，包括汉王科技、海天瑞声、科大国创、科大讯飞在内的多支股票接连大涨，即便他们的业务只和ChatGPT底层的AI技术有部分关联，也并没有成型的产品。

科技属性、流量纪录、资本疯狂……ChatGPT成为后疫情时代的第一个绝佳故事脚本，没人不爱它。

大公司在狂欢，创投圈也在骚动。

2022年底，一家美元基金的年轻投资人Kevin被派到硅谷，彼时，硅谷已经因ChatGPT陷入疯狂，他所在的基金敏锐地觉察到这个变化，因此那阵基金各个赛道的投资人“都在关注AI的变量”。甚至有人相信，这“可以让TMT投资人续命15年”。

过去几年，互联网增长见顶的讨论不绝如缕，人们不得不向投机味道浓重的Web3、元宇宙投注热情。而当ChatGPT横空出世，人们共同体验了它似模似样地捉刀作业、起草邮件、书写代码，甚至富有逻辑地胡说八道后，共识前所未有地快速成型。

全球互联网人口在过去一年增长了近1亿，增长率仅约2% 来源：Datareportal

短短两三个月，热潮就从硅谷传到中国，从去年年底的“新时代来了”，变为今年年初“人人都知道新时代来了”。

随着前美团二号位王慧文发布自带5000万美元入局AI大模型、广纳技术英雄的招募贴，热烈的情绪走向高潮。

AI公司出门问问创始人李志飞最近也与王慧文面议AI大模型到深夜。“ChatGPT把去年躺平的中国创投圈都炸醒了，”李志飞几天前在朋友圈写道，此时“堪比2010年左右开启的移动互联网，听到最多的词是All in”。

盘点“天选之人”时，36氪原本认为，卖掉搜狗的王小川错过这次机会堪称憾事——清华计算机系毕业的王小川创立搜狗18年，业务涵盖搜索、输入法、翻译，均与AI语言模型相关——但意外听到他也在计划创业，回归做AI大模型的消息。

36氪向王小川求证，他承认，自己在“快速筹备中”。

2、上头派，冷静派

此时一个最实际的问题是：中国能否沿着相同的路径，复刻一个ChatGPT？

在硅谷看过一轮之后，投资人Kevin的情绪却从热烈走向冷静。他发现，中国的复刻之路远比想象的要艰难。

钱是第一道门坎。OpenAI出世之时由几位硅谷大佬承诺出资10亿美元。在ChatGPT发布前，微软就已经在2021年悄悄向OpenAI投资了20亿美元。与之对应的，是OpenAI的巨额支出，业界推测其核心语言模型GPT-3的单次训练成本高达460万美元。换算下来，王慧文为此次创业筹备的5000万美金，只供GPT-3进行十次训练。

在提及入场AI大模型“报名费5000万美金起”仅一天后，李志飞又发朋友圈说，在饭局上“惊闻门票可能已经涨价到一亿美金了”。“现在的感觉真是AI圈一天人间三年，一天不学习和思考就跟不上吃瓜群众的认知了”。

钱还是最容易迈过的一道门槛——在OpenAI已经探明道路、还发了论文的情况下，Meta还开源了一个类似的AI大模型，后来者已经能节省很多试错的训练费用。即使考虑到AI大模型后续还需训练，微软又追加了100亿美金投入——中国互联网历史上，在诸如打车等风口，募资过百亿美金的案例并不在少数。

第二道门槛要难迈得多，至少对小公司来说如此。由于美国对中国禁售芯片，而运行AI大模型需要大量GPU芯片——芯片上受的钳制，又影响了做AI大模型。

AI公司“彩云科技”的创始人袁行远告诉36氪，要想跑通一次100亿以上参数量的模型，至少要做到“千卡/月”这个级别，即：用1000张GPU卡，然后训练一个月。

即使不用最先进的英伟达A100，按照一张GPU五万元的均价计算，1000张GPU意味着单月5000万的算力成本，这还没算上算法工程师的工资。

“但是中国历史上买的A100卡肯定是够的，后面哪怕禁运了，但公有云厂商以前买的那些卡，复刻ChatGPT是非常绰绰有余的。”Kevin对36氪分析。

阿里、华为、腾讯、百度、字节……这些大厂都有公有云业务。多位业内人士对36氪分析，短时间内，芯片（意味着算力资源）至少对大厂还不是太大问题。

第三道门槛，人才的流向，有点灵魂拷问。考虑到OpenAI不过500人规模，而经历过上一轮AI热潮的中国公司动辄数千人，凑个人头应该不在话下。

但Kevin认为，现成的优秀人才，都在四大美国科技公司的AI Lab里。不同于上一波硅谷人才回国潮之时，如今世界局势、国内财务自由前景都截然不同，如何让人才“系统性回国”成为挑战。而上一波AI人才是否能顺滑转换做AI大模型，还要打个问号。

至于商业变现，似乎前景无限，但又不甚明朗。

Kevin预测，AI大模型在中国的变现之路，一定不如美国“清爽”。他以云服务做类比，在美国，可以直接按租用服务器收费，其他都不用管，正如ChatGPT可以直接按调用次数收费。但在中国，面对大企业和政府，技术公司得做全套服务、甚至是定制开发。

这项技术与大用户产品结合，更可能爆发无穷威力。例如ChatGPT与搜索结合——这带来了颠覆Google搜索的想象空间，让投资了OpenAI并获得使用授权、拥有Bing搜索业务的微软，市值在过去一个月里大涨1631亿美元——但在实际落地上还有障碍。

一位百度搜索业务的员工告诉36氪，公司对于ChatGPT业务与搜索的结合尚有担忧：“搜索广告的本质是给用户展现更多结果页面，可ChatGPT是更精准、更有逻辑地推送答案，两者结合后可能会影响搜索广告收入。”

上头派和冷静派——从目前的情绪上，李志飞把业界分为这两派。上头派“满腔鸡血不管不顾只求第一个进入，希望获取先发红利，让资金和人才向其靠拢”；而冷静派“谋定而后动，希望全面梳理人才架构、技术路线、国家态度、接下来互联网巨头的合纵连横、潜在商业模式等关键问题”。

哪一派能最后能胜出？

即使目前是上头派，最终也得面对冷静派考虑的这些问题。

3、类ChatGPT=CheatPPT？

多位从业者都对36氪说，中国做出类似ChatGPT的产品“只是时间问题”。但对复刻一家OpenAI的公司，却大多表示悲观。

OpenAI为什么没有出现在中国？这个问题有点过于触及灵魂了。

耗时长度，就可能超乎想象。

“小冰做AI Being的时候，我还是个小伙子，现在做了10年了。10年来我们没有变过方向，磨了不一定有结果，不磨更没有结果。”小冰CEO李笛对36氪感叹。从微软亚洲互联网工程院拆分为独立公司的小冰，是目前国内不多的拥有完备人工智能框架的AI 公司。几年前的小冰已经能写诗、作画、唠嗑，算跟ChatGPT非常类似。

“磨”，是指对模型背后 Instruction（行为逻辑模版）的打磨。当机器将表示无奈的“。。。”误以为所有标点符号都要重复三个时，粗暴的处理方式当然可以禁止机器重复标点，而要想让模型更聪明，需要人为地写入更多 Instruction，告诉机器什么情况下可以使用“。。。”，什么情况不能。

“你得有工匠精神，得死抠 Instruction才有机会做得很好，OpenAI的优势，就是它真的死抠。”李笛说，“国内外的科研能力差距并没有很大，但从业者需要耐得住寂寞去打磨。”

道理看似简单，但做起来却难。

一位大厂AI工程师看不惯内部急于出成果的做法，他们私下把类ChatGPT产品叫 “CheatPPT”，“就是交个PPT，给领导画个饼”。因为“从技术到到应用又是一回事”，他对中文大模型在短时间内做产品，“还蛮悲观的。”

训练一个有一两千亿参数的大规模语言模型，需要大量的人工调教和用户数据反馈。云启资本合伙人陈昱认为，这也是很多大厂短期内拿不出和ChatGPT相媲美产品的原因，因为这些都不是“匆忙应战”所能解决的。

况且，时至今日，大模型仍未找到最优解，就算最接近图灵测试的ChatGPT，在知识性和逻辑理解能力上依然有所欠缺。李笛将打磨过程视作“够天花板”：“人工智能的思维上限，要用无数次Instruction的微调去试探。”

而且，死抠也不见得立竿见影，OpenAI的成功，在今天看来仍有偶然性。

OpenAI成立时，业内主流人工智能路线是“监督式深度学习”，需要人工将语义、图片打上标注，机器才可以识别相似信息，典型的应用场景是客服回答与直播鉴黄。但OpenAI选择的“非监督强化学习”技术路线，是将巨大的语料库不经标注地直接投进模型，等待机器吐出一个未知的结果。

经费在燃烧，结果却无从预料，这种九死一生的创新模式，成了大多数公司无法承受之重。

一位明星AI创业公司工程师向36氪描述了急于追逐ChatGPT的难堪一幕：为了成为投资人眼中的OpenAI，该公司的底层算法直接照抄GPT-3流传的复刻版；拿不到数据语料，就去中小学生的QQ群投放语音聊天包，结果收回来一堆带有颜文字的聊天纪录。

“模型越训练，效果越匪夷所思，这个模型最后使用的成本，肯定比招一个人工客服贵。”这位工程师对36氪说。

大模型所需的语料，是对耐心的重大考验。

“所有的文本数据都在互联网上，但难度在于怎么清洗出好数据。”昆仑万维CEO方汉对36氪表示，昆仑万维从2020年开始做自有AI多国语言大模型，仅仅是用自己的专有算法清洗数据，就整整花费了近两年，从百亿级数据里筛出了10%的好数据。

不少AI老兵多少都经历过坐冷板凳的岁月。清洗数据的“脏活累活”，聆心科技CEO黄民烈和清华的课题组做了数年。在中文语境下训练出一个ChatGPT，要面临更复杂的语言体系。黄民烈介绍，中文的语法较英文更松散灵活，也没有空格对词语加以区分。

深入AI大模型的训练细节，“耐心”是一项反复出现的关键要素。如何更有耐心地重视基础科研，也许才是一个真问题。

但尴尬的是，过去三年，在降本增效的大背景下，身披光环的AI科学家们成了科技巨头中的尴尬存在。2019年末，腾讯AI Lab主任张瞳离职，去了港科大；2020年，字节跳动AI Lab负责人马维英离职，去了清华；2022年，阿里M6大模型带头人杨红霞离职。一位曾在大厂AI实验室工作过的员工告诉36氪，在大厂里做基础科研的一个尴尬细节是，“连OKR都没法定”。

至于在上一波AI投资热潮中出现的“AI四小龙”，基本都在做视觉识别、挣安防领域的钱，似乎已经离AI通用大模型有一段距离。在风险投资“5年+2年”的投资周期要求下，创业公司需要在这个周期内走到商业变现一步，而做基础研究很难养活自己。

此刻，缺乏耐心的故事正在再度上演。

为了迎合投资人的口味，有创业公司正试图将自己强行包装成“中国式OpenAI”。一位国内明星AI创业项目的工程师告诉36氪，ChatGPT爆火后，公司CEO要求模型效果达到与ChatGPT近似水平，工程师们只能通过粗暴改写程序等方式，强迫机器按照他们的想法运作。

“比如AI会把每句话里的标点符号重复三次，后来发现是因为训练数据里，很多用户会用‘。。。’表示无语，机器就误以为这是人类的正常表达，我们就只能写一段逻辑，强制机器不要重复标点，但这样模型不会提高任何能力。”这位工程师对36氪无奈表示。

上述案例还属于正经AI公司临时作弊。一位双币基金投资人曾在两年内3次遇到过同一个团队：第一次是在元宇宙概念爆火，第二次是Stable Diffusion带火图片生成，第三次则是在最近，他们又开始做NLP（自然语言处理）。

“发展路径不清晰，实现希望很渺茫，商业价值不明确，一旦突破改变世界”，很可能是受到OpenAI的刺激，王慧文发帖说，如果自己新组的AI公司有剩余股份，想成立一支“非盈利性”基金，投资这样的科技探索。

而具备头3个特征的创业项目，往往都是拿不到融资的。要求一般投资人投这样的项目，也违反常理。

4、中国式打法

我们既希望出现中国的OpenAI，也要认识到，OpenAI狂堆参数的“暴力美学”，对绝大多数AI公司来说是个美丽的陷阱。

在国内，李笛见到过不少公司跟着OpenAI训练千亿、两千亿参数的模型，大多落得模型、钱财两空的下场。

“初创公司搭大模型的成功率是非常低的。”李笛对36氪说，“烧钱是一方面，你还得有工程上的综合能力，搜索、自然语言处理、模型优化……小公司突破起来太难了。”

他给出的警示是：OpenAI的模式并不适合所有公司。一方面，大模型对不少业务场景没有必要；另一方面，还是成本的问题，“如果一个35亿参数的大模型的运行成本和以前的检索模型差不多，它才能落地，否则赔死了。”

一名双币基金的投资人用两个疑问，拒绝了一个立了“1年做出大模型”军令状的项目：

“你们做大模型的必要性在哪？”

“有什么明确的商业模式吗？”

“ChatGPT的出圈，会让我们在心态上对走在无人区的公司更包容。”一名投资人告诉36氪，“但评判项目价值的逻辑没有变，商业模式依然至关重要。”

“要死抠，在提高模型质量和降低成本两个方向同时抠。”李笛总结如何“落地”。

对于小公司而言，抠成本需要一些巧劲。比如做AI翻译业务时没钱买高质量的标注数据，袁行远想到了求助拥有丰富双语语料的字幕组和翻译社。

买不起GPU怎么办？那就租。袁行远算了笔账，按照2000万人民币的利润来算，在研发上投入1000万，在机器上投入500万，是公司能力的上限。这也意味着，按照显卡每张3-5万元的价格，fine-tune过程需要的100张GPU，公司有能力掏钱买。但从零训练所需的1000张卡，彩云科技租借了云服务，把成本压到了几百万。

刚创业时，袁行远手中只有一台服务器、一张GPU和北京6月的降雨数据。没有办法做到“千卡/月”，算法工程师就要特别小心，“就怕模型跑到一半挂了没保存，一切前功尽弃，浪费了算力资源”。

大模型的效果是惊艳的，但李笛认为，通过将其拆解为更小、更轻量的步骤训练，依然能达到殊途同归的效果。

创业公司在探索天花板的同时，还要活下去。

即便是最初定位为“非营利性组织”的OpenAI，在高昂的入场费面前，也得与商业结合。2019年，微软宣布注资10亿美元，并取得了将OpenAI部分技术商业化的权利——两年后，10亿美元铺就的成果有目共睹，ChatGPT横空出世。

去年开始，聆心智能开始面对普通人，做了类似于ChatGPT的AI对话。但黄民烈意识到，在现阶段的算法能力下，面向用户收费还为时尚早。其一款AI对话产品最后因为效果不达预期，推迟了一个月发布。

“做大模型研究是需要持续资金支持的长跑。”在黄民烈看来，资金储备是留住人才和维持研发的基础。2月，聆心智能刚完成了Pre-A轮融资的交割。而在风口中，黄民烈决定再多和投资机构聊聊。

并不是所有AI公司都要当OpenAI，要搞ChatGPT。正如移动互联网并非只是苹果手机和安卓系统的机会，还会长出诸如字节、美团、滴滴等一些极有价值的公司，只是需要一些时间。

明势资本合伙人夏令认为，未来在相关竞争中形成争夺关键点的，是“谁能拿到更多场景里，user in the loop（用户在环）的、高质量反馈的私有数据，并以更高效率迭代”。

好消息是，热潮来临之时，创业公司的资金压力也许会得到纾解。

“我们的黎明终于要来了。”2022年底第一时间试用ChatGPT后，这是虎博科技CEO陈烨的第一反应。

在那之前，虎博科技已经在NLP（自然语言处理）领域苦熬数年，也推出过类ChatGPT的C端金融搜索业务，但当时技术还未成熟，商业化前景有限，不得不将其收缩。最难的时候，团队连水电煤支出都要一分分地计算。

而最近一段时间，陈烨拉着技术同事一起熬夜写代码，研究ChatGPT的模型、路径，并准备购入百万级别的机器用于研发。

AI上一次引发热潮要回溯到2016年——谷歌旗下的AI机器人AlphaGo在“人机大战”中，第一次击败人类职业围棋冠军李世石。那之后，AI行业经历了从极速繁荣到资本退潮，行业走入数年的低谷期。走进新时代，成了所有人的热望。

“技术圈的创业，就好像推导数学公式，你在还没有推导出来之前，谈别的是浪费时间，”一位AI技术专家对36氪表示，“如果ChatGPT真的起来了，中国这帮做业务型创新（如外卖、电商）的成功者们，如果没有跟上这波创新浪潮，都会被浪潮推走，成为上一代的人。”

也有人试图保持冷静。华创资本投资人张金告诉36氪，纵观中国三类AI创业公司——基础层（即大模型侧）、中间工具层、下游应用层——融资进度跟美国是几十倍甚至百倍的差距。比如应用侧一些公司，在美国都已经10亿美金了，商业化能力也很强，但国内公司普遍只有数亿人民币的估值。

无论如何，没有人想留在过去。在36氪多次约访后，一位经历过上一次AI周期的投资人最终选择拒绝：“最近忙着观察、讨论，确实没空回顾从前。”而在36氪所在的一个讨论群中，有人一进来就迅速将自己的昵称改成：“确保AI创新发生在本群”。

（36氪作者窦轩、李安琪对本文亦有贡献）