奇才公主闯天下《AI未来指北》栏目由腾讯新闻推出,邀约全球业内专家、创业者、投资人,探讨AI领域的技术发展、商业模式、应用场景、伦理及版权争议。
ChatGPT的火爆让沉寂许久的创投圈再度热闹起来,创业者迫不及待投入这波热潮,试图抓住“淘金”机会;投资圈也跃跃欲试积极寻找下一个独角兽标的。但大模型似乎和往期热炒的风口有所区别,人们对它的争议不仅停留在产业颠覆层面,而且上升到对未来人类思维模式的挑战、对人与机器相处的伦理争议。
在这场技术浪潮中,投资人群体依旧保持惯有的敏锐嗅觉,试图捕捉新机遇。但大模型动态进化带来的不确定性,也让投资人的出手显得格外冷静,他们反复斟酌:从存量市场看,大模型出现后,哪些产业需要重新审视和建造自己的壁垒?从增量市场看,下一个超级应用可能诞生在何处?
腾讯科技“AI未来指北”系列,本期专访华映资本管理合伙人章高男,分享投资人在AIGC领域的投资和判断逻辑。
创业公司做通用大模型的机会是0,垂直模型蕴含新机遇,但垂直模型的核心机会将掌握在拥有稀缺私有数据的公司手中。模型本身并没有太高的壁垒,核心门槛在于优质数据。
大模型会大大降低游戏的生产制作门槛和成本,游戏领域可能会跑出一个类似“抖音”的平台级机会。
在未来5-10年国内能活下来并且产生商业价值的通用大模型不会超过3家,否则就是无效竞争和资源浪费。
腾讯科技:华映很早就已经开始在AI领域进行布局,之前就投资了聚焦通用计算芯片的壁仞科技、提供数据标注服务的星尘数据,近期的AIGC热潮开始后,你们在大模型方向的出手比较挺谨慎,还没有正式投资相关企业,这里面的逻辑是什么?
章高男:大模型虽然热,但在一级市场出手谨慎的不仅华映资本一家,很多机构都处在积极学习和冷静观察的阶段,这背后的深层次原因是投资人“不敢投”,ChatGPT的爆火让大家看到大模型蕴藏的未来趋势和潮流,但他们对大模型的进化和预判还有很多不确定性。
不光投资人,即便是做AI模型的专业人士、企业家、学术大牛对大模型能力边界的预判也存在严重歧义。有一些企业家可能会出于自身经营立场发表有目的性的观点和判断,但没有任何商业利益瓜葛、能够做出相对客观判断的科学家们也没有对大模型的能力边界达成共识。
大模型基于谷歌Transformer框架做深度学习,本质上是基于模拟人类大脑运行的神经网络算法,但神经网络并不是数学推导,它按照人脑的逻辑运行,它的底座是一种“自我意识”,这导致大模型的运行结果具备很大的不可预测性。
Yann LeCun正在开始推翻用自回归学习方法产生思维的模型,转而建立新的“世界模型”去模仿推理,比如人类拥有极强的小样本学习能力,他们用10个小时学习开车,就能开得很好,不需要用大量数据投喂产生更大的样本才能学会。如果机器用海量数据学习自动驾驶却依然没有学会,那么机器的思维还是有一些缺陷。当然所谓这种“世界模型”是非常早期前沿的理论探索,离实际的应用差的很远。我只是想强调未来模型产生推理能力的不确定性。今天的算法产生复杂推理和预测能力可能很难,但未来未必。
整体而言,虽然大模型在认知和组合上能够帮助人类提升效率,但是连科学家都还不能预测大模型的进化历程,投资人就更难理解了,他们很难弄懂模型和模型之间的区别,甚至每个模型的调优方法。实话讲我自己面对很多算法也是失去推导能力的,如果连看都看不懂,怎么能真正对算法的能力做出合理的预判呢?更何况是一堆算法的耦合,我其实也只能硬着头皮学一些皮毛同时多向专家请教再去研究,这个领域认知的门槛太高了。
腾讯科技:ChatGPT掀起国内大模型领域创业热,与之并存的是投资“饥荒”,有的投资人为了不错过机会跨界看AI、马不停蹄找项目,但他们却依旧感叹无项目可投,这波“创业热”和“投资冷”形成反差,为什么面对大模型,投资人出手如此谨慎?
章高男:这不算“退却”,大模型给投资人带来的颠覆不仅仅在于“投资”这个行为和动作本身,而在于对投资人的认知和思维底层逻辑的改变,甚至它对我的生活也带来改变。它给我的冲击,在于它可能在更多行业不断代替各种数学和推理方法,来帮助我们提供更多解决问题的方法,也让我更看重具备复杂思维能力的人才,以及具备稀缺私有数据、愿意拥抱深度学习技术的项目。
第一,它有上下文。我们可以把每个单词类比成一个人,人都身处于一个社会语境,一个人在社会上的地位和权重取决于他跟周围人的临时或长期关系。如果你的朋友是总统,你一天花10个小时在总统,总理身上,那么你肯定不会太差。这就说明一个人的地位是可以通过与社会中其他人的关系权重系数达到一定高度的,每个单词和单词之间在不同场景上也有权重系数,contex建立的正是这种权重系数。
第二,情景学习和思维链。当大模型的预训练数据规模大到一定程度之后,我们只需要输入一些任务描述,同时输入有限的任务案例,模型就能依次类推,对类似的这类问题能够给出很好的答案。也就是说有很强的小样本学习能力。思维链是把复杂逻辑问题分解为简单的逻辑问题,这就取决于使用者的能力和水平了。这也就是说不同水平的人使用大模型的效率是截然不同的。个人认为从本质上讲大模型还是高效的编程工具范畴,只不过过去是用计算机语言编程,大模型是用人类语言编程友好度和效率更高。但是解决复杂问题的效率还是取决于使用工具的人的逻辑能力。
第三,指令学习,就是把人类的语言和要做的任务做尽可能精准的对齐。Open AI用人类增强反馈学习,通过人工将问题的答案进行排序,不断反馈给模型,达到一定程度后,采用一定的 评分机制采用强化学习取代人工提高效率。有了这个我们发现我们问题的回答和人类习惯很接近了,且不管正确有效与否,至少感觉很拟人了。当然这是 ChatGPT模型的特点,因为ChatGPT就是为任务而设计的,其本质就是大量暴力的精准提示来减少任务的模糊性。而Google的Bert模型这块就不是重点了。
我们可以看到纯粹用这些方式很难产生出真正的复杂思维,机器永远是在已知给你的数据中寻找最优的组合逻辑。但是仅仅这些已经足够能带来巨大的变化了,譬如这会导致所有的知识体系传授相关的职业门槛大大降低,比如医生、律师这类职业未来可能会变得人很少,低级的编程人员也会少很多,因为他们更多的是知识的搬运和应用。相反,未来具有极强复杂逻辑能力的人或者极具创新能力的人或工作岗位,能更好利用这些知识工具从而使得效率大大提升。
腾讯科技:您提到通用大模型,继ChatGPT之后,国内各家都在发布大模型产品,中国是不是需要更多大模型公司?会存在重复造轮子的问题吗?同时在您看来,AIGC领域的项目满足什么标准,你会出手投资?
章高男:首先,我基本不会投资通用大模型,我认为未来5-10年国内能活下来并且产生商业价值的可能不会超过3家,超过3家就是无效竞争和资源浪费。现在出现很多大模型,百花齐放,但每家公司的目的和真正投入不一样,有的可能出于股价或其它营销目的做通用大模型。我认为通用大模型不必做太多,因为它只能解决通用型的问题;此外,通用模型进入各行各业的效率比较差、成本却很高。
通用大模型天然适合搜索和问答场景,搜索内容是fact,问答内容是opinion,未来搜索和问答会二合一并且入口被大模型垄断,人们只要想获取知识,就会找通用大模型,不管用户问的是fact还是opinion,只要问就给回答,这个入口就是通用大模型。
其次,从项目角度,我认为创业公司做通用大模型的机会是0,但垂直模型是机会,核心是拥有行业稀缺私有数据。模型本身并没有太高的壁垒,核心门槛在于数据。以前我没有特别强调私有数据的重要性,大模型让我对投资标的选择标准发生改变。
越是垂直,专业属性越强,准入门槛越高的行业都会产生大量私有数据。譬如生物医药、智能制造, 政企等等。从去年开始,我们关注对智能制造的工艺改进实验,每次实验的结果都表明,这个领域的数据是极端稀缺和私有的,每次实验都投入了大量的时间和资金。大模型用了大量强化学习,最缺的就是结果验证。 这些数据对企业而言是至关重要的,通用大模型想要获取这些数据需要极高成本。
我过去一直遵循自己制定的三个标准寻找项目:第一,是否有增量市场;第二,是否具备极高壁垒;第三,是否行业前三,这个原则是我的底层逻辑,可以坚守十年甚至更长。在这个基础上我又加了一个约束条件:必须能够产生稀缺私有数据 ,当然这必然导致项目范围会受到一定限制,但是成功概率也会一定程度被提高,有舍有得 。
另外,如果企业高度拥抱神经网络,将它作为技术迭代的重要工具,这对我来说也是极大的加分项,特别是在制造业工艺线的改进中,因为这些领域过去离数字化技术相对较远,如果跨界结合得好,机会会更大。
再者,从人的角度,我会更看重具备复杂思维能力的人,他们具备更高的不可替代性,一个人的思维抽象能力越强就越不能被替代,思维抽象能力越弱的人越容易被替代。比如开车需要一个相对复杂的逻辑,它需要对各类情况进行预知和动态判断,实时性要求也较高, 这对大模型就是巨大挑战了。
另外更稀缺的人才是怀疑和创新的人才, 会“say no”的人不太会被替代,人类主要的进步靠“say no”产生,而不是“say yes”,但大模型“say no”的能力很弱,他们总是给出一个已有人类知识中最接近指令的所谓已知最优解, 而敢于怀疑和否定绝大多数人认为正确的意见才会产生真正具有突破性的价值。譬如过去我们都认为“地心说”才是真理,后来变成“日心说”,第一个提出“日心说”的人一定是被全世界反对的人,但真理往往掌握在少数人手里,这些人是真正推动社会进步的源动力。
腾讯科技:大模型对稀缺私有数据的改造,是你从存量市场的角度观察到的机会,从增量市场角度来看,哪些细分市场能生长出独角兽应用?
章高男:其实每个行业都要积极拥抱各种类大模型工具作为知识的效率工具,但大模型不是万能的,它的高效不一定能被应用到所有场景。
因为通用大模型是基于人类语言发展而来的,在内容领域,由于工具的改进可能会诞生更多的颠覆式创新机会。
我个人的直觉是,游戏的生产制作门槛和成本未来会被大大降低,游戏领域可能会跑出新的平台级的机会。游戏制作的本质是内容制作,目前 UE5已经能做到电影级的画质,UE5加上大模型对工具链的渗透 ,某种程度可能会重构产业形态 。
过去的顶级游戏需要千人团队花数年制作,就是因为工具链的复杂度和使用门槛以及模型制作的复杂度都极高。这导致游戏制作非常封闭且门槛极高,但是这种情况正在改变,未来真有可能几十个人就能做出一些很高质量的小场景,这些场景是可以互相耦合叠加的。如果这些场景质量足够高,它们就可以在电影,广告或市场活动等其他领域被重复利用或者二次开发。
AI把游戏工具链的门槛大大降低了,它将过去只有几万人或几十万人参与的内容制作,泛化到几百万人,几千万人。如果真是这样游戏就不仅仅是游戏了,而是一个个组合起来的可弹性发展的小世界。虽然我不是这个领域的专家, 但感觉这可能就是未来Metaverse的一部分。我几乎不玩游戏,过去对Metaverse也毫无感觉,但AI大模型让我对这方面的认知发生巨大改变,我甚至觉得未来就是应该这样的。
腾讯科技:最近,75 岁深度学习之父Geoffrey Hinton突然离职谷歌,他表示对自己投入一生的研究感到遗憾,“目前不知道要怎么防止坏蛋利用 AI 来作恶”。在您展望的未来社会图景中,有没有AI治理方面的布局?其中有哪些机会?
章高男:AI治理有很多机会,这属于数据安全机会,它是有很多商业价值的,而且也是一个增量市场。 比如360做的就是安全这件事情,但相比较于这种约束性机会,我更喜欢创新型机会。
AI规范的核心是对数据的监管,但AI发展太快了,导致数据安全行业是滞后的,相关数据安全治理会迟到但一定不会缺席。工具就像核技术,拥有了核武器,我们可以用它去毁灭世界,也可以让它发电造福人类,主要看是谁在使用以及如何使用。监管是为了发展而不是消灭。
第三,大模型仍然脱离不了更高效的编程工具,至少在未来5年内,大模型仍然还处于工具范畴,但它作为一款工具应用的深度范围会越来越广;
第四,各行各业都开始拥抱深度学习技术,某些领域甚至开始取代有严格解析能力的数学模型;
第五,从AIGC相关场景来看,我认为游戏和元宇宙世界可能会产生新的、千亿级别的平台。
腾讯科技:这是你站在当下的视角做出的5年内的预测,如果再加一个5年,大模型会发展到什么程度?AI能产生人类的情感和意识吗?
章高男:不一定是加5年,只能说在我可预见的未来里,比较认可Yann LeCun的观点,他认为未来可能会出现比目前更复杂的“世界模型”,它可以模仿推理。Yann LeCun认为,自回归大型语言模型没有前途,因为它难以解决诸如事实错误、推理有限等问题,“世界模型”才是未来,它可以学习世界的表征和预测模型、学习推理、学习计划复杂的动作序列。
AI产生情感是很容易的,比如让它说话的声音和风格无限接近乔布斯,这在技术上没有任何难度,虽然这不是人类真正的情感,但它足能够以假乱真。但现有AI技术想要产生复杂推理能力、实现对未知的预测,还要面临很大的挑战,它是否能像人一样思考还是未知数。
|