ndlc 222b刚刚,OpenAI收购了制作开源版「我的世界」的初创公司Global illumination,具体收购金额未知。
对此,英伟达高级研究科学家Jim Fan表示非常好奇:「下一步是什么?在GPT-5上运行多智能体文明模拟?也许「我的世界」就是打造AGI所需要的一切?」
最近,这家公司开发了最受欢迎的产品——开源多人在线角色扮演游戏「Biomes」。
一直以来,Global Illumination所做的工作侧重在面向视觉的产品和服务上。
也就是说,OpenAI有可能正为ChatGPT拓展更多的图像/视频类功能,或者是为了构建Dall-E 2图像生成服务,又或是推出一个文本-视频产品,以与初创公司Runway的Gen-2竞争。
「Global Illumination」(全局光照)一词在计算机图形学领域已经使用了很多年,用于描述在3D物体上创建逼真光照效果的算法。
全局光照的最初算法之一是加州理工学院(Caltech)的研究员James Jim Kajiya在1986年提出的。
这家公司共有8位成员组成,3位创始人。有趣的是,官网每个人头像都用的是像素小人。
一些网友表示,此举是OpenAI的一次出色的「收购」,通过收购来收揽新人才。
2013年,Thomas加入Ins,成为首席工程师,并在5年后,升任为工程总监。
他被称为Ins「第16号工程师」,「Instagram内容排名算法原始创作者」,于2020年正式离职。
在Ins工作的7年里,他在Ins在迭代平台的发现算法方面发挥了重要作用,比如信息排名算法、探索排名、故事排名。
另外,他还发明了故事投票贴纸、Hyperlapse,emojineering等产品,并被Fast Company评为商业领域十大最具创造力的人之一。
去年,Thomas在为Future写的一篇文章中,透露了他领导的团队开发了Instagram的个性化内容排名/推荐系统,取代了默认的反向时间顺序推荐。
Taylor已有20多年的编程经验,并有8年以上的计算机科学教育,在领先的科技公司有10多年的工作经验。
同样,他在2015年加入Ins后,就领导了Feed排名的开发,专注于机器学习和基础设施组件的排名。
2012年,作为YouTube机器学习工程师,他主要负责视频推荐,领导了核心基础排名设施重构。
在微软期间,为必应搜索结果中的站内链接设计并构建了生产算法。在谷歌,负责内部核心服务和基础设施开发分析,以及监控软件。
他本人也曾在Facebook、Ins工作过,被外界誉为Facebook的顶级设计师之一。
他还设计了Cobalt图形渲染堆栈,让嵌入式设备上的动画帧率速度比Chrome更快。
-设计了主要浏览器组件的高级布局,JavaScript引擎、Web API(包括DOM)、网络引擎和图形。
-设计并实现了一个跨平台的低延迟基于网络的解决方案,可以在电视和VR头显上观看YouTube的3D 360球形视频。
团队里唯一一位华人研究员,曾在Riot Games、Pixar致力于游戏动画的研究。
他个人也是非常擅长实时渲染、基于物理渲染、以及Networked Gameplay。
「Biomes」是一个为Web构建的开源沙盒MMORPG(大型多人在线角色扮演游戏)。
而对于OpenAI来说,其实早在2022年的时候就提出了一种全新的VPT「视频预训练模型」,能够让AI学会了在「我的世界」里从头开始造石镐。
而整套流程需要一个骨灰级玩家至少20分钟的时间才能完成,总计要操作24000次。
具体来说,研究人员首先收集一波数据标注外包们玩游戏的数据,其中包含视频和键鼠操作的记录。
然后,利用这些数据制作逆动力学模型(inverse dynamics model,IDM),从而推测出视频里每一步在进行的时候,键鼠都是怎么动的。
在训练了70000个小时以后,OpenAI的行为克隆模型就能实现其他模型做不到的工作了。
比如,怎么砍树收集木头,怎么用木头做木条,怎么用木条做桌子。而这一套事儿需要一个比较熟练的玩家操作小50秒的时间。
甚至还有「跑跳搭」的骚操作,也就是起跳的时候脚下放个砖块或者木块,跳着跳着就能搭个柱子。这属于是骨灰级玩家的必修课了。
他们发现,利用传统方法训练的RL策略几乎没有获得任何奖励,从不学习收集日志,而且很少收集木棍。
与之形成鲜明对比的是,基于人来数据微调后的VPT模型不仅可以学习如何制作钻石镐,而且在收集所有物品方面的成功率,甚至达到人类水平。
在现实世界中应用这些系统之前,最好先在虚拟世界中进行练习,看看会发生什么。训练的速度可能也会更快。期待几个月后能看到一些「我的世界」加速运行的惊人视频。
这家初创公司的工程师团队来自高水平的设计团队,我认为ChatGPT很快得到大幅升级。
还有人认为,从Global Illumination做过的事情来看。他们的产品能力是OpenAI非常需要的,但是结合前几天的斯坦福AI小镇来看,这种高自由度运行成本低的沙盒游戏结合AI会有无限可能,所以OpenAI可能是看重了他们成员的产品能力,也可能纯粹的看上了这个高自由度的游戏。
|