产品视角看技术一般不看原理就看效果。
每天会我花点时间观察 AI 的最新进展。方法是有 API 的主要方法就是建立测试集各种测,视频这类的我主要就看非官方出品的到底做成什么样了,是不是具有普遍性。
看多了上面这些视频后,我是两点感想:
第一,视频生成这事真的要到爆的时候了。
第二,GPT5 这槛大概率是能过去的,虽然是不是 OpenAI 先过不好说。
在这个新机会点彻底爆开和现在之间其实是 AI 的小低潮。
为什么说视频生成要爆呢?
模型方的官方视频因为有利害牵涉,最多可以看看苗头,不太能信。
所以得换个视角,如果一般用户以一定频次和量级持续往出爆精彩视频,那就差不多到临界点了。你看当年 MJ 火起来之前也是这样,持续各种图片被爆出来。因为社交网络上持续爆视频这事必须满足俩条件:
第一个是质量得让人惊讶。超出原有认知。
第二个得相对容易和便宜,很多人都能做了。
前一个是时机,后一个是基础。缺一个也不行。现在那有谁没事爆图片的,即使图片比过去做的还惊艳,也没人看啊。
现在看这俩条件基本满足了,只差一点点。一旦这个满足了,就变成 AI 的下个大众型机会点。
为什么说是大众机会呢?
AIGV(Video)这是我杜撰的一个词,但确实应该区分生成文本、图片和视频。因为他们影响量级就不可能一样。国内的头部主播收入和过去博主收入就不在一个数量级上,甚至都不是十倍百倍的差异。假如抖音上市等于多少个小红书和知乎呢?
现在这个视频生态面临洗牌,一波人要上机关枪了,另一波人还是大刀长矛,所以这影响恐怕比过去文章生成大的多。他会推进视频平台往不可测的方向发展。
视频平台外的部分我们反倒是能看的清楚一些,甚至发展路线过去都操练过一遍了。
先是新版李一舟会出一波。这时候的内容生成面临双重专业性,一部分是视频生成的模型,一部分则是视频本身的某些技巧。
也还是会有套壳的工具,Heygen 这种不完全产生视频的工具都每年 2000 万美金,这里的新工具应该价值更大。
然后大量 AI 生成的内容会进入各个平台。各个平台估计会有点纠结,但最终还是会像现在这样,基本还是允许,最多加个标注。
再往后会往纵深发展,不停留在宣传片这个层次,而是向短剧(段子、动画等)发展。这时候会再炸一下,因为和上一波的进展就重叠了。之前 AI 碰撞局上,周玮分享过他写短篇小说的 Agent,听过后你就知道这类产品再结合上视频生成能力,特别的契合。这类产品的价值空间一下子就会上来很多。
再之后估计就是长剧和直播。其中直播稍微复杂点,因为要和经常说的动捕做结合,做到特别逼真恐怕还要花点时间。
最后肯定是电影。扔本小说,AI 改出剧本,AI 生成电影,这是什么感觉?
先纵后横的 AI
之前文章中提到过几次,AI 和互联网最大的不一样是先纵后横,像打深井,现在这里深井又多了一口。
文图是一口井,视频是一口井,并且更深更大。
更有意思的是这是个大众机会,大厂好像也不能基于这个做什么垄断产品。
每个人差不多是平等的,它辅助你的创意实现,培养一批工具和教工具的人。
先纵后横会导致这这么一个状态:它不会一下子炸的那么厉害,比如一下子就出个微信,但会持续炸。
这时候面对它的基本方法论根本不是高瞻远瞩,而是要回到现场,需要 AI 碰撞局这类把案例聚集起来的,让大家能鲜活感受 AI 应用现场的手段。
再简单了说就是实事求是,得知道情况是什么,别人干成什么样了,然后形成自己判断,自己不理解的就当不存在,至少不能用来做事。
这和互联网非常不一样。那个是一波大浪冲到底过去就过去了。
彻底成熟了什么样?
我之前发了这么个视频,没想到自己读者群(进读者群大家发私信吧)里还有几个这方面专家,又多聊了几句我就发现这是个成熟产业。
上面的生成视频技术一成熟再加上视频里的这套技术,有可能催生这种产品:
一个人有一个自己的分身,这个分身就是视频里那种产品,然后生成脚本、生成内容、发布是全自动的,你对着说它就能发布内容。剪映什么的就不要了。这市场应该还很大,真有愿意干的可以试试。
这东西就每人多一个手机,但这手机能自己动起来,生成内容发布内容,和直播架子、话筒什么的其实差不多,需要的量还很大。有人估计用去做水军,但那是做水军违法,就和有人用手机打诈骗电话,但不能说是电话的问题类似,无人机不也用来扔炸弹么。
GPT5 最终肯定会来
看着视频的进展,我就比较确定 GPT5 肯定会来。
现在 GPT5 是个符号,也说不清到底是什么,隐喻就是 AI 能再进展一步。倒不一定是 OpenAI 的下个版本,它标识着通用智能是否还能再跳一级,智能的通用性每跳一级,其影响和单纯生成视频肯定不一样。
为什么说 GPT5 一定会来呢?
比如说理解物理世界有自己世界模型这事,在生成文字和图片的时候理不理解物理世界是不关键的。但生成视频的时候如果不理解物理世界,细微的地方是做不好的。
解读为什么可以看论文,但看结果就是 AI 对物理世界的理解在深入,它在形成属于它自己的世界模型。
假如有一天 AIGV(Video)能够生成现实世界的各种电视剧,也能够生成各种精彩的奇幻电影,那它的世界模型就必然同时覆盖现实空间和虚拟世界(比如漫威宇宙)。
从这个角度看视频生成和 GPT5 差不多是同步的。
是不是 OpenAI 反倒是不好说,OpenAI 宫斗了一场后看着有点抓瞎,总是很随性的发产品,然后 Sam Altman 不解决公司迫在眉睫的问题,没事去发表涉政言论,这怎么看也路子不对。但这是另外的故事了。