AI 的下个进化和爆点_小程序开发行业资讯

产品视角看技术一般不看原理就看效果。

每天会我花点时间观察 AI 的最新进展。方法是有 API 的主要方法就是建立测试集各种测，视频这类的我主要就看非官方出品的到底做成什么样了，是不是具有普遍性。

看多了上面这些视频后，我是两点感想：

第一，视频生成这事真的要到爆的时候了。

第二，GPT5 这槛大概率是能过去的，虽然是不是 OpenAI 先过不好说。

在这个新机会点彻底爆开和现在之间其实是 AI 的小低潮。

为什么说视频生成要爆呢？

模型方的官方视频因为有利害牵涉，最多可以看看苗头，不太能信。

所以得换个视角，如果一般用户以一定频次和量级持续往出爆精彩视频，那就差不多到临界点了。你看当年 MJ 火起来之前也是这样，持续各种图片被爆出来。因为社交网络上持续爆视频这事必须满足俩条件：

第一个是质量得让人惊讶。超出原有认知。

第二个得相对容易和便宜，很多人都能做了。

前一个是时机，后一个是基础。缺一个也不行。现在那有谁没事爆图片的，即使图片比过去做的还惊艳，也没人看啊。

现在看这俩条件基本满足了，只差一点点。一旦这个满足了，就变成 AI 的下个大众型机会点。

为什么说是大众机会呢？

AIGV（Video）这是我杜撰的一个词，但确实应该区分生成文本、图片和视频。因为他们影响量级就不可能一样。国内的头部主播收入和过去博主收入就不在一个数量级上，甚至都不是十倍百倍的差异。假如抖音上市等于多少个小红书和知乎呢？

现在这个视频生态面临洗牌，一波人要上机关枪了，另一波人还是大刀长矛，所以这影响恐怕比过去文章生成大的多。他会推进视频平台往不可测的方向发展。

视频平台外的部分我们反倒是能看的清楚一些，甚至发展路线过去都操练过一遍了。

先是新版李一舟会出一波。这时候的内容生成面临双重专业性，一部分是视频生成的模型，一部分则是视频本身的某些技巧。

也还是会有套壳的工具，Heygen 这种不完全产生视频的工具都每年 2000 万美金，这里的新工具应该价值更大。

然后大量 AI 生成的内容会进入各个平台。各个平台估计会有点纠结，但最终还是会像现在这样，基本还是允许，最多加个标注。

再往后会往纵深发展，不停留在宣传片这个层次，而是向短剧（段子、动画等）发展。这时候会再炸一下，因为和上一波的进展就重叠了。之前 AI 碰撞局上，周玮分享过他写短篇小说的 Agent，听过后你就知道这类产品再结合上视频生成能力，特别的契合。这类产品的价值空间一下子就会上来很多。

再之后估计就是长剧和直播。其中直播稍微复杂点，因为要和经常说的动捕做结合，做到特别逼真恐怕还要花点时间。

最后肯定是电影。扔本小说，AI 改出剧本，AI 生成电影，这是什么感觉？

先纵后横的 AI

之前文章中提到过几次，AI 和互联网最大的不一样是先纵后横，像打深井，现在这里深井又多了一口。

文图是一口井，视频是一口井，并且更深更大。

更有意思的是这是个大众机会，大厂好像也不能基于这个做什么垄断产品。

每个人差不多是平等的，它辅助你的创意实现，培养一批工具和教工具的人。

先纵后横会导致这这么一个状态：它不会一下子炸的那么厉害，比如一下子就出个微信，但会持续炸。

这时候面对它的基本方法论根本不是高瞻远瞩，而是要回到现场，需要 AI 碰撞局这类把案例聚集起来的，让大家能鲜活感受 AI 应用现场的手段。

再简单了说就是实事求是，得知道情况是什么，别人干成什么样了，然后形成自己判断，自己不理解的就当不存在，至少不能用来做事。

这和互联网非常不一样。那个是一波大浪冲到底过去就过去了。

彻底成熟了什么样？

我之前发了这么个视频，没想到自己读者群（进读者群大家发私信吧）里还有几个这方面专家，又多聊了几句我就发现这是个成熟产业。

上面的生成视频技术一成熟再加上视频里的这套技术，有可能催生这种产品：

一个人有一个自己的分身，这个分身就是视频里那种产品，然后生成脚本、生成内容、发布是全自动的，你对着说它就能发布内容。剪映什么的就不要了。这市场应该还很大，真有愿意干的可以试试。

这东西就每人多一个手机，但这手机能自己动起来，生成内容发布内容，和直播架子、话筒什么的其实差不多，需要的量还很大。有人估计用去做水军，但那是做水军违法，就和有人用手机打诈骗电话，但不能说是电话的问题类似，无人机不也用来扔炸弹么。

GPT5 最终肯定会来

看着视频的进展，我就比较确定 GPT5 肯定会来。

现在 GPT5 是个符号，也说不清到底是什么，隐喻就是 AI 能再进展一步。倒不一定是 OpenAI 的下个版本，它标识着通用智能是否还能再跳一级，智能的通用性每跳一级，其影响和单纯生成视频肯定不一样。

为什么说 GPT5 一定会来呢？

比如说理解物理世界有自己世界模型这事，在生成文字和图片的时候理不理解物理世界是不关键的。但生成视频的时候如果不理解物理世界，细微的地方是做不好的。

解读为什么可以看论文，但看结果就是 AI 对物理世界的理解在深入，它在形成属于它自己的世界模型。

假如有一天 AIGV（Video）能够生成现实世界的各种电视剧，也能够生成各种精彩的奇幻电影，那它的世界模型就必然同时覆盖现实空间和虚拟世界（比如漫威宇宙）。

从这个角度看视频生成和 GPT5 差不多是同步的。

是不是 OpenAI 反倒是不好说，OpenAI 宫斗了一场后看着有点抓瞎，总是很随性的发产品，然后 Sam Altman 不解决公司迫在眉睫的问题，没事去发表涉政言论，这怎么看也路子不对。但这是另外的故事了。