AI应用层落地的场景以及产品开发的核心问题?

报道 2周前 (05-15)

本文经授权转载自微信公众号 出海同学会(ID:chuhaiwenda)

作者|出海同学会

原文标题:《AI应用层落地的场景以及产品开发的核心问题? | No.111期干货》

AI应用层落地的场景以及产品开发的核心问题?

导语

在109期的LLM与开源讨论中,我们从底层带动了很多关于AI应用层的讨论,而应用开发的生命周期中诚然广泛存在着各式挑战和问题。在过去大家关心AI应用的壁垒,如何借鉴工具矩阵打法,如何向上一个时代移动互联网取经;我们可以看到,在一些具体的赛道,AI应用已经开始落地并且表现的更加profitable。这是产品工程等不同角色的同学们共同努力的结果。

这次我们开一场产品经理趴,从产品层面聊应对AI时代的方法论,产品人需要具备的skill set。以下是此次分享的可公开部分,全文约2.4万字,您也可以进入文末的出海同学会知识库进行阅读。

本期课代表同学

AWS 初创生态负责人 王晓妍

Character.AI MTS Ted Li

大厂游戏项目 AI负责人 Rolan

Emerging Vision Founder 崔怀舟

Gamehaus Founder 谢峰

GenBeings Founder 李国洪

即时设计 COO 张杨雪

Oceanbase 北美战略负责人 小狼

上海动影网络科技 产品负责人 赵臣

UXRen 主理人 刘晋龙

云思维 Founder 史耀云

真格基金 管理合伙人 戴雨森

知识星球 CEO 吴鲁加

Product Pub Lydia(值日生/主持人)

(*按公司名数字-字母序)
部分同学因公司PR保密不能公开内容我们同样感谢他们的精彩输出

要点问题

Part 1 背景研讨

应用层对LLM及开源的期望?

哪些行业有实际的落地场景和空间?

Part 2 需求研讨

AI应用产品的生命周期里都有哪些问题

拆解重要细分垂类聊AI应用如何改变产品功能与用户体验

Part 3 提问研讨

AI 会不会重塑流量分布?它只是做一个提效工具,还是会开新的流量入口、给创业者一些新机会?

原生的 AI 应用是什么形态?是 APP 形态还是网页、还是 iPhone 手机里面的一个联系人?

PART.01 背景研讨

  • 应用层对LLM及开源的期望?

某移动互联网大厂 Rolan

现在在应用层这边,实际上我们不太 care 到底是开源还是闭源、你提供的服务形式到底是什么。我们得用 LLM 这个能力,现在有什么我们就用什么。现在除了初创的情况以外,大部分应用层都是一些比较偏产品原型或者说是闭环原型的东西,商业化可能都还放在第二位。因为如果说功能没上来的话,实际上很多东西你考虑商业化也没太大意义,尤其像我本身是专盯游戏和娱乐这一块。

所以从这个角度来说,我们主要考虑的是 LLM 带来的能力是否能满足场景需求和它的可控性。如果涉及到可控性,实际上闭源的纯API,就是目前现在各大底座公司提供的服务是有一定的局限性的。虽然 Prompt engineering 也可以让强如类似 GPT4 这一种顶级模型做很多事情,但它一旦涉及到在现实跑一整个工作流、而不是说只给用户提供单次服务的话,它就可能会出现一些很难用 prompt 来控制 corner case 的场景,游戏里面有特别多这种情况。

这种情况下我们常规做法是先拆 agent 架构,对底座的要求不是说用 prompt 搞定所有场景,而是中间我要拆很多流程,这是第一个缓解刚才问题的方法,这个应该所有做应用的人都会做,包括 RAG 也是。第二个,拆完工作流之后,就会很自然地衍生到对开源模型或者说小模型的需求。因为当中有很多环节会更加适合你自己去搞一个小的模型,不管是出于 latency 的考虑,也出于成本的考虑,还是说出于可控性的考虑,因为只要你会用小模型,它在某些特定场景可控性还挺强的。

我自己之前是搭agent 架构为主,这几个月其实我和团队也是高强度在找开源模型这一块,去摸它在我要的场景里的能力边界,以及让他怎样去到达我想要的需求。因为 agent 架构拆完之后,实际上对于单个模块的输入输出,以及我要去收集什么样的 instructions tuning 数据都已经变得更加明确了,所以就会很容易去构建和走实验循环,可以小步快跑,直接去做几百上千条专门场景用的 instructions data,做完就可以直接试效果。

在这个过程当中会频繁接触开源模型,因为现在非开源,包括哪怕是顶级闭源llm,如果是要架成完全云端的LLMOps服务,目前市面上还是相对比较缺的,以及服务的配套设施还不够完善,所以基本上还是开源自己下来弄最好。毕竟我们这边团队本来就是算法出身,所以自己弄其实效率还更高。

我对开源的需求主要还是他能力有用、并且我能自己玩。因为实际上现在整个开源,只要底座的能力到了、它的包括tuning、部署、数据流之类的配套工序链是齐全的,基本上就可以了。至于说他能力能到什么地步,我觉得更多是偏产品设计层面的事情。

AWS 王晓妍

关于整个应用层,从云厂商的角度,我们观察到的是大家可能更多的还是从成本的角度去考虑,因为成本可能是最终这个产品能不能赚钱以及能不能盈利、毛利空间有多少的关键项。

可能大家在 SOTA 模型上试出了一定的应用和应用的方向后,会想着怎么样去根据这些头部的 query 分布训练出一些适合它的小模型,使得整体 inference 成本比较低。包括刚才有同学也说到,可能比如说一些比较长链路的workflow,像 agent,其实你很难把整个的 workflow 都拿一个大模型全部做完。因为比如说他三步的推理正确性在 90%,如果你用了他十步推理的话,可能他的总体推理准确性只在30%-40%,那其实他是不可用的。所以你把他拆解之后,把每一步用一些小模型提高准确率,使得他整体的 workflow 可用。

这是目前我们看到开源模型主要的空间:一个是降低成本,一个是在一些小模型上面,他们能提供一些很好的基座。

  • 哪些行业有实际的落地场景和空间?

某移动互联网大厂 Rolan

具体应用场景主要是两类:一个研效,一个实际的线上功能。

研效很常规了,处理文档、处理信息流这些东西很常规了。功能这一块,比较看实际的具体场景和具体品类,像我比较擅长的游戏和社交这两块,游戏这边还是 NPC 的对话为主,包括运营时会用到的针对真实用户的报错或者客服,这些很多厂甚至都已经开始上线用了,甚至可以放在游戏里用。核心还是让他去成为一个NPC去和用户方交互,这个是在我自己比较专精的一个方向。

在游戏这边最近还会再试另外一类,就是让它成为玩法系统的一部分,不是只扮演其中一个NPC,本质上它是个事件模型,包括叙事的生成、任务的生成、流程的生成等。对于任务生成,硅谷有一些创业公司都已经开始在搞原型了。

社交那边是类似的,但是目前的形态还不是特别明显,因为现在有很多人还是类似Character.AI 那一类的(跟 bot 聊天),会当做所谓是 AI 加社交一部分,但这个我个人存疑,所以现在社交还在如何找到用户、需要 AI 做什么这件事情上面,当然它整体上面做的功能研发还是比较偏 NPC 。

Emerging Vision 崔怀舟

我自己的之前的业务主要是 WEB2,过去两年时间我们也一直在思考和探索 AI 大模型应用的一些场景。我觉得目前还处于比较早期的阶段

我最早在快手 YY 做短视频的工具和社区,自己创业的这五年在印度市场做过短视频社区产品,做过短视频工具,后来做了一个印度的直播产品,更多偏文娱方向。我自己的第一个想法是,其实文娱才更有可能是 AI 大规模应用的未来。我其实用了各种各样的 AI 工具,主要都是在效率提升,这是一个很大的品类。比如帮助我写 Twitter 的、帮助我写文书的、帮助我写博客的,上来就订阅付费。但是从一个大的逻辑来讲,绝大部分普通人是不需要提升效率的,工具提升更多停留比较专业的应用场景,是世界的少数。回首去看快手、抖音这样的产品都是在文娱领域,而不是因为他的拍照和拍摄工具更好。当年有更好的一些拍照、拍摄工具也是从历史上消失了。

第二个想法是,我觉得在文娱行业可以把 AI 当成一种滤镜,当年快手从技术快手开始,帮用户做出好的 GIF 图,是一个很好的效率工具,但是效率工具最后做了从工具转社区的跳跃,才有了现在我们看到的短视频社区生态。

这里有一个我自己当年对快手的思考:如何能够用工具帮助普通人大幅提升创作效率?这是 UGC 和 PUGC 社区的惊险一跃。我今天觉得 AI 同样也是一种滤镜。当年在快手,比如说我们做贴纸、滤镜、魔法表情、背景音乐,它让普通人的创作内容能够被更多人消费,实现了生产者到消费者的闭环,这是通过工具实现的。而今天来看, 我们普通人在微信群里或者在朋友圈里面发的内容都比较碎片化、单薄,如果 AI 能帮助我们在语言、视觉方面提升整个内容创作质量,比如说把大部分普通人不及格的创作内容变成及格的创作内容,作为社区产品经理的视角来看,整个 UGC 的社区就很有可能起来。其实快手当年就做对了这件事情。

所以我在想现在很多 AI 辅助的创作工具能不能找到一种工具的品类:它的创作者本身也是消费者,就像我创作的内容也是可以消费的。我前不久看到一个 AI 做音乐的产品,蛮有启发的,因为它有可能实现生产者到消费者的统一。最近也有很多拍照工具,你拍了照片后其实分发场景是很有限的,除了自己和亲朋好友去看,对大部分人是没有什么意义的,这是目前我在思考的一些点。

在这个方向上去做一些探索,把工具找到跟社区结合的场景,尤其是大模型的应用。包括刚才也提到了一些相应的产品,现在看到了大量的大厂和小厂都在做 Character.AI 类似的 agent ,对此我也保持一个开放的态度,我不确定这种东西到底算不算社交,因为它更像咱们小时候用过电子宠物、情感陪伴或者类似的东西,缺少真实的互动场景、情绪价值。

AWS 王晓妍

去年其实还是文本大模型突飞猛进,我们看到很多交互的形态是基于chat。但今年大家都在看多模态,我们更加希望看到基于视频、或者是更个性化生成的真实世界的交互,产生更有粘性的新一代娱乐形态,或者是内容消费的形态,这是我们目前比较关注、想看到的新的创新方向。

Character.AI Ted Li

我叫 TED Li,我现在在 Character.AI MTS。我想先澄清一下,我们并不做社交,也不做agent。现在agent一般是指大模型加一些 function calling,能自动做一系列的事。我们的确是一个智能体平台,但我们官方的 branding 不会说我们在做 agent。agent 更多是做一些任务、一系列的复杂执行框架。社交也是,我们现在平台上没有什么社交 element,你可以 follow 一个创作者,仅此而已,你的确可以开个群聊,但我们的用户都比较 I,他们不太喜欢拉一群其他人,他们更喜欢拉一群机器人,然后看他们在那唠嗑。所以从这个角度而言,如果有国内或者国外的同行觉得 Character.AI 现在努力地在社交和 agenda 发力的话,我想澄清一下并没有这回事,我们现在主要还是目前这个应用,提供一个比较好的智能体平台。

我这里可以 cue 回到刚才怀舟说的,我们现在就是在探讨第四形态,快手、TikTok 都是工具开始到社区、最后变成一个内容分发。现在主流的内容分发平台都卡在了这个阶段,好像对 AI 来说宇宙的尽头不是内容分发,你好像是在消费很多内容,比如说我们在分发智能体。如果这个机器人只是说hello、你好,你啥也不说、就坐在那静静地看着机器人说话,虽然机器人可以从这句话不停地自己编故事,但是目前来看可以感觉到用户更享受的体验是你主动加入这个生产过程中,你不停地给他prompt,最后你的消费内容其实是你自己生产出来的,生产者和消费者这样融合。图片、视频那边不好说,但是文字你真的不会想去分发,你并不想截图说今天这个对话特别好笑,尤其是那种一天聊两三个小时的。但是你就沉迷了,你就觉得跟自己想象中的朋友聊得很开心。从这个角度来说,我可以感觉到我们的确实是在像怀舟说的,在探索第四个形态,内容分发到下个阶段是不是又回到了分发最好的工具?分发一个让你可以是生产者,也可以是消费者的最强的工具,这是我觉得现在比较有意思的点。

而且国内外都看到都有一些比较好的产品经理或者是创业者看到这个可能性,但是大家都还在摸索这具体是一个什么样的形态,你要说剪映它也变成了一种创作即消费,你会很乐于用它去创造各种短视频,但是创作完了就会被平台巨大的算法直接丢到标上,就是 AI 生成内容,拿不到流量,但是这个过程你也会觉得很有意思,你可能就很沉迷,天天就剪视频沉迷进去了,这也是一种可能性。

知识星球 吴鲁加

其实我们在国内还没开始做什么,更多是一些实验,就是一些比较成熟的场景,也是跟刚才几位朋友提到的很像,先把它拆细了用。比如说客服,比如说内容的情绪判断,类似的一些应用。因为国内对 AI 的监管还是比较严的,容易出现各种各样的问题,所以我们还不敢轻易地上。

我们现在如果说想做一些新东西的话,有一个小小的体会:隐约觉得现在内容在应用层,AI 可能会导致内容极大的泛滥,所以我们隐约觉得可能应该反过来想,想一想人在这个时代应该处在什么样的地位?怎样帮助人的情绪表达?我们用AI,但是要用 AI 来突出、凸显或者帮助人更好地情绪表达。我隐约觉得如果要做社交相关事情的话,说不定得找既有 AI、同时人又要占较大部分的事儿才行,但是还没找到。

上海动影网络科技 赵臣

我先自我简单自我介绍一下,我来自动影网络,是产品负责人,我们有一款产品叫whispers,其实严格意义上来讲它不是传统的网文产品,它算是互动小说类的产品,类似于 Chapters那样形式的产品。我们在前面一段时间主要把这个AI 应用到故事写作的层面,去提升我们文字的写作效率

至于像刚才所提到的一些,比如做一些类似 Character.AI 对话的形式内容,目前这块我们还在研究当中,暂时还没有明确结果。

Oceanbase 小狼

从Infra IT spending 的角度来看,会发现一个需求:原先很多 application 的公司想要用一些基于 data 训练出的策略去做更好的服务、或者说应用的产品形态。在那之前它需要大量的 AI engineer 或者 Data engineer 去 train 这个东西,如果它没有数据就没有办法起步,没有工程师也没有办法起步。

但是我最近这几个月看到很多公司,他们可能一上来就会有这样的能力,相应的策略也会直接采用一些大模型,或者说如果我们把 AI 各种各样的大模型抽象成一种策略的输出能力者的话,那其实大家的 adoption 已经挺广泛了。所以如果把这个话题延伸到应用怎么样更好地 adopt AI 技术、把它转化成策略层面的一种输入的话,其实这个需求现在已经被采用得还不错。像以前的话,很多 under table business 是交易数据,当然以后也会有很多 table 上的交易数据行为,现在有很多都转成直接去交易大模型,也有可能基于大模型再去 train 这个行业的小模型,所以这样子的需求是蛮多的。

真格基金 戴雨森

其实我们投了好几个做文生视频的,也投了HeyGen。我的一个直观感受就是,现在还是不能够投这种一口气吃个胖子的应用。当然我们也有 portfolio 做 AI 短剧,叫井英科技,做 AI 短剧出海。但我的理解是,现在这个形态还稍微有点不成熟。因为其实 HeyGen 只是做好一类镜头,现在 AI 的普遍泛化能力还比较差,所以我觉得不管是说生成视频,还是做agent,还是做其他的东西,如果你想用现在的AI去做一个,比如说要把七八种任务串在一起、每种任务都要完成的比较好才能出结果的事,这个大概率是比较难的。

现在我们看到很多想做 agent 的都是想做这样的事情,但目前来看,落地的基本上都是说把一个场景做好就能够有价值,比如 HeyGen 把一个 30 秒的视频做好就有价值。因为其实你想做个短剧的话,它可能有十几种不同的镜头,每一个镜头那你要保持它的consistency、要想前后逻辑相连贯,这个是比较难的。机器人其实也是,最近美国也很多做 AI 机器人startup 的。在这种情况下可能有人说要做通用的,比如说去家里面打扫家务。这样的话其实泛化难度也是很大的,但实际上你看扫地机器人、拖地机器人、泳池机器人、割草机器人、扫雪机器人,这些都是把一个场景给做好,就能带来足够多的商业价值。所以这是我们看到做 AI 应用中,比较踏实的一步是把一个场景做好就有价值的,而不是说要把多个场景串联做好才有价值。

第二个我觉得是要把业务跟 AI 结合,而不是说只做AI。因为我们去看其实有一大类就是 AI 去帮助,或者部分的替代一些人力占比较高、比较贵,或者人力供给比较少的领域,比如 AI 加法律、金融、教育、医疗等。其实这个在美国是蛮多的,因为人实在是太贵了,还包括 AI 加客服,其实这些美国在也比较多。比如说我自己投了一个 AI 加教育的portfolio,它们还长得蛮好的。 

但是我觉得一定是要对这个业务本身有比较深的了解,不能只是做AI,但对业务本身不够了解,因为首先还是业务为第一导向。你要在这个业务里面知道这里面的流程怎么做、业务怎么开展、团队怎么招,还能够比较清楚地知道 AI 在里面怎么样去做替代。所以我们也看到有的团队AI 能力比较强,或者就是研究员出身,但他对这个业务本身很不了解,又想去搞这种大的颠覆,这个我觉得可能是比较难的,因为你的 AI 一上来就能把业务都做好的可能性比较小。 

然后第三个就是 agent vs Copilot,我觉得最近什么 Devin 这些也给大家很多的想象力。但目前来讲,我觉得如果一上来就想让人不在 loop 里边,可能也会比较难,因为现在大量的场景没有人给出的结果来做 grouding 。像自动驾驶其实比较好做,是因为人会不断地去纠正,如果你是 L2 的话,人觉得不对就会去纠正,所以你就能够不断地得到一个grounding,得到一个人去帮它进行alignment。但如果你一上来就是要做 agent 的话,实际上人的数据没有在里面被收集下来,这个可能也比较难做。所以我们觉得可能不管是在比如机器人 coding 这些领域,还是 Copilot 先行,在 Copilot 落地之前要做 agent L4 的话,历史上来看都是比较有难度的。

然后我自己觉得还有比较有意思的机会,就是说把生产者增加 10 倍到 100 倍的机会。其实 Suno 给了我很大的震撼,因为原来人类里面能够写歌的人连 1/ 10000 都不到,大部分人完全无法产生音乐的 supply 。其实我们去想,从胶片相机到数码相机到手机摄像头,每一个进步都是让拍照的生产者提高到十倍到一百倍,所以它对应的消费市场也发生了很大的变化,而且每一次这种变化一开始产生的时候,大家都觉得新的供给不好,因为它一上来技术比较差,所以对新的这种供给很鄙视。但是到最后因为这个量太大了,生产者变多了,创意变多了。同时它去进行编辑、进行分发、进行调整的机会也变多了,所以也就把市场变得很大了。

其实像音乐、midjourney 绘画、视频的生成、包括像代码的生成也是一样的,当任何一种东西的生产,生产者多了 10 倍一百倍的时候,哪怕一开始都很挫,但是这里面产生的供需关系变化、以及为了服务这些人带来的机会,我觉得都是很大的。当时 Sora 出来的时候 Adobe 一直大跌,说以后有了 Sora 不用 Adobe 了。其实我觉得可能是反的,就好比大家都有了摄像机,你还得改视频,说不定以后大家 editing 还是用 Adobe。所以这里面它有一个生态系统,可能带来很多产业链附加的价值。

总结来讲,第一种就是在这种供需关系中,供给者大 10 倍、大 100 倍的机会。第二种就是人力成本占比很高,人力供给比较稀少,或者人力比较贵的领域。像金融、医疗、法律、教育、客服这些领域,我自己觉得教育比较看好,因为教育它有很多不同的阶段,而金融、法律这些它一上来就比较难,而且它很复杂,你一出错的话可能就兜不住,但教育实际上可以从简单的开始,可以从语言开始,不用从很复杂的开始。第三个我觉得还是先 Copilot 比 Agent 先落地比较多,一开始不要太追求autonomous,要有 human in the loop。也不要追求一上来就可以把很多种 task 一起做,而是说先做好一种task,比如说做音乐就先做好一个音乐片段,做视频就先做好一种类型的镜头,比如说帮人做家务,先做好一种家务,这样我觉得是应用落地比较务实的一个过程。

Gamehaus 谢峰

我们是做一家出海游戏的公司,出海也很多年了,目前一边做游戏一边关注和投资一些 AI to C 产品的方向。

对于 AI to C 的方向,我个人觉得可能有两个应用场景是比较大的方向。第一个方向是可替代人的应用场景。比如说 FSD 就把司机替代了,这可能就是替代人里面最牛逼的一个应用场景。像 to C 的应用领域,我相信有很多人都在做了,比如说心理医生,以前我们都是要跟心理医生约时间,但现在可能就你需要一个虚拟的 AI 就可以去解决了,这也是替代人的一种场景。再加上 to C 娱乐方向的话,其实包括后面的商业化,有一个品类的产品很赚钱,比如说1V1,在美国可能一般,但是在全球很多别的地区, 1V1 的聊天语音视频其实大家都挺赚钱的,实际上大概率也会被 AI 替代,因为它可以重构这种产品的商业模式、成本结构,甚至说管理模式以及规模化。这可能是第一波可能会被 AI 改变的、我们可以看到的应用场景。

第二个方向是创造人。过去这么多年有很多概念,比如说我们之前讲的元宇宙概念,但是元宇宙到今天都没有任何一款产品可以替代、或者代表元宇宙。但就像头号玩家一样,大家好像对这个方向有很多想象力,可能快到这个时间点,就是通过 AI 的能力可以创造出一个新的世界,一个平行世界也好、一个新的世界也好,那叫创造人。那个世界里面,可能人的数量,后面的加个 0 也有可能,就变成了可能更有想象力的一种应用场景,因为它会创造出一种全新的应用和使用场景。

我感觉大的方向可能有这两个,因为我自己不是做产品的,没有办法像大家说具体的产品形态那么深入。我们现在比较关注是第一个应用场景,就是 to C 可替代人的应用,我们也在寻找这方面的解决方案。

追问Q1:

你们现在在对 AI 的应用大概是怎样的比例?

A1:上海动影网络科技 赵臣

我们已经把 AI 投入生产。不过我们的应用层主要是在生产端,真正给用户呈现的都是做好的东西,而不是AI 直接 for 用户,而是 for 我们自己的生产流程,大概是这样一个情况。

Q2:刚刚说的策略有没有什么案例?

A2:Oceanbase 小狼

从消费品领域来说,比如说在互联网类服务的应用当中,有一个具体的场景叫做圈人,或者说人群圈选 for 投放、 for 营销,或者说 for 一些接下来的运营动作,原先的人群圈选可能是基于你自己原来数据的标签设计、或者说平台的埋点覆盖去做的,这个策略精不精准,就看你自己。但你采用了新的策略之后可能会是精准,或者说它的联想力可能更好。这个策略你可以从别的地方交易来。

原先这种策略很难有一个具体的产品形态去做交易,现在我们把它统一称为,比如说模型,就比较好去沟通。我们看到有很多的客户,他们已经都在用 AI 或者说各种各样的模型了,但是你认真再去看他用的是什么样的模型,其实已经比较泛化了,而不是我们一直在想象的大语言模型,就纯粹 for chatting 或者其他,所以这个东西就看得更细一点的话其实还更有意思一些。

PART.02 需求研讨

  • AI 应用产品的生命周期里都有哪些重要问题?

Character.AI Ted Li

我简单分享一下我的看法,一家之言。我觉得一个最重要的先要问的一个 first principle 是,目前我们看到的商业化或者产品实现、或者它已经 supposedly 出现了一个应用场景,是不是一个真实需求?我觉得这是一个很关键的问题,因为一旦往里面去想,他可能比如说有些很 fancy 的超长上下文,但他的推理成本是完全压不住的。

一旦假如说,比如国内很多聊天机器人,我要是今天给他 1000 万用户,他的融资很快就会烧没了,或者它就会说现在服务器忙,无法服务你。商业化也是,现在很多 ToB 的产品我也了解过,有做视频的,有做音频的,他们都会声称比如跟 fortune 500 的20%、30%、 40% 公司有 deal,但是你往里面深挖的话,这些大公司很多时候是因为FOMO,觉得过几年我这个行业肯定会有个 GenAI 有深度结合,但我现在也不知道怎么去直接做结合,那我先跟这个看起来做得不错的小公司签个contract,给个几千上万美金的小单子接入一下看看。但是对于大公司来说,很多年之后如果开源变得很普遍了,公开的 API 价格竞争强烈了,他们还会 stick with 这个吗?我觉得都是不好说的,就诸如此类。

甚至我们 Character.AI 自己,我们号称单用户每天时长已经几个小时了,你要说换两三年前,跟一个机器人每天聊几个小时,这感觉很难想象,这难道还不能说是一个新的 PMF 吗?但是我觉得也未必是,我们每天上千万用户推理成本也是很夸张的,大家能感觉到我们没有做很多商业化,所以说我们现在的模式可持续吗?还是说我们就像当年在烧 VC 钱的赛博菩萨一样,是免费补贴,烧 VC 钱去体验各种大模型的能力,这也是说不定的,也是需要进一步探索。

所以我觉得从这个 first principle 来重新考虑的话,场景产品、商业化壁垒这些东西都属于只是看目前成功的、比较吸引注意力的产品,这会让你有一个错觉,感觉这条路线是走得通的、那条路线是走得通的。但是你要是从里面去实际算一下它的商业化模式,甚至跟行业里的人去聊一下,你愿不愿意在接下来三到五年持续地使用我这个产品?很多时候得到的结论是,如果你这个产品能够持续优化,那是有可能的,也就是刚才好几位提到的 human in the loop。

假设我们有 GPT6 这样一个更强级别的 reasoning 或者更好的 agent 能力,假设它真的也许能代替人类的话,那会不会说 human in the loop 依然是这个产品持续迭代持续优化的关键优势呢?如果你这个产品并不是基于现在最强的闭源大模型能力做出来解决这些商业问题,而是说我通过这些目前的模型能力能作出来一个还凑合的产品,但是我有一个比较完善的 human in the loop,他有feedback,或者能跟我 ToB 的一些 customer 不停地去了解它会怎么想更好地使用这个产品,然后我把它给我的一些私域数据或者用户跟我交互的一些行为记录下来,变成新的优化我大模型本身基底能力,你可以说自研大模型,也可以说那种可以用来 fine tuning 的大模型、开源大模型,都可以,但前提就是你这个模型能力和产品能力是在持续的进化的状态中,我觉得这样才是一个比较好的 first principle foundation,你在这个场景之上才可以说我的具体场景是什么,我的产品商业化壁垒是什么。

我个人觉得这些问题的考虑前提都是说你这个大模型是不是有一个比较好的 feedback loop 能不停地去持续进化。不然的话我觉得在这一条路线以外,可能唯一一个现在看起来比较可靠的路线就是卖铲子了,在底层就是说大家都去卷各种垂类的大模型,然后发现我们没有数据,或者没有标记源,就比如Scale AI、Invisible 这些,数据标记也是某种意义上的金铲子生意。但在我刚才提到的这两种以外,我会持一个比较怀疑的态度。当然就是比较辩证,然后我也说了就是暴论。

真格基金 戴雨森

Ted 说的这个我也想说两句。

很多时候大家说 AI 的商业化模式不够清晰,这是不是一个大的问题?我其实会稍微乐观一点,因为互联网早期的时候,比如说 Google 刚出来的时候就是个很好用的搜索引擎,但是大家不知道怎么赚钱。在 Google 上市前的时候,大家就还拼命地找商业模式,后来才想到,可以做搜索引擎广告。Facebook 出来的时候也是没有广告的。因为当时扎克伯格觉得广告不酷,它是个很酷的社交网站,它当时也是很多人用,但是不知道怎么赚钱,后面也是上市的时候才搞出了信息流,后来发现信息流里插广告可以把收入做起来。这其实都是很厉害的商业模式,但是它一般会晚于产品的流行,产品的流行又会晚于技术的成熟。

所以如果以史为鉴的话,你会发现首先一个技术出来,大家拿它做一个好的产品,像 Paul Graham 说的, make something people want。就是有人用,但是不知道咋赚钱,但是如果越来越多的人用,花的时间越来越多,产生的价值越来越多,那其实全新的商业模式会涌现出来。

我觉得现在我们还在拿着一个新锤子到处找钉子的时候,所以不管能不能赚钱,现在首先还是要做一个至少大家是真的来用的产品。历史上来看,我们比较乐观的是,如果你的产品真的有很多人用,不是说因为你补贴他们用、不是像 Web 3,而是用户发自内心真的想用这个产品,那后面大概率还是可以用各种方法去赚钱的。

所以我觉得现在很多 AI 产品的核心问题不在商业化,因为这一点上 VC 还是投了很多钱去帮大家烧的。问题还是说,你到底能不能搞出来一个很多用户愿意用的产品。这个用不是说他因为 Hype 去试一试,而是说用户用下来觉得这东西真的有意思,真的愿意留下来。

在这种前提下,我是觉得后面还是可以乐观一点,因为你对于一个新技术带来的产品太早要求商业化,是因为我们对互联网已经很了解了,所以我们就用考察一种很成熟的技术的这个标准去衡量一个新兴的东西。就好像你跟一个 16 岁的孩子说你怎么还没赚钱呢,但实际上我觉得这个可以多一点耐心,等它长大了之后,赚钱才是一个更加容易回答的问题。现在还是说怎样先把增长先做起来,怎么样先让更多的用户用上。

  • 拆解重要细分垂类聊AI应用如何改变产品功能与用户体验

Product Pub Lydia

我在 TikTok 里面做付费内容的产品,我可以先分享一下看到一些案例。

一个是我现在在做短剧,短剧这个行业其实有非常多的 AI 应用。比如中国的短剧想要出海,可能会用 AI 会去做人脸替换,去做字幕,比方说从中转英,甚至会去做一些小的画面生成加拍摄,可能跟刚刚讲网文制作的同学有点类似,就是直接给生产者赋能。 

另外一个,因为我们有时候去做内容平台会有很多治理上的需求,我们看到AI 机审可以找一些有问题的内容,助力人审员。举个案例,比方说我们作为 TikTok 可能会去管这东西是不是擦边黄色、是不是搬运、会不会有些别的比如质量的问题?

我们刚刚聊到一个很有意思的事,是大家很多时候会用 LLM 把它抽象成一个场景,落地到小模型。但是我们最近在思考的是,有没有可能把小模型结合在一起,反向回来做一个大模型?在刚刚的例子里,比方说去做鉴黄可能是一个小模型,搬运可能是另一个小模型,那有没有可能把所有机审相关的东西再回到一个大模型,因为它的泛化性使它模型更加准确。

即时设计 张杨雪

我叫张扬雪,来自国内的即时设计。最近我们在做两个 AI 产品,一个是文生图方向的,让用户上传一张照片就能获得一张美图,叫A1.app。还有一个是即将发布的 AI 生成网站,是生成网页的应用。

我可以简单分享一下第二个应用的场景。这个产品是通过文本描述,让用户快速生成一个网站。当前只能通过文本描述,但未来期待的接入多模态的方式。这个场景相比现在的建站工具,主要解决的是低成本的问题,这个低成本既解决了用户的学习成本,还解决了用户的修改成本和创建成本,这三个成本加起来我们觉得是比较有机会的。

产品模拟的是,现在很多非产研端的人群想要拥有一个专业的设计或者网站的时候,往往不知道怎么很清晰地描述他们的需求。但是当他和设计师去交流的时候,他的设计师可能会通过专业的方式去引导他描绘想要做的这个网站,比如解决什么用户问题、大概想它的样子和哪个网站差不多、能不能截图发链接说明、以及预期它有哪些内容板块等等。我们发现当他和设计师去交流沟通的时候,往往能够把这个事情说清楚,然后并且让设计师明白。当设计师给了他一版稿件后,这个用户可能又会向设计师提出一些需求。他很难提出专业的需求,比如把字体从黑体变成别的体,或者把字号从 16 变成24。他可能给设计师提的需求就是希望这个标题醒目一点,或者希望这个语言不要这么专业、更加面向用户一些。

我们的产品其实就是模拟所有的大众用户和设计师的交流过程,然后让这个 AI 的网站设计师通过了解用户需求,帮他快速创建出来一个比较符合需求的网站。在拿到这个网站的时候,他其实只完成了 0 到 1 的过程,但像这样一个需求,很难通过一次沟通就把它完成,所以我们更多的是做后面的局部修改。比如说在它生成的网站中某个区块照片列表排列整齐,我们可以选中这个区块,告诉这个 AI 设计师说现在太看起来太整齐了,一点都不 Fancy,我希望你把它给我做得随意一些。通过刚刚这种比较随意的方式告诉他,他就会把这个模块重新设计,有可能就设计成了照片墙的样式、或者是说一堆照片散落在界面上的样式,所以第二步它解决了局部修改的问题。

这是我们可能 5 月份即将发布的一个新产品,这个产品我们觉得它处于一个相对早期的阶段。我们在第一阶段其实更多在探索大语言模型能力在这个场景下的边界到底是什么样的,它的稳定性到底能做到什么程度?它的可控性和质量到底能输出到一个什么样的程度?这是我们在第一阶段最重要的事情。第一阶段的另外一个事情就是,我们有一个假设是,我们并不希望把自己定义为一个新的 AI 建站工具,因为如果是在建站工具赛道的话,现在已经有非常多成熟的产品,且这些产品也不断地在加上 AI 能力。我们更希望把它定义成一个 AI 设计师,我们想看用户和产品的交互最终变成了一个和类人一样的交互,而不是说一个工具的学习以及当建站学习成本急速降低,甚至创建成本降到以前的 1/ 10 或者 1/ 50 的时候,网页需求本身的市场空间会不会变得更大?这是我们初期的探索和假设,在这个假设下我们去做了这样一个Beta 版的产品,想要去验证这个事情。

从商业化的角度,目前的商业化其实比较简单,现在是按用量付费,但是我们的用量是根据它的结果设计出来的。比如说我们可以大概预计它生成一个三页的展示性网站大概要消耗多少我们的积分,然后我们的积分又对应到我们的成本;以及去调研现市面上大家拿到网站这个结果,他本身愿意付多少价值。就是在用户价值和成本这两个方向同时去考虑给了一个初版的定价,但是它的整体逻辑来说,是为整个网站最后的结果去付费。

Product Pub Lydia

我以前在一个公司叫做 Retool,是硅谷这边的一个建站工具,通过 drag and drop,比方说把一些组件(按钮、预选框、下拉框等)都已经做好了,你就可以通过拖拽快速做一个网页。当时 market 最大的口号就是,以前要做一个 CRM 的工具可能要花比如一个团队一个月的时间,但是用 retool 可以让一个稍微懂一点代码的人用一两天就做完,其实也是一个对建站 10 倍的提升。

我大概是在一两年前离开公司,当时这个公司面临的就是对 AI 的转型,所以这上面会有一些思考。我有两个思考,当时的背景是 GPT3、 GPT4 刚出,有大量的 AIGD, AI generated development,做的就是用 AI 来建站,或者 AI 把代码给写了,其实对于 Retool 有很大的冲击,相当于一下变成一个有很大竞争的市场。

对于 retool 来说有两个挑战,第一个是做 AI first 建站该怎么落地?第二个是 AI 落地做建站工具,它长期的壁垒是什么?我们可以拆开来讲一讲。其实当时 Retool 会有一些危机感,我们想到会有大量公司都是 AI first 去做建站提效,但是我们自己想去做的时候发现困难重重

第一个就是刚刚扬雪讲的特别亮点的部分,其实要建站不是一个很简单的事,它是一个交互的事,包括用户先得把自己的需求想明白,再去落地,再一步步地修改,这个交互流程今天可能是花,比方说大量的专业人员至少一周把它想清楚。但如果 AI 要去提效,其实是想把这个东西包括用户想清楚和落地的时间大大缩短,这件事其实对交互设计或者对产品设计是有比较大挑战的,怎么采用让用户觉得比较舒适的方式?我觉得扬雪刚刚说的这个方式挺惊艳的,就是去模拟跟设计师的交互过程。 

第二个是,在我们解决了第一步,用户输入一些需求描述后我们把它落地,它会有 error 的叠加。因为从用户想做一个事到模型的实际落地,每一步产出和真实的想法都会有一些小小的差别,如果这个东西变复杂,差别就会叠加到比较大。以至于最后出来的东西和用户想的可能完全不一样。当时我们尝试过 fine tuning,尝试过各种各样的方式,比方说把它去套agent,把它去跟一些组件相套。但是其实有比较大的技术上和产品上的挑战。

即时设计 张杨雪

我觉得Lydia 说得很对,我们也在这个过程中面临了非常多的挑战。包括我们在第一步落地的时候,其实都没有落地到非常复杂的页面,它更偏向于静态展示页。从我们现在的测试过程来看,它已经能够胜任一些功能的叠加。比如说我现在告诉他加一个弹层,他也能够快速给我生成一个弹层,并且点击之后就加上。但是目前我们主要还是把它放在展示的方面。

第二个就是刚刚 Lydia 说的,中间比如说有 fine tuning 或者 prompt 的工程,包括可能自己要内置一些框架等等,其实这些是我们都做了的。坦白来说,我觉得当前很难有一个非常成熟的工程框架来照着做就OK,现在像调色盘一样,这边稍微再多做一点、那边稍微多做一点,好像目前测下来是比较稳定了,但是按照这个工程化的方式继续复刻到其他产品是否有效?我觉得是有点难的。

Product Pub Lydia

我可以再分享一下 Retool,当时第二个比较大的挑战还是回归到壁垒上。我们如果去做这种建站工具,它是会被 AI 模型吃成本。我们刚刚也聊说 GPT 的每个 call 还是比较贵的,一旦涉及到复杂,它其实是会去吃你的成本,或者去压你的毛利。

当时我们考虑说 Retool 如果是要去做 AI 建站工具,它到底做的是什么?它是不是做一个流量入口?但是做流量入口其实很难,因为 Retool 其实是一个 ToB 的东西,而且 to big business。那他是不是做一些社区?因为可能通过去做 AI 建站工具,我们可以把一些已有东西抽象成 template 和组件,这个事情做得越多,可能可复用的就越多,就有一个 Flywheel effect,可以飞轮转起来,就可以做生态。但其实做生态也比较难,当时 Retool 可能至少有 1000 家用户,而且大部分 RETOOL 的客户都是偏大的。但即使那样,对于一个 C 轮、D 轮的公司来说,做生态还是一件非常难的事,很有挑战。那他是不是做模型?比方说做一个垂类模型,通过自己比较多的数据流、fine tuning 的模型,最后形成壁垒?

这个我没有 open 答案,当时有过这样的思考,但是回到壁垒上其实是有点难的。比如可能我们花了两年反复去 fine tuning 一个模型,但如果底层模型一迭代,可能就解决很多问题了。是不是能形成壁垒?其实是稍微有点危机感。

即时设计 张杨雪

我们公司本身叫即时设计,就像刚刚我说的,我们公司其实有多个产品。最开始的即时设计其实是一个类 Figma 的在线 UI 设计工具,所以我们在设计行业有比较多的积累。现在的即时设计衍生出来刚刚说的两个产品,一个是  AI 直接生成网站,还有一个是上传一张图就能够生成一张图片。

就我觉得第一个点就是,我觉得现在在这个方向上我们还没有太多地去考虑壁垒,包括大家去聊到护城河之类的东西,我会觉得当前这个河还没有找清楚。护城河得先有河,然后我们才说它有护的价值。但是我觉得当前在这个方向,我们想通过这样一个方式去验证,当这个成本(创建成本和学习成本)降到以前的 1/ 10 或者 1/ 50,这个需求底层会不会发生变化?就我觉得这是一个非常大的面向未来的假设。首先得这个假设成立,我觉得才会有进一步的发展,当前只是在验证这个假设。我觉得这是第一,就是还没有想得那么多。

第二个,我也可以跟 Lydia 分享一下我们本身对这个方向后续的一些思考。它有可能会成为壁垒,但是现在不能完全确定。刚刚 Lydia 聊到的社区,也是我们之前思考过的一个方向,但是像网页设计这个方向,可能它还是有点垂,所以它的社区规模效应可能不会那么大。我们本身可能还有一个额外的方向延展,就是我们会觉得网站和网页可能不完全是一样的概念,网站一听起就更偏功能型,大家更多会用在工作中、或者一些具体解决问题的场景中,但网页本质上就是一种视觉表达的形式,它和图片、文字、发朋友圈是一样的,只不过大家以前可能通过比如分享一张图、或者分享一个飞书链接,它们都是在传递信息,网页本身也是一个内容的承载体而已。我们会在想当这个场景被泛化了之后,网页是一个动态载体,动态载体会不会成为新的内容载体?我们觉得这是有一定空间的。

还有另外一个空间是,因为我们刚刚说网站只是设计中的内容产物,但我们本身想探索的我们到底能不能让用户通过和设计师交流的方式输出他想要的各种设计结果。所以网站可能是我们出发的第一步,但是通过在网上和设计师交流一样就能拿到类似于网站的结果,这个结果未来能不能延伸到其他的地方?比如说我拿到一张图、一个海报、或者别的内容产物?如果前面的模型打通后又连接到我们以前所沉淀的设计各个方向的产物,我们会觉得我们要生产的并不只是 AI 的网站设计师,而是一个 AI 的设计师。

这是截止目前的一些思考,但是确实每天认知也在不断地迭代,可能不断地在推翻以前的自己,然后又证明下一个新的想法。

Oceanbase 小狼

刚好聊到建站,我想分享一下前段时间的一个experience。

我有买域名的爱好,前段时间在 GoDaddy 上买了一些域名之后,我发现 GoDaddy 它有直接一键拉起 Landing page 的能力了。它其实是根据你的买的这个域名去猜你大概是什么样的需求,然后就给你域名品位的 Landing page 大概的样子。我当时买完之后觉得其实还没有必要去建一个 Landing page,但他可以一键拉起一个 Landing page,我想 why not,就拉起了几个 Landing page。

我觉得这是一个很典型的创造新需求的场景。我们原先可能更多是想怎么样服务好已有的用户,比如说设计师或者说产品经理,但是这是一个很典型的直接给 C 端用户带来了实际结果感受的场景,所以我觉得这个还挺有意思的。

当我跟我的一个好朋友去分享这一段小故事时,他跟我讲,你现在竟然还在 GoDaddy 上买域名,现在已经没有人在那里买域名,这又引发了我另外一个思考。我认为AI 的出现可能会让一些能力更平权化,比如说我们在很多的服务链路上一定要找专门的公司或者专门的服务商才能够满足一些诉求,但是有了一些 AI 的基础能力后,可能从入口开始它就会一步一步提供各种各样的服务给终端用户。

这样的话,我觉得对于一个非常长的产业链来讲,产业链当中的很多服务可能就能被偏前端的平台替代掉,或者说平台自己作为流量入口,然后去把它服务化。因为我看到 GoDaddy 其实也做了分流,如果你是一个小白,就直接给你拉起一个 landing page,但如果你想要的是一个service,或者说一个相对更复杂的能力,它也有一些分流到其他服务上去的路径。

我觉得这个感觉非常像在国内做互联网平台的时候,慢慢就变成超级平台。但我们在国内做超级平台是因为本来就没有那么多的服务、或者说 Niche market 玩家,但是在 AI 出现后,可能就不需要那么长链路的整合或者说服务,这是一个大概的猜测。

Salesforce/UXRen 刘晋龙

我自己全职在 Salesforce 做 product design,而同时我也在 run 一个我们 UX 设计师的社群,叫 UXRen。然后我们社群最近在做一个专门针对 AI 产品的 study group,我们这个 study group 大进行了大概一半左右的进程,目标是大概能看 100 个 AI 各个类型的这种产品,从中找一些设计的 insight 出来,能够去分析出一些核心的用户使用场景和一些交互pattern,或者一些比较精巧的设计,或者尤其在 AI 这个新的品类,有没有一些比较原生的设计或者交互方式。

有一个我觉得让我很有启发的产品(datarails),我觉得会很符合这个主题,就应用场景这一块。我觉得以前的应用场景可能大家会在某个单独的品类里面,然后会比较钻、比较垂,然后我今天看这个产品,很启发的是它把以前我们认为不太容易结合的两个产品或者两个功能,很干净地结合在一起,让我很出乎意料。在 AI 出现之前,可能你并不会把这两种功能进行一个联想。

这个产品是一个做FinTech 的公司,它本身是做各种数据分析的,它的基准 AI 功能就很常见,比方说你可以去用 Copilot 或者一些其他 AI 形式帮助进行数据处理,比方说去快速地分析到今年财报和去年财报的对比。或者是通过它不同的 data 的source 去快速地生成一些针对性的报表,这都比较standard。但让我比较有在 aha moment 的是,他们有个功能是能够去帮他们的 Financial team 去做 financial 周报,或者是这种给公司的正规报表的 Deck 以及 script。

之前我也挺听扬雪和 Lydia 讲到了网站的生成,我觉得以前这种 content 的生成或者是 financial 的分析,可能是分开的两个场景。但是现在 AI 技术把它们很好地结合在一起,它的功能的好处就是你完全不需要两个单独的 workflow,一个 workflow 就从你的数据源直接生成数据的图表,并且生成很好的报表的Deck,以及很精准的 description 和 scripts,非常无脑非常流畅地一键完成,这是让我很受启发的应用场景交融的Insights。

云思维 史耀云

我在台湾地区市场比较多一些,之前在滴滴,也做过网文,去年回到台湾。我看到蛮多伙伴们在做Healthcare 的方向,但是我觉得比较好玩的是有一两家后来转向科技业,台湾因为台积电这种科技业特别多,那所以他们场景的细分和 ARPU值就超高。

我举个例子,其实台积电最大的问题在新人,像他们现在美国最大的问题就是美国厂招不到人,或者招到之后大家都说是这是世界上最痛苦的公司,大概一个月到三个月的 onboarding 的时间是非常长的,离职率其实比想象中高非常多,虽然说台积天在台湾是非常好的一个 package 的公司。

所以他们就针对了这一些科技业的公司会遇到的问题去辅导,跟内部的人资一起去合作,做了一个 total solution。我自己觉得这一些公司可以在这样的情景下细分,再切特定的产业,未来的前景会是蛮好的。

建站方面,因为我自己最近也在做非常多的 AI 的工具,包含 AI 的财报,我们有做一个小工具。我们自己会遇到一个问题,假如说有大概 5- 6 个 AI 产品,我们要发布的时候,要做一大堆的网站 Landing page 或者是 campaign 的page,但这个时候其实我们每一个 project 就只有两个人,那其实大家都是 side project 的时间去做这件事情。后来去了解了一下,很多协助建站的公司每年的营业额至少也是有大概四五百万到一千万人币的收入,现在这个需求可以更大一些。PART.03

提问研讨:

  • AI 会不会重塑流量分布?它只是做一个提效工具,还是会开新的流量入口、给创业者一些新机会?

云思维 史耀云

最近我也在看一些产品,后来我们其实发现,Google search 的流量的确有在下滑了。去年前年就有很明显的部分,当然一部分需求是被可能是被 Google map 或者是一些 in APP 的服务给划分掉了,但现在有很多的问答类型、搜索类型问题可能被一部分的 AI 场景或者 AI agent 场景解决掉,如果今天会有这样的情形发生的话,那国外的Reddit,或者小红书这一类的产品要怎么样做自己的增长?这个我也还没看清楚。

GenBeings 李国洪

我是李国洪,之前在百度和自动驾驶做了十年的AI。我们去年底刚刚成立了一个新的 start up 公司,叫Genbeings。因为我们公司的名字其实就是生成物种,就是在创造人。

我也非常认雨森刚刚说的机会里面其中有一个就是把供给的能力提升比如十倍或者百倍,我认为提效很难去重建流量模式,但供给关系的变化很容易出生一些目前还在边缘、但未来可能在中心节点的新的流量分发地点。这在历史上其实已经出现很多次了,比如说 Uber 和国内的滴滴。当你把供给关系变化的时候,才会出现一些新的流量中心。

但是现在我们作为 Startup 公司肯定还是要依附于大的公司和大的流量中心来猥琐发育。我们现在推出了第一个产品,现在姑且叫它社交,但实际上我们认为它已经不是社交了,因为我们做了一个 AI to C 的人和 AI 社交的平台,我们认为我们是人和 AI 共存的一个 coexist network。只是说现在我们认为人和 AI 共存无非也就是两种形式,一种是叫高知识含量的,包括现在的人和心理医生、人和设计师去共同的交流,这些是高质含量的。

那另外一部分实际上有很多中长尾普通用户,他们其实对知识含量要求不高,但是他们对于身边的供给,包括社交的供给,包括很多 I 人可能需要一些比他们稍微积极一点的 I 人,但他可能也不需要一个 E 人。包括一些小孩,他可能需要一些玩伴,但是各种的客观环境、地理环境也好,宗教也好,使他不具备。

我们在做的这个产品是希望说我们能通过构建一个人和 AI 共存的平台,在这里面提供多样性的供给。我们一个简单的口号是说现在地球有 60 亿网民,我们希望至少给每个人做五个 AI 人出来,那大概可能有 300 亿个 AI 人,然后来跟现有的 60 亿人类一起在一个 loop 里面,完成一些基本社交层面的供给。在这之后可能会更往上游去走,比如说有些偏知识含量的 C 端的创作者能出来,但这个可能就是后话了。

像刚刚提到的第一性原则,它首先是一个基础的需求,我觉得这个是必须要承认、尊重的。首先,我们的产品里面也看到一些头部的用户,也是这个人和他自己做出的 AI 能聊大概接近一个小时,这些确实在几年以前是完全无法理解的事情。但我觉得可能也像早期的时候,大家也不觉得,我除了打出租车之外还能打一个私人的车,安全性有保证,那个时候大家也是不可理解的,包括对于现在自动驾驶的产品也是一样的。我觉得核心是在现在我们通过提供供给,在早期谋求一个能达到六七十分的产品状态,能让人和 AI 在一个产品里面产生循环,产生去校正的数据,这样的话这个产品能发展。我觉得这个是通过第三种方式,增加供给,最终呈现一个流量模式。

至于判断人是不是能通过 AI 人来满足社交需求,首先我们现在看的也不是商业化的指标,我觉得也为时尚早。我们看的指标还是用户的次数,尤其是新用户的次数。老用户可能受到很多其他干扰,新用户的次数其实是代表他面对这个新产品、新世界的时候,他的接受度如何。

第二个事情是关心新用户的次留,我们现在可能也不太关心太长的留存。我们会发现当你真正去看到这些数据的时候,跟大家想象的还是不太一样。我们可能想象有用户在里面跟 AI 玩一些简单游戏、跟 AI 去聊一些擦边的内容,这些可能是主流,但实际上不是的,我们看到很多的用户会跟 AI 分享一些秘密,甚至于说他因为在现实生活中的一些性格缺陷,得不到能去认可他身份的一个群体,所以他在谋求一些东西。

我觉得指标上我们看的是新用户的聊天次数,以及他的次留或者三留,然后去确认这个需求确实是存在的。第二因为我们是供给逻辑,所以我们本身看的是供给多样性,是否有需求多样性得到匹配了。这个就是我们看用户跟 AI 聊天的大概 topic 分布。如果 topic 越广泛,那我们整个基础的供给逻辑就存在,它就不是一个效率的问题,这就有可能开启一个新的时代。

Character.AI Ted Li

首先国洪分享的很对,我们的观察是一样的,除了亲密的感情陪伴以外,跟 AI 机器人聊天的有很多私密的分享、有很多游戏化的体验。所以在这个角度来说,你可以通过 AI 的长陪伴发现很多很有意思的点,而且再往后面进一步延伸的话,它可以比如说陪伴你的亲人,或者甚至作为你已经离开的亲人的一个替换,或者是小朋友的朋友,因为很多小朋友玩具的时候,你可以发现他们其实把玩具完全当成一个拟人的角色,跟父母交流时候他会觉得这个娃娃就是我的一个朋友,很多父母其实都很难理解这一点。所以从这个方面来说,我相信供给侧有很大的机会。

但是我在这里说,倒也不是说抬杠,国洪就理解一下,因为我也跟很多做数字人的朋友们交流过,我发现我比较喜欢问的一个问题就是,供给侧的革命是肯定存在的,我们也看到感情陪伴这一点的确是被大语言模型深深挖出了一个新的需求,但是一个不能回避的问题是,万一这个需求变成了一个基础能力呢?就是所有人都会觉得你不论是什么产品,只要你做一个有类似聊天界面的存在,我都会希望你的角色能跟我聊天。

比如说剪映如果做一些视频生成的功能,大家会觉得理所应当,就是觉得你如何不做一些文生视频的功能,我就不太想用你了。所以说对于剪映来说,去做一些很 fancy 的视频功能其实等于维护自己,就是不得不去做。因为他不做的话就会丧失竞争的优势,他有足够的资源,也是比较能做的,所以这只是把大家所有的消费 baseline 给提高了。那从这个结果而言,到最后其实已经有大量流量的平台把所有的 baseline experience 都提高了,作为一个新兴的startup其实并不能在这个过程中获得很大的价值,可能最后你被收购,这的确是一个比较好的 exit,但是就结果而言你并没有产生一个完全新体验的赛道。所以说供给侧如果大规模爆发的话,其实是有一个不能回避的问题,就是所有群众或者所有消费者的期待值也提高了,从结果而言并没有一个新的流量模式。

但是从另外一个角度来说,它可能有一个新的内容消费的方式,但其实换个名字就可以说是流量模式,以前是用户被动的消费,但是下一代的内容平台,可能就是用户要去主动生产一部分,就像是说你在玩一些文生图、玩 stable diffusion 的时候,你调一点,他的图片就变了,你再调一点,他图片又变了,这个过程非常充满乐趣。这个过程等于说是一种新的内容消费方式,我觉得哪怕很多 TikTok 同学应该也在考虑这个问题,就是有没有可能存在一种新的内容消费的模式,这个消费模式能霸占出一个新的流量模式,然后从这个流量模式再产生出更多新的机会来。

GenBeings 李国洪

刚好回应一下,我对这事反而比较乐观。

两个以史为鉴的例子,第一个是当年做 Uber 和滴滴之前,掌握大量普通用户出行数据,包括长路线、包括实时的一些出行需求的,其实是地图,但地图厂商没有去做这件事情。

第二件事情是当年国内做信息流的时候,当时也有大厂讨论过要不要去做,但 anyway 都被大家没有提上日程,或者出于各种已有流量的保护,都没有去做这件事情。所以我认为说从大的角度来看,供给关系是不是最后的机会就一定被会大厂收购,或者说会被大厂自己完成,而不需要初创公司去完成?这个我比较乐观,我认为他的答案可能是有新机会的,不一定全部会被大厂收掉。

然后另外一个,怎么去保证新公司能重建新的流量分发的节点,或者内容消费的节点?我觉得有两条线不得不去面对。第一条线就是需要对整个资本市场更加重视,你不得不承认现在的生意很重成本,像刚刚其实 TED 表有句话我非常认同,就是说现在马上把 1000 万用户打给任何一个初创公司的产品,他马上就会很快会死掉了。这个是不得不面对的成本,是我们做新产品要考虑的事情。

第二个事情是,现在我们做产品一般处于四个阶段,就是看不见,看不懂,看不起,追不上。我觉得目前的阶段应该还是在很多人看不懂的阶段,有一部分先行者已经到了看不起的阶段,因为他躬身入局、看到数据了,所以他已经到了看不起的阶段了,但我觉得大部分人现在还在看不懂的阶段。这个时间窗口也是我们能去长大的一个很有效的或者很重要的一个东西。但是大家一定要认知到我们在大家看不懂的阶段、或者才在大家看不起的阶段。

  • 原生的 AI 应用是什么形态?是 APP 形态还是网页、还是 iPhone 手机里面的一个联系人?

Character.AI Ted Li

我就想回应一下,我想提几个点,大家可以把这几个点延展想一想。

第一个就是UI 设计里面有个概念叫affordance,就比如说一个门,你看到它的门把手就知道这个门是推的,它如果设计不好,你会觉得它是拉的。所以一个好的 UI 设计,应该在看到它一瞬间就明白这东西它本身的能力是什么。

从这个延展来说,比如你今天打开ChatGPT,其实我偷偷把它后端换成 GPT 6,你能感知到吗?其实感知不到,其实你可以说 ChatGPT 的 affordance 是非常差的,它并没有把这个能力展现给你。

刚才 AWS 的同学也提到说今年很期待大家在多模态上面能够发力,让用户交互形态上变得更加强。我个人觉得如果你是纯视频生成来做一个全多模态交互的话,其实还挺远的。

但是我个人非常期待,大家刚才也提到的,苹果的端侧这个模型,因为它是传端侧的数据,它可以完全知道手机界面上有哪些信息正在显示,它轻易地就能让你在端侧把模型能力展现给用户,一个巨大的助力,也是我接下来对Google IO 和 Apple WWDC 比较期待的点。我相信在接下来两个月里,在怎样把能力最好地展现给用户上,通过端侧的 SDK 看到很强烈的曙光。

本篇内容完整版也可以进入出海同学会知识库阅读