文档能否成为AI的超级入口?

报道 4个月前 (07-09)

本文经授权转载自微信公众号 出海同学会(ID:chuhaiwenda)

作者|出海同学会

原文标题:《文档能否成为AI的超级入口? | No.113期干货》

文档能否成为AI的超级入口?

导语

在AI的企业级应用中,有一类产品非常吸引大家的注意,也被行业认为将是未来AI的重要入口,这就是文档。Notion、飞书Lark、Google、Microsoft等企业均将文档以及相应的办公Copilot场景视为重要的投入方向。

与此同时,我们关心很多问题:AI在文档内是否能够持续产生价值?目前行业先行者遇到了什么挑战和问题?文档是否能够成为AI协作的超级入口?另一方面,许多早期的AI创始人已经不满足于APP这样重的创新方式,在更多AI和LLM接入的场景里展开了尝试,那么文档是否可以成为新的IOS?像Midjourney之于Discord,文档生态内是否有诞生新杀手级应用的可能?未来的创新方式将如何被重塑?文档能否成为AI创新的超级入口? 

我们这一期携手Linkloud,邀请了文档与AI行业相关的朋友们一起讨论。以下是此次讨论的可公开部分,全文约1.9万字,您也可以进入出海同学会知识库进行阅读。

本期课代表同学

爱设计& AiPPT.com CEO 赵充

Databricks 数据发现团队Tech lead 孙孟磊

前飞书Lark AI&Search负责人 FC

金山办公 WPSAI产品经理 付子豪

LeanTaaS Staff Software Engineer 赵耀东

Notion AI&Data Infra负责人 XZ Tie

Notion 用户研究 侯悠扬

微软 Principal Product Designer 刘妍

Linkloud Founder 高宁(值日生/主持人)

Xinyun(文档笔记整理)

(*按公司名数字-字母序)
部分同学因公司PR保密不能公开内容我们同样感谢他们的精彩输出

要点问题

Part 1 背景研讨

文档产品应用AI目前主要的场景

文档产品应用AI有哪些挑战和问题

Part 2 破壁研讨

训练LLM时文档数据的归属问题如何解决

如何吸引用户尝试AI功能并让其持续付费

Part 3 机会研讨

文档+AI的形态将如何影响未来的信息流及创新方式

PART.01 背景研讨

  • 文档产品应用AI目前主要的场景

前飞书Lark AI & Search负责人 FC

我叫FC,原来在飞书负责飞书智能伙伴,做AI智能助手。因为飞书本身是一个协同平台,相当于是 collaboration office,所以文档是里面的一个重要模块。在大模型刚出来的时候,大家很自然地觉得文档是最大的一块场景,因为生成和总结这两件事情恰恰是大模型比较在行的事情,因此很自然地就会想到文档的辅助生成,以及文档、网页、PDF的总结,纯文字的总结做得很多,在这基础上再衍生出去,也有数据的生成和会议的总结。会议的总结其实是完成语音转文字以后,整个流就进入了文字总结的流,前后是通过这种方式把它们连接在一起。

其实AI处理文档的过程中有几个挑战。一个问题是文档应用的场景,写文档的情况到底是什么?我们说到文档,真正做进去会是写 email、作报告和总结、写普通的工作文档。但是工作文档有很多种,小结、产品文档报告等。文档的格式有很多,每一个文档都有它自己的写作技巧和数据源,所以要把每一个专业文档写好是不大容易的。Email 在国内基本上没人用,去做的话投入不划算。

还有一些场景虽然说是文档,但是格式要求是完全不一样的,就是我们说的PPT,它也算文档,但是 PPT 的整个构架、包括生成的内容还有格式、最终的deliverable,这些东西其实是要做一些深度集成的。基本上这些场景我们都试过,PPT效果不算特别好,Email 使用的人不多。总结性的可能比生成式的使用更多一些。

Notion 用户研究 侯悠扬

可能在海外的 user case 可能会稍微广泛一点。比如说海外的用户用 Email 做沟通还是挺多的,不管是 sales 或者是 marketing, Email 就是一个蛮常见的场景。Notion 也有这种场景,很多人也会用ChatGPT,现在连 Gmail 里面也会有 AI generated content。PPT 的话,现在 Notion 没有support,但是我知道有比较火的 startup,像 Gamma 也会帮助做 PPT 这一类的文档,在海外是蛮大的一个机会。可能和国内用户的使用习惯不一样。

关于文档质量,现在 Notion 在 AI writing 之外有 Q& A feature,基本上是用 RAG 去做。用户可以基于自身的文档、内容提问,AI 就会帮你进行总结。比如说我有很多的文档,我可以基于我自己的文档去 summary,或者去问一些相关的问题,或者让他提取一些精华内容,你可以再从这些内容出发进行扩展和写作。我觉得基于RAG、基于本身 workspace 内的、比较 contextualize 的信息对用户来说还是很有价值的。

我们得到很多用户反馈,特别是那些把 notion 作为整个公司 knowledge base 的用户(把所有的信息都放在 Notion),大家很容易能够从这里提取更多相关的信息。可能会解决一些 generate AI 言之无物的问题。

Databricks 数据发现团队Tech lead 孙孟磊

我是 Notion 的忠实用户,有几个个人例子可以分享一下。

我现在 Databricks 做数据发现和数据治理的相关的工作。现在我正在拿 notion 做一些笔记,我最近用 Q&A 还蛮多的。我不太会写很好的笔记,但是我会写很多的笔记,特别是在高强度、时间紧的时候,我的笔记写得非常原始。对于我来讲一个高频的用法是,我会每天或者每周用 Q&A 去帮我做查缺补漏,让他帮我总结一下这一周的待办事项和有哪些他认为比较重要、需要下周去 follow up 的事情。我觉得这个对于我来讲还是蛮有效的。当然这是笔记的一个应用场景了,笔记更多是个人提高效率。

对于文档来讲,我们公司用 Glean,最开始它的普及率不是特别高,但是当真正用起来之后,它的渗透率还是蛮高的。在 Glean 官网上,半年前我看到公司平均每个人每天会 query 5 次,最近我上去看这个数据是每个人每天 query 14 次,我觉得这个增加还是蛮明显的。对于文档来讲,我觉得分享、归纳总结确实做得不错。

爱设计& AiPPT.com CEO 赵充

我们首先思考的是把用户群切一刀,分专业用户群和小白用户群。专业用户群是指像 4A、咨询公司等,他们写 PPT 是为了赚钱,这种专业用户不是我现在要打的目标用户。我们打的是小白用户,比如我让助理写一个差旅报销的PPT,他根本不知道怎么写,这种是我的用户,比如有些孩子家长帮白天忙了一天,晚上要帮孩子写家庭作业PPT,这些偏低频的泛化的需求是我们现在满足的用户。我觉得这是一个核心思考,就是要切一刀,我们打的是偏小白一点的用户,我暂时不打专业的。

另一个层面就是用户主要用啥?我觉得就核心两点,第一个是前面大家讲的发散式的东西,就是一句话生成一个PPT,这个满足很多小白的需求。第二个就是导入文档,把文档变成PPT,以更好的形式展现出来,或者以网页的形式展现出来。用户对发散式的需求会稍微多一点,第二种就稍微专业一点。比如我写 PPT 从来都不会是第一种,我都是想好了写啥,然后让助理帮我写。这部分就相当于我造了一个助理出来帮我。

微软 Principal Product Designer 首席产品设计师 刘妍

我刚刚加入微软,是跟 Copilot 合作,做 AI 的设计。我们做的主要是 Copilot 对传统产品的更新和迭代,包括像大家说到的 Word、Powerpoint、Azure 还有 Teams。

我觉得有一点是,微软对文档的概念可能更广阔化,就不只是word、Powerpoint,比如说 teams 里面的会议总结,包括像 Azure 这种云端里面的一些文档,包括各种 backlog。文档的概念可能会更广阔一些,不只是我们熟悉的Word。

所以我们在思考 Copilot 怎么样能在这些不同的产品中应用,其实我们目前也在探索很多场景,比如大家刚才提到的,给个大纲就可以直接生成 PPT,但我自己有试用,但我觉得生成的非常 general,其实没有特别大的很好的输出,只是模板上会美化,所以我觉得还是有很多可以做的。包括像 teams 这一边,目前大家如果有使用新版的 teams 都会看到有 Copilot可以直接总结会议记录、summary、生成各种items、智能录音(录完之后可以知道每个人在每个点说的信息,不用听完整个录像就能 get 到关键点),这些已经开始可以使用了。当然还有很多新的功能还在探索中,包括各种各样的场景。

因为这个领域还算比较新,包括 Copilot 在微软的使用也是在刚开始的探索中,所以我觉得未来还有蛮多可能性的。

追问

Q1:

飞书对文档 AI 应用有需求的大概有多少用户?

A1:

前飞书Lark AI & Search负责人 FC

我们的覆盖面其实很广,各个行业都有,所以数据是具有统计意义的。按每天 DAU 的比例算,写文档的人在用户里面占比不大,即每天写文档的用户并不多,综合起来每天大概 100 人里面可能是个位数的人在写文档。同时平均下来一天 100 个人里面大概也只有二三十个人在看文档。

但是这里面还有一个附加条件是飞书专业用户的比例会比钉钉和企微高一些。一般用户知识管理需求不大或者偏向于运营沟通多一些的企业会用企微和钉钉,因为他们大部分是免费的,飞书其实还是蛮贵的。刚刚的数据是传统意义上的文档。其他像email 非常低,可以忽略不计,PPT 也可以忽略不计。

Q2:

AI 在哪一类型的文档处理上对用户有用?

A2:

前飞书Lark AI & Search负责人 FC

我们的确遇到有一些场景对用户非常有用,但这个比较非常小众。有一段时间 PDF 总结、翻译、提炼特别火,后来我们也特意看了到底什么样的人在用PDF。PDF 格式的文件很多都是学术类文件。我们发现有大量的人在读国内外学术论文的时候会使用 AI 总结,对于这帮知识精英来说,他们自己知道怎么用大模型,知道应该怎样去问问题,甚至也知道怎么样对大模型给出来的东西做二次整理和消化。建立在这一系列的东西上面,那个场景使用得特别好。

我们看完数据以后既高兴又高兴不起来,高兴是因为大家真的喜欢这个场景,高兴不起来是因为你会发现就那么一小撮精英非常喜欢这个东西,这个东西没有办法规模化,因为大部分人不会花时间去读这种类型的内容,这是一个非常典型的例子。

还有一个情况,接下来可能慢慢也会有一个悖论,你会发现大模型写的东西基本上不会写错,但是很多情况下写的东西言之无物。像一些企业,比如字节对文档内容本身要求非常高。我们内部试过后普遍认为大模型写出来的文档质量根本不行,虽然语句通、结构也不错,但是言之无物,有时候我们会说它写了一大堆没有错误的废话,这个也是一个问题。这样会导致:信息产生过多,信息消费效率降低,又变成一个双刃剑。

Q3:

Notion Q&A 功能和场景是不是对 Glean 有一些替代的效果?

A3:

Notion 用户研究 侯悠扬

我们可能想要解决类似的问题,因为 Glean 也做很多enterprise,想要 connect 你所有的 doc,像 Google Docs、Jira tickets 等。因为Glean 是从 Google 出来的,原来做 Google 内部搜索,那个 tool 非常好用,但是它发现很多公司没有内部搜索的功能,所以就做了,现在它要结合 AI 的功能,提供更多有 Q&A 的功能,以及你可以 connect 任何第三方软件。我觉得解决的用户场景是类似的。

好像 Glean 最近也融了很多钱,我觉得对于 search 场景,至少很多海外公司愿意花钱去买这个 solution,因为在信息检索时如果能快速让大家得到答案,能明显地提高工作效率。

Q4:

在 Notion 的文档撰写中,哪些细分的 feature 用户是用得最好的,哪些是对你们的挑战?

A4:

Notion 用户研究 侯悠扬

整体来看,用户会在 Notion Q&A 问任何关于公司的问题。比较常用的一些场景有 HR 信息、公司的一些信息等,我们叫做 factual knowledge。比如说我们公司产假政策是什么样的,或者帮一些公司的新员工来了解公司的 policy,实际上就替代了一些 search 的场景。就好像现在 Google 也加上 AI Overview,基本上就是信息搜索的功能。原来可能我只能给你提供一个 doc,你还要去读通篇的 doc,或者有一些很 specific 问题可能你要去 slack 上问同事、花很多时间去了解,现在你可以直接用 natural language 写一个问题丢给 Notion Q& A,Notion 就可以帮你进行总结,回答你的这些问题。我觉得实际上是对搜索的提升,整体对平时用搜索或者请教同事问题的场景都是很有帮助的。 

具体的数据我现在也不记得。可能大家也都会有体会,一般来说一些基本的 editing 比较常用。比如说translate是一个很常用的场景;还有correct, 对于一些同学在海外工作可以进 check grammar,就像 grammarly 的 user case 也蛮常见的;然后还有基本的比如 improve my writing,或者 make it short、make it longer、make it formal,这些很基本的场景都还是蛮常用的。

然后 challenge 的话,我觉得整体就像刚才 FC 讲的,如果只是基于基本的 generative AI writing 肯定还是不够的。所以我觉得未来我们可能也会继续深耕如何更好地 support 很垂直的场景、帮助大家更好地写专业的文档,然后可能通过 Q& A 提取现有 workspace 里的一些文档信息。当然我们现在内部也会 evaluate 不同的大模型,海外我们有很多大模型可以选择,不同大模型擅长做不同的事情,然后你也可以再 fine tune 自己不同类型的文档,进一步提升垂直文档的写作质量。

Q5:

在公司层面上,你看到周围的同事或者你自己用 Glean 做最多的 query 一般是什么?更多是关于政策、HR 等方面的知识,还是说会有其他跟自己业务或工作职能更相关的一些query?

A5:

Databricks 数据发现团队Tech lead 孙孟磊

首先我觉得这个完全取决于公司和 Glean 的 integration 到什么程度(他把什么东西放到了 Glean)

比如对于我作为一个工程师来讲,我 99% 的应用场景都是搜技术文档,或者搜一些工作相关的文档,好处是它可以做集成。我们公司并不像有些公司把所有的文档都放到一个平台,我们会放到不同的,比如 Jira、confluent、Google doc等等。在搜索的时候如果有一个单独的入口可以搜索所有文档,确实是一个非常大的效率提升,因为有时候你根本不知道去哪里搜。用了 Glean 后我们非常直观的感受是发现了以前我们根本就不会想到的地方去看文档。像 Google doc 本身的搜索功能一般它只能做 title 的搜索,并不能搜索里面的文本。我觉得这是一个很大的效率提升。它的全文本搜索可能跟 AI 无关了,可能它们私底下会有一些 AI 的功能,但是对于我来讲它的信息聚合能力是提升效率最高的

Q6:

大家对发散式PPT制作内容的质量和效果可能还是有些要求,如何去做质控?

A6:

爱设计& AiPPT.com CEO 赵充

现在基本上满足用户需求了。因为世界上不是所有人都是卷人,大部分人的需求其实能满足。针对要求高的人,我们会外挂知识库,包括了个人知识库、公司知识库和行业知识库,这样的话就能满足一些卷人的需求。我们后面还有编辑器,就先生成大纲,再做美化,再拖拉拽改一改,然后把大纲改一改,就能交差。

  • 文档产品应用AI有哪些挑战和问题

前飞书Lark AI & Search负责人 FC

我觉得最大的挑战有几个点:一是到底我们的目标客户群有多少?我们做 C 端或者做 SaaS,我们总是希望目标客户基数越大越好,我们很多定价模式其实是和使用量、和用户的subscriber严格绑定的,我们肯定希望目标用户越多越好,但是真正需要通过文档来沉淀传递知识的企业多不多?这样的职能多不多?这是一个比较大的挑战。

第二个挑战是国内模型生成的文档质量到底高不高?生成完以后到底能不能用?这个问题一直很困扰。因为写出来的东西如果质量不好的话是没用的。我相信在座的每一位,当你们写文档的时候,很多东西 generative AI 是帮不了我们的,因为我们脑子里面有一些非常独特的东西,它可能帮我们可以稍微整理一下格式,但是思路和本身精华的 topic 没法帮忙,至少在我们的使用里发现它没有办法根据一个提纲来展开符合你个人想法的、符合你公司使用环境的、符合你个人风格,或者是特殊文档风格的东西。这一方面垂直化的深入场景在现在泛化大模型里效果并不是特别好。

金山办公 WPS AI产品经理 付子豪

我是付子豪,目前在WPSAI。我把文档产品应用 AI 的场景分为三大类。第一类是生成式 AI,无论是文档、PPT还是各种各样的格式,它本质上就是去生成文字。第二大类是Copilot,比如在表格里面植入代码,用 Python 去写一些东西,用 SQL 去查一些数据,以及像过去在表格做 RPA。第三类就是刚才大家畅聊的 RAG

我先说第一类,我觉得无论是生成文本还是生成 PPT,文档格式终究是一个容器,它和展示的环境相关,但它本质上其实都是去生成文本内容。但是这里面其实会有挑战和问题是你必须要抓到一个非常好的场景。而且,你用国内模型生成的内容和质量有上限,所以这个场景要对内容质量要求不是特别高。比如你要是完全用来写学术论文,可能就不太行,但是你如果去写一些偏总结类型的、偏格式修改的,或者偏发散一点的、不是特别看重内容质量的场景就比较好一些。比如你要去做一个旅游攻略,可以让它去帮你发散,这些其实就是非常好的场景。PPT也是如此,我更觉得今天 AIGC 在文档里更像是去为用户创造了一个高级的 template,过去的模板可能只有格式,但是今天的模板有了和你场景相关的一些内容,但是这些内容未必是你需要的。所以你大概率还是会需要去修改或者润色等等,但是他对于你的思路的引导和发散性就会很好。

第二类的 Copilot 本质上希望通过生成 code 或者类 code 的东西去帮助用户从最开始的仅仅看文档、表格走向去做数据分析等更深度的分析。这里面其实痛点也很明确,就是当你的表(Excel )足够宽、足够大的时候,大语言模型很难完全理解整个表结构,这也是我目前在落地的时候发现一个非常大的痛点。如果你是一个非常窄的二维表,那其实理解还 OK,但是一旦当你把表的列变多了、行变多了,模型理解起来还是会有一些问题。美国的 Arcwise 也是做数据分析的,但是他们相对来说做得比较取巧,比如说他做数据分析前先写SQL,把你的目标区域给摘出来,你可以去修改你的目标区域,甚至插入你的目标区域去做下一轮分析,这就有点像插入一个数据透视表。它跟 Google sheets 在做集成,是一个插件

最后对于 RAG,我觉得最核心的原因是 workspace 查询做得很烂,其实文档里藏了很多知识,但大家找不到,或者人走了可能就流失掉了。但我觉得RAG 里最核心的是处理数据异质性:当你去找文档的时候,可能有表格、PPT、PDF,怎样把这些格式的文档处理成大语言模型能懂的东西?能够找得到?这也是我认为比较核心的点。

追问

Q1:

飞书在 AI 层面有哪些设计和 IM 很好地融合?

A1:

前飞书Lark AI & Search负责人 FC

因为本身平台的属性决定了它的数据有 aggregation。数据的 aggregation 理论上是一种加持的状态,就是说我的很多信息,在 IM、会议、文档里面交流的,这里面很多信息是有共性的。但同时这也是一把双刃剑,有一种情况是有更多的信息可能会造成相互的干扰。

比如我们刚才说到知识库,其实知识库本身是一个很基础的东西,你现在的知识库呈现方式往往就是 RAG。其实做深的话,RAG 本身可以作为文档生成的支撑型的数据源。为什么我说是双刃剑,就是各种不同类型的信息,他们的属性相差很大。IM 里面交流的信息的时效性非常强,文档的信息它的时效性会非常长,会议里面它的准确性和不确定性会非常多,要不然就不用开会了,会议里面讨论的东西不一定是个结论。这样的非结构化的数据,其实包含了逻辑性,还有很多类似的关键词。在做 RAG 的时候,比如说 Instant message,我可能今天早上跟你说了一个下午就变了,但是早上跟你说的东西也进了数据库。所以这样虽然有互相加持的能力,但是可能会引入更多 noise。这其实不仅仅是文档,这对企业整个知识库管理都是一个挑战。

当我们把不同类型的数据去做 aggregation  时,出来的东西效果并不像我们想象的那么好,而且有时候要去证伪都很难。因为有时候你可能都不知道他的信息是从哪里召回的。它回答了一个日期,这个日期可能就是两个人聊的时候提到了,但是真正大家定下来的日期不是这一天。

Q2:

AI 给的答案难以溯源是技术上可解决的吗?还是说技术程度上能解决,但是涉及到你对这家公司或者业务的 knowhow 上了解的不一样,所以其实导致你在做的时候又变成一个很非标的 solution?

A2:

前飞书Lark AI & Search负责人 FC

你说的对。到后来你可能又开始往 rule base 的方向走了。比如说,我们说下个月的会议时间,当你有这么多信息的时候,你做完搜索后可能说,我把任何和会议日期相关的东西按照召回的信息发生时间来倒排序,发生在最近的就认为是最准的。但是你依然不能保证最新的一次对话里面这个是对的,因为你没有办法去一个一个澄清。我们只需要想这么小一个点,就会发现当海量非结构化信息放在一起的时候,这个问题不一定能被工程化就解决。当然你说我还有其他的方式,可以每个人说的话加权重。工程上有很多方法去可以去做信息的后处理,但是你的规则是什么?这个规则就像你说的,是不是又会沉淀为一个企业里面特有的rule base 的规则?那这样的话你是不是又要去做 RAG 的逻辑集成?做完以后你还能不能规模化?你的集成成本还能不能靠 AI 降下来?这个东西有可能会产生一些悖论,把 RAG 做好其实不容易

Q3:

Notion 会不会也遇到类似难以找到答案的问题?

A3:

Notion 用户研究 侯悠扬

我觉得有,但是我不是工程师同学,所以技术细节我可能没法解释得很清楚。但是我觉得至少我们的一个处理是一定保证回答有 reference 和 source。我一定会说我是基于比如 10 个相关的文档来回答这个问题,通过这些文档我可以引用什么信息,而且用户点进之后可以到引用的一段话。我观察到很多用户不只看到 AI 给出的答案,他是会返回去自己再看一下那个 doc,再自己去 validate。也有一个 feedback 机制告诉 AI 的回答是否正确。

Q4:

微软会不会也遇到类似难以找到答案的问题?

A4:

微软 Principal Product Designer 刘妍

我觉得肯定会。但一部分原因可能在于用户不太会 prompt,我觉得如何问高质量的 prompt 也是一个关键。因为我不是做技术需求的,我是设计师,其实这方面我自己也在学习,engineer 可能会对各种 prompt 会更懂。但我觉得普通的用户是不知道怎么去提问的,所以在产品设计这个端口,我们会很注重去设置不同的用户体验,如何提供各种能用的一些 prompt。就比如说如果你有 teams,你打开 Copilot,他直接会给你一堆prompt,可以直接点。他不会让你说 “recap this meeting” ,因为用户想不起来这些。我们直接就在 UI 上就给出了各种各样的 prompt,然后用户可以来使用。我觉得技术上它能精准地找到结果,但我认为很大一部分普通用户并不知道怎么样来使用。

包括很多产品没有onboarding,就是东西太新了,很多用户完全不了解该怎么用。所以我觉得在从用户体验这个角度,包括产品设计角度就要提供很多的指导,或者手把手地教用户,尤其是在初级的阶段。

我这两天刚参加完旧金山的 GenAI Summit。我其实对技术了解非常浅,我觉得现在技术算是比较成熟的,但是 AI 产品的落地和用户体验其实还非常早期,包括未来交互体验的范式应该什么样子,很多东西都是有待去定义的。Copilot 这边非常的 open,还在集思广益,什么都可以尝试一下,是一个蛮开放的状态。

PART.02 破壁研讨

  • 训练LLM时文档数据的归属问题如何解决

Notion 用户研究 侯悠扬

归属问题我理解就是data privacy这方面,我们还是很注重这一点的,因为就从调研来讲,AI 对大家来说也是个新生事物,整体的话大家会有非常多的 AI concern,我的 data 会不会被泄露?我的 data 会不会被用于 training model?所以我们现在不会用任何用户的 data 去训练我们的模型。

我看到有一些公司可能会有一个 disclaimer,或者有一个很清晰的用户的 agreement,就是说如果你要用一些用户的 data 去 train model ,你一定要得到用户的 permission。最近 slack 有一个 case 就是好像它 by default 把用户 data 用于 train 它的 model,这个事情在海外有一个很大的讨论,很多人在诟病 slack 这个 policy,你要发 email 联系 slack 才能不会让自己的数据被用于 train model,很多人非常反对,所以肯定是不建议这样做的。特别是对于海外的用户,欧洲的用户也有很多这种 PR,美国也有很多用户数据相关法规。所以如果是出海的同学做任何 AI,不光是文档,一定要注意这一点。否则可能会触发一些法律法规问题。

  • 如何吸引用户尝试AI功能并让其持续付费

Notion 用户研究 侯悠扬

付费这方面,我们有不同的机制,我们基本的付费定价就是 AI addon,不管你现在是 notion 的什么 plan,你一个月付大概 8 美金就可以得到 AI addon,这个定价是在你本身 Notion subscription 上额外 charge 的一个 fee。同时我们也会有一些,比如AI free trial,你可以试用比如几十个,去尝试用一下 AI,如果你觉得用得不错,或者是你可能想用更多、触发到了这个 limitation,这个时候我们会 pop up 提示,试图就对用户进行一个转化,这也是一个机制。

我看到很多,不管是Microsoft Copilot,或者 Google Gemini AI 也是,比如说针对 Google 用户,可能前两个月你是免费的,你 trial 用好了之后,如果你想继续付费,你可以继续付费。我觉得这可能是现在 AI 的定价的一个基本 model,因为很多时候用户其实并不熟悉 AI 到底能干什么,所以可能一开始想他们付费是很难的,所以就可以让用户多尝试。如果用户真的觉得好了,或者是他用到了你的limitation,可能他会更容易去转化。

前飞书Lark AI & Search负责人 FC

我最近也在观察各种各样人的使用习惯,其实想法又有点变化。首先,单靠一个文本去收钱的时代肯定已经不存在了,就像 Notion 或者是WPS 不会单单因为文本生成收你一笔钱,我们一定是把它打包一起给你,提供的一定是 AI 的能力。甚至接下来包括那些 PDF AI、Chat PDF 都会消亡,因为它太单一了,而且它那一层是做不厚的。所以收钱牵涉到一个模式问题,但这个模式也是有挑战的。

从飞书的产品特性来说,AI 是附加型的,我比较头疼的是,我们可以做一些东西出来,而且做得不错。但比如我举个例子,我去跟一个造车新势力说,在 1 万块钱上加15%,让每个人都有 AI 功能(这个数字只是打个比方),15% 的溢价,这个 extra cost 能不能 justify 下面所有人使用后的效能提升?这始终是一个挑战,这都跟文档没关系,这是一个 AI in general 的挑战。Key decision maker 到底认不认可加的 AI ?这很重要,这一块还是很有挑战的。

而且我还在思考另外一个问题,刚才我们说的是实际商业化定价的战略,这个战略要符合不同的用户。比如说制造业和服务业真的对 AI 需求有那么大吗?我们觉得其实不是。再换一个角度,又回到了什么人愿意付钱?高端用户。国内现在的百模大战,都已经开始上免费的东西了。我也横向对比了美国,我发现我们可能低估了很多用户的能力,很多用户在某个行业里面深耕,不管是做餐饮的、法律的、房地产的,他们用 ChatGPT能够做很多事情,写文档、总结文档等都可以。很多人不是专业的,但是他们使用 ChatGPT 门槛越来越低。我现在跟我国内的朋友聊天,他动不动给我个 Kimi 的截屏,这就说明大家已经把这个方式用得很溜了。

这个情况下,像我们这种 SaaS 提供同质化的功能,我们最大的优势就在于数据的隐私和数据的集成。但是你再往上加一层厚的护城河,会非常难,因为人家也可以把数据放在一起,甚至做个人化的 RAG。企业级这一层首先在功能上没有优势,并且还有开销的问题,中国有大量的价格敏感性,在产品有免费替代品的情况下,定价策略和产品推广就会变得更难。这个是我最近看到的一些情况,AI 普及率远超我的想象。

第三个问题就是,我们做企业级的公司就要不断去挖护城河,到底有什么是个人做不到的?企业的信息一定是个人做不到的,因为你不可能把企业的信息全部扔到 chat 上面去,所以这个还是有护城河。但是也牵涉到另外一个问题,就是企业想自己做模型的意愿是不是起来了?如果是的话,他们又想自己去做模型,数据又会封闭,一旦他做完这种封闭式的模型训练以后,你做 SaaS 的那一层又被他自己替换掉一些。这两头我都是我们要考虑的事情。

金山办公 WPS AI产品经理 付子豪

其实我们现在尝试的付费是在相当于在传统的 WPS 会员之外,也像 notion 一样叠加了一个 AI 会员,他会给你一些尝试的机会,然后比如说像 chat PDF、文字生成、PPT 生成。我们把效果比较 OK 的功能塞到这里面去,然后以 limit 次数来做限制

但是其实那也像刚才 FC 说的,我觉得今天办公软件其实更像是一种标准的流通格式,本质上就是一个内容的承载容器。所以像今天模型大幅度降价甚至免费,某种程度上对国内办公软件想从 AI 方向去收费有一些影响。

我觉得目前能看到商业化能做起来的,是帮助企业去搭建RAG,有点像Glean的那种方式,这个是 OK 的,如果是普通走会员的机制,相对来说困难会比较大一些。这里面的 gap 是你愿不愿意打断你的工作流?比如说在 word 里面,你原本的工作流可能是一键触发就去生成了,但是如果用外部模型可能你还要输一段 prompt,然后去生成,然后再想办法粘贴。我觉得唯一的点就在于应用的 prompt 积攒和整个工作流。

微软 Principal Product Designer 刘妍

微软这边比较明确,也就是所谓的freemium,先尝试使用,喜欢的话再继续购买。但是像微软很多的产品,像企业端的,比如说 teams 都是公司去买,所以跟个人用户的购买意愿没有很大关系。大部分还是利用微软的护城河,就是它的生态系统。而且大多数的比如传统大厂都有在用微软整套的系统,全部打包买走,所以变现在微软不是特别大的问题。所以没有那么多用户端的数据和大家分享。

追问

Q1:

现在 Notion Q & A 是不是大家都免费都能用?

A1:

Notion 用户研究 侯悠扬

现在它也是一个 free trial,在AI addon里面。另外我们的一个策略是当时有个 waitlist,有点饥饿营销,但是这个 waitlist 也是为我们自己进行一个准备。用 waitlist 这种机制,你可以一波一波去 roll out  Q& A 的 experience,相当于一个 Alpha 版本。在这个过程当中我们会获取更多的 user feedback,不断地去 improve 它。用这种方式也可能能提升用户的好奇心,他们可以慢慢地进入这个 free trial,好奇这个东西到底是什么,然后想要去尝试。

Q2:

有去 track 大部分用户为 Notion AI addon付费是因为哪个点吗?

A2:

Notion 用户研究 侯悠扬

我感觉可能对不同类型的用户 value props 不太一样

对于比较大的 workspace,他们有需要搜索的场景,那 Q&A 对他来说有很高的 user value,因为他会有 challenge 找不到文档,有很多文档、很多人。至于 writing,我觉得 in general 不管是个人用户或者企业用户都可以用。

Q3:

你有观察到 AI 会是让企业用户更好更快地接受 Notion 的卖点吗?还是说企业用户考虑更多的是文档本身?

A3:

Notion 用户研究 侯悠扬

我觉得企业用户可能会有一些比较独特的需求,特别是对于 data privacy 等方面,尤其对于 AI 产品可能会有更高的需求。所以我们要满足他们这些方面的需求,让他们的文档、信息 very safe。不管有没有AI,就是包括在没有 AI 的时候,都要 keep their data privacy and security。

Q4:

WPS 搭建 RAG 的优势是不是原本客户的文档都在 WPS 上了?

A4:

金山办公 WPS AI产品经理 付子豪

对,大多数客户是这样的,日常办公使用的就是WPS所以也是数据产生的源头;另一方面其实也是由于WPS 在这些年积累了很多文档格式转换的能力,比如从 PDF 转换成另外一种格式的格式切换,从我的角度来看其实就是不同格式的数据异质性处理。你怎么样先处理成一个大语言模型能懂的东西?才能进一步搭建起来RAG。我觉得这个能力目前来看也是一个非常核心的点。

PART.03 机会研讨

  • 文档+AI的形态将如何影响未来的信息流及创新方式

Databricks 数据发现团队Tech lead 孙孟磊

我对于创新方式方面没有太多的想法,但是就像之前有同学提到,我觉得很重要的一点还是数据质量,因为接下来的信息流可能会有人写的数据,有 AI产生的数据,或者说混合的数据。在这个过程中如何甄别真正重要的数据,如何能够让 AI 产生的数据有更多方向,这个是我比较感兴趣的。

举一个我们公司的例子,我们组有一个产品是做 auto documentation,其实是一个很简单的产品,但是它的 adoption 特别好。它做的事情就是把一个表格的 Meta data 输到 AI 里面,然后产生 comments,然后这个 comments 就作为数据的简介。其实 80% 或者 90% 的数据都是没有这种 comments 的,因为有了一个非常简单的方法可以产生comments,这很大程度地帮助企业客户去主动或者半被动地标注他们的数据,包括比如行列这些都可以去标注,这样会很大程度地提升企业的数据质量。同时因为有了一个被标注的信息,它可以接下来更多被用在比如 training 或是 RAG,或者增强搜索,在这些方面会产生很多正面的影响。

所以总体来讲,我觉得文档和 AI 肯定会对信息流产生非常大的影响,这个可能是正面的,可能是负面,比如说 garbage in, garbage out。

前飞书Lark AI & Search负责人 FC

其实这个问题我想了挺久,我是这样想的,文字类的交流本身是一个非常抽象化的、非常高级的过程,这就注定了它的受众会比较小。最近我也跟很多人聊过,也慢慢回到了另一个点,就是我们不得不承认当今社会对信息获取的渴望度和需求是非常大的。文档和文字本身在正规场合,在大量交流的场合,它可能会起到非常好的作用,但是在提高效率的过程中,它是不是最好的形式?这个反而是我最近一直在考虑的问题,我会从另外一个角度去看文档和 AI 的形态。

我觉得我们现在说的是大语言模型的一个非常显式的、直接的应用。我觉得除了直接基于文字的应用以外,我们现在在说多模态的时候,我觉得文档或者文字很有可能是多模态连接的一个底层中间件,因为很多逻辑表达和多模态之间的关联,最好的形式往往是文字和逻辑。所以我现在想的东西是,一方面是现有的高级使用者如何使用 AI 文档,另一个方面,很有可能 AI 会把文档作为一个载体来连接多模态。

再另外一个方面,当生成内容变得非常廉价快速的时候,信息量的爆炸就会很快超过人的消费能力。我觉得接下去很有可能是矛与盾之间的关系,也就是一方面有人会不断地去帮助你快速、廉价、高效、准确地生成信息。另外一批人会帮你去快速、准确地去收集和提炼信息。我觉得这两点可能会形成互补,甚至于对抗。这点我无法预测,完全取决于使用场景。

其实大家也能够理解,现在用户还愿不愿意真的从头到尾去读很长的一份文档,还是说用户会很自然地让 AI 去帮助提炼。很多人的习惯已经改变了,正是因为出现的信息量太多,文档加 AI 也许会促进对 AI 总结的需求。我个人觉得有可能会往反方向走,生成式的东西可能会导致那些内容消费类的应用场景火起来。

微软 Principal Product Designer 刘妍

我想补充一下,就是很多人不怎么会去读长文档,可能会去看总结。我发现有一个痛点,就我看的这些总结缺少很多 content,感觉它并不能代表文档的everything,它可能只是一个骨架。我在想有什么很好的方法能在这二者中间得到 balance,让我了解这个文档的框架,但我也不会失去一些重要的信息。

大家真的都只会看 summary 吗?就比如我现在就不会,我认为 summary 对我来说营养很少。我也尝试过把一个大的文档丢进去,它会给我生成一些 bullet points,但我觉得不够,还是会回去找一些 reference。

金山办公 WPS AI产品经理 付子豪

其实我最近自己也在思考这个方向,前年提出了一个文档应用化,就是基于在线文档和表格去搭建一些应用。然后在去年也做了一些小的应用,比如把表格作为原有的数据源,去做查询器,比如用户要查个工资、查个分,类似于这样。叠加多模态的能力和叠加生成的能力后最终是什么形态,现在还没有一个特别明确的概念。但是我觉得文档应用化,就是由文档为基底去搭建应用,这件事在生成式AI发展火热的今天有可能能成。

至于如何影响未来的信息流,最近也有一个挺火的消息,就是 AI 生成的东西可能会污染到整个互联网的内容。所以我也挺看好未来用另外一种 AI 来甄别哪些是 AI 生成内容,哪些是 UGC 的内容,这也是一个比较好的方向。无论是腾讯的“元宝”的上线,还是百度文库出的“橙篇”,现在国内一些应用一个非常大的壁垒就是它的 UGC 内容库,其实对于办公软件也一样,办公软件的 UGC 就是企业数据。未来如果AI 生成的数据越来越多,它的基线还没有那么高的时候,会不会污染到这个数据?我觉得这也是一个有待讨论的点。

Notion AI & Data Infra负责人 XZ Tie

我觉得首先,任何新技术最后都要服务于产品。AI 这个技术很好,但是最后还是要有一个产品的应用真的解决用户的痛点,然后他愿意付费,这样才是一个真正好的应用。当然悠扬肯定之前也说了,Notion 没有AI 也是一个 workplace productivity,提高大家生产力的工具,我们是利用 AI 更好地提高大家的生产力,take notes、share knowledge,提高工作、信息分享的效率。所以说首先还是要基于解决一个真正的问题。

其实我的团队最先用 AI 上是 2022 年的夏天,那个时候 GPT AI 还没有这么火。我们最先开始是想解决 Notion search quality 问题,Notion search 在所有的用户反馈里面一直都是前三个需要提高的地方。所以我们也是从真正解决用户提出的痛点来最先开始考虑 AI 的。我们团队做了这两年,终于有一个能面向所有 Notion 用户的产品,它真正跟 Notion 所有的产品都结合得非常好。

文档的好处是,文档本来就有最重要的信息了。现在数据、用户的信息最重要。如果你把这个文档做得好,所有的用户都愿意把它最关键、最有用、最有价值的信息存在这里面,那么你的 AI 自然而然会有很多的机会。也有很多其他的公司纯提供AI 的技术,那么他的数据从哪里来呢?用户需要相信他,让他有这个数据,这些新技术才能被应用。所以我觉得文档其实是一个很好的场景。在文档之上,现在 Notion 是可以帮你写,然后帮你润色,帮你提供一个模板。

然后第二个,我们的 Notion AI Q & A 就是一个chatbot,帮助你提高在 Notion 里搜索信息的精确度,然后用 chat bot 这种方式来让这个信息变得更容易理解。我们还会做AI assistant,提高你整个 workflow 的 automation。之后还有很多其他的应用,还是基于用户愿意相信 Notion,在 Notion 里面存他最有用的信息。以这个为基础,我觉得可做的东西就很多了。

LeanTaaS Staff Software Engineer 赵耀东

我叫赵耀东,来自 LeanTaaS,我们是一家做医疗的 SaaS 公司,有 1000 多家医院是我们的客户,我们也在尝试 AI 做一些东西。

我最近看到一个非常有趣的说法,就是说真正有价值的东西并不是给用户提供或者制作一个 workflow 工具或者制作一个workflow,而是通过你的行业经验以及你的SOP,把它固定成一个workflow,最后直接给用户提供最终的 report。这个是下一阶段有价值的东西。

比如说我了解房地产或者是某些专业上的东西,如果我是这个行业的人,那么我会有一些 SOP 能够从这些文档里面找出来最有价值、提供决策性支撑的信息。然后我把这个 SOP 包装成一个产品,别人把文档扔进来,我就能直接告诉他,比如这个房子不能买是因为什么,或者这个公司不能投是因为什么,或者建议投的原因是什么。

相比于 template 的话,这个 workflow 是非公开的。比如说律师,他就靠这个吃饭的,他不可能把这些专业知识全部做成 template 公开,而且这些专业知识生成的 template 可能还要根据他的经验不停地进行更新。

我最近发现大家其实并不是想要一个很强大的 workflow 工具,每个人想的并不是如何更好地把工作做完,而是如何能够不需要做这个工作。我说的这种形态就直接跳到最后一步,用户给我他所有的文档,然后我回答用户几个专业性问题,直接告诉用户结论。至于具体我怎么做的,那就是我的私有知识。

追问

Q1:

会不会未来有很多初创企业会在 Notion 上面去创业?

A1:

Notion 用户研究 侯悠扬

即便没有AI,已经有很多人在 Notion 上创业了,而且每年赚的不少。因为我们就像一个乐高一样,用户可以建立自己的乐高来针对一些应用场景。我记得有人做过一个特别 specific 场景,好像是小孩夏令营相关,他就靠这个每年能卖很多钱。因为 notion 也好,或者 Lark 可能类似,会有很多的 primitive blocks,你可以用这个去建你自己的 template、application等,再把它卖钱。

我们也把 AI 看作一个 block,是一种类型的乐高,可能它是非常 creative 的乐高。现在应该是有一个 AI block,你可以在这个 block 里面去调用AI,去summarize,你也可以去写,然后放到你本身的 template 或者是 application 里面。AI 其实已经成为它的一部分了,所以肯定是会有这样的场景,是会有人在 AI上面进行创业,继续创造出更多有意思的东西来。

Q2:

你怎么知道 Notion 的一些 block 是第三方的开发者?怎么找到一些 AI 插件?

A2:

Notion 用户研究 侯悠扬

有一个Notion AI template的网站。并且如果他用到 AI 的话,他会有一个标签。

Q3:

AI 未来的交互模式是什么,比如语音和文档都是重要的交互方式,你们怎么看这个问题?

A3:

微软 Principal Product Designer 刘妍

我觉得语音肯定是一直在进行的,但我觉得它不是一个 next big thing,这个东西一直都有。然后这两天也会有讨论,比如说在客服方面的 conversational AI,包括chat bot,我觉得这个对话一直都在进行,所以我不觉得它会是个 big thing。

至于什么是big thing,我觉得是在用户体验,就是如何能让普通的用户都真正进入战场中,让他们能从中获得价值。我觉得现在普及度还是不够的,然后我认为下一个比较有意思的应该是应用场景的创新