从信息焦虑到高效学习,我做了款 AI 知识管理工具,帮你轻松整理音视频内容!

在信息过载的当下,用 Ai 好记,高效沉淀你自己的高质量知识库

1、请先介绍下你自己,以及目前在做的产品「Ai好记」。这款产品的主要功能和定位是怎样的?

我是宇宙大烧卖,清华大学毕业后在大厂做了五年算法工程师,最近辞职出来创业,做了这款「Ai好记」。

一开始它只是我为了解决自己痛点做的一个小工具——我平时要参加很多视频会议,也会看大量行业分享、技术讲座来追踪前沿。这类视频动辄一小时起步,三四个小时也很常见,完全看完去“扒信息”非常低效,而我自己更习惯用文字快速学习和做笔记。

640.png

「Ai好记」的定位是:个人多模态知识库,帮助用户更高效地处理各种模态的信息输入。现在我们重点打磨的是「音视频内容的知识管理」,后续会逐步扩展到文档、网页等更多信息来源。

目前的核心能力,可以简单理解为三件事:

  1. 高精度转录: 把音视频快速转成图文稿,包括比较准确的讲话内容 + 关键画面截图(比如 PPT 页)。

  2. 结构化输出(思维导图): 自动生成思维导图,用户可以点击导图节点在内容间快速跳转,用“立体式”的方式学习一段长视频。

  3. 智能总结 + 深度对话: 提炼核心内容,也可以基于音视频内容继续和 AI 对话、追问、延展。

现在已经有很多老师、学生、医生、企业高管在用。简单说,只要你需要高质量信息输入,只要你逃不过“看一堆行业视频”,那「Ai好记」就能替你省掉很多时间。

观猹产品:https://watcha.cn/products/ai-hao-ji


2、「Ai好记」这个产品的最初灵感来源是什么?为什么选择从「音视频转录 + 总结 + 导图」这个方向切入,而不是做更常见的 AI 笔记或写作类产品?

灵感其实非常直接:信息焦虑

我每天都会接触大量视频和播客,但时间又非常有限。会有一种很典型的状态: ——收藏了无数内容,但真正点开看的只有少数; ——好不容易花一个小时看完一个视频,过两天又忘了 80%。

市面上的 AI 笔记 / 写作工具很多,它们大多解决的是“文本→文本”的问题。但我观察下来,当代人获取信息最大的瓶颈,其实在于 非结构化媒体

640 (28).webp

音视频是 信息密度非常高 的媒介,但同时也是 检索效率、消化效率最低 的。

我们选这个方向,就是想攻这块“硬骨头”: 如何高效啃完一段长视频,并真正把内容变成自己的知识?

在这个链条里:

  • 转录成图文,是基础
  • 做总结,是提效
  • 做导图和结构化输出,才是把信息真正内化成知识结构的关键一步。

3、目前团队的构成是怎样的?在早期阶段,遇到过哪些资源瓶颈?你们是怎么突破的?

我们现在是一支小而精的敏捷团队,主要由:

  • 产研团队(产品 + 技术)
  • 运营团队
  • 服务 B 端客户的销售和支持团队

我作为创始人,会深入参与产品和技术的核心决策。

早期比较大的三个瓶颈:

① 冷启动用户 没有用户,就不知道该往哪儿优化。我们没有选择“广撒网”,而是做了一个相对“笨”的决定——深耕垂直圈层: 先从自己熟悉、也真正存在痛点的一些社区切入,比如开发者社区、产品经理社区等。靠售卖性价比非常高的终身会员,聚集了第一批愿意一起“共创”的种子用户。 他们的需求、吐槽和正向反馈,基本决定了产品最早期的路线。

② 国内业务合规与各类审核 在国内上线一个网页应用或 App,要过很多关: 域名备案、公安备案、软著申请、支付开通…… 早期预算有限,又没法全外包,只能自己一点点啃。最大的感受是: 很多事情要 提前做——比如软著,如果等到 App 要上架才想起来,就会被时间卡得很被动。

③ 用户增长 团队的基因是偏产品和技术,对“增长怎么做”一开始其实没太多经验。后面是通过和 AiPPT 团队合作(后续也被他们收购),一起做了矩阵产品,做用户导流,再配合达人营销,慢慢把用户池做大。


4、从最初版本到现在,哪些功能是最早上线的?后续又新增了哪些?有没有曾经尝试但最终放弃的功能?

最早上线的功能 很纯粹: ——只做了一件事:B 站视频的图文转录 + 总结。 可以说就是一个非常典型的 MVP。

之后的所有功能,基本都来源于用户反馈。 我们现在有几百个用户群,我几乎每天都会和不少用户聊天,要么帮他们解决问题,要么收集需求建议 —— 需求池里已经躺着几百条来自用户的诉求了。

后续陆续加上的功能包括:

  • 多平台链接解析: 不止 B 站,支持小红书、抖音、小宇宙、百度网盘、阿里云盘等,是呼声最高的需求之一。

  • 批量解析 / 批量上传: 很多课程是几十个小节视频,如果只能一个一个传,用户体验会很崩溃,所以我们加了批量上传与批量解析。

  • 基础的笔记管理与阅读体验优化: 比如批量移动 / 删除 / 改名、阅读界面的排版等。看似是“小事”,但对每天用的人来说就是“呼吸感受”。

  • 分享功能: 允许用户把总结后的笔记或导图分享出去,这一块我们也把它当成天然的传播与种草环节。

  • 交互式思维导图: 不只想做一个“好看的静态导图”,而是希望用户可以点击导图节点,视频就自动跳到对应时间点播放,让导图成为真正的“内容地图”。

  • 以及像 AI 播客、翻译 等功能,也在根据用户需求陆续迭代。

因为大部分功能都来自真实场景和刚需,真正“做了又砍掉”的功能反而不算多,更多是一些交互和细节层面的调整与重构。


5、在 AI 总结过程中,你们是如何减少“幻觉”或错误理解的?对于技术类或学术类视频,是否做过专门的算法或语料优化?

我们最在乎的一点其实是:转录要尽可能准

很多用户处理的是工作内容、专业课程、重要会议,一旦转写不准,后面总结再“看上去很聪明”,也只是错上加错。

我们主要做了三层处理:

① 语音识别算法的稳定性 研发同学在这块确实花了大量时间: 针对不同口音、语速、噪音环境做了很多测试和调参。现在整体识别准确率在用户反馈里是“肉眼可见”的提升,我们也会持续打磨。

② 专业领域语料优化 像医学、金融、工程等垂直行业,我们有专门构建语料库和术语词典,让模型更懂这些行业的专业语言。 同时,我们也开放了自定义专业术语功能——用户可以预先录入常用术语,识别准确率会大幅提升。

③ 原文版 + AI 润色版双通道 我们提供两种文字稿:

  • 原文版:尽量忠实保留现场说话内容;
  • AI 润色版:在原文基础上做错别字修正、口癖清理(比如“嗯啊就是那个”)、段落排版和重点加粗,让可读性更好。

640 (27).webp

在此基础上,AI 总结和 AI 问答都是基于实际内容来“发挥”,大部分信息都能在原视频中找到出处,这样可以最大程度减少“凭空瞎编”的幻觉。


6、在你看来,结构化输出(比如导图、大纲、多层笔记)对 AI 工具有什么意义?为什么你们如此重视这部分的呈现与设计?

我一直有个观点:结构化,是把信息变成知识的关键一步。

很多 AI 工具生成的内容,看上去“字很多、很用力”,但如果只是长段落流水账,用户很难真的消化进去。

只有当信息被组织成 清晰的层级和框架 时,用户才有机会真正看懂、记住、用得上。

我们之所以特别重视结构化输出,大概有这么几个原因:

① 学得更快

一堂两小时的课程,如果没有结构化,你往往要从头看到尾才能摸清主线。 有了导图 / 大纲,你可以:

  • 一眼看到全文结构;
  • 快速判断“这课值不值得认真看”;
  • 想看哪一段,直接跳过去。

② 更方便整理与复习

每个人习惯不同,有人喜欢导图式的“全景鸟瞰”,有人习惯大纲 + 文字稿。 我们希望通过导图 + 大纲 + 文稿这套组合,让大家可以按自己的方式去整理,把内容从“看完就忘”变成“随时能复盘”。

640 (26).webp

总之,结构化输出带来的,是 10 倍级别的学习效率提升,这件事我们会一直死磕下去。


7、用户上传的音视频等内容,会如何被加密保护?是否会被用于模型训练?在数据隐私与合规方面,你们采取了哪些安全措施?

这一点我们态度非常明确:

  • 用户上传的音视频,在处理完成之后会从我们的处理链路中删除;
  • 传输过程采用加密通道,防止中途泄露;
  • 不会把用户的原始数据拿来训练模型或做其他用途。

在招聘、医疗、企业内部培训等场景下,大家对隐私的敏感度都很高,我们也希望做到“让用户敢放心把最重要的内容扔进来处理”。


8、接下来几个月,Ai好记有哪些计划中的更新或迭代方向?今年年底前,你们希望上线的重点功能或改版目标是什么?

如果用一句话概括:现在的 Ai 好记,还只是我们理想形态的一半。

今年年底前,我们主要会围绕三个方向发力:

① 支持更多模态输入

从“音视频整理工具”升级为真正的 AI 多模态知识库。 除了音视频,我们会支持:

  • 文档 / PDF
  • 网页内容
  • 其他文本输入……

用户扔进来任何一种内容,都能得到统一的:图文稿 + 总结 + 导图。

② 知识库联动与复习能力

我们希望打通不同笔记之间的壁垒,让用户可以:

  • 跨视频 / 文档进行主题检索和问答;
  • 按“主题”关联内容,而不是按“文件名”找内容;
  • 逐步构建属于自己的一个“知识图谱”。

③ 移动端体验的全面升级

我们会重点打磨 App 端体验,让用户 在手机上也能完成完整流程: 从导入内容,到阅读笔记、看导图、碎片时间复习,不再受限于 PC。

此外,我们也在筹备海外站的上线,计划支持更多国际主流平台。并探索与部分硬件厂商合作,让「Ai好记」出现在更多实际学习和办公场景中。


9、10 分满分的话,你愿意给你的产品打几分?理由是?

我会给它 7.5 分

这个分数背后其实是两点:

  • 一方面,它确实已经解决了很多用户的真实痛点,这是值得肯定的;
  • 另一方面,离我们心目中的“终极形态”还有很长一段路,我对它的期待会更高。

我希望有一天,它是那种你一接触到新知识、下意识就会打开的工具。 现在我们还在这条路上,边走边打磨。


10、除了自己的产品,你平时还有在用哪些 App 或网站?有没有哪些工具或设计,曾启发你在产品上的创新?

我经常用的有:

  • Obsidian(知识整理 / 双向链接)
  • 微信读书、语雀(阅读与笔记)
  • Cursor、Claude Code(写代码提效)

Obsidian 对我们的启发很大——它让我更直观地看到“知识节点互联、形成网络”的价值。 我们现在已经打通了 Obsidian,用户可以直接把 Ai 好记里的笔记导出到 Obsidian,在自己熟悉的体系里进行二次整理。

未来在 Ai 好记内部,我们也会往“知识库之间互相关联”的方向走,让笔记和音视频内容能互相“串起来”,形成更清晰的知识网络。

语雀、微信读书 的阅读与整理体验,也影响了我们对“沉浸式阅读”和“笔记管理”的设计。我们希望用户转换后的图文笔记,是那种你可以安心把它当“书”来看的,而不仅仅是“扫描一下总结就走人”。

至于 Cursor、Claude Code,对程序员来说已经是“标配”了。它们提升了我写代码的效率,也从侧面不断提醒我: ——真正提效的工具,就是最打动我的工具。 这其实也是我做 Ai 好记的一个底层动力。


11、平时生活中你都有哪些工作或生活习惯?

我做事有个比较典型的方式:自上而下(Top-down)的拆解习惯。

简单说就是:

  1. 先确定一个清晰的目标;
  2. 再逐层拆解任务,直到拆成“最小可执行单元”;
  3. 每个小任务都要能够被评估结果、估算时间。

这样做的好处是: 事情的进度、完成度都是可量化、可感知的,不容易陷入那种“忙了很久,但不知道自己在忙什么”的状态。

在团队协作上,我也会尽量要求大家这么做: 每做一个需求前,都要先拆清楚任务,而不是一头埋进实现里。


12、请用一句话打动用户并让她使用你的产品

在信息过载的当下,用 Ai 好记,高效沉淀你自己的高质量知识库。