Avsnitt

  • 本集深度简介

    这期Lewis和Will从内部视角拆Google大模型这几年的产品与工程博弈。开篇直击Flash 3.5这次三倍涨价:Flash当年根本不在产品线规划里,是Pro升级速度掉到两三倍、time to first token撑不住聊天机器人客户三秒drop 30%用户的硬指标,才在一个月内紧急训练出来的"意外惊喜"。

    慢一点换更高智能是不是好trade off?

    Google为什么先发Flash,而不是Pro?

    我们聊到token定价的玄学:成本算得清,但定价全靠先到市场的定价权,Google和Anthropic早期只能跟着 OpenAI;以及从去年12月Opus拿到编程这个break out use case后,整个行业从打价格战转向每次发布都涨价的拐点。

    后半段我们聊到Gemini在ChatGPT上线前两个月、从七人小组到百人团队,为什么DocAI数据如何反哺Gemini的文档理解能力,还有PM与工程师在Flash-lite免费策略上的真实对抗。

    时间线索引

    00:00 开场 + 听众参与的新尝试

    00:45 Flash三倍涨价

    04:29 产品思维vs工程师思维

    14:54 token定价玄学

    21:44 谷歌为什么迭代慢

    26:16 下一个跃进

    32:02 Gemini诞生史

    40:40 上周趣闻

    我们聊到的话题

    Meta发布250亿美元企业债券全(https://www.reuters.com/technology/meta-weighs-big-equity-raising-finance-ai-infrastructure-ft-reports-2026-06-05/)

    Gemini Diffusion (https://deepmind.google/models/gemini-diffusion/)

    OpenRouter的模型排行(https://openrouter.ai/rankings)

  • 本集深度简介

    这一期我们拆Genspark.ai,这家由前百度小度核心高管2023年在硅谷创立、靠20人团队做出爆炸式营收和成长的公司。从对标Perplexity起步,agent来了之后果断放弃旧use case,靠生成PPT和"Call for me"打电话功能在日本意外出圈。我们和Manus做对比:同样的中国团队、同样的领域、接近的估值,但Manus收购被叫停,Genspark还在自己往前跑。

    硬核的讨论集中在它到底有没有护城河。Genspark号称背后接了70个模型,做了大量harness和plumbing的脏活累活,按场景在速度、成本、智能三者间做编排。但Lewis的判断是这种差异化正在快速收窄。它没自己的模型,go-to-market不如微软、谷歌、所谓数据飞轮也比有直接入口的大厂差两三个数量级。

    我们也戳穿了估值游戏:200万月活、ARR这些数字里的灰色地带怎么算、为什么早期融资只需要说服一个投资者、为什么这阶段该死磕增长而不是留存。延伸聊到大厂高管创业的反直觉优势(人脉、招人、决策力)与眼高手低的陷阱。最后一个真问题:没有模型、没有数据中心,Genspark为什么要融4亿多美金,是走企业路线?还是砸钱做市场营销?还是要去做自己的模型?

    时间线索引

    00:00 拆Genspark

    02:42 把agent缝进Workspace

    04:26 70个模型的harness编排

    09:01 Office与workspace的护城河

    12:15 Distribution is king

    16:06 200万月活与ARR的水分

    20:43 增长还是留存

    27:50 高管创业的陷阱

    40:26 上周趣闻Opus 4.8和workflow

    我们聊到的话题

    Claude 4.8发布: https://www.anthropic.com/news/claude-opus-4-8

    Claude code workflow: https://code.claude.com/docs/en/workflows

    Manus出圈demo: https://www.youtube.com/watch?v=K27diMbCsuw

    Semrush关于Genspark的流量数据:https://www.semrush.com/website/genspark.ai/overview/

    Decagon (AI电话客服): https://decagon.ai/

    Gamma (AI Slide的竞品): https://gamma.app/

  • Saknas det avsnitt?

    Klicka här för att uppdatera flödet manuellt.

  • 这期播客Lewis和Will两个Google前员工从内部视角复盘I/O 2026。这次Google居然没launch Gemini 3.5 Pro,只先放了Flash。Lewis拆当年做模型的真实困境:Pro和Flash差距拉不开,4倍价差定不出来,所以只能Flash先行,这条线索一直贯穿到现在。

    Will从Agent经济学算账:token cost指数级失控已经压不住了,何凯明的paper直接质疑per-token定价模式,Google押注cost+speed+live mode的300ms TTFT,未来一年可能才是真正的position优势。

    我们也毫不客气吐槽Antigravity 2.0:IDE概念升级后直接消失、紧急公关加回button、还和Gemini CLI重复造轮子——典型的大厂病。还聊了Gemini Spark的命名内幕、Omni到底是真unify还是换壳、World Model有没有research支撑。迭代意料之中,Distribution is the King才是Google真正的护城河。

    时间线索引

    00:00 Gemini 3.5 Flash登场

    02:46 Flash好迭代、Pro难拉开差距

    11:00 Omni多模态

    16:17 Antigravity 2.0

    22:24 Gemini Spark

    26:54 I/O整体复盘

    31:11 拓展新闻

    我们聊到的话题

    OpenAI解决80年的数学问题(https://openai.com/index/model-disproves-discrete-geometry-conjecture/)

    STATE-Bench (https://opensource.microsoft.com/blog/2026/05/19/introducing-state-bench-a-benchmark-for-ai-agent-memory/ )

  • 7个人、0融资、25M ARR。Obsidian把VC那套增长叙事撕得稀碎。这期拆这家"反硅谷三件套"的笔记公司:当Mem烧掉OpenAI Startup Fund 25M、Reflect/Tana/Heptabase全军覆没时,它靠不做AI、不上云、不tracking用户活下来了,反过来成了Claude最好的context层。

    第一,所有人都把Obsidian的护城河归因于local文件,错了。真正的壁垒是用户full control激发的创新意愿,你在vault里投入几百小时搭的知识图谱,那个能力是你自己的,但你迁不走。这和Databricks、AWS账单复杂到看不懂是同一套设计哲学:complexity by design,把摩擦本身做成粘性。

    第二,Obsidian连自己有多少DAU都不知道,by default不tracking。这种反产品经理姿态意外变成了preserve privacy的卖点,但同时也是它走不了VC路线的根本卡点。

    第三,过去几年Mem烧光OpenAI Startup Fund的23M、Reflect、Tana、Heptabase这批AI first note taking集体扑街,反AI的Obsidian反而被Claude反向成就。Markdown格式让Claude Code能直接读你的vault。Note Taking可能已经走到头,Note Seeing才是下一站,Note for Agent才是新的契合点。

    我们也辩论了拿不拿VC的浪漫主义vs幸存者偏差、早期投资投人还是投增长、以及Notion和Obsidian长期谁能赢这场battle。

    我们在这期聊到的一些公司和话题:

    Obsidian (https://obsidian.md/)

    Obsidian-Claude (https://github.com/AgriciDaniel/claude-obsidian )

    Knowledge graph conference 2026 (https://www.knowledgegraph.tech/)

    BitNet b1.58 2B4T Technical Report (https://arxiv.org/pdf/2504.12285)

    时间线索引

    00:00 Obsidian的反硅谷三件套 - 7人/0融资/25M ARR

    02:49 不做AI却被AI需要: 反增长叙事下的护城河悖论

    05:47 local-first真正的护城河不是数据归属,是full control带来的创新粘性

    08:51 Complexity by Design: 从Obsidian门槛到Databricks账单的同一套留人逻辑

    12:43 反AI的注脚: 手动knowledge engineering vs AI主动capture的矛盾

    15:12 浪漫主义创业vs把VC当validation筛子: 拿不拿钱的底层判断

    22:31 Obsidian不做用户tracking:反产品经理是principle还是历史包袱

    26:14 估值只能go up: seed轮拿多少钱的双刃剑

    29:31 Note Taking正在消亡: Notion和Obsidian谁能跑赢note seeing时代

    33:50 Collaboration绕不开上云: Note for Agent才是真正的破圈口

  • 这一期《硅谷温差》,我们把手术刀对准了RAG时代的明星初创公司Unstructured.io。当所有AI Lab都在追求模型层面时,Unstructured.io却在ChatGPT发布的三个月前就瞄准了那些被大厂工程师“不屑一顾”的脏活: 文档预处理 。

    在RAG爆火的这两年,Unstructured.io凭借对65种复杂文件格式的暴力拆解赢得了开发者口碑和近600万开源的下载量。但作为资深建设者,我们必须直面那个温差:

    在工程实现上,帮你搞定 PDF 里的表格确实很爽,但这足以支撑一家初创的估值吗?

    在Vibe Coding盛行、大模型厂商开始下沉并原生支持数据的今天,单纯的Plumbing还能维持多久的技术红利?

    本期节目,Lewis和Will深度拆解了这家由前CIA分析师创立的明星项目。讨论了它如何利用ChatGPT发布前的空窗期,通过的深度绑定和开源快速占领开发者心智。面对Vibe Coding带来的开发门槛下降,以及OpenAI、Google等巨头直接在接口端集成文件处理能力,第三方工具的结构性摩擦正在显现。

    针对Unstructured.io面临的0.02%极低付费转化率及云服务商的围剿,我们结合各自在微软和Google的实战经验,为企业级数据创业指出了三条路:垂直化深耕、深度整合平台生态、以及从简单的RAG转向更硬核的Context Graph建设 。这是一场关于“护城河”消失与重构的深度复盘。

    我们在这期聊到的一些公司和话题:

    Unstructured.io

    OpenAI据传开始研发自己的手机

    Vertex AI重新命名Agent platform

    Lovelace.ai

    时间线索引

    00:00 新系列开场:拆解早期初创的商业模式与技术护城河 。

    00:45 Unstructured.io 的野路子:CIA背景的创始人和文档脏活”。

    02:57 从智能到管道:为什么Plumbing在RAG时代更具穿透力 。

    08:14 开源与PLG陷阱:600 万次下载背后,为何换不来高效的企业级转化 。

    11:18 大模型原生下沉与Agentic Search对传统管道的降维打击 。

    24:24 CEO视角的破局方案:垂直化深耕、Context Graph建设与寻找Founder-Product Fit 。

  • 在 AI Lab巨头不断迭代的背景下,初创公司的边界在哪里?本期节目中,Lewis 和 Will 结合自身在硅谷的观察与实战经验,深度拆解了垂直领域AI (Vertical AI) 的创业机会。我们聊到了为什么VC正在从看好平台型公司转向量化垂直领域的深度,以及如何利用领域知识 (Domain Know-how)和私有数据在法律、农业、医疗等传统行业构建核心壁垒。

    VC为何警惕模型层创业,以及初创公司如何通过深挖垂直业务场景来避免被大模型一波带走。

    为什么“技术大牛 + 行业老炮”是 AI 时代最完美的创业拍档?

    我们深挖了几个行业案例

    Harvey AI: 法律初创公司如何通过ChatGPT切入,并迅速拿下普华永道等大单。

    EvenUp: 如何利用法律文书等 LLM 无法爬取的“私有数据”构建护城河。

    Blue River Technology: 斯坦福博士如何通过给杂草喷农药这个极其细分的场景,被John Deere以3.05亿美元收购。

    AI时代的“个人 SaaS”: 讨论了随着AI提效,未来的软件行业是否会像自媒体一样,进入万众SaaS的繁荣时代。

    本期我们聊到的话题:

    Harvard Business Review - Heavy Machinery Meets AI

    Uber CTO说4个月用完了全年的Claude budget

    John Ternus接管Apple掌门人

    时间线索引00:00 播客开篇:为什么在AI创业中选择“小而美”的垂直赛道01:59 避开LLM wrapper陷阱:投资人眼中的硬核技术与垂直壁垒05:32 完美的创业组合:当Domain knowledge撞上工程实现09:00 Harvey vs EvenUp:深度垂直与私有数据带来的非线性优势13:32 工程思维 vs 业务思维:从处理dirty work到构建知识图谱15:42 寻找生态位:服务AI labs的plumbing work与模拟环境构建17:13 定制化粘性:复刻Palantir模式,提高客户的迁移成本24:52 案例复盘:Blue River如何靠解决一颗“杂草”实现数亿美金退出30:56 个人SaaS时代的到来:大厂裁员背景下的long tail机会36:03 终极思考:当AI接管了专业技能,人类的价值锚点在哪里

  • 每个人都讨厌繁琐的报销程序,在AI Agent的时代,这种被软件奴役的日子可能到头了。在本期《硅谷温差》中,Lewis和Will将深入拆解在硅谷被热议的话题:SaaS真的死了吗? 如果软件不再需要图形界面,如果学习成本归零,那些估值百亿的SaaS巨头还能靠什么活下去?

    UI的终结: 为什么自然语言才是最终的终端?当Agent接管了所有的脏活累活,复杂的菜单和按钮将彻底消失。

    护城河的转移: 代码不再值钱,逻辑可以被AI抄袭。在Agent时代,企业的真正壁垒是那些藏在员工脑子里的Tribal Knowledge和不可复制的核心数据。

    商业模式的革命: 订阅制已老,基于结果的定价到底有没有出路。

    商业新物种: 为什么未来会出现2人组成的10亿美金公司?

    无论你是SaaS行业的创业者、开发者,还是每天在各种软件系统里挣扎的打工人,这一期都会让你重新思考:在AI时代,我们到底需要什么样的工具。

    本期我们聊到的话题:

    Menlo Ventures: Software Finally Gets to Work: The Opportunity in

    Claude最新发布的Managed Agent

    Claude的Memory API

    时间线索引

    00:00 UI之死:为什么Agent时代手动填表是效率自杀01:59 交互重构:自然语言如何让专业软件的学习成本归零04:16 Intent驱动:从完成任务到记住意图的边际收益转换06:29 SaaSforAgent:当MCP协议与Skill成为软件的新形态07:46 护城河迷思:为什么BusinessLogic在Token面前不再保值11:42 TribalKnowledge:散落在文档之外的非数字化数据才是真堡垒16:28 算力套利:小模型(SLM)与开源模型在成本战中的战略地位19:05 定价博弈:Outcome-basedpricing如何重塑SaaS毛利结构24:00 组织变革:5个人能撑起10亿营收吗?劳动力与算力的对调34:01 VerticalSaaS:垂直领域如何靠业务深度对抗通用智能的蚕食

  • 欢迎收听《硅谷温差》第三期!最近的 AI 圈简直像是按下了快进键,Lewis 和 Will 从 Andrej Karpathy 的一条推特聊起,面对一个月上千篇的论文和层出不穷的新工具,身处硅谷风暴中心的我们也真真切切地感受到了前所未有的“AI 焦虑”。

    当“Link Memory”这样的想法在 48 小时内就能被社区代码化,当一个月像过去的一年一样漫长,身处旋涡中心的我们该如何自处? 本期节目,我们不仅聊焦虑,更在聊边界的消失与新秩序的建立:

    协作关系的瓦解与重组: 为什么曾经 1 个产品经理、1 个设计师配 10 个工程师的“黄金比例”正在消失? 为什么现在的设计师已经开始写 API Spec?

    核心竞争力的回归: 如果 LeetCode 的算法题已经失去了筛选意义,未来的面试会不会变成长达 6 小时的 Agent 协同实战? 为什么说深厚的计算机科学底层功底,反而在 AI 时代成了更大的“杠杆”?

    “一人公司”的兴起: 两人创业就能撬动 18 亿美金年营收? 我们聊了聊 Base44的案例,探讨如何利用 AI Agent 构建属于自己的数字孪生团队。

    信息过载的自救: 面对每天如洪水般的技术推文和论文,我们分享了各自的信息脱水秘籍——从 AI 自动过滤到“让信息飞行一个月”的沉淀法则。

    节目中我们聊到的话题:

    Pessimists Archive

    Crunchbase: Q1 2026 Shatters Venture Funding Records As AI Boom Pushes Startup Investment To $300B

    Latency Space

    Gary Marcus

    纽约时报: A.I. Could Change the World. But First It Is Changing Silicon Valley

    时间线索引

    00:00 信息过载下的防波堤

    04:15 VibeCoding与手写代码的黄昏

    07:24 黄金比例的坍缩

    11:59 单兵能力的指数级放大

    14:45 工程师的医生化转型

    18:56 一个人的独角兽。

    24:39 警惕VibeCoding陷阱

    33:16 大厂招聘的底层博弈

    36:41 产品经理的硬核壁垒

    38:34 专家过滤机制

  • Jensen Huang说AGI已经来了,但你的Agent可能连半小时前的对话都还没理顺。现在的 Agent Framework里,Memory是最不完善、最有潜力的那个组件。

    这期播客我们为你拆解那些被包装成黑盒的真相:

    为什么堆长度解决不了“长情”的问题?

    状态冲突的噩梦,看看那些让架构师崩溃的工程现场。

    知识图谱的文艺复兴: 这个老技术在 AGI 时代真的还有救吗?

    这是一场关于Agent + Memory = AGI? 的深度复盘。不谈科普,只谈实战中的坑。

  • 本期节目《OpenClaw到底是生产力神器,还是高级玩具?》,我们将聚焦最近最火的自主 Agent 框架 OpenClaw,深入分享我们的实战心得。

    大多数 AI 的突破,都发生在高深技术与日常应用的交汇点。在本期节目中,Lewis 和 Will 将带你深入探讨现实中的如何将底层的 AI 模型转化为高效的生产力引擎。无论你是开发者、产品经理,或是对 AI 未来充满好奇的观察者,你都将看到像 Openclaw 这样尖端的智能体(Agents)如何超越消费级的“热度”,重新定义自动化与效率。

    Will和Lewis分享了他们从资深用户进阶为创新者的心路历程,揭秘AI如何深度嵌入生活的方方面面:从利用 cron Job 管理个人财务,到AI驱动的迭代实验设计日式庭院。与此同时,拆解了部署系统时的实战挑战,从本地机器的开发环境搭建,到生产环境中的风险控制与安全管理。

    我们提到的内容

    Kimi杨植麟GTC2026演讲Alpha Evolve

    内容时间轴

    00:00 生产力神器还是高级玩具:Openclaw 在复杂项目中的多任务上下文瓶颈。02:32 架构深度对比:为什么 Discord 频道的 Channel 逻辑比 Claude Code 更适合处理 AI Strategy。07:55 算力与隔离的结构性矛盾:128G 内存本地运行 vs. GCP 云端隔离的权衡与 Connector 补丁。12:30 递归式进化:用 Openclaw 改写自己的内存层(Memory System)及故障自恢复的小技巧。19:28 价值度量重构:从代码行数到 Impact per Token,如何定义 Agent 时代的开发者绩效。27:13 Agent 的终极形态:从手机媒介的局限性到“24/7 全知助理”的硬件想象空间。