Avsnitt

  • 随着Llama 3的发布,国内各路英雄豪杰纷纷开启了炼丹之旅。Llama-3 8b在惊人的15万亿令牌上训练,而Llama-2仅为2万亿。毋庸置疑,Llama 3目前是开源大模型中能力最强的!其跑分成绩已经赶上了GPT-4。




    然而,Llama3的优势不仅限于此。作为开源大模型,每个人都可以对其进行个性化的定制,这意味着相比GPT,它具有更强的定制性和安全性。另外,Llama3 8B的模型可以在内存只有8G的树莓派上运行,对于计算机资源的依赖比以往都要低,人人都可以本地部署Llama3,可应用于针对B端企业和各种场景下的自然语言处理、机器翻译、文本生成、问答系统、聊天机器人等场景。


    目前,我们主要通过微调(Fine-Tuning)来定制所需的模型。例如,Llama 3原生不支持中文,但我们可以通过微调让它支持中文。

    什么是微调(Fine-tuning) ?这是机器学习和深度学习中的一个术语。它指的是在预训练模型的基础上,使用特定任务的数据集进行额外训练的过程,目的是让模型更好地适应特定的任务或问题。通过微调,我们可以调整模型的参数,使其更精准地解决特定问题。


    就像一个已经非常了解世界的成年人。现在,我们需要它去学习一些更专业或更具体的知识。微调的过程,就像是对这个成年人进行一些专业培训,使其在特定领域更加精通。

    为了帮助大家更好的理解什么是“微调”,我前天写了一篇轻松的入门教程《Llama3微调教程:超简单,人人都可以打造属于自己的GPT!》:

    地址:https://mp.weixin.qq.com/s?__biz=MjM5NDIzOTg0Mw==&mid=2448257753&idx=1&sn=627c94e8b0d66bc9866ab4a42edaaa73&chksm=b29316d585e49fc312553b5efaca684af566be55237b8c4e2a1d9a472dd31f7ee74157c08163&token=1764237450&lang=zh_CN#rd


    就算你不懂技术也没有关系,通过这个简单的Llama 3微调案例,我们可以免费体验整个大模型微调的过程。你可以学习到AI工程师是如何进行环境配置、数据准备、模型训练、模型运行、模型保存以及本地模型使用。


    这对于大多数普通人来说,这是一个免费体验AI工程师工作方式的机会;如果你想转入AI行业,这也是一个很好的入门案例。
    你可以通过我的微信公众号“PM熊叔”浏览。


    另外在Shownots中,我列出了目前已经微调好的Llama3作品,大家如果有兴趣可以体验一下。


    愿每个人都能从中受益,开启自己的AI探索之旅!

    以下是一些微调的llama3的作品:


    llama3-Chinese-chat-8b:https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b
    Instruct + 进行中的中文sft版本:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary
    联通微调版本:https://www.modelscope.cn/models/UnicomAI/Unichat-llama3-Chinese/summary
    Openbuddy微调版本:https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-8b-v21.1-8k/summary
    破解安全限制系列(目前仅支持英文):
    Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8B
    neural-chat:https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b
    聊天机器人:https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b
    Bunny-Llama-3-8B-V(多模态图文版本):**https://wisemodel.cn/models/BAAI/Bunny-Llama-3-8B-V

    我的公众号:

  • 今天要介绍的这篇文章《The Bitter Lesson 苦涩的教训》是由知名计算机科学家,阿尔伯塔大学、DeepMind的神经网络专家Rich Sutton 在 2019 年发表的,主要讨论了在人工智能研究中一个重要的观察:当简单的算法能够利用大量的计算资源时,往往会胜过依赖于人类专家洞察力的复杂算法。


    在回顾AI历史上一些关键进展时,Sutton指出,虽然研究人员曾多次尝试通过设计复杂且模仿人类理解的算法来提升机器学习模型的表现,但通常更简单、更基本的方法,只要能通过增加计算能力进行扩展往往能取得更佳效果。他强调了规模和算力的重要性,并认为未来的研究应该更多依赖于扩算力,而非复杂的设计。


    OpenAI 在2021年的论文《神经语言模型的缩放法则 Scaling Laws for Neural Language Models》讨论了AI模型的性能如何随模型大小、数据集大小和训练计算量的规模提升而提升。


    今天,在缩放法则(Scaling Laws)的加持下,简单的Transformer架构让GPT等大语言模型涌现出了“能”,也展示出了AGI通用人工智能的可能性。


    现在就让我们来读一读,回顾这篇经典文章。


    苦涩的教训


    Rich Sutton  2019年3月13日


    我们从70年的人工智能研究中可以得出的最大教训是,利用计算的通用方法最终是最有效的,而且差距很大。其根本原因在于摩尔定律,即集成电路上可容纳的晶体管数量每隔18-24个月会翻倍,从而使芯片性能指数倍增。


    大多数人工智能研究都是在假设智能代理可用的算力资源是恒定,在这种情况下,利用人类知识是提高性能的少数行之有效的方法之一,但在略长于典型研究项目的时间内,大规模的计算量又不可避免地会变得可用。


    研究人员寻求在短期内实现改进,试图充分利用他们对特定领域的人类知识来节省算成本,但从长远来看,唯一重要的是利用计算资源。这两者不必相互对立,但实际往往如此。由于对一种方法的投资存在心理承诺,我们在一个东西上花费大量的时间,就不会在另一个上花费更多时间。而且,基于人类知识的方法往往会使方法复杂化,使其不太适合利用计算的通用方法。这些案例不胜枚举,我称之为苦涩的教训。


    作为人工智能研究者,我们学习这些教训是有指导意义的。下面,我们来回顾其中一些最知名的案例。


    在1997年,计算机国际象棋领域见证了一个历史性的事件——计算机通过大规模深度搜索击败了世界冠军卡斯帕罗夫。当时,大部分研究者都倾向于利用人类对棋局结构的深入理解来设计算法,这一失败让他们颇感挫败。当一个相对简单的基于搜索的方法,结合先进的硬件和软件展示出惊人效力时,依赖人类知识的方法显得力不从心。这些研究人员对于“蛮力”搜索的胜利持怀疑态度,认为虽然这次有效,但它并非一种普遍用的策略,也不符合人类下棋的风格。他们曾希望能通过更贴近人类思维的方法取得胜利,因此对结果感到失望。


    计算机围棋的研究历程展示了一种类似的发展模式,但这一过程比其它领域晚了大约20年。初期,研究者们尝试通过利用人类的棋知识和游戏特征来减少搜索需求,但随着搜索技术在规模上的有效应用,这些努力最终被证明是无效甚至有害的。同样,自我对弈的方式学习价值函数也显示出其重要性,这种方法不仅应用于围棋,在国际象棋等许多其他游戏中也同样适用,尽管在1997年首次战胜世界冠军的程序中,学习的作用不大。自我对弈不仅是学习的一种方式,它像搜索技术一样,使得可以利用大量计算资源。搜索和学习是利用大规模计算的两个关键技术,在计算机围棋和国际象棋的研究中,尽管研究人员最初依赖于人类的理解来减少搜索的需要,但最终还是通过采用搜索和学习技术取得了显著的成就。


    在语音识别领域,20世纪70年代DARPA主办的早期比赛中,参赛者采用了包括人类发音知识在内的各种特定方法,例如对单词和音素的认识。相对的,一些新的统计方法采用了更多的计算,并基于隐马尔可夫模型(HMMs)进行操作。结果显示,统计方法优于那些基于人类知识的方法,这一发现推动了自然语言处理领域的重大变革,并在随后的几十年中逐渐成为主流。深度学习在语音识别中的崛起标志着这一发展方向的进一步演进。


    深度学习方法较少依赖人类知识,而是利用大量计算资源,通过在庞大的训练数据集上进行学习,显著提升了语音识别系统的性能。研究人员原本希望开发出能模仿人脑工作方式的系统,并尝试将这种理念应用于他们的系统设计中,但这种方法最终被证明是适得其反,甚至是对时间的浪费。尤其是在摩尔定律推动下计算能力大幅提升并找到有效利用方式的背景下,这种做法更显得没有必要。



    计算机视觉领域也遵循了相似的发展模式。在早期,研究者们试图通过识别边缘、圆柱形等广义结构,或使用SIFT特征来处理视觉信息。然而,这些方法如今已被淘汰。现代的深度学习神经网络主要采用卷积技术和某些类型的不变性处理,并且在性能上有了显著提升。


    这一趋势给我们的教训是深刻的。作为一个领域,我们似乎还没有完全吸取这一教训,因为我们依然重复着相同的错误。要真正理解这些错误的诱惑,并有效地避免它们,我们需要认识到依据我们所认为的思考方式构建方法最终可能不会奏效。这是一个我们必须接受的苦涩教训。


    从这些历史经验中,我们汲取了一些重要教训:


    1 )人工智能研究人员经常尝试将人类的知识整合到他们的智能系统中。2) 短期内,这种方法似乎总是有益的,并且能给研究人员带来满足感,但长远来看,它可能导致发展停滞,甚至阻碍进一步的创新。3) 真正的突破通常来自于完全相反的策略,即通过扩展搜索和学习能力来充分利用计算资源。尽管成功令人欣慰,但这种成功往往带有苦涩,因为它是在放弃了受青睐的、以人为中心的方法后才实现的。


    从这些经验中我们应该学习到的第一个重要启示是,通用方法的强大力量在于其扩展性,即使在可用计算资源极大增加的情况下也能持续有效。搜索和学习是目前看来能在这种环境下无限扩展的两种方法。


    第二个重要启示是,关于大脑的实际工作原理的极端的复杂性;我们应该放弃试图以简化的方式来理解大脑的工作,如简单地处理空间、物体或对称性等。这些概念都是外部世界中复杂性的一部分,本质上是难以简化的。试图将这些复杂性内置于系统中是不切实际的。


    相反,我们应该专注于内置能够探索并捕捉这种任意复杂性的通用方法。这些方法的核心优势在于它们能找到有效的近似解决方案,但寻找这些解决方案的过程应该是自动的,而不是依赖于我们的直接输入。我们希望人工智能代理能够自主探索和发现,就像我们一样,而不是仅仅复制我们的现有知识。将我们的发现硬编码到AI系统中,不仅限制了系统的学习潜能,还加重了我们理解这些发现过程复杂性的困难。


    观点


    Rich Sutton《苦涩的教训》原文到这里就结束了,我想聊聊我自己的观点和感悟:


    人类总是习惯将自己对于世界的认知注入于亲手打造的系统之中,但是历史一次又一次的证明这种有效性只是短期的,从地心说到日心说,从经典力学到量子力学,从专家系统到大语言模型,当每一次科学革命到来之时,那些越是符合直觉的经典理论越是岌岌可危。


    《金刚经》有云:“一切有为法,如梦幻泡影”,我们当前观察到现象和规律,可能都只是暂时的。那这个世界运转的逻辑到底是什么?


    设想一下,如果你是这个宇宙的程序员,拥有无穷的时间和算力资源,你会如何设计这个世界? 



    智能设计论者说:沙漠中不会凭空产生精美的手表,所以精密的人体一定是被有意设计出来的。但是你作为一个想要摸鱼的程序员,其实对于细致入微的设计全宇宙中所有的生命体可能并没有太大兴趣,你只关心能否用最简单的算法让DNA持续地演化,演化出智能体,再让他们做那些你不想做的事情。


    遵循“缩放法则(Scaling Laws)”依然是你最佳的选择,因为你不用操心这个宇宙的每一个角落的细节,你只要设计最基本的法则,并允许系统在这些法则指导下自我组织和进化,剩下的事情交给无限的时间和算力就好了。


    正如480年前,哥白尼坚信上帝相信简洁优雅的规则,因此有了日心说:“天体运动的真实模型应该是基于数学的完美和简洁,而日模型相比地心模型在数学上更为简洁和优雅”。


    而今天,AI领域的进展告诉我们“简洁优雅的数学模型”依然有效,只要简洁的设计和上大尺度的数据训练,就能拥有强大的鲁棒性和智能性的系统。


    佛法有云:“缘起性空;自见成佛”。这可能才是我们这个世界的本来面目。




    欢迎订阅我的播客和知识星球。




  • Saknas det avsnitt?

    Klicka här för att uppdatera flödet manuellt.

  • 前天,我参加了洪宇的《遇见AIer》的播客节目的录制,聊了聊ComfyUI的Mixlab Node背后的故事和AI产品经理关心的一些话题。如果感兴趣,大家可以去听下这期节目。

    # 缘起

    2023年10月,我和Shadow一拍即合,共同发起了“ComfyUI中文爱好者社区”,并把Mixlab Node纳入了议程。目前,社区已聚集了超过1000名ComfyUI创作者,包括行业内的ComfyUI大咖。Mixlab Node目前已获得600多个星标。


    https://github.com/shadowcz007/comfyui-mixlab-nodes



    我和Shadow都对AI创作工具及社区抱有浓厚兴趣。去年,我们见证了AnimateDiff和ComfyUI的崛起,并意识到国内迫切需要一个ComfyUI学习社区。这不仅为AI创作爱好者提供了一个交流和学习的平台,也吸引了一批热情的开发者和创意人才来共同开发ComfyUI的插件和工作流,这也促成了Mixlab Node的诞生。



    # 社区驱动型产品


    简而言之,Mixlab Node是基于Stable Diffusion和ComfyUI构建的节点工具。它的核心特色在于ComfyUI的高度灵活性,通过模块化设计让各种插件(或称为节点)能够无缝串联。这种设计使得用户可以轻松调用各类AI模型和处理模块,完成从图片生成到视频制作,甚至是接入大语言模型进行互动游戏的多样化工作流程。


    ComfyUI的开放性和模块化让开源社区的开发者能够迅速整合最新技术和模型到用户的工作流中,而我们的MixLab Node就是其中之一。


    Mixlab Node最大的特点就是“社区驱动开发”,在我们社群里面,开发者和创作者每天都会讨论大量的新技术动态和使用需求。我们的功能往往源自社区内部的实际反馈,确保了产品的实用性和创新性。


    例如,Mixlab Node加密功能正是基于社区反馈而生。当时我们社群中的一些大佬的工作流被一些人冒名顶替,引起了社群内的广泛关注。开源并不是做慈善,一个良性的生态环境,既要开放共享又要尊重个人创作权益,这样开源才有持续发展的动力。所以我们想有些工作流只有通过原作者提供密码才能继续使用。通过这种方式,不仅可以让创作者的原创作品免受盗用,还可以让优秀的创作者更好地活下去。


    相似的案例不胜枚举。Mix Node正是在这样一个开放、共享的环境中不断成长和优化的。通过与社区成员的紧密合作,形成了一个积极的、自我增强的闭环系统。这不仅推动了MixLab Node不断完善和进步,也为开源的AI创作贡献了自己的一份力量。


    # JUST DO IT的开发模式


    我和Shadow的首先达成的共识是,在AI时代我们必须要抛弃掉传统的思维方式。


    在传统的软件和互联网产品开发过程中,从需求收集到产品发布通常需要经历多个步骤,包括需求分析、文档撰写、评审会议,以及最终的开发迭代,这一系列过程往往耗时长达数周,然而,由于AI技术快速迭代,这种模式很难跟上技术进步的步伐。


    我们更提倡“Just do it”——有好的想法,那就先做了再说。我们直接从社区收集到好的创意就可以开始动手做开发,不需要给领导写报告,不需要撰写需求文档,更不需要走评审流程,做好后交给社群中的小伙伴们测试反馈。只有这样我们才能打造出更酷的节点。


    另外,通过使用GPT,可以把开发的时间极限压缩。例如,我们在GPT的帮助下,只花了1到2天内完成录屏工作流的开发和上线,这放在传统企业,起码两周才能搞定。


    录屏的需求的灵感来源于我们自己的创作视角的切换,我和Shadow都曾做过设计师,我们都想把自己的草图让AI重新渲染,但是主要的创作工具都在PS等传统软件上 ,因此想了个录屏功能,然后再考虑如何通过技术手段来实现。最后,我们发现录屏节点搭配LCM模型可以快速将草图变成精美的图片,这个功能出了以后,社区里面创作者也反馈非常积极,得到了很好的验证,也给我们带来了极大的成就感。


    “Just Do It”模式并不完美。随着MixLab Node功能的不断丰富,产品逐渐变得庞大,这引发了关于用户认知清晰度的担忧。Shadow建议是先集中实现功能,然后再考虑精简和优化。我们最终的期望是提供更完整的软件产品体验,而不仅仅是单一功能的模块。


    虽然初期采取“Just do IT”的策略有其必要性,但随着时间的推进,我们也会考虑如何降低用户的学习门槛。因此,在接下来的发展方向上,将包括开发教程和案例,帮助用户更好地理解和利用MixLab Node,同时也探索新的商业模式以确保项目的可持续性。


    # AI赋能个人成长


    在开发MixLab Node过程中,ChatGPT和GPT-4在提升开发效率中起到了关键作用。


    我以前做过前端开发,熟悉Javascript,但是对于Python一直都是一知半解。从前要掌握新的技术领域,我通常需要购买在线课程或书籍,先自学清楚然后才能动手实践。但是今天,我们只要向AI提出功能描述,它就能生成代码。通过持续地调试和优化,我们就可以实现所需要的功能。这种方法极大地缩短了学习与开发周期,仅仅三年前,这样的场景还是难以想象的。


    通过与AI工具的协作,即使是非专业程序员也能拓展自己的技术领域,提高对新技术的适应能力和问题的解决能力。


    在未来,真正能够称之为“精英”的,将是那些具备鲁棒性和深刻业务理解的人。


    鲁棒性也是称之为说泛化能力,是指你不会将自己限定在特定的岗位角色中。通过有效利用AI,你可以跨领域地解决问题。


    此外,深刻业务理解能力也依然重要,这样你才能识别并聚焦于有价值的真问题。这样全面的技能和视野,将使你在AI时代中突破重围,不仅仅是完成别人给你的任务,而是成为解决关键问题的关键人物。


    # 成为AI产品经理

    首先,无论是哪个领域的产品经理,基本功是必不可少的。这包括但不限于对需求的深刻分析与洞察、对用户和产品的深入理解。这些技能对所有产品经理来说都是共通的。当然,AI领域的特殊性在于,你需要对底层的技术手段有所了解,了解它们的潜力和限制。


    其次,运用AI能力不能异想天开。许多人有过高的期待,认为AI可以做到任何事,但实际上它的能力是有限的。我们需要理解这一点,并能基于此制定合理的产品策略,是AI产品经理的重要技能之一。


    因此 ,产品经理需要掌握目前流行的AI工具和“提示工程(Prompt Engineering)”。因为在AI的世界里,你需要知道如何与AI进行有效地交流,才能扮演好“用户与AI之间的桥梁”。更重要的是,当AI的回答不尽如人意时,需要知道如何调整你的产品方案,让它能获得更好的结果。这背后的逻辑和优化技巧,是很多传统产品经理所缺乏的。


    然后,培养自己的对社群的感知能力。AI产品的开发和迭代,往往需要用户的直接参与和反馈,需要建立和维护一个活跃的创作者社群。只有更接近用户,更好地理解他们的需求和期望,从而共同创造出更符合用户需求的产品。


    AI产品经理不仅要有坚实的基本功,还要懂得如何与AI合作,如何与用户合作,搭建AI与用户的桥梁。我相信,只要你愿意不断学习、实践并保持开放的心态,你一定能在AI时代的产品管理领域中找到属于自己的位置。


    # 尾声


    在这个迅速变化的时代,开放的创新文化和社区的集体智慧将成为推动技术前进和个人发展的核心力量。这不单单局限于开源AI工具或社区的构建,而是关于在AI的浪潮中我们如何持续创新、适应变革,并推动个人的成长。


    我们不仅需要重新审视传统的开发模式、学习方法和工作理念,还思考如何作为个体和社区共同前进。这对于任何在快速演进的世界中寻找自己定位的人来说都是深刻的思考题。


    我们不仅只是学会适应,还需要积极参与到变革过程中。我们既是技术进步的贡献者,也是个人及社区繁荣发展的推动者。


    欢迎加入“ComfyUI中文爱好者社区”!

  • 最近越来越多人在问类似的问题,AI都那么厉害了,还需要学编程吗?计算机专业依然吃香吗?特别是昨天很多人看到了Devin AI,更是产生了一种“是不是程序员要失业了?”的疑问。


    # AI 程序员能做什么?


    就在前几天,仅仅成立两个月的公司Cognition发布了一款Devin AI 的产品。它被宣传为史上第一款AI程序员。在演示中,Devin AI拥有自己的命令行、代码编辑器和浏览器等工具,可以自己制定计划、执行任务和解决问题,它可以独立完成整个软件的开发和构建的工作。


    另外,根据官方宣传,Devin甚至拥有“成长”的能力,它可以通过阅读文章,学习原先不懂的技术,还会自主寻找程序中的错误,并且进行修正。


    从宣传来看,Devin要比之前Copilot类似的AI编程助手要更进一步,更像一个能够独立完成开发任务的程序员。这不仅代表着AI独立完成开发工作的可行性,也激发了公众对“AI是否能替代程序员”的讨论。


    也有网友分析,其实Devin AI并没有想象中的那么厉害:首先,Devin的底层技术是基于GPT4,它的使用成本比普通程序员更高;其次,程序员的面试题并不难,ChatGPT也能胜任;还有就是执行的任务过于简单,和人类相比还是有较大差距。所以,人类程序员目前还是比较安全的。


    虽然如此,但是随着大语言模型的性能越来越好,在可预见的未来,AI程序员必然将软件开发过程中起到关键性的作用。


    # 有了AI还需要学编程吗?


    会不会现在学了编程,以后就没用了?


    我想这个问题可以类比为“有翻译软件了还需要学英语吗?”我相信很多人回答是:学习英语依然重要。


    诚然,英语已经成为许多人综合素质的一部分了。翻译软件不能百分百解决我们的需求。例如,要查询最新最全的论文和资料,懂英语可以让我们无损获得原本的信息,而翻译软件只是方便我们快速的浏览和过滤信息的工具。另外,学习英语不仅仅是学习语言,也是学习一种文化和思维方式。这样我们才能更好地与世界接轨。同样的逻辑也适用于AI和编程。


    首先,编程只是软件开发的一部分,编程是打开计算机世界的一把钥匙,计算机科学的复杂性远远超出了编程本身。它包括系统架构设计、网络安全、需求分析、用户体验和项目管理等诸多方面。这些综合性的知识和技能,才是软件创新基础。即使AI能够自动化编程任务,也需要人类来解决更复杂的问题,需要人类保持对行业趋势的敏锐洞察,他们需要理解业务需求,与非技术背景的团队成员进行有效沟通,确保技术解决方案能够满足业务目标。


    另外,编程不仅仅是写代码,它是解决问题的一种方式,也是一种思维训练。学习编程能够帮助人们培养逻辑思维、系统思维、创新思维以及动手解决能力。这些能力在AI时代尤为重要,不仅限于技术领域,同样适用于生活的各个方面。随着技术的不断进步,新的工具和平台层出不穷,个人需要能够适应这些变化,还要能在变化中找到创新的机会。这种适应力和创新力对于个人发展、职业生涯乃至企业的竞争力都是宝贵的资产。


    除此之外,编程并不是计算机学科的专利,它也是一种跨学科学习工具。在尝试解决来自不同领域的复杂问题时,编程能够通过数据分析、可视化、机器视觉和仿真模拟等技术手段,帮助整合和应用多学科知识,从而促进创新解决方案的产生。这种跨学科的视角不仅拓宽了我们的思维,也为AI程序员的任务分配提供了更加清晰的指导。让我们能够从更综合的视角理解和应用技术,进而更有效地推进项目和研究工作的进展。


    其实,AI本身还有很多需要迭代的地方。例如,AI科研论文、设计AI算法、提升AI性能、定制AI模型以及AI伦理安全方面,人类依然扮演着无可替代的角色。换句话说,正是因为AI的发展,为计算机专业人才创造了更多的挑战和机会。对于准备想实现自己的想法人来说,现在是学习编程的最好时机,学习编程可以更好地应用AI的能力,助我们实现很多的创意和想法。


    因此,面对“有了AI还需要学编程吗?”这个问题,我的回答是:绝对需要。


    # 讲讲我的经历


    我大学是学工业设计的,算理工科中的文科专业。原本编程这件事情对我来说是一件很有畏惧感的事情,大学仅有一门C语言差点挂科。但由于我对于互联网一直感兴趣,还有自己做产品的冲动,所以我临近毕业的时候,去学习了编程和软件工程相关知识。而之后又做了程序员、产品经理还有创业者,一路走来,有挫折也有收获。


    过去,我经常刻意隐瞒自己做开发的经历,生怕别人认为我的职业定位不够专注。但是多年以后发现能帮助到我的恰恰是跨学科能力。


    如果今天你是一位想自主创业的产品经理,究竟学过编程和不会编程的人在做产品方面到底有什么区别?


    首先,学过技术的产品经理在理解技术层面的细节上有明显优势。能更好地与研发团队沟通,能更精确地传达需求,能更好地理解团队面临的挑战,并在技术可行性和资源分配方面做出更合理的决策。这种深入的理解有助于建立团队成员间的信任和尊重,从而促进团队合作和项目的顺利进行。在这些年里,我和大部分开发同事之间都维持着不错的关系,因为团队合作没有什么比理解更重要了。


    其次,具备编程背景的产品经理在设计产品时,能更好地考虑到实现的复杂性和成本,会更重视需求价值,可以更好地制定MVP(最小化可行性产品)策略。特别在产品的早期规划阶段,你就能预见到某些功能的实现可能会遇到的技术障碍,不会把产品功能设计得过于复杂或者理想化,从而在设计上做出更加现实和经济的选择。让产品赢得了低成本地快速验证市场的时间。这种前瞻性不仅能够节省开发时间和成本,还能避免在项目后期进行大幅度的修改,提高了产品开发的效率和成功率。


    再者,了解技术原理,也能够让我们更好地把控产品体验。会去主动思考影响产品体验的技术指标,不会想当然地做一些脱离实际场景的理想化的功能。通过能够更好地评估不同设计方案的技术实现难度,能在设计和功能性之间找到最佳平衡点。这样的产品经理能够推动设计和技术团队更紧密地协同工作,共同创造出既美观又高效的产品。


    此外,编程经验还赋予了产品经理对新兴技术的敏感度和适应能力。AI时代,新技术层出不穷,具备技术背景的产品经理拥有较强的技术的敏锐度,能够更快地理解这些新技术如何被应用到产品中,以及它们对市场和用户体验可能带来的改变。例如,我经常会去Github上查看一些有趣的开源项目,学习一些新的技术课程,也会思考如何把它们应用到自己的项目和工作中。这种能力使得产品经理能够领导团队走在技术发展的前沿,创造出创新和有竞争力的产品。


    最后,通过学习编程,我还获得了一系列强大的思维工具,包括面向对象的编程思想、设计模式、以及统一建模语言(UML)等。这些工具提升了我的逻辑思维和系统思考能力,教会了我如何将复杂问题逐步分解成可管理的小任务,帮助我们对问题进行抽象和建模,让我更好地理解事物的运转模式,从而找到机会点。这在产品规划、市场分析还是项目管理中,都极大地帮助了我。


    步入生成式AI时代,大语言模型已经成了我不可或缺的助手。以往有很多灵光一现的创意,因为我的技术视野的限制而无法实现,它们最终只能沉睡在我的思绪中,逐渐被遗忘。但如今,我的一些突发奇想的灵感交给了GPT之后,它能很快地生成代码。虽然代码可能充满了错误,但GPT帮我快速拓展了技术视野,引导我去深入研究,并让我能对代码进行细致优化。例如,我在ComfyUI的Mixlab-Node的开源项目的开发过程中,有很多想法的实现就是通过与GPT协作来完成。


    因此,作为一名独立开发者或产品经理,我们应当把AI程序员视作一位协作伙伴。正是因为有了它的帮助,让我们可以在实现更有趣的功能的同时,节省下更多时间,让我们可以用来考虑赚钱的事情。


    # 总结


    当我们面对Devin这样的AI程序员的时候,我们并不要为程序员岗位感到过于的担忧。编程将会变成像外语一样的普遍性能力,人类通过学习编程,我们可以更好地发挥机器的能力。


    在AI的帮助下,越来越多的普通人可以实现自己的创意和想法,成为自己事业的掌舵人。在AI时代,必然是超级个体崛起的时代。


    在传统企业管理中,员工们扮演的是流水线上的零件。但是在这个AI变革的新时代,我们不应当把自己角色局限在某个零部件上,拥有灵活的思维、开阔的视野和敏锐的洞察力显得更为重要。


    只要我们把握好时代趋势,技多并不会压身。请快行动起来吧!

    欢迎加入ComfyUI中文爱好者社区,ComfyUI是一套灵活的AIGC工作流搭建工具。目前我们集结了一群跨界的设计师、程序员 产品经理和创业者。我们正在探寻AI的生成技术在各行各业的解决方案,每日社群里面都会有高质量的讨论。


  • 窜台参与麦田老师的播客录制,

    欢迎大家订阅她的播客专辑《麦田的职场圆桌会议》


    AI能成为你的小情人吗?

    AI如何感知我们的情绪?

    科技飞速发展下,我们如何抓住机遇,而不被AI



    本期播客带你深入探讨AI时代,我们该如何勇敢面对挑战,拥抱变革,用知识赋能自己的人生旅程!跟我一起思考,变得不可替代!

    【本期嘉宾】

    郝俊慧: 《IT时报》主编 资深媒体人  在科技报道领域深耕近20年,长期关注互联网、信息通信、人工智能等前沿科技。《IT时报》是中国最早的通信类媒体之一,前身为《上海邮电报》,具有近60年的产业传播历史。

    鑫声心生  :化学博士,双一流大学材料学科博士生导师,喜马拉雅播客智库成员,在职业规划,前沿科技方面著有多部学术著作,喜马拉雅《七点早知道》、《消息拌饭》等栏目担任特约嘉宾。      曾主持多项国家与省部级科研项目,在国际高水平期刊发表论文50余篇,授权国家发明专利5项,受邀在国际学术会议作报告10余次,担任碳中和领域知名期刊Carbon Capture Science & Technology(碳捕集科学与技术)创刊编委。生物质产业碳中和技术联盟东北区负责人,国际碳捕集协会(IACC)执委。
    PM熊叔:产品经理/设计师/程序员,研究方向是AI创作工具和创作社区Mixlab无界社区和ComfyUI爱好者社区发起人

    02:01 AI的快速发展:挑战与机遇并存,我们应该怎么办?

    04:04 AI监管与安全性:全球共识的挑战与前景展望

    06:05 人工智能带来的变革:找到共识的挑战与前景展望

    09:03 人工智能工具的崛起对影视制作行业的影响及未来职业变革

    12:05 AI时代的创意表达:掌握AI技能,成为多功能手的可能性

    15:10 人工智能时代的个人成长:如何提升效率与竞争力?

    18:09 培养孩子独立思考能力:保持想象力与逻辑分析能力的平衡

    21:13 培养孩子立体人格:中学阶段学习的重要性与魅力

    24:15 通用能力与专业能力:职场中的人才选拔与培养

    27:18 培养孩子自主学习的能力:AI时代的关键竞争力

    30:20 拓展认知,提升独立判断能力,迎接人工智能时代挑战

    33:22 勇敢拥抱人工智能,迎接时代的变革!


  • 窜台参加麦田老师的《麦田的职场圆桌会议》

    欢迎大家订阅她的播客专辑。


    【本期嘉宾】

    郝俊慧: 《IT时报》主编 资深媒体人  在科技报道领域深耕近20年,长期关注互联网、信息通信、人工智能等前沿科技。《IT时报》是中国最早的通信类媒体之一,前身为《上海邮电报》,具有近60年的产业传播历史。

    鑫声心生  :化学博士,双一流大学材料学科博士生导师,喜马拉雅播客智库成员,在职业规划,前沿科技方面著有多部学术著作,喜马拉雅《七点早知道》、《消息拌饭》等栏目担任特约嘉宾。      曾主持多项国家与省部级科研项目,在国际高水平期刊发表论文50余篇,授权国家发明专利5项,受邀在国际学术会议作报告10余次,担任碳中和领域知名期刊Carbon Capture Science & Technology(碳捕集科学与技术)创刊编委。生物质产业碳中和技术联盟东北区负责人,国际碳捕集协会(IACC)执委。
    PM熊叔:产品经理/设计师/程序员,研究方向是AI创作工具和创作社区Mixlab无界社区和ComfyUI爱好者社区发起人

    【精彩观点】

    02:02 AI时代来临,对职业发展和创业的影响有多大?

    04:04 AI生成视频:从拼图到动画的突破之路

    06:06 SORA视频生成技术的突破:从拼图到现实世界的模拟器

    09:12 技术的飞跃:从三维建模到真实世界模拟的突破

    12:16 真相与谎言:人工智能改变我们对现实的认知

    15:19 职业规划与人工智能:拥抱变化,迎接挑战!

    18:23 人工智能时代下的专业型人才培养:挑战与机遇

    24:32 AI时代的就业挑战:如何寻找新的创意与发展机会?

    27:35 AI时代的独立思考与持续学习:文科生、程序员、咨询师的就业前景

    30:34 文科生的春天来了:人工智能时代下的新职业机会

    33:43 AI时代的共情能力:文科生的的优势与挑战



  • 这周,我的AIGC作品《赛博机甲AIPC笔记本》被比赛主办方联想官方账号转发和点赞了!真是万分荣幸!其实,使用AI绘图工具做产品设计并没有想象中的难。关于如何使用AI设计产品概念图,我专门写了一篇零门槛的教程,希望能够帮助大家参赛拿奖。

    学完这篇文章你可以掌握:

    1.了解目前有哪些好用的AI绘画平台

    2. 学习如何写提示词来设计自己的产品

    3.参加AIGC比赛,提升中奖概率


    现在,让我们马上步入正题。


    一、有哪些可以好用的AI绘画平台?


    无论是在线服务还是本地应用,AI绘画工具的多样化和易用性为创意表达打开了新的大门。从初学者到专业艺术家,每个人都可以找到适合自己的工具,将想象力转化为令人惊叹的艺术作品。


    在线使用的平台,主要有如下几个:

    1. Midjourney (https://www.midjourney.com/)   - 特点:极为优秀的AI绘画能力,但需付费使用。   - 是否有免费额度:否。

    2. DALL-E (https://labs.openai.com/)   - 特点:同样提供顶级的AI绘画服务,属于付费范畴。   - 是否有免费额度:否。

    3. Bing (https://www.bing.com/images/create)   - 特点:优秀的AI绘画工具,且完全免费。   - 是否有免费额度:有。

    4. Leonardo.AI (https://leonardo.ai/)   - 特点:提供良好的AI绘画体验,免费使用。   - 是否有免费额度:有。

    5. Mage.Space (https://www.mage.space/)   - 特点:良好的AI绘画能力,免费且提供多种模型选择。   - 是否有免费额度:有。

    6. 百度文心一阁 (https://yige.baidu.com/)   - 特点:支持中文   - 是否有免费额度:有。

    7.  阿里通义万象 (https://tongyi.aliyun.com/wanxiang/creation)   - 特点:支持中文,   - 是否有免费额度:有。


    总的来说,如果你想要有良好的创作体验Midjourney和DALL-E是最理想选择,其卓越的创作能力是业内公认的。而对于预算有限或希望免费体验AI绘画的用户,可以尝试BingAI的绘画生成能力,因为BingAI绘画接入的就是GPT的DALL-E。另外如果想体验稍微完整的AI绘图能力Leonardo AI也是不错的选择。如果我们受网络所限,百度文心一阁和阿里通义万象也是目前国内用户的选择。如果你更倾向于在本地设备上使用AI绘画工具的用户,首选 Stable Diffusion,主要有Auto11111的WebUI和ComfyUI。另外,还有一些开箱即用的客户端工具,例如,Draw Things和Diffusion Been等。


    二、如何撰写AI绘图的提示词?

    我们在使用Midjourney、DALL-E、Stable Diffusion等文本生成图像工具的时候,我们需要设计文本提示词(prompts)来指导AI生成图像过程,最终获得我们想要的效果。

    我们可以将AI想象为一名正在学画画的中学生,你现在正在扮演一位美术老师,为他布置作业。

    我们应该怎么出题呢?下面是一些方法:

    1. 需要明确具体:

    描述你想要的图像时,尽可能具体和详细,包含场景描述、物体、颜色、情感氛围、风格等。例如,我们出题的时候不说“一辆车”,而是说“一辆红色的跑车在沙滩上”。另外,需要尽量不要有抽象的隐喻,这位学生有可能无法理解。

    2. 使用关键词:

    使用关键词来描述图像的主要元素,如对象、颜色、环境、气氛,虽然有些比较聪明的学生(如Dell-E和Midjourney V6)已经可以理解完整的句子所表达的语义,但是关键词依然是核心。如果我们通过特定的关键词可以帮助AI更明确的表达,特别是一些艺术风格术语,如“印象派”、“超现实主义”或具体的颜色和纹理描述。

    3. 不要过于复杂:虽然要具体,但是过于复杂的提示词可能会使模型难以理解和执行,我们需要找到描述清晰具体但又不过分复杂的平衡点。

    4. 渐进式迭代:不用一次到位,我们可以通过实验和调整描述来获得更好的结果。

    5. 结构性陈述:好的提示词包含不同方面的描述,如主题、媒介、风格、艺术家、细节、颜色和光照等等,如果我们遵循一定的结构,我们可以写出更明确具体的提示词,帮助这位考生更好地理解你的需求。下面是一个比较常用的提示结构:


    Prompt = (主体内容) + (环境设定) + (气氛/灯光) + (构图) + (风格参考)


    1. 主体内容:一款未来风格的电动汽车。

    基础:一款电动汽车。

    基础+修饰:一款具有流线型设计的电动汽车。

    基础+进一步修饰+画面故事:一款流线型设计的电动汽车,在光滑的公路上高速行驶,车身表面反射着周围的城市光线。

    2. 环境:车辆行驶在一条现代化的高架桥上,背景是一个繁华的未来都市,高耸的摩天大楼和光滑的玻璃幕墙反射着夜晚的灯光。

    3. 气氛:一种科技感和速度感的结合,展现出未来交通的便捷和高效。

    4. 灯光:选择高对比度的照明,强调汽车的轮廓和流线型的设计,同时反映出城市的繁华夜景。

    5. 色彩:使用富有科技感的冷色调,如银灰色、深蓝色和白色,以突出未来感和清洁能源的概念。

    6. 构图:采用动态的角度,如斜视角或低角度视图,以强调汽车的速度和运动感。

    7. 风格参考:参考现代汽车设计和科幻电影中的未来城市景象。


    最后,我们将这些描述的关键词整合成一段文本描述:


    电动汽车,流线型设计,高速公路,未来城市,夜景,摩天大楼,光滑玻璃外墙,高对比度照明,冷色调,科技感,银灰色,深蓝色,白色,干净能源,动态视角,斜角,低角度视图,现代汽车设计,科幻电影风格。


    如果使用国外的平台,我们可以使用翻译软件将提示词变成英文:


    Electric car, streamlined design, futuristic city, night scene, skyscrapers, smooth glass facades, high-contrast lighting, cold color tones, technology theme, silver-grey, deep blue, white, clean energy, dynamic perspective, oblique angle, low-angle view, modern car design, sci-fi movie style


    这里是我在Mage.Space的使用SDXL模型效果如下图:


    如果条件有限,你可以尝试国内的平台,像百度文心和阿里通义都支持中文,下面是我这两家平台生成的效果,如果有兴趣可以点击查看大图。


    三、如何使用AI进行产品设计?


    当我们要做产品设计的时候,我们需要对上面的基本结构拓展:


    Prompt = (产品功能 + 风格外观 + 材料构造 + 特殊要求 + 设计灵感)+ (环境设定) + (气氛/灯光) + (构图) + (表现风格)


    首先,我们的产品主体描述需要更加具体,可以包含面几个维度:


    产品功能:描述产品的主要用途或功能。

    风格外观:指定设计风格或外观特征。

    材料构造:提及所使用的材料或构造方法。

    特殊要求:任何特定的设计要求或限制。

    设计灵感:参考某些著名产品或设计的风格特征。


    另外,我们可以加上一些工业设计常用表现手法:3D渲染风格、CG渲染、手绘、马克笔、彩色铅笔、设计草图等,下面是不同的表现手法。



    内容主体:

     1. 产品功能:AI强大个人助理笔记本电脑

     2. 风格外观:融合《新世纪福音战士》初号机的设计元素,动态棱角设计,霓虹绿和紫色高光

     3. 材料构造:光滑金属外壳,带有在不同光线下变色的异彩效果

     4. 特殊要求:先进的全息触摸屏技术,3D全息交互

     5. 灵感参考:高科技的个人电子设备,科幻电影中的设备,如《银翼杀手》中的未来科技


    表现风格:CG渲染、高科技、未来感

    环境设定:高科技的未来实验室,多面全息显示屏,浮动的交互式面板,赛博朋克风格的未来城市背景

    气氛灯光:神秘的蓝色和紫色背光,营造出高科技和未来感的氛围

    构图:高角度俯瞰,笔记本电脑位于中心,周围环绕着先进的设备和充满活力的城市景观


    我们得到以下提示词:

    未来风格AI强大个人助理笔记本,融合《新世纪福音战士》初号机设计元素,动态棱角设计,霓虹绿紫色高光,光滑金属外壳,异彩变色效果,先进全息触摸屏技术,3D全息交互,高科技未来实验室,多面全息显示屏,浮动交互式面板,赛博朋克风格未来都市背景,神秘蓝紫背光,高科技感,未来感,高角度俯瞰,中心位置笔记本,周围环绕先进设备和动感城市景观


    我们可以使用翻译软件将提示词翻译成英文:

    Futuristic AI-powered personal assistant laptop, integrating design elements from Neon Genesis Evangelion's Unit-01, dynamic angular design, neon green and purple highlights, sleek metal casing with iridescent color-changing effect, advanced holographic touchscreen technology, 3D holographic interaction; set in a high-tech future laboratory with multi-faceted holographic displays, floating interactive panels, against a cyberpunk-style futuristic city background; mysterious blue and purple backlighting, high-tech and futuristic atmosphere; high-angle overview composition with the laptop at the center, surrounded by advanced equipment and a dynamic cityscape


    下图OpenAI的DALL-E的生成结果,这是目前表现最到位作品,我们不得不佩服业界顶流的创造力。

    这个是Stable diffusion的SDXL模型生成的结果,虽然环境氛围表达到位了,但是缺少创造力。


    百度文心和阿里通义万象,效果大家自行评价。



    百度文心:https://yige.baidu.com/


    阿里通义万象:https://tongyi.aliyun.com/wanxiang/creation


    另外,优秀好的作品介绍也很重要。我们可以使用ChatGPT或百度的文心一言来帮助我们写设计介绍,将这个文字复制给大语言模型:


    请扮演一位网络营销高手,帮我写条微博,要求请根据以下产品的描述,从这款作品的作者的角度介绍作品

    ```

    [这里写上你刚刚在创作过程中使用的Prompt...]

    ```



    四、参加比赛,准备拿奖


    目前,联想正好在做一个AI PC的设计比赛,奖品还不错,而且作品提交次数没有限制,非常适合我们这些掌握AI绘图的普通人参赛。


    关于这个活动介绍,请参看我们之前相关的文章:2024年会否进化为 AI PC 产业元年?Mixlab&WebN 喊你来组队比赛


    奖品如下:

    一等奖 1 位ThinkPad X1 carbon AI 超级本 2024

    二等奖 3 位联想小新 Pro16 AI 超能本 2024

    三等奖 10 位 价值 1999 AI 礼包

    荣誉奖/最具传播力  5 位 价值 999 AI 礼包


    为了更好的帮助大家,我们专门搭建了专门为大赛文生图服务,你也可以尝试通过这个服务来体验文生图的魅力,文末有扫码入群,免费使用:

    然后,我们把作品和介绍发到微博或者小红书,记得带上:“#一起联想AIPC#” 并 “@联想中国 ”。

    最后,为了提升中奖几率,我们可以把微博地址发群里,让大家一起点赞、评论、转发!


    最后,欢迎大家加入我们的比赛互赞群。



    如果你有兴趣学习更具有专业性的AI绘画技能,欢迎请加入我和Shadow发起的ComfyUI的知识星球。




  • 上周日,我、Shadow和Rui做了一次在线连麦的直播,背景是Rui在上周发布并开源了一款名为《西游大绘战》的AI实时互动游戏。这款游戏在我们ComfyUI中文社区产生了轰动,许多人都没有想到ComfyUI还能这样玩。



    Rui的工作流发布地址https://openart.ai/workflows/profile/rui400


    # 什么是AI实时互动游戏?


    AI实时互动游戏,主要是以大语言模型为核心驱动,用户通过与游戏实时互动生成具有无限可能性的剧情。AI实时互动游戏不仅限于文字,还可以结合Stable Diffusion图像生成能力,创造一个丰富的多模态游戏世界。


    Rui在《西游大绘战》的开发中,利用ComfyUI的节点整合GPT、SD模型和TTS等AI技术,创造了具有独特游戏体验的Workflow(AI工作流)。也再次证明了ComfyUI的灵活性和无限可能性。



    他首先利用 GPT 生成每一话的故事文本和选择,同时,将故事文本转换为自然生动语音,增强了玩家的沉浸感。

    另外,还通过GPT生成Stable Diffusion的Prompt(提示词),用于创造游戏故事场景对应的画面,使得游戏画面能够根据玩家的选择动态变化。


    但将AI技术融合到这种全新游戏设计中也面临了诸多挑战。对于如何处理和控制好AI生成的内容,Rui需要学习大量的跨领域知识,做大量的技术调研,并且还需要像工程师一般不断调试Prompt和参数,才能把控好自动生成的游戏体验。


    # AI时代下的“黑客与画家”



    在保罗格雷姆的《黑客与画家》书中,提到了黑客与画家的诸多相似性:他们都是伟大的创作者,但伟大的作品并不都是事先严密设计好的,他们为了实现一个创新的灵感,能够反复调试和打磨,他们不会因为困难而退缩,他们总能找到常人不曾想到的解决方案,在作品完成的那一刻就注定了它的杰出和伟大。

    面对如此超前和复杂的游戏项目,Rui在《西游大绘战》项目中一个人扮演了一个团队的角色,从策划、设计再到开发制作。但令人惊讶的是,作为一名有十几年游戏原画设计经验的设计师,Rui之前并没有任何编程经验。


    今年随着生成式AI的技术崛起,在SD和ComfyUI影响下,游戏行业正在使用AI工作流快速地生成原画设计来提高设计创作的效率,为游戏行业带来了颠覆性的变革。对于很多传统设计师来说这可能是个威胁和挑战,但Rui意识到这是一个转型和探索新领域的机会。他开始研究如何将AI技术融入游戏设计。


    Rui制作的Workflow堪称艺术作品,为了达到精细的效果,使用了大量的高级节点和控制流程,将技术与艺术完美地结合在了一起,他最新发布的AI工作流作品“Cute You”,由AI生成的名人卡通形象栩栩如生,又一次引起了ComfyUI创作者们的广泛学习和关注。




    Rui是如何掌握这些能力的?他提供了一些学习建议:



    首先,他强调了获取信息源的重要性。他建议使用ComfyUI管理器作为了解节点信息的主要入口。并且定期在GitHub搜索ComfyUI相关节点更新。同时关注知名博主和官方博客分享的使用技巧。

    其次,深入理解SD的图像生成的流程和原理,这是灵活使用ComfyUI的基础 。对于非程序员,特别是设计师而言,学习ComfyUI是一个跨界挑战,需要改变过去的学习方式,需要多加实践探索 。

    另外,要多做实验。开始时不要过于雄心勃勃,因为教程更新也是滞后的,为了防止踩坑我们需要从基础开始,选择小项目,逐步增加复杂性。过程中,我们不要害怕失败,最终我们可以把这些实验经验整合到实际项目中。

    最后,加入专业的群和社区,在社区中提问和分享经验是学习的重要部分,这是学习新技能和解决问题的重要方式。在《西游大绘战》的工作流创作过程中,Shadow就给了很大的技术支持,帮助他解决很多自定义节点的问题和需求,这种合作也是一种前所未有的体验。

    除了以上四点,我认为Rui的能力,更关键在于他的探索未知的创新精神和不断精益求精的匠人精神。正是因为这些品质,让他编排的每个AI工作流都能成为优秀的作品,兼具科技与审美。也让他成为了黑客与画家的结合体。

    在对谈过程中,有社群的小伙伴提到了“超级个体”这个词,我想“黑客与画家”的精神就是AI时代下的超级个体的核心精神。

    # 如何成为AI时代的超级个体?

    在AI时代下的超级个体都是具有匠人精神的产品经理。他们兼具黑客与画家的品质,追求自由的创作精神和产品理想,能够打破社会分工的枷锁,勇于走出自己的舒适圈,能够不断探索和应用前沿的新技术,打造出一件件让人惊叹的作品。

    成为AI时代的超级个体,需要有以下这5个方面的能力:


    首先,需要是终身学习者。他们主动追踪技术发展的最新动态,以及这些技术如何应用于不同行业。他们通过自主学习和项目实践,不断增强自己的技术能力和理解力。

    其次,需要有很强的跨学科思维。
    Rui给我们起了一个很好的表率作用,他能够灵活的切换设计师和工程师的思维方式,他将艺术设计与AI技术相结合,创造出独特的游戏体验。超级个体通常能串联不同领域的知识,利用这些交叉点来创新和解决问题。


    另外,需要有创新和实验精神。在新兴领域中,不断实验是创新成功的关键。Rui的例子告诉我们,通过熟悉掌握AI工具,即使没有编程背景,也可以通过实验和探索获得实践的成功。这种实验精神,需要我们不畏风险勇于尝试。

    还有,就是解决复杂问题的能力。AI技术本身就是解决复杂问题的工具。超级个体需要具备分析复杂系统的能力,并使用AI作为解决方案的一部分。这要求具备良好的逻辑思维能力和系统化思维。

    最后,是建立强大的社会链接能力。虽然AI技术强大,但在实际应用中,跨领域的合作是必不可少的。超级个体通过加入社区参与分享和交流,传递更多关于学习方法、行业洞察以及社会发展趋势的思考。通过强化自己的个人品牌,能够获得更多与能力互补的超级个体的合作,拓展出更多职业发展和创作的机遇。

    总之,成为AI时代的超级个体,需要我们能够在快速变化的技术环境中,不断学习和成长,同时需要具备创新精神、跨学科思维和强大的问题解决能力。超级个体不仅关注技术实践的本身,还关注技术如何影响行业和社会发展。通过分享和交流,从而获得更加广泛的社会影响力,成为一个标志性的个人品牌。


    # 结语


    在前天,Rui为了实现自己新的工作流逻辑,在ChatGPT的帮助下编写了一个自定义节点,并提交到了Github开源。地址:https://github.com/rui40000/RUI-Nodes



    这是《黑客与画家》精神的最直接体现。也鼓舞了许多在ComfyUI中文社区中不擅编程的设计师。

    Rui勇于探索的精神和杰出的创作力,让他打破了传统分工角色的限制。绘画不再是画家的专属,编程也不再是程序员的专属。在AI的帮助下,任何人都可以通过学习和实践,创作自己的杰出作品。

    在AI的加持下,超级个体的崛起将打破现有的职业分工体系。它鼓励个体追求创新,拓展知识边界,实现个人和职业成长。他们产生的价值是广泛的行业价值和社会价值。

    未来的工作场景中,将会越来越重视跨学科知识和创造性思维。这不仅为超级个体提供了更广阔的发展空间,也为企业和社会带来了更丰富的创新资源。

    AI时代,需要我们打破过去那套旧规则,只有拆掉思维里的墙,我们才能获得进化。欢迎加入Mixlab ComfyUI中文社区与大佬们一同成长!


    最后,欢迎大家加入ComfyUI的知识星球。




  • 今年年初,随着GPT、Midjourney大语言模型的火爆,也带火了AIGC(人工智能生成内容)的潮流。随之而来的是越来越多的AIGC产品经理的招聘需求。AIGC产品经理是一个崭新的角色,同时也面临着一系列独特的挑战和机遇。

    到底什么是AIGC产品经理,他和传统的产品经理又有什么不同?就在前几天,我和西坡、小李子对于什么是AIGC产品经理做了一些探讨。(他们都是我的知识星球成员)

    # 1. AIGC产品经理的独特性

    这是某个大厂招聘需求,乍看一下和传统产品经理的招聘需求还是非常相似:

    其实,AIGC根据场景和领域不同,对于产品经理的要求也不同。下图绿色的是应用场景,蓝色的部分是每个应用场景对应的模型技术,AIGC产品经理可以根据下图按图索骥地了解相关的技术知识。

    西坡作为工作在一线的AIGC产品经理,他首先发表了观点。

    虽然AIGC产品经理的工作流程在很大程度上与传统产品经理相似,涵盖需求调研、分析、原型设计等环节,但AIGC产品经理在技术调研和产品功能设计方面的要求更高。这是因为大模型使得产品和研发人员处于同一起跑线。因此,AIGC产品经理需要对技术有更深的理解和洞察能力。

    在这一年里,大模型的技术迭代非常快。它需要产品经理很强的自主学习能力,要能够将新的技术能力与具体产品需求相结合。在日常的工作中,西坡除了撰写需求文档之外,也会使用提示工程调试数据,这样才能够将技术能力与产品需求有效结合。同时他每天也会查看大量的前沿动态,并从中发现机会点。

    另外,在传统的产品管理和AI项目中,我们管理的是确定性,用户需求是明确的,功能目标是明确的,性能指标也是明确的,在产品需求文档撰写时候就已经解决了80%的不确定性问题,剩下20%是项目执行。

    但在AIGC项目中却相反,我们管理的是80%的不确定性。因为用户会把AI当做人来使用,会提任何意想不到问题,但用户都期望AI要能够给出很好的回应。这种不确定性不光是用户带来的,也受数据、模型、提示工程的影响。AIGC产品经理需要能感知到这些不确定性,并让它们控制在用户预期范围内。

    很多2C类型的AIGC产品还要求产品经理要有社区产品经验,因为AI内容创作的驱动力还是来源于人,而在线社区是最好的创作者运营方式,在国外Discord社区已经是AIGC产品的标配。因为在AIGC社区里,创作者们可以相互学习和相互激发。而产品经理只有真正理解了这群AIGC创作者才能更好地知道AIGC产品应该怎么做。

    因此,在AIGC产品管理中,产品经理更需要近距离地观察用户和亲身体验。因为AIGC产品并没有可以直接可抄袭的功能和交互逻辑,很多问题需要亲身体验才能知道。所以这要求产品经理具有强烈的用户同理心,并能够将自己置入用户的情境中。通过近距离观察和体验,才能更好地理解市场动态和用户行为。


    # 2. 快速市场响应与商业能力

    在AIGC领域,产品经理面临的主要挑战之一是快速响应市场变化。这不仅要求他们敏锐地捕捉行业趋势和机遇,还要能够进行快速的市场验证。有效的MVP(最小化可行性产品)策略对于确定产品方向和迭代至关重要。

    此外,产品经理的商业理解能力也至关重要。在产品设计过程中,必须充分理解商业运作逻辑和实现成本。避免过于复杂和无效的需求设计,确保产品在有限的资源成本下能够有的放矢,步步为营地达到产品与市场的匹配。

    在11月7日凌晨,OpenAI举行了一场全球注目的开发者大会,CEO山姆·奥特曼隆重地介绍了GPTs的功能,人人都可以定制自己的GPT助理,还能通过链接分享给朋友。但是目前由于官方GPTs商店还没有上线,许多优秀的GPTs很难被发现。


    为此,Mixlab的小伙伴11月15日还组织了一场名为《GPTs商店,普通人能挣到钱吗?》在线连麦讨论,当我们讨论到是否值得做GPTs精品推荐网站时,西坡认为还是存在一定的机会的,但有另一些朋友表示并不看好这种推荐网站,因为只要官方GPTs商店上线以后,这种网站结局就是昙花一现。

    在第二天,西坡的团队就上线了名为GPTs伙伴”的精品推荐网站(www.gptspt.com),同时西坡启动了社群运营,GPTs创作者和用户开始涌入。社群里的小伙伴都惊呼动作真快。

    目前,他们团队只用了一周不到的时间就收集到了四千多个GPTs。一周的时间,对许多大厂团队来说就是给老板写PPT和做汇报的时间。

    当我们还在担心官方的GPTs商店即将上线的时候。上周末OpenAI的CEO山姆·奥特曼被戏剧性地驱逐出了公司。这家顶尖的AI公司已变成了一团乱麻。当我们认为接下来GPTs官方商店的项目推进应该会被搁置的时候,在昨天山姆奥特曼又回到了公司。

    我给西坡的总结就是“天下武功,唯快不破”。在飞速发展的行业里面,每天都有新变化,反复的犹豫和纠结会让机会转瞬即逝。

    对于创业者来说这是一个动态博弈的过程你能做的就是用最低的成本来验证你的想法,用最快的速度来拿到结果,然后再去迎接下一步挑战,只有快速应变和步步为营,你才更有可能获得成功。

    如果你有兴趣以扫码收们上周二讨论:


    3. 产品经理的职业风险与机遇

    随着互联网行业增量市场向存量市场的转变,科技公司的运营模式也从资本驱动转变到投资回报率(ROI)驱动,产品经理面也临着全新的挑战。这不仅对企业盈利模式提出了更严格的要求,也对传统分工体系下偏安一隅的产品经理们提出了更高的要求。

    项目的ROI和公司财务状况成为决定职位稳定性的关键因素,产品经理需要具有在短期内验证产品的商业价值和潜力的能力,否则自身岗位也岌岌可危。

    在这个多变的职业环境中,产品经理应成为斯坦尼斯拉夫斯基的体验派”。通过亲身体验,深入实际应用场景,亲历市场和产品的起伏变化这种近距离的观察和体验能够帮助他们理解复杂问题的本质,更透彻地理解市场、用户需求、项目运营和管理。

    另外,在职场中,追求财务收益和发展机遇应当不相冲突。产品经理需要明确自己的阶段性职业目标,同时不失对终极理想的追求。只有如此,产品经理才能在不断变化的市场中找到稳固的立足点,并在职业道路上实现持续的成长和成功。


    # 结语

    AIGC产品经理是一个崭新的岗位,这个岗位的定义也会随着技术飞速发展而更新,产品经理还有很多东西需要学习。

    面对技术的复杂性和市场的不断变化,新兴的产品经理们,需要具备深厚的技术理解、敏锐的市场感知、强大的商业能力,以及不断地学习和适应能力。

    通过持续的努力和专业发展,AIGC产品经理不仅能够引领产品成功,还能在职业生涯中取得显著成就。

    如果你是传统产品经理,这也是一次难得的职业转型的机会。如果你已经跃跃欲试,请迈开你的第一步,学会使用ChatGPT,构建自己的GPTs,并把他们带到自己的工作和生活中。

    你可以尝试一下我构建的“高级产品管理专家”GPT,它除了能帮助你处理日常的产品管理工作外,也会告诉你AIGC产品经理需要掌握哪些技能。希望它能够更好的帮助到你,访问地址:https://chat.openai.com/g/g-amlOc6xcY-gao-ji-chan-pin-guan-li-zhuan-jia

    在后续内容中,我会告诉大家如何构建属于自己专业领域GPTs,你可以给我留言你的问题。


    最近,我们正在组建ComfyUI中文社区,如果你还不了解什么是ComfyUI,请查看我的上一篇文章《AIGC工作流: 新时代产品经理和创业者的秘密武器》。目前群已经加满,后台回复我“ComfyUI入群”。

    另外,我们正在与Openart.com招募更多优秀的ComfyUI工作流创作者,详情请查看文章《ComfyUI工作流:AI创作者的新名片#OpenArt联手Mixlab、ComfyUI中文社区》

    关于AIGC产品经理的更多内容和资料可以关注我的星球。


  • 翻到Shownotes的最底部有价值128元的福利可以免费领取。



    这是一篇比尔·盖茨在最近写的文章,主要强调了人工智能技术的未来潜力和影响。他认为AI将深刻改变我们的生活方式,特别是通过高级AI助手(或称之为代理),这些代理能够理解复杂的请求并执行多种任务。他强调了AI在提高效率、解决复杂问题以及改善人类生活质量方面的巨大潜力。同时,他也提到了随之而来的挑战,如数据隐私、安全性和伦理问题。总的来说,盖茨对AI技术的未来持乐观态度,同时也认识到需要解决的关键问题。


    00:10


    即使到了今天,我对软件的热爱仍与当年我和保罗·艾伦一起创立微软时一样浓烈。但即便在这些年间软件有了很大的进步,从很多方面来说,软件仍然相当“愚蠢”。


    要在电脑上完成任何任务,你必须告诉你的设备使用哪个应用程序。你可以使用微软Word和谷歌文档来起草商业提案,但它们无法帮助你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。即使是最好的网站也对你的工作、个人生活、兴趣和人际关系理解有限,而且在使用这些信息为你服务方面能力有限。这种事情在今天只有通过另一个人,比如一个亲密的朋友或个人助理,才能实现。


    在未来五年内,这一切将完全改变。你不需要为不同的任务使用不同的应用程序。你只需用日常语言告诉你的设备你想做什么。根据你选择与它分享多少信息,软件将能够做出个性化响应,因为它将对你的生活有着丰富的理解。在不久的将来,任何在线的人都将能够拥有一个由人工智能驱动的个人助理,其能力远远超出今天的技术。


    这种类型的软件——能够响应自然语言并根据对用户的了解完成许多不同任务的软件——被称为“代理”。我已经思考代理近30年,并在我的1995年的书《未来之路》中写到了它们,但直到最近因为人工智能的进步,它们才变得实用。


    代理不仅将改变每个人与电脑互动的方式。它们还将颠覆软件行业,带来自我们从键入命令到点击图标以来计算机领域最大的革命。


    每个人的私人助理


    一些批评家指出,软件公司以前提供过类似的东西,但用户并没有真正接受它们。(人们仍然在拿微软Office中曾经包含后来又放弃的数字助手Clippy开玩笑。)为什么人们会使用代理?


    答案是它们会好得多。你将能够与它们进行微妙的对话。它们将更加个性化,并且不仅限于相对简单的任务,如写信。Clippy与代理的共同之处,就像旋转电话与移动设备的共同之处一样。


    如果你愿意,代理将能够帮助你处理所有活动。通过允许它跟踪你的在线互动和现实世界的位置,它将对你参与的人、地点和活动有强大的了解。它将了解你的个人和工作关系、爱好、偏好和日程。你将选择它何时介入帮助某事或要求你做出决定。于下午 13:40 的时候发布了一些关于


    为了看到代理将带来的巨大变化,让我们将它们与今天的AI工具进行比较。这些工具大多是机器人。它们限于一个应用程序,并且通常只在你写下特定单词或寻求帮助时介入。因为它们不记得你上一次如何使用它们,所以它们不会变得更好或学习你的任何偏好。Clippy是一个机器人,而不是一个代理。


    代理更聪明。它们是主动的——能够在你提出要求之前就提出建议。它们能够跨应用程序完成任务。它们会随着时间的推移而改进,因为它们记住了你的活动,并识别出你行为中的意图和模式。基于这些信息,它们会提供它们认为你需要的东西,尽管最终决定权始终在你手中。


    想象一下你想要计划一次旅行。一个旅行机器人会识别出符合你预算的酒店。而一个代理则会知道你将在哪个季节旅行,并根据它对你是总是尝试新目的地还是喜欢重复访问同一个地方的了解,它将能够提出地点建议。当被问及时,它将根据你的兴趣和冒险倾向推荐活动,并在你喜欢的餐厅预订位置。如果你想要今天这种深度个性化的规划,你需要支付旅行代理费用并花时间告诉他们你想要什么。


    AI代理最令人兴奋的影响是它们将使今天对大多数人来说太昂贵的服务民主化。它们将在四个领域产生特别大的影响:医疗保健、教育、生产力以及娱乐和购物。


    医疗保健


    今天,AI在医疗保健中的主要作用是帮助处理行政任务。例如,Abridge、Nuance DAX和Nabla Copilot可以在预约期间捕获音频,然后为医生撰写笔记。


    真正的转变将在代理能够帮助患者进行基本分诊、获取如何处理健康问题的建议以及决定他们是否需要寻求治疗时发生。这些代理还将帮助医疗工作者做出决策并提高生产力。(已经有像Glass Health这样的应用程序可以分析患者摘要并为医生提出诊断建议。)帮助患者和医疗工作者将特别有益于那些在贫穷国家的人们,因为那里许多人根本就看不到医生。


    这些临床代理的推出将比其他代理慢,因为做对事情是生死攸关的。人们需要看到证据表明健康代理总体上是有益的,即使它们不会完美并且会犯错误。当然,人类也会犯错误,而且没有获得医疗保健也是一个问题。

    心理健康护理是另一个代理将使之几乎对每个人都可用的服务的例子。今天,每周进行一次治疗会话似乎是一种奢侈。但存在大量未满足的需求,许多需要治疗的人无法获得它。例如,兰德公司发现,所有需要心理健康护理的美国军事退伍军人中有一半没有得到治疗。


    在心理健康方面受过良好训练的AI代理将使治疗更加负担得起且更容易获得。Wysa和Youper是这里的早期聊天机器人。但代理将走得更深。如果你选择与心理健康代理分享足够的信息,它将了解你的生活历史和你的人际关系。它将在你需要时随时可用,并且永远不会变得不耐烦。它甚至可以在你的允许下,通过你的智能手表监测你对治疗的生理反应——比如当你谈论与老板的问题时心跳加速——并建议你何时应该看人类治疗师。


    教育


    几十年来,我一直对软件将如何使教师的工作变得更轻松并帮助学生学习感到兴奋。它不会取代教师,但它将补充他们的工作——为学生个性化工作并解放教师免于文书工作和其他任务,以便他们可以花更多时间在工作的最重要部分上。这些变化终于开始以戏剧性的方式发生。


    目前的最先进技术是由可汗学院创建的基于文本的机器人Khanmigo。它可以在数学、科学和人文学科中辅导学生——例如,它可以解释二次公式并创建数学问题供练习。它还可以帮助教师完成如编写课程计划等任务。我长期以来一直是Sal Khan的工作的粉丝和支持者,并最近在我的播客上邀请他谈论教育和AI。


    但基于文本的机器人只是第一波——代理将开启更多学习机会。


    例如,很少有家庭能支付一对一辅导学生以补充课堂学习的家教费用。如果代理能够捕捉到使家教有效的因素,它们将为每个需要的人解锁这种补充教学。如果一个辅导代理知道一个孩子喜欢Minecraft和泰勒·斯威夫特,它将使用Minecraft教他们计算形状的体积和面积,使用泰勒的歌词教他们讲故事和押韵。与今天的基于文本的辅导相比,体验将更丰富——例如,具有图形和声音——并且更加个性化。


    生产力

    这个领域已经有很多竞争。微软正在将其Copilot作为Word、Excel、Outlook和其他服务的一部分。谷歌也在用Assistant、Bard和其生产力工具做类似的事情。这些副驾驶可以做很多事情——比如将书面文件转换成幻灯片,使用自然语言回答有关电子表格的问题,并在代表每个人的观点时总结电子邮件线索。


    代理将做得更多。拥有一个代理就像拥有一个专门帮助你完成各种任务并在你愿意的情况下独立完成它们的人。如果你有一个商业想法,代理将帮助你撰写商业计划,为其创建演示文稿,甚至生成你的产品可能的外观图像。公司将能够使代理直接为其员工提供咨询,并成为每次会议的一部分,以便它们可以回答问题。


    无论你是否在办公室工作,你的代理都将能够以与今天个人助理支持高管相同的方式帮助你。如果你的朋友刚做了手术,你的代理将提议发送鲜花,并能为你订购。如果你告诉它你想要与你的大学室友联系,它将与他们的代理合作找到见面的时间,并在你到达之前提醒你,他们的大孩子刚刚开始在当地大学上大学。


    娱乐和购物


    AI已经可以帮助你挑选一台新电视并推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了Pix,它允许你提问(“我会喜欢哪些罗伯特·雷德福的电影,我在哪里可以看?”),然后根据你过去喜欢的内容做出推荐。Spotify有一个AI驱动的DJ,不仅根据你的偏好播放歌曲,还会与你交谈,甚至可以叫你的名字。

    代理不仅会提出建议;它们还会帮助你采取行动。如果你想买相机,你将让你的代理为你阅读所有评论,总结它们,提出建议,并在你做出决定后下订单。如果你告诉你的代理你想看《星球大战》,它会知道你是否订阅了正确的流媒体服务,如果没有,它会提议帮你注册。如果你不知道你想看什么,它会提出定制化建议,然后找出如何播放你选择的电影或节目。

    你还将能够获得根据你的兴趣量身定制的新闻和娱乐。CurioAI,它可以根据你询问的任何主题创建定制播客,是即将到来的东西的一瞥。

    科技行业的震荡波


    总之,代理将能够帮助几乎任何活动和生活的任何领域。它们对软件业务和社会的影响将是深远的。

    在计算行业,我们谈论平台——应用程序和服务构建在其上的技术。Android、iOS和Windows都是平台。代理将是下一个平台。


    要创建一个新的应用程序或服务,你不需要知道如何编写代码或进行图形设计。你只需告诉你的代理你想要什么。它将能够编写代码,设计应用程序的外观和感觉,创建一个logo,并将应用程序发布到在线商店。OpenAI本周推出的GPTs为非开发者可以轻松创建和分享他们自己的助手的未来提供了一个窥视。代理将影响我们使用软件的方式以及软件的编写方式。


    它们将取搜索网站,因为它们在为你找到信息并为你总结它方面会更加出色。它们将取代许多电子商务网站,因为它们会为你找到最佳价格,并且不会仅限于几个供应商。它们将取代文字处理器、电子表格和其他生产力应用程序。今天是独立的业务——搜索广告、带广告的社交网络、购物、生产力软件——将成为一个业务。


    我不认为任何单一公司将主导代理业务——将有许多不同的AI引擎可用。今天,代理嵌入在其他软件中,如文字处理器和电子表格,但最终它们将独立运行。尽管一些代理将免费使用(并通过广告支持),但我认为你将为大多数代理付费,这意味着公司将有动力使代理为你的利益工作,而不是广告商的利益。如果今年开始从事AI工作的公司数量有任何迹象,那么将会有异常多的竞争,这将使代理非常便宜。


    但在我所描述的复杂代理成为现实之前,我们需要面对关于技术及其使用方式的许多问题。我之前已经写过AI引发的问题,所以我将在这里专门关注代理。


    技术挑战


    目前还没有人弄清楚代理的数据结构将是什么样的。为了创建个人代理,我们需要一种新型数据库,能够捕捉你的兴趣和关系的所有细微差别,并在保持你隐私的同时快速回忆信息。我们已经看到了存储机器学习模型生成的数据的新方法,例如向量数据库,这可能更适合存储数据。


    另一个悬而未决的问题是人们将与多少代理互动。你的个人代理是否与你的治疗师代理和你的数学家教代理分开?如果是这样,你什么时候希望它们相互合作,什么时候应该保持各自的领域?


    你将如何与你的代理互动?公司正在探索各种选项,包括应用程序、眼镜、吊坠、别针,甚至全息图。所有这些都是可能性,但我认为人类与代理互动的第一个重大突破将是耳机。如果你的代理需要与你联系,它将对你说话或在你的手机上显示。(“你的航班延误了。你想等待,还是我可以帮你重新预订?”)如果你愿意,它将监控进入你耳朵的声音,并通过阻挡背景噪音、放大难以听到的语音或使听起来带有浓重口音的人更容易理解来增强它。


    还有其他挑战。目前还没有一个标准协议,允许代理相互通信。成本需要降低,以便代理对每个人都负担得起。需要更容易地提示代理,以便为你提供正确的答案。我们需要防止幻觉,特别是在像健康这样的领域,准确性非常重要,并确保代理不会因其偏见而伤害人们。我们不希望代理能够做它们不应该做的事情。(尽管我对流氓代理的担忧比对使用代理进行恶意目的的人类犯罪分子的担忧要少。)


    隐私和其他重大问题


    随着所有这些事情的发展,在线隐私和安全问题将变得比现在更加紧迫。你将希望能够决定代理可以访问哪些信息,以便你有信心你的数据只与你选择的人和公司共享。


    但是你与代理共享的数据归谁所有,你如何确保它被适当使用?没有人希望开始收到与他们告诉治疗师代理有关的广告。执法部门可以使用你的代理作为对你不利的证据吗?你的代理何时会拒绝做可能对你或他人有害的事情?谁来选择内置于代理中的价值观?


    还有一个问题是你的代理应该分享多少信息。假设你想见一个朋友:如果你的代理与他们的代理交谈,你不希望它说,“哦,她周二要见其他朋友,不想让你加入。”如果你的代理帮你写工作电子邮件,它将需要知道不应该使用关于你的个人信息或你以前工作专有数据。


    这些问题已经成为科技行业和立法者的首要关注点。我最近参加了由参议员查克·舒默组织的一次AI论坛,与其他技术领袖一起,许多美国参议员也参加了此次论坛。我们分享了关于这些和其他问题的想法,并讨论了立法者采纳强有力的立法的必要性。


    但是,其他问题不会由公司和政府决定。例如,代理可能会影响我们与朋友和家人的互动方式。今天,你可以通过记住他们生活中的细节——比如他们的生日——来向某人表达你对他们的关心。但当他们知道你的代理可能提醒了你这件事并负责发送鲜花时,这对他们来说是否还有意义?


    在遥远的未来,代理甚至可能迫使人类面对关于目的的深刻问题。想象一下,代理变得如此出色,以至于每个人都可以在几乎不用工作的情况下拥有高质量的生活。在这样的未来,人们会如何利用他们的时间?当代理拥有所有答案时,还有人会想要接受教育吗?当大多数人都有大量空闲时间时,你能拥有一个安全繁荣的社会吗?


    但我们距离那个时刻还很遥远。与此同时,代理即将到来。在接下来的几年里,它们将彻底改变我们的生活方式,无论是在线上还是线下。


    [原文完]


    观点


    人工智能的发展正处于一个关键的十字路口。一方面,AI展现出了巨大的潜力,能够在教育、医疗保健、环境保护等多个领域带来革命性的改变。它有可能极大地提高生活质量,解决一些长期以来人类难以克服的问题。

    然而,另一方面,这种技术的快速发展也带来了一系列复杂的伦理、隐私和安全问题。数据的控制权、AI决策过程的透明度,以及其对就业和社会结构的影响,都是我们必须认真对待的问题。特别是在AI技术可能加剧社会不平等的情况下,我们需要谨慎行事,确保技术进步能够惠及所有人。


    此外,我也认为人工智能的发展不应仅仅被视为技术进步的问题,而应该是一个更广泛的社会、文化和伦理议题。我们需要跨学科的合作,包括技术专家、社会学家、伦理学家和政策制定者,共同探讨和制定相应的法律法规,以确保AI技术的健康发展。


    最后,我对人工智能未来的发展持谨慎乐观的态度。我相信,通过全人类的合作和负责任的创新,我们可以利用AI的潜力来改善人类的生活,同时有效地应对其带来的挑战。

    福利:北京虎嗅F&M创新节价值125元的门票,关注PM熊叔公众号可以免费领取:微信后台私信我获得兑换密码,即可免费领取。


  • 在我过去的文章里有说过,产品经理是“帮助团队交付正确产品给用户的人”。从客户需求挖掘到最后产品使用体验,产品经理要确保产品价值能够端到端地传递给用户,产品经理需打破团队成员的分工壁垒,这考验着产品经理综合能力和素质,这也是产品经理的领导力的体现。


    如今,随着ChatGPT、Midjourney、StableDiffusion等生成模型带动起来的热潮,AI大模型正逐渐渗透到各种产品和服务中,越来越多的产品经理也在考虑将AIGC(AI生成内容)能力融入到自己的产品中,然而这并非易事,在项目实践的过程中产品经理面临着诸多的挑战和困惑……


    # 一、AIGC的产品管理挑战


    在传统的互联网产品的开发流程中,产品原型图是不可或缺的工具。产品经理或交互设计师通常会使用Axure、Sketch或Figma等工具,投入主要的时间绘制线框图,并通过页面流程图来阐释产品的交互逻辑。通过这种方法,团队成员能直观地理解产品的最终呈现效果,方便地讨论问题并形成共识,从而保证最终交付的产品体验与预期保持一致。这是过去十几年来,互联网和软件行业一直奉行的最佳实践。



    然而在AIGC产品中,用户更关心的是AIGC的数据体验,而不是界面的交互体验,传统的体验设计范式已经不再适用。例如,著名图片生成工具Midjourney以对话机器人的形式呈现,用户只要在Discord中和它对话就能获得高质量的图片,因为Midjourney很清楚地知道:用户更关心的是我们能不能根据提示词生成优质的图片,而不是别的什么东西。



    题外话:“知道自己应该做什么,并把它做到极致”——正因如此才让这只有十几人的小团队能完成1亿美元的年营收。这是我们每一个创业者和产品经理都需要学习的能力。


    因为AIGC产品体验的重心已从界面转向了数据。由于许多产品经理对数据和AI算法了解不足,让他们在技术沟通上遇到了极大的挫败感,而且传统的原型设计工具在应对AI产品时也显得力不从心,无法保证最终的交付效果和预期的一致性。对于一些想应用AIGC能力的产品经理而言,不仅AI模型是个不可解释的黑盒,连AI产品的研发过程也变成了一个不可知的黑盒。


    正所谓“拿着旧地图无法抵达新大陆”,在新时代,我们应该放弃旧的思维方式拥抱新的工具和新方法。


    # 二、AIGC工作流(Workflow)

    Stable Diffusion,作为一款广受欢迎的图片生成的开源项目,为AIGC内容创作者提供了强大的助力。ComfyUI进一步拓宽了Stable Diffusion的创作可能性。ComfyUI通过节点流程的界面设计,让用户可以轻松拖拽、连接不同的模型、模块和参数,形成高度定制和可复用的Workflow(AIGC工作流),而用户无需编写任何代码。它可以帮助我们实现更加丰富和定制化的数据体验。



    另外,ComfyUI还有以下优势:


    易于共享与协作:支持工作流的导出和分享,不仅加速了项目开发,也为团队间的学习和交流创造了条件。


    良好的性能优化:其内存管理和按需加载机制确保在资源受限的环境下,仍能加载大模型生成高质量图像。


    可扩展性:用户可以轻松添加自定义节点、插件和模型,社区已贡献了200多个自定义节点,为工作流的设计和优化提供了丰富的选择。


    ComfyUI本质上是AIGC的Pipeline(数据处理管道)的可视化构建工具,它将Stable Diffusion的运行机制显性化的展示在我们面前。在图形生成的过程中,ComfyUI能够实时为我们呈现数据处理的过程。让我们在设计和调试的时候,可以快速定位和解决问题。



    ComfyUI不仅仅是让AIGC创作者可以更自由地创作,它的流程逻辑的可视化、可复用以及数据的实时可验证,不就等同于产品原型构建工具么?


    在产品融图、营销海报和视频素材等应用场景中,AIGC正在发挥极大的价值。目前,一些前沿的团队已经在使用ComfyUI改进他们的工作方式,产品经理将ComfyUI作为产品原型设计工具,深度参与到模型训练和AIGC工作流的构建中,然后再交由开发人员和算法工程师进一步优化,最后转化成可稳定运行的Pipeline部署到正式环境中。


    通过ComfyUI的可视化节点式工作流,产品经理和开发团队的沟通与协作得到了促进,使项目团队能在早期快速搭建和验证项目原型,缩短开发周期,降低试错成本,确保产品需求和体验目标的一致性,从而更好地实现端到端的产品体验目标。


    # 三、UE蓝图系统的启示


    拖拽式的节点编程并不是ComfyUI的独创,例如,Blender、Maya和Unreal Engine(虚幻引擎)也提供了类似的功能。


    虚幻引擎的蓝图系统通过提供丰富的节点库和强大的可视化编程环境,使用户能够在无需编写代码的情况下构建复杂的游戏逻辑。



    蓝图系统的高度可定制性和扩展性,允许用户创建自定义节点,甚至可以与传统的编程代码无缝集成,直接打包成跨平台的游戏,不仅为游戏开发提供了强大而灵活的解决方案,也缩短了从概念到可交付产品的时间周期。这种方式使游戏设计师、艺术家和小型工作室能快速地制作出可运行的游戏产品,极大地丰富了游戏创意的表达。


    得益于虚幻引擎的强大表现力和无需编程的创作方式,使得其他行业的专家也可以使用虚幻引擎来实现想法。这也让其成为一款贯通各行各业的三维拟真创作工具,从游戏行业跨足至建筑设计、工业设计、城市规划和厂房规划等众多领域。


    可视化的节点编程和模块化设计极大地降低了编程门槛,促进了不同背景的团队间的协作和交流,吸引了来自更多不同领域的创作者共同丰富产品应用场景和生态。


    这也为ComfyUI提供了启示:强大的可视化和模块化能力不仅降低了产品开发和发布的门槛,还拓宽了创意和协作的空间,使得想法可以快速转化为实际可交付的产品成为可能,从而更好地满足不同用户和市场的需求。这就是“引擎”的魅力。


    # 四、展望未来


    目前,得益于ComfyUI的自定义节点的可扩展性,已有开发者创建了ChatGPT节点,为图像生成工作流赋予了大语言模型的思考能力,能快速生成提示词,可以方便快速创作大量的内容。如下图所示:



    展望未来,随着ComfyUI自定义节点的丰富化,它将不仅局限于Stable Diffusion的图像生成能力,而会整合更多领域的AI模型,逐渐成为一个多模态的AIGC产品构建工具。未来也可能会出现类似虚幻引擎的多模态AI引擎平台,能直接将AIGC工作流打包成高可用和可交付的产品。


    另外,由于企业级项目对硬件资源有较高要求,ComfyUI主要部署在团队的云端服务器上,这也将催生团队在线协同的需求,为创业者提供新的机会。我相信未来的ComfyUI在线版本可能会借鉴Figma的在线协同功能,让团队成员能共同参与AIGC工作流的搭建,为AIGC产品开发带来前所未有的在线协作体验。




    # 结语


    十年前,许多产品经理通过学习《网站蓝图:Axure RP高保真网页原型制作》这本书,步入了互联网产品领域。然而,在AIGC产品领域,Axure已无法满足现今的需求。



    正如“拿着旧地图无法抵达新大陆”一样,当我们拿着旧“蓝图”时也难以创造新产品。现在,AIGC工作流已成为我们需要学习和掌握的新“蓝图”的能力。


    通过学习和应用ComfyUI,产品经理和创业者能更深入地理解AI原理和工作方式,获得更为顺畅技术沟通能力。同时,通过快速构建和验证AI模型,我们可以确保产品需求与体验的一致性,大幅缩短产品开发周期。


    掌握ComfyUI的AIGC工作流,产品经理和创业者不仅能自信应对AI产品开发的挑战,还能探索和实现创新的产品设计,树立在AIGC领域的领导力。


    AIGC掀起的热潮也仅仅只有半年多的时间,技术正飞速发展和迭代,新事物层出不穷,在这个行业没有多年经验的老师傅。不管你是创业者还是产品经理,如果想转行到AIGC领域,现在是学习的最佳时机,只要学习的速度够快,你就可能成为该领域的专家。通过掌握ComfyUI,你能为未来的职业发展和团队协作打下坚实的基础,更好地适应这个行业的发展和需求。


    欢迎对AIGC工作流感兴趣的小伙伴一起同行!


    目前,我们正在翻译ComfyUI官方文档和撰写入门教程,网址:https://www.mixcomfy.com


    同时,我们正在搭建ComfyUI中文社区,如果你对ComfyUI感兴趣可以扫码加入。


    ComfyUI爱好者群:



    另外,如果你想深入学习ComfyUI动画等相关知识可以加入这个知识星球,是Shadow和我联合发起的,我们收集和整理全网最新最完整的资料。


    早期用户优惠,满50人后开始涨价



  • 今年4月份,我参加了上海的AIGC(人工智能生成内容)创建者大会,当时对于趋势做了一些分享。具体可以参看文章《AIGC革命:拐点降临的内容产业,如何赢得时代先机》。


    山雨欲来风满楼,将近半年过去了,现在趋势又会有怎么样的变化?技术迭代又给我们带来怎样的机遇?


    # 一、公理

    如今,抖音、快手、微信视频号等短视频平台迅速崛起,短视频和推荐算法构建的信息茧房,已让许多人无法释手、难以自拔。

    互联网行业有个普遍的共识:“视频的价值远超过图文和音频”。因为视频能在单位时间内传递更多维度的信息,这不仅带来了丰富的感官体验,还更容易建立情感纽带,从而实现较高参与度、较强社交传播力和更高的商业转化。如Youtube的贴片广告的变现价值和哔哩哔哩的弹幕的互动价值都是传统的图文和音频内容无法比拟的。

    基于此,我们可以得出第一条公理:“在单位时间内,高信息密度内容的价值要远大于低信息密度内容的价值”。

    然而,互联网视频内容的普及并非一蹴而就,2007年,我国网民数量是1.62亿,互联网的普及率只有12.3%。到了2023年,我国网民规模达10.79亿人,互联网普及率达76.4%,移动互联网人群成为了主力。


    正如每一次量子跃迁都会释放出巨大的能量,新兴技术的普及也会带来巨大的红利。随着移动网络和智能手机的性能提升和普及,PC互联网时代跃迁至移动互联网时代,释放了巨大的增量市场,也孕育了新的内容创作和消费场景。

    在PC互联网时代,由于网络环境和设备的限制,主要人群局限在日常使用电脑的学生和白领,UGC(用户生产内容)主要是图文形式,如人人网、天涯论坛、新浪博客和微博等。由于视频内容较高的制作门槛,更多是由专业人士通过PGC(专业生产内容)形式生产。

    今天,普通人通过一台手机就可以随时随地制作视频和分享内容。如此低门槛的方式,引发了UGC内容爆发性增长。同时,移动社交网络兴起也为内容传播提供了新的平台,进一步推动了视频内容消费的频次和多样性。

    正所谓:“旧时王谢堂前燕,飞入寻常百姓家”。正是因为PC互联网到移动互联网的变革,催生了从PGC到UGC转变,带来了今天内容产业的繁荣。

    由此,我们可以得出第二条公理:“技术革新的普及大大降低了普通人的内容创作和消费的门槛,从而释放出巨大的市场增量价值。

    如今,强大的生成式AI让我们又一次站在了重塑内容产业格局的风口浪尖。ChatGPT、Midjourney、DALL-E、Stable Diffusion等生成式的AI大模型不断推陈出新,AI新应用也让人应接不暇。

    当我们理解“内容信息密度”和“技术革新普及率”这两条公理之后,我们才能更好地去洞察这一切的变化,才能见微知著地做好趋势的判断。


    # 二、洞察

    随着Midjourney、Stable Diffusion技术的普及,制作AIGC图片已经成为众多创作者们兴趣爱好。但现在仅靠生成“1girl”的静态图像已不能满足日益增长的创作需求。在Stable Diffusion生态里,新的方法、论文和模型如雨后春笋般不断出现,AIGC的创作方式也在快速进化。

    我们洞察到了几个新趋势:首先是以ComfyUI为代表的AIGC工作流程的革新,它为个性化创作内容带来了前所未有的便捷;其次,AnimateDiff引领的动画生成展现了动态内容创作的无限可能;最后,DreamGaussian所展现的3D内容生成正开辟着全新的视觉艺术领域。这些趋势预示着一个更加繁荣和多元的AIGC时代即将到来,同时也将带来更多的机遇。


    1. AIGC工作流革命

    在Stable Diffusion项目中,目前普遍流行的WebUI,如Automatic 1111,因其缺乏灵活性,让普通用户难以根据自己的想法构建完整的创作流程,也限制了用户对新方法和新模型的尝试。

    新推出的ComfyUI正在改变这一切。它允许用户通过拖拽节点和连线的方式,将不同的模型、算法和参数组合在一起,形成一套自己的工作流,从而编织出更有创造力的AIGC内容。


    这意味着,即使是无编程背景的用户,也能够高度灵活和个性化地使用Stable Diffusion进行创作。ComfyUI按需加载模块的设计方式,在保证灵活性的同时,也大大减轻了系统资源的消耗,让装有中低端显卡的电脑也能顺利运行。

    AIGC的创意很重要,但AIGC工作流更具价值,因为这才是人类创造力的真正体现。让人惊喜的是ComfyUI还可以通过PNG图片共享完整的工作流信息。也就是说,用户不仅可以创造多彩的作品,还可以非常轻松地分享他们的创作流。这直接促进了优秀的AIGC工作流技巧在社区普及和传播,也将带来更多具有创意性内容。

    ComfyUI不仅为Stable Diffusion带来了更高级的创作体验,它还为我们揭示了AIGC工作流的巨大潜力,预示着我们正步入一个更高效、更具共享性和创新性的AIGC创作新阶段。

    Shadow最近也在做ComfyUI的课程,大家可以看看效果:ComfyUI的视频工作流


    2. AIGC动画即将崛起

    因为创作者不满足于2D静态图像的生成,AnimateDiff应运而生,其目标是将Stable Diffusion的静态图片生成能力扩展到动画生成领域。这一工具可以无缝将文本或静态图像转化为高质量的个性化动画图像,免去了复杂的模型微调。

    AnimateDiff之所以卓越,是因为它从大量视频中汲取了动作的先验知识,不仅确保了动画的流畅性、一致性和多样性,还能实现无可比拟的平滑过渡,几乎没有任何闪烁。下面是我前几天视频号分享的内容,在24小时内获得大量转发和观看。


    AIGC动画的优势在于其更高的自由度和容错性。创作者可以释放无限创意,打造出超越现实的艺术品。而且,它改变了传统动画对专业技能和资源的依赖,使非专业用户也能轻松参与。

    这不仅是技术的巨大进步,更标志着创意表达方式的革新。现在,每个人都有机会成为宫崎骏,创作出令人惊叹的动画作品。这是Shadow做的一个童话故事的实验,故事和gif动画都由AI生成的,请查看时间是主观的,每个人对时间的感受都不同

    AIGC正从图片领域跃迁到视频领域,预示着新的内容创作浪潮的即将到来。就像我前几天在视频号分享的动画短片,利用AIGC技术,创作者不仅能吸引更多观众,还能获得视频的巨大流量和商业价值。这在传统图文媒介中是难以实现的,这是所有内容创作者都不应忽视的机遇。


    3. AIGC从平面走向立体

    同样因为不满足于2D图像生成,也有不少AIGC创作者也在探索如何将2D图像转化为3D形象和场景,因为3D有着比2D更高的灵活性和操控性。然而,传统的文字或图像生成3D算法耗时长、精度低,这严重阻碍了AIGC在3D领域的深入应用。

    最近DreamGaussian横空出世,它实现了一种高效的文本和图片生成3D算法。它可以在短短两分钟内,从单一视角的图片中重建出高质量的纹理3D网格,其效率是现有技术的十倍之多。更难能可贵的是,尽管处理速度极快,但它在输出模型的质量上却毫不妥协,下图是老算法和新算法的渲染效率比较。



    DreamGaussian通过采用创新的3D高斯喷洒技术,在虚拟空间中模拟粒子的自然运动,可以精确地构建3D模型。这种技术不只是还原物体的几何形状,还能捕捉其表面的细微纹理和色彩,展现了惊人的细节和还原度。该技术虽已展现出强大的潜力,但它的旅程才刚刚开始,在效率、精度和应用场景上仍然有一定的优化的空间。

    通过与Stable Diffusion结合,DreamGaussian使内容创作者能够以前所未有的速度和创造力生产出高品质的模型,从而极大地加快了创作流程。更重要的是,3D内容生成技术将为各行各业开辟了新的应用路径。无论是电影和游戏产业的快速内容创建,还是产品设计和建筑领域的可视化原型设计。AIGC 3D将优化现有工作流程,降低成本并激发新的创意表达形式。

    相信不久的将来,内容消费者能够在内容平台看到越来越多的AIGC 3D视频内容,能够在VR和AR体验中享受到更逼真、高质量的3D环境,实现前所未有的沉浸式体验和交互性。随着这一技术的不断成熟,我们预见一个更加丰富、精细、互动性强的元宇宙即将到来。


    # 三、机遇

    AIGC依然在飞速发展,正所谓“春江水暖鸭先知”,一线的AIGC创作者们已经敏锐地感知到这些趋势变化。AIGC的工作流程优化和内容形式迭代,正为创作者、投资人和创业者打开一片新天地。具体的产业机遇主要集中在以下几个方面:

    1. 内容创作新浪潮: AIGC技术正在降低内容创作的技术门槛,使个人创作者和小型工作室能够更加容易地打造出具有差异化和个性化的内容。即便是没有深厚艺术背景的创作者也能制作出专业级的动画,满足市场对高质量、多样化内容的渴望。

    2. 广告与营销的革新: 在广告和营销领域,AIGC允许品牌以前所未有的方式创作个性化内容,并快速产出高质量的广告素材。目前,一些知名品牌已经在使用AIGC打造创意广告,通过打造更为生动、引人入胜的广告形式,获得市场的关注。

    3. 娱乐内容的多元化: AIGC正将娱乐体验推向一个全新的境界,尤其是在直播互动、游戏以及VR/AR等领域。目前,游戏产业正在使用AIGC快速生成游戏环境和角色,为玩家提供更丰富、更沉浸式的体验。

    4. AIGC教育培训需求: AIGC技术的崛起不仅改变了传统的内容制作流程,也为CG教育带来了革命性的变化。如何精通并利用AIGC技术创作出更多更优质的内容成了每个创作者的必修课,已经有越来越多的教育机构开始提供AIGC的相关课程。

    5. 算法和算力的需求: AIGC内容创作的复杂性和精细化需求的提升,也产生了算法和算力的迫切需求。创作者和工作室等小型创作群体,也要应对能耗和硬件成本的快速上升,这也将催生更多的算法和算力服务的需求。


    # 四、展望

    未来,一个更加繁荣、多元的内容产业将会浮现。在这个产业中,个人创作者能够更自由地表达创意,观众可以享受到更加丰富和个性化的内容,而AIGC创作和服务需求也将因技术迭代和普及而迎来新的增长点。

    我在《AIGC革命:拐点降临的内容产业,如何赢得时代先机》做了一个论断:如果你能够帮助更多人跨越鸿沟,那你在这个过程中也能获得巨大成功。

    目前,AIGC技术还在迅速迭代,AIGC技术的使用门槛依然相对较高,但这正是巨大的市场机遇所在。那些能够构建桥梁,帮助大众跨越这一技术鸿沟的企业和个人,将站在价值转化的最前沿。但是将前沿科技应用到大众市场也并非易事。

    “如何凭自己的能力找一个最容易撬动的价值杠杆,如何用最少的资源跑通一个可持续的商业模型?”依然是考验每一个创业者的难题。

    请记住这句话:找到你的客户最想要的需求和你能够做得最好的东西,并请专注于两者的交集。

    PM熊叔,公众号:PM熊叔重新理解创业:一名创业者的中途复盘(2018~2019)

    我相信,无论是打造更友好的创作工具,还是通过提供教育和培训来降低AIGC的门槛,这些先行者都将收获属于这场技术革命的红利。

    对于所有的创作者、创业者和投资者来说,现在正是深入了解这一趋势、积极参与并引领这场技术革命的最佳时机。让我们一起勇敢地踏上这条新的征程!


    最近,我们正在打造国内首个ComfyUI中文社区,期望能够帮助更多人了解和使用AIGC的工作流,我和Shadow已经翻译了ComfyUI的官方文档,目前正在内测中,如果有兴趣可以扫码入群。



  •        在上一篇文章《AI时代的产品经理的成长之路(上)》,我们讨论了,产品经理的底层框架和职业模型,也讨论了刚入行的产品经理如果要达成“方案交付能力”需要修炼哪些基本功。

           从业2~3年之后,我们有了牢固的基础,有了经验的积累,有了团队的认可。这时候,我们就需要从“方案交付能力”转向“产品交付能力”了。今天,我们就来讨论专业的产品经理应该如何交付成功的产品。



    一、产品经理的通用技能


           产品经理岗位设置的初衷就是要有人为产品的成败负责。当刚刚步入这个岗位的时候,我们或许都曾怀揣着一种创造伟大产品的信念,以为通过自己的努力可以应对一切挑战。然而现实却告诉我,产品的成功并非只是依靠产品经理一个人就可以搞定的。产品的成功取决于团队的成功,而不是产品经理个人。

           产品经理需要懂得激发身边的每一个人。就像领航员一般不仅要带领着团队朝着正确的目标前进,还要灵活地应对各种变化和挑战。最终,产品经理交付给用户的不仅是一个解决方案,而是一种“共识”,这种共识来自市场、用户、团队、决策层、合作伙伴等等。

           谷歌风投的产品合伙人肯•诺顿,将产品管理工作比作“粘合剂”,能将不同领域和角色连接在一起,就像《星际迷航》中的通讯器,可以帮助不同种族之间进行交流。没有这种“粘合剂”,产品就很难成功。

           因此,产品的成功在很大程度上取决于产品经理所具备的软技能,这些技能是一种通用的技能,无关乎所在的行业领域,但在驱动团队交付正确产品方面起着关键作用。这些技能大致分为以下四个方面:

    “产品管理的核心技能”引自 《Product Management in Practice》

           1. 沟通(Communication):作为产品经理,你需要能够以清晰、有力的方式传达你的想法和愿景。这不仅包括与团队的有效沟通,还包括与各种利益相关者,如用户、开发人员、设计师和高管的沟通。良好的沟通技能有助于建立信任、促进合作,并确保项目朝着正确的方向前进。

           2. 组织(Organization):组织能力对于产品经理至关重要,因为你需要协调多个任务、计划和团队成员。这包括制定项目计划、管理产品路线图、分配任务以及确保项目按时交付。良好的组织能力还包括有效地处理任务的优先级,以确保最重要的工作得到优先处理。

           3. 研究(Research):产品经理需要对行业、市场、用户和技术进行深入研究,能够感知到行业趋势和变化,深入了解市场竞争格局和理解用户需求。通过研究能力和洞察力指导产品决策,确保产品满足市场需求并保持独特的竞争力。

           4. 执行(Execution):产品经理不仅需要规划和制定策略,还需要确保项目按计划执行。这包括推动开发团队、跟踪进度、解决问题和应对变化,以及没有人认领的事情。执行能力是将策略转化为实际结果的关键,同时也是推动项目成功的关键。

           接下来我们将深入探讨这些通用技能的知识点,以帮助产品经理更好地应对不同领域的复杂的产品管理挑战。我们需要点亮的技能如下:

    * 素质层:责任心、独立思考、沟通能力

    * 认知层:商业认知、系统思维、数据思维、心理学、项目管理

    * 影响力层:团队驱动力

    * 交付层:需求管理、产品规划



    二、产品交付能力:百尺竿头更进一步


    1、素质层

    1)责任心

           当你刚刚进入产品管理领域时,充满了热情和雄心壮志。你可能梦想成为乔布斯一般的产品经理,创造出令人拍手叫绝的产品,为公司赢得市场份额,引领行业发展。然而,在实现这些梦想之前,我们需要一个至关重要的关键因素——责任心。

           责任心不仅仅是完成工作任务的能力,更是一种态度和价值观,涵盖了积极承担、持续努力、克服困难、认真负责、关心项目和团队需求等多个方面。责任心激发产品经理带领团队积极地解决问题,确保项目顺利推进,提高团队的信心和凝聚力。这种责任心将产品经理塑造成团队的领袖,引领着整个团队朝着共同的目标前进。

           有责任心的产品经理会关注产品长期的成功。他们把产品视为自己的“孩子”,不仅关注产品的阶段性交付,还关心产品的迭代路线和市场表现。这种责任心驱使他们不断改进产品,确保产品不仅具备满足用户需求的功能,还能赢得较高的用户满意度,让产品在市场中保持竞争力,为产品的长期成功奠定坚实基础。

           产品经理的工作充满挑战和变化,在这不确定的环境中,具备责任心的产品经理能够冷静应对问题,积极寻找解决方案,坚定面对挑战,绝不回避问题,努力确保项目成功,同时也塑造了可靠的职业形象。这种信任和责任心不仅赢得公司和团队的尊重,还为产品经理创造更多职业发展机会,使他们能够承担更多责任和应对更多挑战。

           总之,产品经理的责任心不仅影响产品交付的成功,也对个人和团队的发展产生深远影响。责任心不仅推动产品经理主动发现问题和解决问题,也促使他们不断反思和成长,从而展现出卓越的专业素养和领导力,最终使他们赢得可信赖的产品领导者的地位。这是实现产品经理职业成功的关键之一。

           推荐阅读书籍:《高效能人士的7个习惯》《产品经理:从优秀到卓越》


    2) 独立思考

           独立思考能力是产品经理所必备的素质。产品经理需要有主动发现问题和提出解决方案的能力,而不是人云亦云。这种能力不仅有助于应对复杂问题和挑战,还能为团队和产品带来新的视角和机会。

           具有独立思考能力的产品经理不会简单地依赖于现成的答案,也不会偏听偏信某一方的观点和建议,更不会一知半解的套用书本上的理论框架。通过深度的独立思考能力,产品经理能够为团队和产品找到新的视角和思路,发现问题背后的新机会,从而推动产品的进一步发展。

    产品经理该如何在没有明确答案的情况下做出明智的决策?独立思考能力并非一蹴而就,需要产品经理不断地培养和锻炼。

           首先,我们需要有多元的知识结构。我们要培养好奇心,积极广泛阅读和学习,从而拓宽自己的认知领域。另外,我们还要倾听不同人的建议,获取多角度和多元的信息和观点。从而帮助我们更全面地思考问题。

           其次,我们要养成深度思考的习惯。在遇到问题的时候,不要匆忙做出决策,而是要静下心来,多花一点时间深入思考问题的本质。我们要善用数据、逻辑分析方法和分析工具框架,通过全面分析来找到最佳解决方案。特别是当我们为自己的idea兴奋不已的时候,需要习惯性地连续问自己“5个为什么”,让自己头脑冷静下来。

           再次,我们要了解思维的局限性。了解常见的思维的局限性和认知谬误,如证实偏差、基本归因偏差、达克效应、因果关系错觉等。这有助于识别和纠正思维错误,获得思维能力的提升。同时,通过批判性思维挑战已有的观点和假设,可以帮助我们找到逻辑缺陷,从而挖掘问题的本质。

           最后,更重要的是我们要定期反思自己的决策过程,识别不足之处并加以改进。这种反思能力有助于不断提高决策的质量,并避免重复犯同样的错误。

    推荐阅读书籍:《学会提问》《思考的艺术》《批判性思维工具》《逻辑思维简易入门》


    3)沟通能力

           沟通能力是产品经理最不可或缺的技能之一。沟通远不仅仅是信息的传递,它包括倾听、解释、协调和影响等多个方面。卓越的沟通能力不仅有助于建立信任,还在促进合作、问题解决和最终产品的成功方面起着关键作用。

           首先,产品经理需要在内部团队中展现出卓越的沟通能力。他们必须能够清晰地将产品的愿景、目标和需求传达给开发、设计、运营以及其他相关团队。这确保了团队知道需要构建一个怎么样的产品,以及应该以怎样的优先级进行执行。产品经理还必须知道如何协调不同团队的工作,以确保项目按计划推进。当问题出现时,通过高效的沟通能力,产品经理能够帮助团队快速识别问题并共同找到解决方案。

           另外,产品经理还需要与外部各方进行有效的沟通,包括用户、高管、投资人以及其他职能团队。产品经理需要通过沟通来了解用户的需求、痛点和反馈,还需要向高管和投资人汇报项目进展和阶段成果、传达产品愿景和战略。通过沟通影响公司的战略决策、资源分配以及跨部门协作。

           沟通能力需要我们在工作中不断地提升,包括倾听他人、情绪管理、尊重多样性、演讲和结构化表达等方面。产品经理通过积极提升这些沟通技能,能够为自己和团队创造更多成功的机会。

           总之,卓越的沟通能力对于产品经理至关重要,不仅在团队内部协作中起着关键作用,还对外部利益相关者的理解和公司的战略决策产生深远影响。产品经理沟通技能的提升并不仅仅是个人能力的提升,也为产品和团队的成功铺平道路。

           推荐阅读书籍:《产品领导力》《结构化表达:如何汇报工作、演讲与写作》《Product Management In Practice (产品管理实践)》


    2. 认知层


    1)商业认知

            产品的成功本质是商业的成功,产品经理的商业认知涵盖了战略、市场、经济学和决策等方面。它有助于产品经理更好带领团队推动产品成功,同时也有助于公司在竞争激烈的市场中脱颖 而出,实现长期可持续的商业价值。

           首先,产品经理需要懂得如何将产品与公司的商业战略紧密结合。这意味着要理解公司的目标、市场定位和竞争策略,以确保产品的特性和发展方向与这些战略保持一致。只有这样,产品才能为企业获得商业竞争的成功。

           其次,产品经理需要深入了解市场需求、用户行为和竞争情况,以分析数据、洞察趋势、识别机会和风险,从而指导产品发展。同时,掌握经济学原理和商业模型可助力产品经理制定盈利策略,包括成本效益分析和定价战略,确保产品在市场中实现最大化盈利。

           产品经理也需要识别潜在商业风险并采取应对措施,考虑市场、竞争和商业模型风险,以减轻不利影响。这些商业认知帮助产品经理做出明智决策,既有利于产品又有益于公司整体业务。

    另外,产品经理需要知道如何与不同部门沟通商业价值,包括市场营销、销售、开发、运营等。  商业认知有助于他们更好地沟通和协作,确保产品的商业目标得到理解和支持。

           更重要的是,商业认知关系到商业模式的创新。产品经理可以通过商业认知推动新的商业机会,让产品更快地达到PMF(产品和市场的匹配)。对于现代产品经理来说,商业认知是不可或缺的核心素养。

           推荐阅读:《定位》《创新者的窘境》《消费者行为学》《经济学原理》《行为经济学》《消费者行为学》《博弈论》《跨越鸿沟》《商业模式新生代》《AI经济学》


    2)系统思维

           在产品经理的日常工作中,我们经常面临复杂问题,但大多数人解决问题的方式都是头痛医头脚痛医脚,眼前的问题解决了,短期数据指标提升了,但是产品并没有变得更好,而且长期看可能还产生更多问题。这是为什么呢?

           因为很多复杂问题中包含了众多相互关联的因素和变量,但我们的大脑更倾向于线性地处理具体的信息。

           通过学习系统论、系统思维、系统工程和系统分析等相关领域的知识和应用,我们可以培养对于系统的思考能力。让我们更好地理解系统运转的逻辑,更有效地解决问题,并做出更全面的决策,对于个人和组织来说都是一项极具价值的技能。

           首先,系统论给了我们一个整体性的观点。我国著名学者钱学森对系统做了这样的定义: 系统是相互作用和相互依赖的若干组成部分或要素结合而成的具有特定功能的有机整体,系统的整体具有不同于组成要素的新的性质和功能。因此我们不能像盲人摸象一般仅关注局部的细节,我们更要关注整个系统的行为和相互关系。这样我们方能获得超越局部的视角,更全面地理解问题的本质。

           其次,系统论给了我们一个研究系统的方法。 系统思维将系统分解为组成要素、相互作用、结构、边界和环境。我们可以通过使用建模方法和工具来理解这些元素如何相互关联和如何受外部环境影响,常见建模模型有图形模型(如系统循环图)、概念模型、数学模型。

    最后,系统论能让我们了解系统的普遍性质和特征,如目的性、功能性、动态性、层次性、相关性、自组织性、时延性、韧性、适应性等。我们可以更好的预测系统的行为和响应,帮助我们更好的预测系统的趋势和未来。

           总之,在现代商业环境中,产品本身就是一个复杂系统,涉及众多因素和相互作用。产品经理需要系统思维来理解这种复杂性,找到问题的根本原因,才能制定有效的解决方案和做出明智的决策。

           推荐阅读:《系统之美:决策者的系统思考》《第五项修炼》《系统思考(白金版) 丹尼斯.舍伍德》《系统化思维导论》


    3)数据思维

           数据思维AI时代,数据扮演着至关重要的角色。无论是大型企业还是初创公司,都在不断产生和积累海量数据。数据思维已经成为了产品经理必备的技能之一。数据思维是一种将数据融入决策和产品的思维方式。

           在产品工作中,产品经理要理解数据、应用数据和避免数据陷阱。 

           首先,产品经理需要具备数据分析能力,以理解产品问题和用户需求。通过分析数据,他们可以发现范式、趋势和关联关系,从而更好地解决问题和满足用户期望。产品经理需要学习常用的数据分析工具或语言,如,Excel、SQL、Python等,以及通过数据仪表板来监测关键指标和用户行为。

           其次,产品经理要将对数据的见解转化为实际应用,数据才会有价值。产品经理要将数据见解转化为产品策略,以支持产品的发展和改进。通过定义数据指标和复盘定期评估策略的有效性。另外,对于AI产品来说,数据是算法模型的关键养料,有效的数据收集和应用是确保模型性能和产品成功的关键因素。我们需要知道如何构建AI产品的数据管道,支持数据收集、处理、训练和应用。同时,我们还要密切关注行业最佳实践和法规,确保数据的合法合规使用。

           最后,我们还要识别数据分析中各种陷阱,如选择性偏见、相关性与因果关系混淆等。产品经理必须具备数据素养,以识别和规避这些陷阱。我们要审查数据来源,验证假设,与其他团队成员讨论数据,确保数据的准确性和可信度。才能更好通过数据来获得产品的成功。

    数据思维是产品经理不可或缺的核心能力。它不仅是一种技能,更是一种战略优势,可以为产品和业务带来巨大的价值。通过理解数据、应用数据和避免数据陷阱,产品经理可以更好地驱动产品的成功。

           推荐阅读书籍:《深入浅出数据分析》《深入浅出统计学》《拆穿数据胡扯》《数据思维:从数据分析到商业价值》《产品经理数据分析实战手册》 《精益数据分析》


    4) 心理学认知

           心理学知识有助于产品经理更好地理解用户、优化用户体验、改进产品定位和决策,从而更好地满足市场需求,提高产品的成功概率。这些知识点应成为产品经理工具箱中的重要组成部分,以便更好地执行其职责。

           了解用户的需求是产品成功的关键,而心理学是探索用户需求和行为背后的钥匙。心理学可以帮助产品经理更好地洞察用户的行为和需求背后的心理机制。通过了解用户的决策过程、情感反应和动机,有助于产品经理更精确地满足用户的期望。

           另外,产品经理需要不断改进产品的用户体验,使其更易于使用和愉悦体验。心理学认知有助于理解用户的注意力、认知负荷和情感反应。这使得产品经理能够设计更符合用户认知和情感需求的界面和功能。

           同时,心理学认知也可以帮助产品经理更好地做产品增长,设计激励措施,提高用户采用率。例如奖励系统和稀缺性策略,可以帮助产品经理引导用户采取特定的行动,如注册、购买或分享。

           另外,在用户研究层面,心理学认知能力可以指导产品经理进行有效的用户研究和实验。这包括访谈、观察、调查和A/B测试等方法,可以帮助产品经理验证和改进产品设计,确保产品满足用户需求。

           通过应用心理学知识,产品经理可以更成功地满足市场需求,创造出卓越的产品,并在竞争激烈的市场中脱颖而出。因此,不仅是科技产业,各行各业的产品经理都应该在其工作中重视心理学认知,这将是他们事业成功的关键之一。

           推荐阅读书籍:《思考,快与慢》《心理学与生活》《消费心理学》《影响力》《设计心理学》《认知心理学》《社会心理学》《动机与人格》(马斯洛需求层次理论)《上瘾》《用户体验度量》


    5)项目管理认知

           产品经理通过深入了解项目管理知识,可确保团队在整个迭代周期内高效协作,排除潜在风险,实现产品交付的成功。

           在项目管理中,有一个著名的概念叫做“不可能三角”,它包括时间、成本和范围三个要素。产品经理需要理解,在资源有限的情况下,不能同时满足又好又多的产品需求,并且还能保证按时交付。产品经理需要在这些因素之间做出权衡,以确保项目目标和客户需求的平衡。

           产品经理应该熟悉常见的开发模式,如瀑布式开发和敏捷开发。尤其是在互联网项目中,敏捷开发可以更好地应对市场需求的快速变化,确保产品能及时适应新的挑战和机会。产品经理通过掌握敏捷开发的核心原则和方法,如Scrum和看板等,能够有合理规划版本、编写用户故事,以明确产品功能和需求。通过快速敏捷地持续地交付,来及时获取用户反馈,为产品指明方向。

           了解项目进度和风险管理基本概念对产品经理将产品规划转化为项目执行至关重要。这有助于确保项目按计划和预期前进,并在面临挑战时迅速应对。产品经理需要将产品路线图与项目管理过程相整合,以确保产品的功能迭代与整体产品战略一致。这包括项目计划、资源规划以及识别和应对项目风险。

           总之,项目管理认知可以帮助产品经理更好地做好产品管理,确保产品与战略一致,高效地满足用户需求。这些知识将提升产品经理的职业竞争力,让你在竞争激烈的市场中脱颖而出。

           推荐阅读的书籍:《人月神话》《项目管理知识体系指南(PMBOK指南)》《敏捷软件开发:原则、模式与实践》 《硝烟中的Scrum和XP》


    3、影响力层


    团队驱动力

           产品经理的团队驱动力是指他们在团队中发挥的能力和影响力,通过积极的态度、合作、领导和协调,推动团队朝着共同的目标努力并取得成功。这种驱动力涵盖了多个方面,如责任心、领导力、沟通能力等。

           团队驱动力的源动力是产品经理的责任心。产品经理不仅关心自己的任务,还关心团队的整体目标和项目进展。他们愿意主动承担任务,持续努力,克服困难,以确保项目按计划进行并成功交付。他们会在团队中树立榜样,通过自己的行动和态度来影响他人,从而建立可靠的形象。

           此外,产品经理在团队中还需要展现出一定的领导力。他们可以协调资源、调解冲突、推动合作,确保团队成员都在同一个目标下紧密协作。他们需要具备激励和激发团队成员的能力,帮助团队成员克服困难,保持积极的态度。

           另外,产品经理的沟通和合作能力也是团队驱动力的重要体现。他们需要与各种不同角色的团队成员进行有效的沟通,包括开发人员、设计师、营销人员等。通过清晰的沟通能力,产品经理可以传达项目的目标、需求和优先级,确保团队成员都理解并共享相同的信息。另外,产品经理还是用户和团队的信息通道,他们主动地将用户和市场的反馈带给团队,激励团队持续改进产品;面对不好的反馈,产品经理也能够积极做出调整,以确保团队能在正确的道路上前进。

           总之,产品经理的团队驱动力表现为他们在团队中发挥积极的领导作用,关注整体成功,积极协作,解决问题,推动决策,并始终保持责任心和关注产品的热情。这种能力对于协助团队实现共同目标和推动产品成功非常关键。

           推荐阅读书籍:《高效能人士的七个习惯》《第五项修炼》《启示录:打造用户喜爱的产品》《产品领导力:杰出的产品经理如何打造卓越的产品和团队》


    4、交付层


    1)需求管理

           需求管理涵盖了从需求收集、分析、排定优先级、PRD文档化、评审、沟通、验收以及变更等工作内容。在有限的时间和资源下,产品经理需要通过优秀的需求管理技术,确保产品按用户期望和业务目标交付。我们不仅要合理的评估和决策,还要灵活应对变化和冲突。确保产品能保证质量地按时交付给用户。

           日常工作中,需求管理通常围绕产品的阶段性目标(或版本迭代计划)和产品需求池(Product Backlog)展开。当产品上线后,随着用户的反馈和项目的发展,产品阶段性目标也会产生变化。因此我们需要经常性地将需求与产品的整体目标进行校准,调整规划版本功能特性和优先级。同时,产品经理还要保持与团队和利益相关者的透明沟通,及时更新需求的进展和变化。避免信息不对称和误解。

           另外,在项目推进的过程中,需求管理最大的失误就是花了大量的时间和资源去做没有价值的功能,导致项目偏离目标和价值迟迟无法得到验证。很多时候,决定什么不做比决定做什么显得更为重要。因此,权衡需求和排定优先级是产品经理的重要工作,我们需要了解一些重要的价值评估模型,帮助我们更好地识别和排定需求优先级。例如,ROI(投资回报率)、KANO模型、RICE(重要性、影响、信心和努力)模型、MoSCoW模型(Must have、Should have、Could have、Won't have)、ICE(影响、信息、努力)和价值努力矩阵。

           产品经理专业性除了撰写优质PRD以外,更重要的是懂得如何用最低的成本和最短的时间验证一个极具意义的需求。特别是项目早期,有诸多不确定性,看起来再完美的Idea也可能经受不住现实的考验,快速地收集市场反馈显得尤其重要,这需要产品经理有精益创业的MVP思维。

           推荐阅读书籍:《用户故事与敏捷方法》《软件需求(第三版)》《用户故事地图》《重新定义产品路线图(Product Roadmaps Relaunched) 》《精益创业》《精益创业实战》《AI产品管理》


    2)产品规划

           在产品规划中,产品经理需要综合众多关键因素深入思考,以确保产品能够满足市场需求并实现商业目标。

           首先,产品经理需要确立清晰的产品愿景和目标,以帮助团队对未来有明确的认知。这需要深入地市场调研、行业趋势分析和竞争格局的了解,以及用户反馈的收集和分析。这些步骤有助于确定产品定位、竞争策略,并提出独特的价值主张和商业模式,以及达到阶段目标的资源需求。这些内容通常会沉淀到商业需求文档中,用于申请项目启动的资源。

           然后,产品经理需要将愿景和目标转化为清晰的、可操作的产品路线图。路线图展示了产品的阶段性目标、里程碑、不同版本的关键功能特性和上线时间。有了产品路线图之后,产品经理还要推动团队达成共识。让团队能够清晰地了解到整个项目的战略节奏,可以有条不紊地推进工作。通常这些内容会沉淀到市场需求文档或者项目管理文档中。

           在AI时代,产品经理除了关注常规的功能性需求外,我们还需要知道AI模块如何更好地与应用场景结合。如果是AI First的产品,产品规划的时候需要考虑通过打造数据飞轮不断优化和提高AI模型。因此,我们还要特别关注数据需求和数据体验。

           最后,在规划的过程中也要识别潜在的风险和挑战,因为市场变化和业务的演变可能会影响原本的产品规划,因此产品经理制定相应的应对策略,需要定期修正路线图和计划,以保持与市场同步。另外,还要关注合规性、伦理和安全性需求。

           推荐阅读书籍《用户故事地图》《重新定义产品路线图(Product Roadmaps Relaunched) 》《产品经理方法论》《精益创业》《精益创业实战》《软件需求(第三版)》《AI经济学》


    三、总结

           综上可见,产品经理绝非是一个毫无门槛的职位。他们需要在多个层面展现出卓越的素质和技能,才能确保产品的成功。

           在素质层面,责任心、独立思考和卓越的沟通技能至关重要。在认知层面,商业认知、系统论认知、数据认知、心理学认知以及项目管理都扮演着关键角色。影响力层面需要产品经理具备领导和激励团队的能力。最后,在交付层面,需求管理和产品规划是核心任务。

    我们可以感受到,这是一个对综合能力要求极高的职位,产品经理既要有战略规划能力也要有实际落地能力,不仅应对市场竞争的挑战,还要解决复杂多变的问题,才能确保产品在不断变化的环境中获得成功。

           佛法有云:“诸法因缘生,诸法因缘灭。”意思是,所有事物都是由无数因素和条件相互作用而产生或毁灭的,一切都是流动变化的,没有单一原因可以解释一切。


           同样,产品经理的工作也充满了因缘和合。无论是个人发展、团队成功、用户需求还是市场竞争,我们只有不断参悟事物间的因缘,才能找到通往成功的道路。

           回顾我的创业经历,一次天使轮融资的尽职调查中,投资人问我是否相信产品能够成功。我坚定地回答:“我相信产品的成功等同于团队的成功。虽然我们的团队就几个人,但麻雀虽小五脏俱全,有算法、开发、产品和市场等领域,但每个人都拥有丰富的从业经验,都能够独当一面。最关键的是,我们都相信‘通用的大规模知识图谱技术能够帮助更多人成功’,随着模型和算法的不断迭代,在未来会具有广泛的应用。此外,我们仅用了短短四个月的时间将一款完整可用的AI产品推向市场,这已经证明了我们团队强有力的执行力。尽管创业过程中充满了挑战,但我坚信,这样的团队是最有望取得成功的。”

           不久之后,我们成功获得了数百万美元的天使投资。在众多决策中,有时候相信团队比相信自己的方案更为重要。这或许正是佛法所表达的“因缘而生”的真谛——天时地利人和,诸法因缘而生。

    我已将文章中提到的资料,放到了我的知识星球,如果有需求关注我的微信公众号:PM熊叔


  •        AI产品其实并不神奇,任何产品的商业价值都在于其对人类的价值。
           随着ChatGPT火热,越来越多的产品经理也在考虑为自己的产品添加AI功能,但是事实上并没有那么容易。作为产品经理我经常能收集到各种AI产品的Idea,有些甚至过于科幻,每当我们迫不及待的去实施的时候,结果总是状况百出。

           该如何选择更好的技术方案或许是算法工程师关注的领域,但对AI产品来说,如何管理好AI产品需求也是一个重要挑战,这也是AI产品经理的使命所在。

           这两年的实践中,我先后做了“Get写作”和“互链文档”两款智能写作产品,前者是针对新媒体写作场景,后者是针对于日常笔记场景。不管是哪个场景,摆在我们面前最大的问题并不是“我们可以用AI打造一款怎样与众不同的产品?”而是:“我们该怎么去定义智能体验?”


    一、如何定义智能体验?


           学术界对于AI智能已经有了一些定义,人们期望AI像人一样,能合理地思考和行动(出自《人工智能——一种现代化的方法》),如下图。


           从用户体验角度来看, AI产品的智能体现就是能合理地做出行为决策,换句话说就是“机器能根据输入条件作出合理判断并输出结果”,我们暂且称之为 “自动化决策”。
    例如,Siri能够合理地回答你问题,虽然有些回答听起来很搞笑,但只要输出的结果让人觉得合理,就依然会被人接受,如下图。

           AI的输出是否合理,这个取决于人的主观评判。这也是数据标注工作所做的意义所在——尽可能通过标注让模型更能贴近人的预期。
           当我们把一连串“自动决策”串联在一起了后,就变成了一个自动化的业务流程,帮助人类省心省力地完成业务目标,这也是AI产品的价值体现。
           例如,扫地机器人通过良好的寻址算法,趁主人不在家的时候扫遍房间的每一个角落,让人觉得省心又省力。但如果在扫地过程中不断需要主人来处理各种状况,如卷了电线和异物,就算这些状况和算法无关,那也会让人觉得不智能。
           因此,AI产品的体验效果并不一定取决于算法,而是在产品使用过程中是否能流畅地达到用户预期的目标或价值。
           综上,最终决定产品的智能体验感的核心还是在于经过AI的一系列自动决策后,能更好地满足业务场景中的需求。


    二、AI产品需求的挖掘与管理

           根据前面的分析,所谓的AI产品需求管理,首先要挖掘那些能够自动化决策的需求点,其次当这些需求点串联在一起的时候,让产品整体能达到较好的使用体验。前者和算法有关,后者不仅仅局限于算法,如下图所示:


           需要强调的是:不管技术手段如何变,产品经理始终都需要以实现商业价值为目标和用户体验为中心来选取具有可行性的技术手段和方案。但反观目前市面上的一些AI产品经理的资料,通篇照搬AI技术的概念,而忽视了产品本质,这是一种舍本求末的表现。

           在AI产品需求分析与整理的过程中,我们总结了以下四个关键步骤:1. 收集场景案例;2.绘制决策流程;3. 筛选可行性用例;4. 制定AI产品路线图。



    1、收集场景案例

           我们要教会AI决策,我们就必须弄清楚人是怎样做决策的。 我们应当以实现业务价值为最终目标,专注分析业务场景中的问题。在项目早期,收集实际场景中的业务案例显得尤为重要。

           我们可以将收集的案例整理成一个个表格或者卡片,包含要素有:场景概述、业务目标、业务流程、关键决策点、业务痛点、过往案例:

           1. 场景概述:用最简洁的一句话说明该场景中的业务要点“谁-做什么-为什么做”,这类似于敏捷开发中的“用户故事”;

           2. 业务目标:用于明确业务要达成的最终结果,并为自动决策获得一个可衡量标准。我们可以寻找业务中一些量化的KPI,这不仅是对人的考核也是对AI的考核;

          3. 主要业务流程:目的是为了弄清楚当前的系统运行情况:在原有的人工的业务流程是怎么样的?现有的业务流程中有哪些优点或者缺点?

           4. 关键决策点:找到关键逻辑决策点,在流程中人是如何做决策的?判断的效率怎么样?判断规则是什么?要输出怎样的结果?

           5. 业务痛点:找到产品能够发挥价值的地方,有哪些痛点?有哪些抱怨?

           6. 过往的成功与失败的案例:主要是为了弄清楚一些真实情况。能否举出多个成功的案例?能否举出多个失败的案例?失败的原因是什么?会怎么样处理?

           在我接触过的项目中,一些业务方对表格中的问题会表现得一脸懵逼,原因很简单,自己都没有弄清楚自己业务的SOP(标准作业程序)就期望AI来帮他们解决问题。这种情况,还是需要由人类先摸索出有价值的SOP,因为人做不好的,AI也很难做好。

           如下图,CRM客户挖掘的业务场景案例:每天,电话客服人员需要拨打大量的电话,找到对产品感兴趣的客户,以便于销售人员跟进。对于客服人员来说,工作量大而且重复,容易让人烦躁。


           通过这样的收集和整理,让我们对要解决的问题和场景有一个直观的感知,但随着调查的深入我们还可能会发现新的问题。为了不遗漏有价值的信息,这个阶段我们收集的案例,应该有更多发散性。


    2、绘制决策流程图

           通过业务案例的收集,我们可以梳理出一个业务流程图,我们可以使用“UML活动图”来绘制,并且我们还要重点标识出决策的判断点。如下图:



           如图所示,起点是挑选客户资料,结束点是标记出有意愿的A类的客户。 为了更加明确,我们将理想的关键流程(Happy path)放到主轴上面,代表决策的菱形节点放在两边,我们可以一目了然,看到那些通向“幸福 Happy”的关键决策。

           先不考虑任何实现手段,我们需要先弄清楚,每一个决策点的输入、输出和规则是什么。我们可将这些决策点整理成一份“决策用例清单”,然后再综合考虑是否合适AI自动化决策:

    用例(Use Case)是UML中术语,一个用例代表一个完整的系统功能单元,但不考虑该系统的内部实现细节。


           另外,我们还可以将此清单直观地整理成UML用例图,这个系统参与者有三个:客服,客户,AI。

    3、筛选可行性用例

           根据上面的用例,AI该如何与人类一起工作呢? 并不是所有“决策”都是适合机器做,机器做决策的特点是效率高速度快,但应变性弱并且依赖训练数据,需要保留一定的容错性。

           人类做决策的特点是灵活性高,但是效率慢、主观性强等问题。我们可以用“场景决策矩阵”判断,如下图:



           按照场景和决策两个维度:

           * 场景分为“常规场景”和“细腻性场景”:常规场景中可以收集的数据充足,细腻场景对数据细节要求较高,可以收集训练数据量较少,AI的出错率较高,需要有人类优化和把控结果。

           * 决策分为“信息性决策”和“行动性决策”:信息性决策提供的是信息建议并不会直接影响项目执行,行动性决策是直接影响结果的执行命令,例如,智能驾驶。如果AI执行行动性决策任务可能会导致严重项目风险。

           我们将这两个维度分成四个象限:

           1. 常规性场景+信息性决策:对细节要求不高,学习案例多,AI学习效果较好,AI只提供信息建议,辅助人类决策,出错的风险很低,特别适合AI来做;

           2. 细腻性场景+信息性决策:对细节要求极高,学习案例少,AI做出正确判断有难度,AI提供信息建议,由人类为主导AI辅助做决策,出错风险低,早期适合人类为主导,随着模型调优人类可以逐步放权;

           3. 常规性场景+行动性决策:对细节要求不高,学习案例多,AI学习效果较好,AI代替人类做行动决策,出错有一定风险性,早期适合人类为主导,随着模型调优人类可以逐步放权;

           4. 细腻性场景+行动性决策:对细节要求极高,学习案例少,AI做出正确判断有难度,让AI代替人类做行动决策有很大风险,建议人来做。

           我们可以将上面的决策用例做一个基础的判定:排布在场景决策矩阵如下:

           通过这样的分类方法,我们能很清楚的知道机器和人类应该怎样分工,案例中大部分决策用例都可以交给机器,但“询问进一步沟通的意图”是很关键一步,如果全权交给机器,效果将大打折扣。这样,我们就有了一张人与AI的分工图:

           这时我们有了两条思路:

           第一条思路,如果AI效果好的话,那么全权负责整条链路,让人在最后一步把关,这样的好处是效率高;

           第二条思路,AI作为一个辅助工具,帮助客服自动化筛选客户信息,做好通话情况记录和打分,一定程度有效提升客服效率,而且结果也可控。

           到底哪个方案好呢?

           一方面需要根据实际的业务需求判断, 例如,针对高端人群的产品,获取客资成本高,对于这些高端客户来说冷冰冰的机器人电话显得没有诚意,但是普通话不标准的销售人员也可能让人觉得是山寨推销。

           另外一方面,我们需要将需求对应到不同的技术模块上,因为算法产品有一定不确定性,贸然使用不成熟的技术,也承担着巨大风险。 作为产品经理,我们应积极与数据科学家和工程师沟通,或许他们也有更好的建议,对于产品经理来说,沟通永远都是第一要务。

    4、制定AI产品路线图

           AI和人一样,需要一个成长过程,这个过程中需要不断的积累数据和调整算法策略。一个好的AI产品路线图,需要给我们的产品规划一个学徒期,从简单的决策开始,再逐渐演变为更复杂的决策。

           我们可以根据前面的算法模块的拆解,挑选出哪些需要优先做的模块,我们可以从影响、努力、风险三个维度考虑。如下图:


           我们优先选性价比高和风险较低的模块,如果是一些通用性的算法模块也可以考虑使用大厂提供的服务。这样保证产品功能完整性的同时,也降低了不确定性带来的问题。


           AI产品相比传统产品更需要大量数据,我们需要提前做好数据埋点和反馈机制,确保产品上线后,能够收集足够的数据,充分了解各种决策及其完整上下文。这样便于算法工程师,持续的优化模型和算法。

           另外,为了更早的发现真实场景中的问题, 我们需要让用户尽早地使用我们的产品,但是由于产品还在学徒期,功能不完善、体验不确定,并不适宜大规模推广。我们可以考虑通过邀请制,让愿意尝鲜的用户先体验,这些用户往往比普通用户包容性更强也更加积极,愿意提更多的意见和想法。

           基于上面的几点考虑,我将路线图中的需求分成应用层需求和算法层需求两类。


           应用层主要是指直接与用户打交道的需求,这部分是偏传统的软件开发内容。细分下去包含,决定产品使用体验的功能性需求;和运营节奏息息相关的增长性需求,如邀请、裂变、积分等;还有用户看不到的但能让产品和服务变得更好的支持性需求,如产品后台、数据埋点与数据统计平台等。

           算法层是指与自动化决策息息相关的需求。应用层与算法层通过算法服务提供API打交道,这些API需要根据应用层场景进行调整和优化。但算法只有API是不够的,还需要一些支持性的模块,例如网络爬虫和一些基础算法模型,另外应用层真实的数据反馈对于算法层也非常重要。

           在产品早期,我们需要迅速验证我们的业务方向和价值。所以,我们首先需要为用户做好基础场景的建设,并为AI的崭露头角预留出更多的空间,于此同时我们也需要做好算法层的技术建设,然后再逐步引入种子用户不断优化产品。而中期,我们需要提供更多的业务数据反哺算法,形成数据飞轮,做到人无我有的极致体验。最终,我们整理出我们的AI产品路线,让我们的AI产品能够从学徒期慢慢走向成熟。


    三、结语

           在这两年的AI产品实践中,我在产品经理、设计师、工程师之间来回切换角色,不仅仅是为了打造心中所想的产品,也是为了探寻心中的一个答案:“AI时代,产品经理应该如何做产品”。

           过去一年,可谓一路狂奔,将原本写产品需求的时间放到了写代码上,不知不觉中,我的github瓦片图也快要被绿色占满,但值得庆幸的是,通过亲手打造的产品,团队也成功拿到了融资。


           AI产品其实并不神奇,任何产品的商业价值都在于其对人类的价值。只是不同的技术方案需要考虑的侧重点会有所不同。对于产品经理来说,科技在进步,思维方式需要迭代更新,但也不能全部舍弃,用“进化”这个词来形容我们AI时代的产品经理可能更为贴切。

           如果您喜欢我的文章请继续关注我,我将继续更新我在AI产品领域的一些总结和思考。也欢迎一些志同道合的小伙伴,共同探讨,一同进化。

  •     这是我2020年翻译的文章,首先发表在我的公众号“PM熊叔”。3年之后的今天,我们进入了大模型时代,但这篇文章并没有过时。因此我将它的音频重新发布我的播客之中,希望能帮助到大家。
        2020年1月25日, 在曼彻斯特产品思维大会上,Salesforce 爱因斯坦系统的产品总监马尤克·博瓦尔做了个分享,探讨了在人工智能时代,产品经理需要做哪些调整,以及如何打造成功的人工智能产品, 演讲主题《人工智能如何重新定义产品经理》


        一、故事

        在步入正题之前,我们从一些有趣的故事开始:


        1、AI重新定义职业
        在几个月前的马萨诸塞州剑桥城,聚集了在成百上千的技术爱好者,一名来自斯坦福的教授在探讨人工智能是如何改变世界,探讨传统的职业是如何被AI打破和瓦解的。这位教授就是吴恩达,一家名为“Landing AI”的公司的创始人,他也是著名的在线教育公司Coursera的创始人。在他的分享中提到了一段产品经理的工作的场景画面。
        以聊天机器人应用程序为例。在互联网时代,如果我们的产品经理正在设计一款新的网页或APP,那画线框图是必不可少的环节。通过原型图,产品经理可以告诉工程师这款程序应该是什么样子,而工程师将根据原型图方案进行实现。这就是长期以来,硅谷和科技公司的产品经理和工程师协作的方式。但在人工智能时代,这种旧的工作方式将变得无效。


        假设你在做一个聊天机器人,那又会怎么样呢?
        例如,我们在打造一个“行为疗法”的聊天机器人,通过与机器人聊天的方式解决美国人的心理疾病。如果展示在线框图上面,或许是这样:
        机器人说:“你好~”
        用户说:“我不开心”。
        机器人:神奇地展示了一张图片,括弧:一张源自于NLP生成的图片
        这完全没有用,我不需要知道对话的气泡的形状是怎么样的,我需要知道谈话的实质是什么,我的聊天机器人如何能够感知到用户发生了什么。传统的产品经理通过线框图为聊天机器人提供产品规格,但对于工程师来说更需要了解内在的逻辑。


        2、产品经理再造
        在加利福尼亚的旧金山,有一个叫做洞见数据科学(Insight Data Science)的组织。前不久,他们开办了一个为期七周的集训项目,帮助来自不同背景的专业人士转行至软件工程和数据科学领域。我的法国同事利昂·麦奎尔,她拥有神经科学博士学位,她加入了他们的数据科学项目,并在林肯获得了一份数据科学家的工作。最近,我从人工智能产品主管杰里米·卡拉斯科得知,他们正在启动一个全新的项目。此项目称为数据产品经理项目或者AI产品经理项目。杰里米认为,对于更传统的产品经理来说,他们需要掌握必要的技能,能专注于数据、更懂得如何利用AI来打造产品。
        最后,Salesforce 爱因斯坦的产品副总裁马可·卡萨莱纳正与他的团队合作开发一门新的课程,这是一个针对的内部培训课程,为人工智能和机器学习带来的第四次工业革命做准备。
        我问马可:“这门课的目的和目标是什么?”他说:“我们要让我们的产品经理们获得一些感知力,让他们能够快速地评估用机器学习解决业务问题的可行性,知道哪些业务问题适合使用AI,又有哪些不合适。”
        人工智能时代,产品管理发生怎么样的改变?作为产品经理,如果要打造一款成功的AI产品,你又需要掌握哪些技能呢?


        二、产品经理的奥林匹克竞赛

        工程学作为一门学科已经存在了几千年。它的历史可以追溯到埃及金字塔工程和军事工程。一千多年里,诞生了机械工程、发明了蒸汽机,工程管理已经是一门非常成熟的学科。相较于工程管理,产品管理要年轻许多,其历史不到一百年。最早的产品经理,实际上做的是品牌管理,他们被称之为“品牌人”。在制造业中,它又变成了“产品线经理”。

        随着软件业的发展,它又发生了一些改变,使用着像Scrum这样的敏捷方法。这让我想起了职业体育。回顾过去的50到100年里,电视里重复播放着每一个世界纪录是如何打破的。我相信,不管你是在运动场上还是在家中舒适地观看,这已从根本上改变了你参与运动方式和情感的寄托。

        电影《点球成金》普及了体育分析方法。另外,有更多的高科技装备和运动器材出现在每隔四年的奥运会上,每一次都会有新的世界纪录。我们的确走在“更高、更快、更强”的道路上。最后,越来越多的女性也开始从事职业运动。

        华盛顿邮报还特别提到:女性在男性运动中的领导地位。其实,产品管理就像是一项运动比赛,随着人工智能和软件行业的发展,它也正在被重新定义。世界正在改变,AI产品经理正在崛起。如果你细想一下我讲的故事,就会发现那些针对产品经理的新要求。

        三、产品经理的新技能

        通常,产品经理需要跨职能地串联起每一个利益相关者,如:销售、市场以及开发。但是对于AI产品经理,你还需要串联起另外两个重要角色,即数据科学家和数据工程师。

        同时,产品经理还需要更新技能树的五个方面:

        1. 问题映射,

        2. 数据是新的UI,

        3. 验收标准,

        4. 可解释性、伦理和偏见,

        5. 将研究迁移到生产。

        1、问题映射(Problem Mapping)

        随着人工智能的热潮到来,你可能也会面临着新的执行压力,需要考虑如何将AI应用到产品之中。但是我们在考虑问题的时候,却常常忽视了将这些技术方案映射回业务问题上。

        AI产品经理需要能够将业务问题与机器学习或深度学习问题相匹配。这包括理解业务需求,明确定义问题,选择合适的算法和技术,以及为团队提供清晰的问题定义。随着技术的不断进步,AI产品经理需要不断学习如何更好地将业务问题映射到技术解决方案。

        AI产品经理必须能够清楚地表达产品的价值主张。产品经理必须先考虑传统的方法、评估使用传统的规则引擎来解决问题,而不是冒着风险去做。我们先举一个如何提升客服效率的例子。像亚马逊和优步这样的大公司都有庞大的客服部门。每天都会新增大量的客服工单。例如,顾客可能会抱怨:

        “我的订单在哪里,为什么还没有收到?”

        “收到了错误的订单,我需要更换”

        “我需要退款,优步司机取消了我的订单,但是费用还没有退给我!”……

        这个部门的目标就是尽可能快地解决掉这些不断涌现的客服工单。因此,系统的衡量指标就是如何尽可能地缩短解决工单的时间。

        作为一名产品经理,我会先思考要解决的问题,会考虑传统的方法、流程和规则引擎——最好的引擎是已持续使用了一段时间的。这个案例中存在一定的问题,“分类”和“产品”这两个字段值是空的。

        因为这些字段有助于正确地将客服工单指向到正确的部门。从而让它们可以得到快速解决。如果缺乏这些字段,客服工单很可能会被错误的分配到其他部门。导致它们在不同的部门之间来回流转,从而浪费了宝贵的解决时间。

        可能,每个产品经理会这么想:通过使用一些规则,根据客服工单中的其他字段来填写此字段中的值。但通过进一步分析,我们会发现这样的规则是很繁琐的。它不会随着时间的推移而扩展,它将变得难以管理。坦率地说,有时候一个严格的规则并不能真正抓住价值。但倘若你有一段自由格式的文本并缺少关键字段和描述,您无法找出将其映射到“产品”和“类别”的规则。

        此时,你就可以使用人工智能了。实际上,这可以建模为一个多分类问题。这些字段中的每个值都对应多个分类。您可以通过肉眼从历史的客服工单中学习和获得相应的感知,例如通过查看标题和描述来确定预测值应该是什么。

        在我们的“爱因斯坦”系统中,我们可以看到这些字段的预测值。每个预测值都有相应的置信等级。人们可以通过肉眼使用传统的方法进行评估,而不是冒着风险使用AI去解决问题。请记住,我们每时每刻都应该将解决方案映射回业务问题上——即缩短客服工单的解决时间。


        2、数据是新的用户界面 (Data is the New UI)

        在AI时代,数据的质量严重影响着用户体验。AI产品经理最重要的职责之一就是提供数据规范。

        众所周知,数据是任何机器学习算法的基础。

        我们首先要问的是:我们有足够的数据吗?如果没有,那么也就没有训练机器学习模型的数据集,也就无法从数据集中的预测信号中进行学习。

        第二个要问的是:在现实世界中,你的数据有多干净或有多少噪声?但据我们所见,你的大部分数据都是非常混乱和充满噪声的。它可能存在于第三方系统中。当你开始给机器学习之前,你可能还需要连不同来源的数据,再导入到数据仓库之中。

        第三个要问的是:历史数据中是否存有用来给机器做监督训练的样例?也就是所谓的监督分类问题。如果没有样例来训练机器学习模型,数据科学家还得想其他的办法。

        以一种通用的图像识别的AI产品为例。

        一般的目标数据集,在互联网上面可能都能找得到。如果你用这个来分类猫和狗,它会表现会令你大吃一惊,大概100%的准确率。但是如果你用同样的产品从医学诊断中检测肿瘤,它的表现很差,因为它从来没有真正看到过数据,也从来没有真正地训练过。

        实际上,通常情况下你可能甚至没有标注好的数据来满足机器学习的训练需求。必须强调的是,数据是一个全新的维度,这在传统的产品文档中是完全没有的。正如一些人对智能产品说的那样:数据是新的用户界面和用户体验。


    3. AI世界的验收标准(Acceptance Criteria in the world of AI)

        在产品应用于现实之前,它的验收标准是什么?在传统的产品管理中,这可能是功能的完整性、打开页面的数量、合适的完成提示等等。

        AI产品经理需要明确定义和衡量模型成功的标准。这涉及到确定模型的性能指标,如准确率、召回率、F1分数等,以及如何将这些指标与业务目标相联系。了解如何设置合理的验收标准是确保项目成功的关键。

        这里举一个欺诈分类的例子,我们试图将欺诈交易从正常或良性交易中分类出来。

        这是一个理想分类器的例子,它能将每一笔欺诈性交易都归为欺诈,良性的交易依然还是良性。数据科学家会惊讶地说:这是完美的精确和完美召回率,但这只是一个永远无法实现的梦想分类器。

        在现实世界中,它可能会滑向两个方向:要么会漏掉一些欺诈行为,但它仍然有完美精确率(如下左图);要么在识别出欺诈行为同时也将一些良性行为误判为欺诈行为,也就是引入了假阳性(如下右图)。

        作为产品经理有责任根据服务所在的领域来明确清楚正确的用例度量指标,以便数据科学家能够采取相应的举措。在这个例子里面,产品经理不需要拥有航天科学家一般的智慧,但需要知道欺诈交易是有害的,其代价远远大于在实际中引入的假阳性。

        不过这还不够,一旦你找到了正确的度量指标,你还需要弄清楚阈值是多少,什么时候需要达到你认为的合理数值,精确率是否要达到80%或90%。当你思考这个数值是多少的时候,你必须再次考虑业务指标,并回溯到数据科学的指标上。

        再举一个销售领域潜在客户评分的例子。

        我们正试图预测潜在客户销售成功的可能性。例如,格雷格·汤姆森先生得分是88。这意味着他有88%的可能性转化为订单。但比较棘手地方在于它是一个转化率,我们还需要考虑整体的转化漏斗。

        这里有两个重要的指标:

        一个是由产品经理根据业务需求所决定的业务指标;

        另一个是针对当前的案例,与数据科学家和数据工程师合作得出的数据科学指标。

        而后者能帮助你在商业中树立竞争壁垒。

        因此,当你准备向实际用户推出AI产品的时候,你可以先明确这些额外的验收标准。

        4、可解释性、伦理和偏见(Explainability, Ethics & Bias)

        AI产品经理需要了解如何解释模型的决策,以便用户和利益相关者可以理解并信任模型。此外,他们需要考虑数据偏见和模型偏见的问题,以确保不会导致不公平或有害的结果。

        如今,我们的许多客户正在体验我们的这套预测应用。其中最常的问题是:“为什么机器学习模型没有做出它所做的决定呢?”事实上,人工智能软件根本不同于传统软件。

        因为它的结果并不是基于一组写好的代码产生的。随着时间的推移,随着数据和反馈循环的加深,该软件的会越来越像一个黑盒。但我们还需要考虑可解释性,因为这将有助于建立用户对产品的信任。

        这里有一张图,能够帮助我们评估可解释性和精确性:

        从图中可以看出,我们需要为机器学习的可解释性和精确性做极大地权衡。相对简单的模型,如线性回归或决策树,准确性较差但可解释性较好;而神经网络、深度学习的准确性极高,但却更像个黑盒。产品经理需要根据特定的应用场景和用例来做出决策。如果你的产品面向于一个高度监管的行业,法律要求这些预测是可解释的。比如,医疗健康和法律领域需要符合欧盟的《通用数据保护条例》。

        可解释性和精确率之间应该如何平衡?作为产品经理需要相应的保持洞察力,并在第一时间与数据科学家和数据工程师保持同步。另外,产品经理也需要想想这个产品是否有性别和伦理方面的影响:如数据需要具有足够的多样性、典型性,或者不能产生如种族歧视和性别的偏见问题。我最喜欢举的一个例子是谷歌翻译,左边是无性别区分的土耳其语,右边是对应的英文翻译。

        如果你顺着往下念很快就能发现这个偏见:

        他很努力地工作(AI用的是单人旁的他),她很懒(AI用的是女字旁的她)。可见灾难性的性别偏见已经渗透到了这个产品中。

        或许你会想到一个功能来去剔除掉性别。但事情没有那么简单,性别是医学诊断的一个极其重要的特征和信号。例如,前列腺癌只发生在男性身上。可能在翻译产品中关系不大,但在人力资源招聘系统中匹配求职者的职位描述关系非常大。我们似乎应该要提供一些关于如何处理偏见引导。去年12月,谷歌发布了一个版本,解决了翻译中存在偏见的问题,每一个中性的短语,它都会给出男性化和女性化的翻译。

        5、将研究投入生产(Scaling from Research to Production)

        AI产品经理需要了解如何将研究成果迁移到生产环境中。这包括将训练好的模型部署到生产服务器、建立实时或批处理的数据管道,以及确保模型的持续监控和维护。将研究成果转化为实际产品需要跨越从研究到工程的鸿沟,需要不断学习和适应新的工具和技术。

        最具有挑战性的问题是,机器学习项目所需要的成功要素,研究环境和实际投产环境完全不同。下图源自一本非常有名的出版物,叫做《机器学习的隐性债务》:

        真实世界的机器学习系统只有一小段代码,如中间的小黑盒所示。这与大家普遍认知相反,您可能会认为机器学习是你的人工智能产品的最大和最主要组件,但实际上它只是一小块。其所需的周边基础设施庞大而复杂,有配置、数据采集、数据验证、资源管理、特征抽取、分析工具、线程管理工具、基础服务设施和监控等等。

        在我们的Salesforce的爱因斯坦系统,也有一张非常相似的架构图:服务器、配置、数据存储、ETL数据处理、计算、机器学习算法、编排、度量标准、数据科学经验、模型的生命周期管理、健康监测和基础设施等等

        数据科学家和数据工程师实际上正在设计这样的一款产品,它需要能够回答各式各样的问题才能真正被带到生产环境中去。

        “请确认你的数据是本地还是在云端?”

        “请确认你的机器学习模型是在服务器上,或者不需要分发到移动设备?”

        “是否准备重新训练你的机器学习模型,动机是什么?”

        “请确认产品是否需要实时预测能力?实时预测虽然有用,但这又是非常复杂和难以设计的,又或许您可以使用一个离线批处理系统”……

        每一天都会有成千上万的研究成果发表,但却少有应用到实际的规模生产。所以作为AI产品经理,我们必须建立起敏锐的洞察力:判断哪些产品值得投入,判断哪一种产品能够为实际的用户真正地产生价值。

        虽然最近AI很火,但它在20年前就已经存在了。过去主要应用在搜索和广告领域,你在谷歌时看到的搜索建议、你在雅虎上看到的推荐广告、你在亚马逊上搜索时的自动更正……如果你在搜索和广告领域工作那必须提供明确说明,并且与数据工程师紧密的合作。

        如今人工智能的应用领域呈指数级增长, 同时也需要产品经理提供大量明确的产品规范说明。如图所示,通常的AI产品开发阶段划分为:奇特的算法、炫酷的DEMO、试点、一般采用、商品,这五个步骤。在炫酷的demo之后,AI产品会陷入鸿沟之中,无法推向市场。

        不管你的数据科学家们是多么的喜欢你们的小花园,或者你的营销演示又多么有创意和多么酷。 “AI产品鸿沟”很可能会成为你的AI产品普及的障碍。

        作为一个孤岛,越来越多的AI产品需要管理。

        作为一名产品经理你需要提升技能树。在你的工程项目中,能够实际地为数据科学家提供有价值的需求和规范。

        最后,请你回答一个问题:

        当你面对一个真实的具体的客户痛点,你是否有能力打造一款有用的产品,而不是仅仅地做一个很酷的功能?

  • 西坡(公众号:西坡居)是我的产品知识星球里面的嘉宾,这是他的原创文章,文章写得很好,有实践、有思考、有方法,也欢迎越来越多的朋友一起探讨关于AIGC的产品实践心得。


    从2023年4月开始,考研落榜的我参与了春招,并凭借丰富实习和项目经验拿到了一些offer。然而,出于对AIGC事业的浓厚兴趣,我毅然选择了这个领域。于是我见证了国内ChatGPT、Midjourney、Stable diffusion的崭露头角,经历了账号销售与课程热潮、百模大战、GPT4的发布、生成式AI的合规管控,以及国内首批大型模型向公众开放,至今我们已进入AI应用的大爆发时代。


    刚开始,我的职责与许多的产品经理相似:拿到需求,进行需求分析,绘制产品原型,输出需求文档,召开需求评审会,并跟进至需求完全落地。但由于无论是产品还是技术,仍处在一个比较早期的阶段,并没有拿到太多的反馈,像是在摸着石头过河,走一步看一步,并且能看到竞品也在飞速地迭代。实话说,内心是着急的。所以不断的在尝试接触业务,C端业务,B端业务,去询问用户想要什么,需要什么,我们的产品哪里不行?结论是:过去的一段时间,我们的产品没有解决用户真实的需求,有点用但不完全有用,可以白嫖但不愿付费。


    作为AIGC的产品经理,不仅需要有产品设计能力,更要确保产品的技术实现与用户体验和价值同步。而当你负责大型语言模型相关产品时,还需掌握技术框架设计、Prompt工程编写以及最终效果的评估和验收。因为在早期,技术人员往往缺乏这些能力,因为他们难以深入业务。甚至部分的产品经理也接触不到具体的业务。


    但时间证明,如果一个新业务的产品没有得到市场的真实反馈和业务接触,那么你会陷入迷茫。同时,对竞品的了解仅停留在表面,产品最终可能会走入死胡同。这促使我反思:产品的价值真的仅仅取决于技术进步吗?


    我想不是的,产品的价值来自于用户,来自于企业,来自于实际应用。好像这半年是技术在推着产品走,而不是市场和业务推着产品走。这是大公司和创新企业可以做的,但小公司亦或是小团队不行,小团队的创新投入成本和技术能力达不到长时间、大规模创新的成本要求。小团队需要做的应该是回归产品的本质,发挥产品真正的价值。


    反观大厂,大型企业可以投入“百模大战”,享有标准化的产品服务、高质量稳定的产品线和庞大的客户群。对他们来说,用AI赋能现有产品要比新建一个AI产品再补充基础服务来得更为经济、高效。这并不意味着小团队不能创新,只是他们的创新应更多地集中在产品定位、服务方式和商业模式上。


    在AIGC这样的新赛道,身为小团队的产品经理我认为需要什么?也是我个人在努力的方向。


    1. 敏锐的市场洞察能力:从三四月份的“套壳AI软件”,到七八月份的“C端产品”,到如今九月份,C端产品基本实现覆盖,B端产品的刚刚起步阶段。快节奏,稍纵即逝,慢一步就容易步步慢。


    2. 整体产品的思维:什么是整体产品,我看到一篇喜马拉雅产品经理熊叔的观点,我比较认可。

    “你在营销时向顾客承诺交付的产品(即强有力的价值主张)与你实际交付的产品是不一样的,两者之间存在落差,要消灭落差。必须强化产品,增加配套服务和辅助产品,使之成为整体产品”文中列举的例子可能并非普遍适用,但足以让我们理解到莱维特整体产品模型的理念。



    1)通用产品(基本产品):iPhone作为一个通用产品,是一款移动智能手机,具备通话、短信、上网等基本功能。这是用户购买iPhone时实际获得的基本产品。这些功能我个人总结为C端用户的高频词,硬性需求。


    2)期望产品:用户在购买iPhone时期望获得更多,他们期望高质量的手机性能、良好的摄影体验、顺畅的操作界面等。期望产品还可能包括更新的操作系统版本、安全性等。也就是优质的用户体验。


    3)延伸产品:为了提供更完整的体验,iPhone提供了一系列的延伸产品。例如,Apple Store中的App Store提供了海量的应用程序,能够满足用户各种需求;iTunes Store提供音乐、电影等媒体内容;Apple Care服务提供了额外的售后支持,延伸产品增加了iPhone的价值。


    4)潜在产品:iPhone在不断地发展中具有潜在的产品创新空间。随着技术的发展,iPhone可以不断升级、引入新的功能,比如更强大的摄像功能、更高效的处理器、更先进的安全性等。此外,随着5G等新技术的普及,未来iPhone可能会在网络连接和应用上有更多的创新。


    整体产品思维与产品的MVP思维,在通用产品部分是高度一致的。也就是说我们的产品出发的时候也要想好它的核心功能是什么?提供的基础价值是什么?有没有满足用户的真实需求?而不是上来就强加亮点,那或许能吸引到一定的用户,但能不能把用户留住,靠的一定是高频次的使用需求。


    3. 敏捷开发的意识:如何合理地利用好有限的资源做有价值的事情,对公司业务负责,也对研发人员负责。想清楚产品开发时的产品定位是什么?用于验证技术的demo,用于客户展示的样品,用于投入市场的完整产品等等产品需求,不同的需求,我们的投入都是需要评估的。这既能保证团队的高效,也是打造团队凝聚力的保证。因为在一线做产品经理,我发现不管是自己,亦或是研发人员,当做出来的东西没有得到正向的反馈是会有挫败感的。短期可以,长期不行。因此就需要具备敏捷开发的意思,什么样的需求做不做,怎么做,做到什么程度,都是需要去思考的。


    4. 成交理念(产品定位+商业模式):在产品立项之前,我们需要做出比较充分的准备,在产品开发,迭代和用户提出反馈的过程中才不会手足无措。你做的产品使用的用户是谁?谁来为他买单?这个问题不会受技术发展或者什么探索阶段的影响,因为用户为产品买单只会因为一个原因,那就是这个产品解决了他的需求,不管是情绪价值需求,亦或是生产价值需求。其次就是你的产品功能迭代,健壮性是否满足?它的商业模式是什么?能不能打造业务的闭环?产品可以赢在功能上,更可以赢在商业模式和产品定位上。




    5. 业务意识:与成交理念很一致,但业务意识不是为了促进买单,而是为了留住企业和用户。特别是在AIGC这条赛道上,如果没有业务意识,做出来的产品可能是一个玩具,而不会成为一个产品或生产工具。AIGC让我们有快速生产内容的能力,但如何制作能够直接投入生产的产品,就需要我们融入到具体的业务中。举个例子,文心一言、ChatGPT可以快速的帮我们生成报告,论文或者内容,但生成什么样的内容,这个内容还需不需要人工介入?能不能直接用,这是我们需要思考的。


    6. “重产品而轻技术”:从天马行空到踏实可行,在生成式人工智能的快速发展下,我们的优势在于想创意的时候可以天马行空,底层的技术能力已经超过了所谓的摩尔定理,技术的发展只会超乎我们所想。但当要落地到产品的时候我们要想,我们究竟解决的是什么痛点,解决了用户什么具体的需求。


    总结下来,AIGC产品经理需要什么?


    长期和敏锐的市场感知,整体产品的产品规划能力,敏捷开发意识,直达收益的成交策略,深入的业务意识,“重产品而轻技术”的理念。


    来自AIGC领域一线产品经理的肺腑之言。欢迎指正。


  • 随着AIGC的火热,越来越多的AI创作工具展现在我们面前,越来越多创作者也在尝试新工具和新方法。但实际上真正的问题才刚刚开始,在昂贵的流量和算力成本之下。用户面对着大量雷同的AI工具的时候,新用户如果无法留存那就是意味着成本的损失。如何让新用户真正的采纳我们的产品也显得尤为重要。


    像Midjourney为了抵御羊毛党,就直接关闭了新用户25次的试用机会,因为疯狂涌入的用户也影响了付费用户的体验。


    2019年,我们在GET智能写作创业的过程中,也遇到类似的问题。随着流量的不断增长,没有带来任何有价值的留存,成本不断上升,系统问题不断,团队处于困局之中。


    一、不可能三角


    当时我遇到最大的挑战是运营耀眼的宣传、用户超高的预期、技术无法达到的效果,三者构成的不可能三角。

    初期,我们通过一张名为“开启AI写作新时代”的裂变分销海报,在自媒体的朋友圈引爆了话题。新用户纷纷涌入,我们自以为是个成功的开始。然而,产品内部却像一个破了洞的木桶,用户流失率不断攀升。


    上线后,将近一个多月的修修补补,问题并未好转。因为产品稳定很差,经常出各种奇奇怪怪的Bug,而且我们主推的文本生成的算法效果一直不好,用户抱怨很大,用户纷纷退款。


    另外,迫于融资的压力,CEO急于看到直线上升的DAU,从流量投放上并没有松懈,并没有带来太多留存,而且投放渠道的精准流量也很快被我们榨干。但这种饮鸩止渴的策略,让项目基本陷入了僵局。


    作为产品合伙人我也背负着巨大的压力,我在翻看营销学经典著作《跨越鸿沟》的时候,突然意识到我们犯了三个严重的错误:


    1. 没有遵循产品采纳周期的客观规律,过早地跳入大众市场的鸿沟;

    2. 在产品还未成熟的时候使用的是营销驱动增长的模式而不是产品驱动增长;

    3. 没有建立一个合理的数据指标体系,被虚荣指标冲昏了头脑。


    我们应该如何扭转这个局面?

    二、坠入鸿沟

    《跨越鸿沟》中有一个著名的“产品采纳周期曲线”,它将科技创新型产品的潜在客户群分为五种类型:创新者、早期采用者、早期大众、晚期大众和落后者。

    创新者和早期采用者是最愿意尝试新产品的群体,他们对创新和变革有着强烈的好奇心和热情。落后者则是最抵制新产品的群体,他们对创新和变革有着强烈的恐惧和排斥,他们只有在别无选择时才会使用新产品。


    在早期采用者和早期大众之间存在一条很难跨越的鸿沟。因为这两个群体有着不同的心理特征和需求。如果新技术或产品不能成功地跨越鸿沟,并进入主流市场,那么它就很可能失败。因此,我们还需要在不同阶段,针对不同客户群设计不同的营销策略和产品策略。


    其实,在智能写作项目最初阶段,我们也做了一个核心功能的Demo。当把它交给一些愿意尝鲜的用户试用时,他们给我们的反馈也是积极的。其实,这些用户都是愿意接受新事物的创新者,对于新技术有着极高的包容度,他们对产品的潜力充满信心;另外用户对待Demo的宽容度是不一样的。但Demo测试的反馈并不能等同于大众市场的反馈,大众市场要的是一个稳定实用的产品。


    然而,这时我们犯下了一个致命的错误,我们错误地将这些试用者的反馈等同于大众用户的反馈。更要命的是产品还未上线,我们就信心满满的做预售,就采取了大规模的投放和裂变营销,进一步拉高了大众市场对于产品的预期。


    最终,使得产品刚迈开第一步,就已然踏入产品采纳的鸿沟之中。


    三、产品采纳


    “产品采纳(Product Adoption)”指的是用户从发现、了解、试用到长期使用我们的产品的过程。只有当用户能够持续地使用我们的产品来解决他们的问题,我们打造的产品才有意义。

    产品采纳的过程通常有四个阶段:


    1. 知晓阶段:用户了解产品的存在和基本功能。

    2. 兴趣阶段:用户对产品产生兴趣,开始寻求更多关于产品的信息。

    3. 尝试阶段:用户决定尝试使用产品,体验其功能和效果。

    4. 采纳阶段:用户认可产品的价值,愿意继续长期使用并购买产品。


    特别是对于新推出的产品或技术。在产品发布后,“产品采纳”决定了产品在市场中的成功与否。如果产品能够得到广泛的采纳,吸引更多的用户使用,就有可能实现持续的增长和商业成功。


    对于新用户来说决定他们是否采纳新产品,既有推力也有阻力:


    1. 推动力:当前使用产品还存在尚未解决的问题,会把用户推向新产品;

    2. 吸引力:新产品能够提供新的解决方案,会吸引用户尝试新产品;

    3. 焦虑:全面采用新产品是否存在不确定的风险,会让用户返回老产品;

    4. 习惯性:不想改变已有的使用习惯,会让用户放弃使用新产品。


    制定产品策略时,我们应该充分考虑这四种力量对新用户的影响。帮助新用户顺利迁移到新产品,我们通常会采取如下措施:


    1. 打造独具价值的功能或服务:通过提供更好的功能或服务解决旧产品尚未解决的问题,并在宣传上突出新产品的独特优势和吸引力,让用户认识到采用新产品可以获得更多好处和便利。


    2. 良好的新手体验:提供简单易用的界面和功能,以及提供演示和试用来帮助用户快速上手,让用户感受到新产品与众不同的价值;提供使用指南、视频教程、知识库和客服支持,减少用户对新产品的焦虑感并增加继续使用新产品的信心。


    3. 打造丝滑的迁移体验:对用户支持和帮助,提供迁移工具或优惠措施,让用户低成本、无负担、毫无阻力地迁移到新产品。


    4. 提供稳定服务和持续改进:倾听用户反馈,持续改进产品,满足用户需求,并积极回应用户的问题和建议,让用户能够感知到产品在稳定迭代,赢得用户的长期信任。


    5. 建立活跃的产品社区:鼓励用户参与社区交流,分享使用经验和成功案例,增强用户对新产品的认同感和归属感。


    在我们的智能写作的营销宣传中,成功的勾起了用户的好奇心,带来了很强的产品推动力和吸引力。当他们看到了1分多钟的介绍视频后,往往都会想迫不及待的尝试。如果新用户只是随便地尝试一下,他们会被生成文章的速度之快所震撼。然而,一旦用户开始真正使用我们的产品进行写作,他们就会发现效果和想象的完全不一样,他们很快放弃继续使用了。


    因为用户如果只是随便尝试,很难注意到生成文章的细节,例如上下词句的连贯性。但是当他们在真正实用的时候,他们会开始字斟句酌容不得一点逻辑错误。所以“快”并不是智能写作产品唯一的评判标准。如果效果不好用户宁可不用。因为他们并不需要一个生成垃圾文章的工具。我们自以为完美的逻辑,当暴露在现实的X光下的时候,已无法经得起推敲。


    另外,迫于数据指标的压力,就算面对一堆的问题,我们也并没有踩住流量的刹车,大量流量的依然持续涌入。由于产品稳定性不足,我们的开发团队整天被埋没于用户的埋怨和反复出现的Bug之中。面对一团乱麻,产品迭代几乎停滞。这也影响了产品的口碑,带来的是负面的传播,每个投放渠道的留存率也越来差。


    更不幸的是,当我们如火如荼地将产品推给大众时,竞争对手也没有闲着,没过两个月就有竞品精确地“复刻”了我们的产品,而且算法的效果还要比我们更好一些,让我们完全处于被动的地位。


    四、走出鸿沟


    已经无路可退,我们必须要做出点改变,我开始尝试破局:


    1)达成共识


    首先,我们的当务之急是停止流量的大规模导入,当潮水褪去之后,我们才能发现真问题,才有时间对症下药。但这并非易事,如果停止流量导入必然引起巨大的数据波动。我们的市场先发优势还在不在?如何对投资人交代?如何进行下一步的融资?这是一系列问题。


    大家都清楚,停止流量导入是为了更好地优化产品和用户体验,但同时也不能忽视市场竞争和投资人的需求。在一次周会上,CEO强调市场竞争的激烈性,希望团队能够在优化产品的同时,保持一定的市场份额和增长速度,但运营也已经被用户的抱怨折磨得焦头烂额。CEO、运营、技术、产品都有自己的观点,整个团队陷入了一场严重的矛盾。


    在经过多次讨论和妥协后,大家终于达成了一个折中的方案:分阶段的收窄流量,以减少数据波动带来的影响。同时,整个团队将专注于产品的改进和用户体验的提升,以吸引更多核心用户和早期采纳者,运营配合收集产品反馈和用户维护的工作,但是因为要配合融资的节奏,时间窗口相当有限。


    2)褪去潮水


    流量的闸门徐徐落下,但关闭之前,我们部署了所有关键功能的数据埋点,制定了新的看板。因为用户调查和数据分析成为我们寻找问题根源的重要工具。每周,运营通过问卷的方式收集核心用户的使用反馈情况,产品也在高频地做用户访谈和可用性测试。


    通过用户调查,我们深入了解了用户的核心问题。例如,很多用户抱怨“不知道怎么用”,我们原以为是UI和交互的问题,但是深入访谈之后才发现,“不知道怎么用”是指“无论怎么尝试,生成的文章都不如预期”。一些用户表示,虽然可以快速生成文章,但由于质量不尽人意,最终还是需要花费大量时间来修改,与预期相差甚远。


    数据分析也为我们揭示了问题的实质。用户在试用产品后,平均停留时间较短,且许多用户只是单次试用,很少有持续使用的情况,用户的实际的功能采纳率非常低。用户流失率成为我们最头痛的问题之一。虽然我们曾以速度和效率为卖点吸引了一部分用户,但随着体验质量的暴露,我们也不得不面对现实。


    只有解决了这些问题才是我们走出困局的关键。我们召开了多次紧急会议,成员们围绕着问题的根源展开激烈的讨论。技术团队认为需要加大投入,优化算法和提升数据精准性;运营团队则强调用户维护的重要性,希望加强与用户的沟通,了解他们的真实需求和痛点;产品团队则主张从用户角度出发,重新设计产品,以提供更优质的写作体验。


    3)走出鸿沟


    在进一步明确了问题后,我们决定采取全新的策略改变困局。我们深知要实现这一目标,需要整个团队的共同努力和坚定决心。新策略的核心是重新调整产品的定位和增长方式,将重点从速度和效率转向最终的文章质量和用户体验。以下是我们制定的具体措施:


    1. 放弃营销驱动型的增长模式:我们采用产品驱动增长(Product-Led Growth),从夸大预期的营销宣传,转变为切实可行的产品体验。用一句话概括就是做“用户最想要的且我们能做到最好的”,让产品本身的价值和优势吸引用户,从而实现持续的用户采纳和增长。在产品推广中,我们去掉了一些容易夸大预期的宣传语,例如“AI一键成稿”,更强调产品在场景中的价值,如“一站式的智能辅助写作工作台”。我们以用户满意度和口碑传播为重要指标,建立起用户为中心的增长模式。


    2. 跑通核心场景的体验闭环:随着流量衰退,真正有刚需的用户群体开始浮出水面。我们通过用户访谈、问卷调查和数据分析,深入地调研了不同用户画像人群,详细了解用户需求、痛点和行为习惯。最后,我们找到了最适合的目标场景——公众号文章的写作。基于这些调研结果,我们弱化了“一键成文”,把重点放在了热点话题、文章素材、润色改写和质量检测等更具实用性的功能上,并在产品中提供了实用性的视频操作教程,帮助用户能够更快的创建出一篇可用的文章。通过打造核心体验闭环,确保目标用户在使用我们的产品时获得无缝连贯的体验。


    3. 建立新数据监测系统:为了更好地了解用户行为和采纳情况,我们自建了一套数据监测系统和数据看板。通过收集和分析用户数据,我们可以实时掌握产品使用情况和用户反馈。相较于日活、注册率、转化率等虚荣指标,我们会更关注留存率、流失率、CAC(单位获客成本)、ARPU(单位用户收入)、TTV(产品价值交付时间)、PAI(产品采纳率指标)、NPS(净推荐值)等具有长期意义和针对性的指标。通过有效的指标定义和监测看板,可以找到真正忠实用户,帮助我们评估策略的有效性,并及时调整和优化产品。这确保我们的决策和行动都有客观的数据的支撑。


    4. 搭建产品社区:我们搭建了多个核心用户的微信群,我们实现了与用户建立更紧密的联系。在这个群里,用户可以直接向我们提出问题和反馈意见,我们的团队会积极回应,及时解决用户遇到的问题和困难。这种即时的沟通和反馈机制,让用户感受到我们对他们的关心和关注,增加了用户的满意度和黏性。 另外,我们也鼓励用户分享使用经验和成功案例。用户之间的口碑传播会吸引更多用户尝试和采纳产品。


    5. 以课程的方式做推广:通过与有影响力的自媒体KOL合作推广“AI写作课”,可以借助其影响力和粉丝基础,将产品推广到目标用户群体中,提高用户的采纳率。课程的形式不仅可以突出产品的实用性和用户体验,引导他们关注产品的真正价值,另外也能够帮助建立用户社区,增加用户留存率,实现更好的产品推广效果。


    6. 寻求战略合作和融资机会:我们与其他公众号写作辅助工具合作伙伴关系,共同推进产品的发展和优化。战略合作可以帮助我们分享资源、知识和技术,从而加速产品的改进和推广,同时也能够扩大市场覆盖范围,吸引更多目标用户。另外,为了扩大时间窗口,我们也没有放弃融资,为公司提供更多资金支持,以支撑产品的持续发展和改进。有足够的资金储备可以让我们有更多的时间去优化产品,不受时间紧迫的压力。


    尾声


    2019年末,我们的团队通过辛勤努力,成功跨出了鸿沟。然而,正当一切看似向好的时候,疫情的爆发却给公司带来了沉重的打击。市场陷入了巨大的不确定性,投资人观望态度明显,而公司账面资金也快要见底。


    面对突如其来的困境,团队陷入了分歧。CEO提出了转向短视频市场的建议,希望通过这个新方向来迎接商机。然而,团队中的一部分人,包括我在内,坚持继续走智能写作的路线,因为我们看到了在线办公和企业客户的潜在机会。我们主张沿着智能写作的道路继续前行,顺势推出企业版,而不是突然调转方向,如果只是资金问题可以考虑通过开源节流来解决。


    遗憾的是,我的建议未能被采纳。公司最终启动了短视频群控的新项目。短时间内的突然转换方向,让公司像一名刚刚初愈的病人,无法承受更多的折腾。最终短视频战役还是失败了。到了2020年中,公司已经难以维持,在巨大的分歧和矛盾之中,核心团队成员纷纷离开。


    如今,GET智能写作依然在运营和售卖,但团队已经不是原班人马了。


    《金刚经》有云:“一切有为法,皆如梦幻泡影。”


    在这段遗憾的创业经历中,让我深刻的认识到“坚定的信念和正确的决策是同等的重要”。创业的道路总是充满着未知的变量,当我们无法坚定不移地走下去的时候,我们自己就成了最大的变量。


    面临各种挑战和困难是创业的常态,而对无常的洞悉则需要保持内心平静的智慧。我们要学会放下执念,保持内心的安宁和坚定,以冷静的光去看待一切。只有这样,我们才能在风雨中坚守初心,做出正确的决策,迎接未知的未来,继续前行。


    我在离开GET智能写作之后,并没有死心,决定开启另外一场创业之旅,但这已经是另外一个故事了。


    如果你觉得我的分享对你有帮助,请订阅我的专辑,我将继续分享关于AI产品经理的故事。你可以关注我的公众号“PM熊叔”。


  • 2019年~2021年期间,我在做智能写作项目创业的时候,由于当时市场相关产品较少,遇到了问题没有可以参考的竞品。

    我们只能一路探索,一路踩坑,一路修正。随着产品的迭代,我也在不断地迭代自己的认知,梳理AI产品的方法论和技能树。当时还和Shadow在“蔚来”做了一次关于《AI时代的产品思维》分享。


    但是光有方法论还不够,随着团队越来越大,也出现了一些管理上的新的问题。团队中新入行的同学,在职业发展的道路上产生了迷茫,甚至也有人提出了离职。

    我回想起刚毕业的时候,我的导师告诉我:“如果赶路时候,心中有地图,那么你就不会惊慌,你要找到心中的那张图。”因此,作为产品合伙人,我提议在公司内部推行职业岗位上的能力模型。让小伙伴们能看到自己的成长的方向。

    其实,我并不是想要推行大厂的那套职级的天梯,更重要的是让小伙伴们有明确的修炼方向,产品小伙伴的也觉得跟着我获得了专业提升。

    现在正值毕业季,有很多刚毕业的小伙伴加入产品岗位中来,也希望能帮到大家。

    一、修正观念:人人不都是产品经理

    大多数人听到“产品经理”这个词,总会联想到“人人都是产品经理”这句话。但实际上产品经理这个岗位并没有那么简单。

    用一句话概括产品经理的职责就是“帮助团队交付正确产品给用户的人”。也就是说,产品经理要能凝聚团队的力量交付有价值的产品给用户,而不是一个人孤军奋斗。

    我认识的一些优秀的产品经理,往往都是程序员或者交互设计师出身,他们的特点是学习能力很强、知识面广博、思维敏捷、逻辑严密、沟通能力很强。他们能带着你一步步思考,能够清晰地告诉你怎么样的产品才是正确的产品;另外,他们还有很强的驱动能力,不管是对自己还是对他人,是团队不可多得的发动机。

    我个人的成长经历也比较杂糅,大学是学工业设计的,却阴差阳错的做了程序员,还和朋友一起创业。有人评价我不够专注,但是恰恰正是有这样的经历,让我对如何做产品有了最直接的体感,这个能力区别于在大厂单一岗位培养的产品经理。另外,我也不是完全跟着感觉走,平时也在不断的学习和总结,用体系化的思维框架整理自己的经验和知识,每个职业都有自己的最底层的思维框架,产品经理也不例外。

    从思维框架层面,产品经理的核心能力就是要懂得如何平衡人的需求、技术的可行性、商业价值三方面问题。这个思维框架被著名的设计公司IDEO称之为“设计思维”(Design Thinking)。


    我在从业的过程中,用这三个圈的指南针来指导我在产品岗位上学习、工作和决策:

    1. 人(Human):以人为中心。产品经理应该深入了解用户的需求、痛点和行为,通过观察、用户研究和用户反馈等手段获取关于用户的信息。产品经理需要思考如何创造出对用户有意义、有价值的产品和服务,以提供优秀的用户体验。

    2. 商业(Business):关注商业可行性。产品经理需要理解公司的商业目标和战略,将用户需求与商业需求相结合。产品经理应该思考如何创造出具有商业价值的产品,并将其与市场需求和竞争环境相匹配。同时,产品经理还需考虑产品的盈利模式、市场份额和增长潜力等商业指标。

    3. 技术(Technology):利用技术实现创新解决方案。产品经理需要了解现有的技术趋势、技术能力和可行性,以确定合适的技术方向和解决方案。产品经理应该与工程团队紧密合作,探索和评估不同的技术选型,并确保产品在技术上可行、成本可控、系统稳定和可扩展。

    通过综合考虑人、商业和技术,产品经理可以更全面地理解和分析问题,找到平衡点,并在设计和决策过程中做出明智的选择。这三个圆圈相互影响、相互支持,帮助产品经理设计出具备用户满意度、商业可行性和技术可行性的产品。

    另外,从产品经理的职业能力上看,可以分成四个圈层:素质层、认知层、影响力层和交付成果层:


    1. 素质层:素质层指的是产品经理的个人素质和品质,包括职业道德、责任心、团队合作能力、沟通能力、自我驱动等。这些素质是作为产品经理的基础,能够帮助建立良好的工作关系、处理复杂的工作情境,并展现出专业和可信赖的形象。

    2. 认知层:认知层指的是产品经理对产品管理领域的知识和理解能力。这包括对产品开发流程、市场分析、用户研究、竞争分析、商业模式等的理解。产品经理需要具备全面而深入的行业和产品知识,能够从战略和商业角度思考问题,并做出明智的决策。

    3. 影响力层:影响力层强调产品经理在团队和组织中的影响力和领导能力。产品经理需要能够有效地沟通和协调各方利益,与团队成员、上级、利益相关者进行有效的合作和交流。他们应该能够激发团队成员的潜力,建立良好的工作氛围,并在组织中推动产品管理的重要性和影响。

    4. 交付层:交付层是指产品经理能够通过实际行动和结果展现自己的能力。这包括制定产品战略方案、需求管理、撰写需求文档等工作,最终的结果通过成功推出具有商业价值的产品、实现产品目标、提高用户满意度等来呈现。产品经理要能够有效地管理产品项目,与团队紧密合作,按时交付高质量的产品,实现业务目标和商业价值。能力越大,责任也就越大。产品经理的交付能力成长过程分类三个阶段:”方案交付能力“、”产品交付能力“、”战略交付能力“。

    这四个层次相互关联,结合设计思维的三个圆环构成了产品经理综合能力的框架。通过不断提升自身的素质、扩展认知领域、增强影响力和能够交付出色的成果,产品经理可以更好地应对各种挑战,发挥更大的作用,并取得成功。因此有了这张岗位能力模型图:



    二、方案交付能力:千里之行始于足下


    你可能会发现,初级的产品岗位名称(对标阿里P4及以下)常用的是产品专员或者产品助理,为什么不用“产品经理”这个Title?

    初级阶段的产品工作人员工作和能力,其实配不上“经理”的Title,产品经理是需要承担团队最终的交付结果的人,需要学习产品管理知识、需要有深刻的行业知识、需要有技术和设计能力、需要有沟通和协调能力等等,没有三到五年的基本功修炼,是不可能有好的“产品交付能力”,先要达成“方案交付能力”。当你具备了基本“产品交付能力”才能算一个合格的产品经理。

    因此,针对初级的产品从业人员,我们团队用“产品设计师”的岗位名称。从而强调我们新晋的产品工作者,首先要有交付正确方案的能力,“方案交付能力”是“产品交付能力”的基本功。起码要能产出高质量的产品原型设计方案和具有可行性的需求文档。

    如果把P1到P4,比作做是大学四年的学习的话,我们需要修完所有的专业课程才能顺利的毕业。现在我开始对这些“专业课”进行介绍,并且推荐了一些“课本”,希望不管你是产品设计师还是初级产品经理,都可以查缺补漏一下。

    首先,要把一个合格的方案交付给团队,我们就需要有基础的设计能力,能够将合格的原型给到团队。

    1、原型设计:原型设计是很重要的交付成果物,让团队成员能够清晰的知道需要做什么。主要讲清楚产品需要有哪些信息,是如何与用户交互的,分为低保真和高保真图,想要产品体验好,交互设计能力不可少。需要了解交互设计基本原则,推荐书籍《About Face: 交互设计精髓》《点石成金》《简约之美》《用户体验要素》《破茧成蝶》;设计心理学,推荐阅读唐纳德诺曼《设计心理学》系列。需要有信息架构的设计能力,如果是AI产品经理,还要从传统UI的信息架构还要延伸到语音对话的沟通信息架构,推荐阅读《信息架构,超越WEB设计》《语音用户界面设计:对话式体验设计原则》《Google 对话式交互规范文档》《Amazon 语音交互设计规范文档》《Machine Learning for Designers》。另外,就是UI设计的相关知识,我们不仅要去关注流行趋势,更需要熟悉UI设计的理论和准则,推荐阅读书籍《认知与设计:理解UI设计准则》《平面设计原理》《写给大家看的设计书》《通用设计法则》。除了活动类产品,强调活泼有趣的画面感,大多数产品UI都遵从设计规范(Material Design、iOS规范等),需要具备了解设计规范的制定逻辑(配色、排版、组件、图标),并且能够将规范和产品的灵活结合在一起,最后通过UI设计软件(Sketch、Figma)进行输出。



    2、产品规划:产品规划中需要产出对应的规划文档,最常见的有产品需求文档PRD、其次是市场需求文档MRD和商业需求文档BRD。针对初级的产品工作人员,最基本的要求是需要能够写好PRD。需求制定并不是把原型图简单的往上一放。一方面,你要深入地理解用户需求和产品目标,并且对需求进行识别和拆解,推荐阅读《金字塔法则》《软件需求(第三版)》;另一方面,要能撰写清晰、具体的需求文档,包括需求描述、功能需求、非功能需求等,以便开发团队和其他相关团队理解和实施需求,推荐书籍《火球UML大战需求分析》《需求工程》以及阿里巴巴的“五导家”模型。随着产品开发的进行,需求可能会发生变化。因此,产品工作人员应该定期更新PRD,以确保文档内容与产品的最新需求保持一致。


    3、市场调研与竞品分析:市场调研与竞品分析的内容通常呈现为调研报告,也会呈现在BRD和MRD上,用来推动领导层和团队达成共识。市场调研不是一堆复制黏贴、截图就完事了,需要收集数据和分析、解读和洞察,将调研结果能够应用于产品决策和战略制定上面。我们通过对于企业的调研可以分析它的产业价值链和商业模式,推荐学习波特五力模型、SWOT分析和商业模式画布。我们还要通过分析产品的迭代情况和功能反推背后的战略目标,推荐阅读和学习《用户体验要素》《蓝海战略》的价值曲线图、“用户体验地图”分析等。


    4、业务数据分析:业务数据分析的报告内容通常出现在产品的规划文档和复盘报告中。初阶的产品工作人员需要,了解常用的一些数据指标的计算方式,如DAU/MAU、PV/UV、GMV、ARPU、点击率等,产品经理需要经常计算业务的转化漏斗,需要擅长使用Excel或者Python,推荐阅读书籍《深入浅出数据分析》《深入浅出统计学》《数据思维:从数据分析到商业价值》《产品经理数据分析实战手册》 《网站分析实战:如何以数据驱动决策,提升网站价值》;另外,也会涉及到一些通过SQL查询获得业务报表的场景,所以产品经理还要了解基本的SQL语法,推荐书籍《SQL必知必会》《利用Python进行数据分析》;并且产品经理也要知道,如何根据不同的业务特点制定的核心的可衡量的业务指标、制定产品的改进策略,推荐阅读《精益创业》《精益数据分析》《增长黑客》等相关书籍。


    5、用户分析:用户分析的内容会出现在产品规划文档中,也会出现在产品复盘的文档中。在产品项目前期,我们也要参与到用户调研和用户画像制定的过程,在阶段性复盘的过程中我们也要去了解和收集用户的反馈。我们需要能够有以人为中心的设计思维方式,站在用户的场景和视角来思考问题,推荐学习“用户体验地图”的相关知识点。绘制出有效的用户画像 Persona(相关书籍推荐《About Face:交互设计精髓》),通过分析用户在场景中的流程,找到痛点,使用心理学一些知识点去发现问题解决问题,提出产品需求和迭代的方向,推荐书籍《认知心理学》《社会心理学》《思考,快与慢》《马斯洛需求层次理论》。对于C端产品来说,还有很重要的是,自己也要能带入到用户的角色中去和用户打成一片,成为自己产品的用户,在使用中发现更多的问题。另外,能够了解定性和定量的用户调研手段和分析的一些方法,推荐相关书籍《用户体验与可用性测试》《用户体验度量》。


    有了上面5项基础的交付技能还不够,你需要更多的背景知识的支撑,才能让你的方案更有灵魂:

    1、商业认知:初级产品工作者通过学习市场营销的知识,来提升自己对市场和运营的理解。例如,4P理论、STP理论;另外,产品经理需要与运营团队紧密合作,知道产品运营的思考方式,推荐阅读书籍《流量池》《运营之光》《参与感》《爆款文案》,要从一个简单的营销页面就能感知到很多的门道。此外,产品的每个前台功能都可能涉及到一个运营后台,涉及到推荐逻辑和管理逻辑,也要充分考虑到内容运营和用户运营的各种底层逻辑。

    2、软件工程与架构:虽然产品工作人员不需要亲自敲代码,但是产品是怎么做出来的需要有清楚的认知,否则就是盲人摸象。软件工程知识可以帮你系统的了解软件生产过程,推荐书籍《软件工程最佳实践》《软件工程:实践者的研究方法》;软件架构的相关知识,能够让你知道如何设计软件系统才是合理的,让你的需求文档更有说服力,推荐阅读《系统架构,复杂系统的产品设计与开发》、《大象:Thinking in UML》等书籍。另外,建议所有的产品经理应该亲手尝试编程做一两个小项目,这样你对技术会有更深刻的体会。其实编程语言比英语要简单很多,特别是今天有了ChatGPT的加持,门槛变得更低了。


    3、人工智能技术 :AI产品经理需要了解人工智能的相关知识,知道如何将AI技术应用到自己的项目中去。包括但不限于以下几个方面:首先,对常见的人工智能算法和模型有基本的了解,如机器学习、深度学习、自然语言处理等,能够知道常见的模型评估指标,如准确率、召回率、F1值、AUC等。其次,需要了解数据处理和数据标注的基本原理和方法,以确保数据质量和训练模型的有效性。同时,了解人工智能的伦理和法律问题,如隐私保护、数据安全等,以确保产品的合规性。最后,对人工智能技术的发展趋势和应用场景有一定的了解,以保持对市场的敏感性和判断力。此外,了解常见的人工智能工具和平台,如TensorFlow、PyTorch,以及GPT、Stable Diffusion、Midjourney、LLaMA等,能够理解它们的使用和优缺点。


    4、行业认知:产品工作人员需要对自己企业当前所处的行业有足够的了解,小到一个常用业务功能的设计的最佳实践,大到整个行业竞争的格局和市场变化。能够分析生态链和已有商业模式,推荐书籍《商业模式新生代》的商业模式画布、迈克尔·波特的“价值链分析”;了解市场规模、增长趋势、机会和挑战,同时评估竞争对手的产品特点和定位,推荐书籍《市场竞争战略》;预估行业的趋势,推荐阅读《跨越鸿沟》《创新者的窘境》高德纳Gartner的《技术成熟度曲线》;另外,还要关注国家的法律法规的动态,避免在产品设计的过程中触及红线。对于行业信息的获取,一方面是同行或者业内资深人士的交流,另外一方面可以通过一些行业的自媒体或者媒体网站如36氪等媒体网站来了解。


    另外,还有三个对于基础素质的考核:

    1、执行能力:作为执行层,执行力毋庸置疑的重要,执行力并不是低头干事,我们需要明确自己的目标,通过能够分析问题,拆解问题。需要了解“金字塔法则”,”5W1H分析“,并合理安排的自己每日的时间和计划、“SMART法则”和“重要紧急四象限”、PDCA循环(Plan-Do-Check-Act)(推荐书籍《麦肯锡问题分析与解决技巧》),从而提升自己的工作效率(推荐书籍《高效能人事的七个习惯》)。另外,也要了解项目管理的敏捷开发相关知识,你才能更好地管理和执行需求。


    2、沟通能力:不懂沟通,就不会执行。做产品的一定要和开发撕逼的吗?不同的人有不同的沟通方式,核心的关键是站在对方角度思考,而不是陷入到不良的情绪中。所谓沟通能力并不仅仅是把事情说清楚的能力,善于沟通的人往往善于倾听。很多时候,你的解决方案并不是完全来自你自己,需要产品经理有专业的沟通能力,要能用相关专业知识带领大家层层深入,最终达成团队共识,推荐书籍《关键对话》《非暴力沟通》。


    3、学习能力:其实“学习能力”是一种心态。在职场上,许多人工作了好几年,为什么没有什么长进?其实大部分人对工作的态度是做一天和尚撞一天钟,并没有主动提升的意愿;还有一部分人虽然看似热爱学习,但陷入了“理障”和“我执”。“理障”是把自己限制在自己认为的道理或逻辑中,忽视其他差异性的观点和信息;“我执”是相信自己永远都是对的,不接受别人的批评和挑战。这两类心理现象都会限制我们成长。如果要破除“理障”和“我执”需要我们做到以下三点:保持开放心态、有批判思维、做到知行合一。例如,当你画原型图的时候,可以根据一些设计原则进行设计,但是不必太拘泥某个设计原则,因为设计原则是前人总结的经验,并不适用于所有场景,当你无法决策时候,你一方面你可以根据业务目标判断,另外,你可以和他人交流,有时候直觉判断可能会更加准确。另外,上线之后可以通过复盘和反思修正自己的认知,推荐书籍《刻意练习》。

    三、小结

    初级产品岗位的历练大概2~3年左右,时间并不漫长,如果你能知行合一,你可以学到很多东西,但也可能会遇到很多困难……但这并不是坏事,因为简单的事情是无法铸就你独一无二的竞争力的。

    产品经理是一个极其需要综合能力的岗位,但是学校并没有产品经理专业,每个行业、每个公司,每个团队,每个人的理解都会有所不同。

    我大学本科和硕士都是读工业设计专业,当时受保罗·格雷厄姆的《黑客与画家》的影响,想自己亲手把软件做出来的冲动。我在临近毕业时候特地去学习了编程技术,并找了程序员的工作,又工作了一段时间,我最终选择了产品经理这个岗位。很多人不理解,认为我做事情不够专注。其实,我并不这样认为,其实设计和编程都是一种创造性活动,我真正的目标都是要把一个好产品做出来。

    正是因为有这份经历,让我对于怎么做一款互联网产品也有了更深刻的理解,之后在创业的过程中,也能够更好做好创业者的角色。

    有一次创业,我的合伙人都是算法工程师,因为公司没有像样的产品,导致这家创业公司开了快一年了还是没有一个订单。当时团队也没有钱招聘设计师和前端开发人员,我和团队说:”这样吧,给我把东西做出来,到时候看看能不能卖钱或者融资“。然后,我主动承担起设计和前端开发的任务。半年过去,产品做出来了,也成功谈到了投资,团队续命成功。这就是产品交付能力的最好证明。

    毕业许多年后,我偶尔还是回学校讲课。我也经常提醒学弟学妹:“产品设计师不仅仅要能出设计方案,还要有足够强的动手能力,这是传承百年的包豪斯精神。”

    如果你已经正式地进入产品经理的行列,请听下回讲解《产品经理如何交付产品和战略》,欢迎大家收藏订阅。

    上面内容提到的书和资料,我已经放到我的知识星球了,如果有需要可以关注我的微信公众号“PM熊叔”。



  • 2019年,我们在做智能写作的时候,面临的最大的挑战就是AI给的数据效果和预期偏差太远。特别是做扩写的时候,发现生成的文字很容易跑偏。


    当时,我们做了很多算法和模型研究。几乎爬取了全网的自媒体文章,然后训练一批模型,问题依然很多。因为中文博大精深各种修辞手法和阴阳怪气,再加上随着时代的发展,“米”、“口罩”、“W”等特殊词的用法也如雨后春笋一般涌现,如何让AI能跟上人类语言的理解能力是个让人头痛的问题。

    当时我们也训练了不少语言模型,发现它根本无法弄懂词的含义,无法理解“心灵鸡汤”和“鸡汤”是完全两码事,写出了“老鼠爱喝心灵鸡汤”的令人啼笑皆非的错误;另外,很容易跑偏,从“心灵鸡汤”跑偏到“老鼠喝汤”再跑偏到“动物世界”,一口气扩写出几百个字,能跑偏到十万八千里,让人完全摸不着头脑。

    在试了很多方案之后,我们得到了一个结论:机器无法真正理解人类的语言。然后,我们悄悄把“扩写”放到了“实验室”的板块,放弃了文本生成的持续研发。

    AI生成文字这条路到底通不通?到2023年,在没有体验ChatGPT之前,我还是持保留态度,但是体验之后,我忍不住惊呼:“这三四年的时间到底发生了什么?”

    我和大家一样,重新补起了功课……

    一、什么是语言模型?

    语言模型( Language Model)是一种机器学习算法,它可以根据给定文本来预测下一个词语或字符的出现的概率。

    语言模型通过大量的文本数据来学习语言的统计特征,进而生成具有相似统计特征的新文本。其核心目标是建立一个统计模型,用来估计文本序列中每个词语或字符出现的概率,从而实现语言生成、语言理解等自然语言处理任务。

    比如,我们可以给一句话让ChatGPT做扩写:"我今天吃了一个___"

    它可能会扩写出“苹果”,“馒头”、“面包”、“汉堡”。根据大量的文本统计,这些词出现频率大致如下图:

    果为0.07,馒头为0.035,面包为0.025,汉堡为0.022。

    因为”苹果“出现得比较多,ChatGPT大概率会写出”今天我吃了一个苹果“。但它不太可能预测出”我今天吃了一个火车”,因为”火车“不是食物,虽然语法通顺。但喂给GPT训练的语料里面基本没有人会这样造句。

    正是因为GPT在训练过程中吸收了大量的人类语言数据,所以我们会觉得它的回答符合我们的逻辑。

    人类区别于普通动物的最主要智慧特征可能就是强大的语言能力。语言不仅仅只是一种沟通工具,还包含着人类的思考逻辑和对世界的认知。

    不管AI是否有真正的智慧,我相信只要语言模型的预测能力做到极致,就能够让人类信以为真。

    二、概率从哪里来?

    那么,语言模型是如何预测概率的呢?这要从200多年前的贝叶斯学派说起。

    贝叶斯定理,由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发明的。其主要思想就是,通过已知的知识来预测接下来要发生事情的概率。即我们通过以往的经验、分析或实验,可以推断出一些事件发生的概率。为了更好的理解,我们举个预测地震的例子。

    假设有人收集了大量历史数据,我们可以发现地震和自然界的某些异常现象有某种关系,如鸡飞狗跳、老鼠上街、青蛙搬家、湖水干涸等现象,我们可以根据历史的数据事先计算好这些现象出现的概率,叫做先验概率。地震的概率可以写作P(地震),异常现象的概率可以写为P(异常现象),例如,老鼠上街的概率可以写作P(老鼠上街)。

    正所谓:一切偶然背后都会有个必然。根据历史数据,我们可以算出地震和异常现象的概率关系,我们称之为条件概率。例如,在某个异常现象发生后出现地震的概率,可以写作P(地震|异常现象),先决条件写在|后面。如果是已知地震再计算异常现象的概率,也可以反过来P(异常现象|地震)。

    有了这些数据,我们就可以根据观测,预测还未发生的地震了。通过观测一些现象来预测的还未发生的概率,这叫做后验概率,我们记为P(新地震|异常现象)。

    例如,P(新地震|鸡飞狗跳)表示的是我们观测到鸡飞狗跳,预测可能发生地震的概率。这时我们可以用到贝叶斯公式。

    后验概率 = (先验概率 * 条件概率) / 证据概率

    我们把预测地震的例子迁移回语言模型。假设要预测在给定“吃”这个词之后,下一个词是“苹果”的概率,即P(苹果|吃)。


    首先,语言模型学习了大量的文本数据,获得了大量的先验知识,已经知道了P(吃|苹果)、P(苹果)和P(吃)这三个概率值。其中,P(吃|苹果)表示在给定“苹果”这个词之后,出现“吃”的概率;P(苹果)表示“苹果”这个词出现的概率;P(吃)表示“吃”这个词出现的概率。

    然后,我们可以根据贝叶斯定理,计算后验概率P(苹果|吃):

    我们还可以通过输入法的联想词模拟整个句子的生成过程。

    我们以“今天吃”这个词作为输入,语言模型会继续根据统计数据,计算出在“今天吃”这个词之后,各个词出现的概率。例如,它可能计算出“饭”这个词出现的概率为0.4,“了”这个词出现的概率为0.35,“的”这个词出现的概率为0.33……我们结合语境选择“了”,然后输入法刷新联想词,然后我们选择“一个”。依次重复这个过程,最终得到了“今天吃了一个苹果”的句子。

    大家可能也注意到了它的问题。输入法的语言模型,只能预测上一个词和下一个词的关系,如果没有人类的主动选择就很容易跑偏,这是一个长文本预测的问题。

    在2019年,我们遇到了问题是一样的。而且我们在实际应用中我们会使用更加复杂的模型,我们会用到一些RNN等深度学习的技术,让语言模型可以预测更长一点的句子。但是针对长文本依然无法解决跑偏的问题。

    当时的解决方案就是一句一句的扩,让用户随时可以纠正偏差。但问题是这种扩写的意义又在哪里呢?让我对AI文本生成的信仰顿时崩塌。

    三、什么是大语言模型(LLM)?

    2023年,让整个人类最为振奋的AI技术就是ChatGPT。“大语言模型(Large Language Model)”这个词也随之映入人们的眼帘。ChatGPT让人觉得惊艳之处,能够结合上下文,像人一样有逻辑性地回答问题,就算生成超长的文本也不会跑偏。到底什么是大语言模型?

    大语言模型与普通语言模型相比,大语言模型的一个显著区别在于其规模。大语言模型通常具有大量的参数,并且在训练过程中使用了巨量的文本数据。大型语言模型的参数规模通常与效果成正比,能够更好地理解和生成自然语言文本,更好地完成各种自然语言处理任务,如写作、翻译、问答等。

    GPT优秀之处是做了前无古人的突破性的尝试,使用了巨量的参数和预训练数据。GPT-3拥有1750亿个参数,使用了45TB的文本数据进行训练。训练数据和参数量都远远超过传统的语言模型。

    3.1 大规模的参数有什么用?

    我们要从词嵌入(Word Embedding)说起,为帮助语言模型更好地理解每个词的特征和含义, 我们需要使用大量的参数来存储和处理信息。我们会将这些词嵌入一个高维的向量空间里面,像GPT-3的向量空间的维数就有12288,这意味着GPT-3可以使用12288个维度来充分理解某个词。对于很多单词的理解可能比人类都要透彻。

    语言模型还可以通过词向量空间中的位置的远近来理解词与词之间的关系。

    假设我们的词向量空间有三个维度:颜色、形状和类别。我们有三个单词:“苹果”、“橘子”、“手机”,应该如何嵌入到向量空间呢?

    “苹果”和“橘子”都属于水果类别,因此它们在类别维度上的值相同都是用数字“1”表示;但“苹果”的颜色是红色用数字“1”表示,而“橘子”的颜色是橙色用数字“2”表示;至于形状维度,由于“苹果”和“橘子”的形状都是圆形,都用数字“1”表示,于是有下面这个数值。

    “手机”属于电子产品类别,数值用“3”表示;手机的形状是方的,数值用“2”表示;颜色是多色的,数值用“8”来表示。

    他们之间的关系可以一目了然地展示在向量空间的关系中,如下图:


    我们可以看到语义相似的单词在向量空间中彼此靠近。当GPT在生成文字的时候,它可以根据向量空间知道“苹果”和“橘子”是一类水果,在“吃”的语境中可以相互替换。

    但是这也有新的问题,“苹果”也有可能是指生产手机的“苹果公司”, GPT怎么能知道“苹果”是否特指“苹果公司”呢,根据不同的语境推理出不同含义的“苹果”呢?

    2019年,如何结合语境,让语言模型能够准确地理解词的含义,这在当时也是个巨大的难题。我们当时想的策略也相对简单粗暴,就是通过命名实体技术强制将它们标记为不同的实体名词,例如,“苹果手机”类别为电子产品,“苹果公司”为企业。但是遇到的问题是,我们没有办法列举完所有的命名实体,需要不断扩充新词库;另外在很多语境中“苹果”就能代表”苹果公司“和”苹果手机“,没办法根本解决这个问题。

    GPT-3高明之处就是使用上下文相关的词嵌入方法和自注意力机制来解决这个问题。它的词嵌入方法考虑了单词在给定文本中使用的上下文,而自注意力机制则允许模型在生成文本时考虑前面的所有的单词。最终,让机器能更好地理解语境 ,解决词的多义性和歧义性问题。

    3.2 什么是注意力机制?

    GPT的Transformer模型通过使用自注意力机制(Self-attention mechanism),能够让模型在处理每个单词时都能考虑到文本中所有单词的信息,从而更好地捕捉文本中的长距离依赖关系,解决了长文本的跑偏的问题。这在传统的模型中是无法做到的。

    注意力机制的灵活性来自于它的“软权重”特性,即这种权重是可以在运行时改变的,可以根据上下文来推断出单词的含义,来达到更好的预测效果。

    举个例子,假设我们有一个句子:“我喜欢吃苹果,但我不喜欢苹果手机。”在这个句子中,“苹果”这个词出现了两次,第一个“苹果”是指一种水果,而第二个“苹果”是指一种手机品牌。

    如果是没有注意力机制的模型来处理这个句子,那么模型可能会将两次出现的“苹果”都当做水果来处理。但对于GPT来说就不一样了,它能够根据上下文来推断出每次出现的“苹果”的含义。

    这主要归功于GPT包含的巨量参数中不仅仅包含了词汇的意义,还包含了词在句子中结构和语法、语言风格、语境信息等等。

    注意力机制可以通过计算每个词的相似度来实现注意力权重的计算。当它处理第一个“苹果”时,会注意到前面有一个权重较高的“吃”字,因此会推断出这里的“苹果”指的是一种水果;而当模型处理第二个“苹果”时,它会注意到后面有一个权重较高的“手机”,因此会推断出这里的“苹果”指的是一种手机品牌。

    我们可以简单模拟一下这个注意力权重的计算过程。

    假设我们有个三维的词向量空间,我们先把“我”、“喜欢”、“吃”、“苹果”这4个词嵌入到这个空间里面:

    如果绘制成图,他们在向量空间中的关系一目了然。如下图,两个词越是接近,关系就越紧密。

    语言模型可以用数学方法来分别计算”苹果“与“我”“喜欢”“吃”三个词的权重分数,我们可以通过向量的点积计算方式模拟计算一下,值越大代表的是向量的相关性越大:

    通过计算我们发现“”的相似度最大为2.66,那就说明“吃”这个词相对于“苹果”应该有更高的注意权重。

    或许看到这里,你已经觉得自己消耗了不少的脑细胞。但似乎我们也能够理解GPT工作量是有多么的大。因为要不断地动态的生成和预测下个词,需要消耗大量的算力。没办法一步到位,所以它只能是一个字一个字地给你呈现出来。

    算力也是我们在2019年遇到的难题,因为训练模型的沉没成本很高。稍微复杂一点的模型训练可能需要几天的时间,但是你也没有办法保证预期结果。而且,在模型训练好之后,用户还需要长时间的等待计算结果,导致体验非常糟糕。对于一个争分夺秒的创业团队来说,显然有些不切实际。

    所以我们当时思路是尽可能把模型做多做小,按照不同的文章分类进行训练,想通过这种方式平衡时间和效果,但效果依然不尽人意。从今天的结果来看,没有通用的大语言模型作为基座,把模型做小做细基本就是一条不归路。最终,我们放弃了文本生成算法的持续研发。

    GPT的成功之处,不仅仅是技术的成功,也是在商业上面的成功。有了微软的算力加持,可以更好的保证模型训练和服务体验,才能在普通的用户人群获得巨大的反响。

    四、尾声

    今天,在ChatGPT闪耀的光环之下,我们看到OpenAI的CEO 山姆·奥特曼(Sam Altman) 风光无限,我在短视频平台经常能刷到他的精彩演讲语录,我也总是希望能够从他的成功经历上学到点什么。

    如果有一天,我拿着2023年的大语言模型的论文,穿越回了2019年,重新开始智能写作的项目,我会做得更好吗?其实,我依然觉得很难,因为创业需要”天时地利人和“。

    先不提OpenAI所在的土壤对于创新极其的开放,它吸纳了全球最顶尖的人才,并获得了资本的鼎力支持。光是能够看清未来的方向,并且能够坚定不移地走下去,也是我们大多数创业团队无法企及的高度。

    对于一个创业者来说,看见未来很重要,但认清自己也很重要。看见未来,你才能坚定不移地走下去;认清自己,你才能力所能及地把事情做得更好。在没有能力之前,需要先学会成长;在机遇没有到来之前,需要先学会等待;在没有成功之前,也要学会选择坚持。

    现在ChatGPT的热度之下,又有一些朋友重新投入到AI创业的大潮中。雷军说过:“站在风口,猪也能被吹上天”。但是风很大,浪也会很急,挑战也会很多。希望各位创业者能够一帆风顺。



    最后,我有个AI产品创业相关的知识库,每天会更新一些发现和感悟,6.18做个优惠活动。欢迎有兴趣的朋友加入。


  • 今天,我们来讨论一下什么是用户体验地图。


    什么是用户体验地图?


    Customer Journey Map,缩写为CJM,翻译为顾客旅程图,也叫用户体验地图或者顾客体验地图,是一张超越时间和空间,从个体的视角得到用户与企业、服务、产品之间的关系地图。


    它能够视觉化地描绘用户在使用服务的整个过程中的流程、需求、痛点。它可以很好的帮助我们梳理和分析常见的场景中可能存在的问题。在营销、服务、产品的场景分析中它都能发挥很大作用。


    在我见过的做得比较好的地图里面,首当其冲的还是星巴克的“顾客的全过程体验地图”。



    描述了用户在购买星巴克咖啡的全流程体验,从准备(Anticipate)、进入(Enter)、参与(Engage)、退出(Exit)、反馈(Reflect),每一个步骤下还列举的具体的用户行为,例如,“参与”步骤中包含了:排队、点单、支付、坐下、喝、工作;


    在图中还标识出了用户在体验过程中心情变化,以积极和消极的进行划分,对每个触点(圆点)标记了相应的说明,例如:在工作阶段,免费的wifi就是一个积极的触点。在图的下半部分是从用户的视角,讲述了不同阶段下的不同用户故事,例如:我用着免费Wi-Fi而且信号还行。


    用户体验地图也不一定是一条线性的,也有可以是圆环。例如乐高的“用户体验环(Customer Experience Wheel)”。在图的中心是这个用户画像的说明;圆环外面是用户体验过程,用表情包来表示心情,并在图中标记了需要深入了解的点。


    另外,还有一张很有设计感的地图是Desonance 绘制的,包含了带有故事性的草图。


    大概分以下几大块:


    1. 用户类型 (Customer Type):“用户类型”可以用“用户角色分析法(Persona)”或者移情图进一步细化。

    2. 体验阶段及旅程 (Experience Phases & The Journey): 在不同的体验阶段以图文结合的故事化的方式来描述不同的行为活动,图中包含了痛点、触点、机会点……

    3. 触点详情与交互动作 (Specific touchpoint and interactions):触点的解释说明;

    4. 情绪变化 (What the service is like -- nights and lows ):通过高低来视觉化用户情绪变化过程,从而体现服务效果;

    5. 痛点和机会点 (Point of delight/opportunities & Point of pain/service barriers ): 通过使用图标的方式标记在旅程图中 ;

    6. 关键要点说明( Key to explain the map);


    用户体验地图除了用在商业产品上面,也可以来改善公共服务。例如,英国政府就使用户体验地图来解决公共服务问题,这张图描述了受害人从报案到打官司的体验流程,并站在用户的视角,评估用户的满意度,寻找不同政府部门的服务边界是否存在问题。


    了解完什么是顾客体验地图后,我们该如何绘制呢?


    用户体验地图的绘制需要五步:明确目标、探究问题、头脑风暴、绘制地图、优化迭代。


    第一步,明确目标


    考虑好产品或服务的整体目标,以及期望用户体验地图反应出的具体目标。在做之前,最好把原有的体验流程感受 一遍。并且与利益相关者沟通。可以使用5w1h,进行思考:


    what:我们希望通过用户体验地图解决什么问题?

    why:为什么要解决这个问题?

    where:这些问题在哪些场合发生?

    when:时间截止期限是什么?

    who:涉及到哪些利益相关者?

    how:期望达到的愿景是怎么样的?


    第二步, 探究问题

    1. 用户资料研究,其中包括定性和定量的调查结果,以便于提供洞察客户体验。也可以通过书籍资料做更多的研究。常用的研究方法包括客户访谈、人种学和情境调查、客户调查、客服投诉日志、网络分析、社交媒体收听和竞争情报。

    2. 移情映射,从各个方面描述一个角色在特定场景中的经历。这个练习帮助我们的团队加深对顾客体验的理解,并对顾客所需要的东西做出惊人的洞察力。移情图也为顾客体验地图的绘制提供了感知基础。我们的目标是获得一个全面的感觉,在这段经历中扮演那个角色的感觉,特别是关注他们的想法、感觉、视觉、听觉、说话和行动。

    3. 列出触点清单,以及这些触点出现的场景。然后通过头脑风暴寻找被遗漏的接触点或场景。例如,假设触点是“付账单”,与触点相关的场景可以是“在线付费”、“通过邮件付费”或“亲自付费”。


    第三步, 头脑风暴


    为了收集更多的Idea,我们需要组建一个头脑风暴团队。头脑风暴的目的是在短时间内产生尽可能多的想法。我们可以围绕品牌特点或用户心理等词汇进行。从3到5个词开始,例如:可访问的,社交的,安慰的,然后每个单词使用两分钟的时间发散。每个人都要写下自己的idea,越多越好。两分钟后切换到下一个词……直到大家产生足够多的灵感后,我们使用亲和图进行整理。


    亲和图是一种将标签分类组合的方法,可以重新组织团队的思想,提炼和发现有价值的灵感的方法。


    亲和图有助于我们从网状的发散过程收敛为机会点的探究,以帮助我们获得正确解决方案。


    在头脑风暴的过程中,所有的团队成员都应该把他们的想法通过便签的形式贴在墙上。然后对这些想法进行分类。作为一个团队,你们可以去掉不切实际的标签、重新排列组合和提炼要点,最终形成能够提升用户体验的美好蓝图。


    第四步,绘制地图


    我们把所有的东西放在一起,按照时间线、触点、渠道、情绪来排布,以及用来改进未来用户体验过程的新想法。重新审视一下。


    用户体验地图有5个关键要素,然后组成一副图:


    1. 用户画像:这张图的主角用户是谁;

    2. 触点:场景中服务与用户接触的关键点;

    3. 渠道:交互行为发生的地方是网页端、App、电话、还是在线下某一个地方?

    4. 时间线:根据服务的前、中、后的不同阶段,可以进行细分;

    5. 情绪:在体验过程中的情绪变化。


    另外这张图还可以提供一些额外信息,比如,通过拍摄一些真实场景的照片,能够让人留下印象深刻的互动画面。再例如,列举那些影响用户体验的人,如服务员、朋友、同事……


    第五步,优化迭代


    经过上面的步骤,你的用户体验地图已经不仅仅只是一张挂在白板上的草图,它已经成为你团队思考的结晶。


    通过提炼,你可以将其绘制成一张正式的图。如果不擅长作图你可以下载我的用户体验地图模板。然后,你需要打磨它、工作中利用它、并与同事分享它。


    绘制用户体验地图的关键不是结果而是过程,它促使我们深入的思考,如何改善客户的服务体验,随着时间的推移,我们需要定期维护。例如,按照季度或者年度来校准你的用户体验地图。


    我是PM熊叔,希望我的分享能帮助到你。