如果说今年的风口,那一定是 AI。不过AI像一把双刃剑,既有助益也有风险。我们将从IBM Watson的高飞与坠落,到Google Allo的黯然失色,探索AI应用中的教训。同时,瑞幸咖啡的成功故事展现了凭借策略得当的AI应用,即使在困境中也能崛起。通过ChatGPT实践案例,我们进一步揭示AI在日常工作中的潜能,从PRD文档编写到内容管理的自动化。最后,我们讨论如何与AI高效交流,确保AI是成为推动进步的力量而非阻碍。在整篇文章中,我将分享AI的正确应用价值,和如何嵌入实际的应用场景中。
聚焦AI产品,浅谈应用价值
在分析AI的应用场景之前,我们先将目光锁定一下目前前沿的AI产品如ChatGPT 4、Stable Diffusion(SD)、Midjourney(MJ)、DALL·E。让我们看看它们是如何成为当前技术革新的代表的。
ChatGPT尤其引人注目,它基于OpenAI的GPT-4模型,提供了与人类相似的交互体验。我个人在使用ChatGPT时,由于其高级功能需要订阅,我采取了特定的步骤来续费,包括创建美区账号并通过充值卡支付,这个过程确实有些繁琐,一开始也将我劝退。我也尝试过去使用其他的AI产品,例如Gemini、火山写作、百度的ERNIE等,对于这些产品,一个共通的缺点是在特定领域或任务上的局限性。尽管它们可能在特定场景下表现出色,但无一例外,它们都存在某些方面的不足,如理解复杂查询的能力、跨语言应用的适应性、创意内容生成的深度和宽度,以及对特定用户群体的可访问性和成本效益。其实我个人觉得Gemini还挺不错的,响应速度比chat GPT4 要快。不过我从一开始就用的是GPT3.5,到目前也在坚持续费GPT4,也算是GPT4的忠实使用者。
在AI视觉创作领域,DALL·E、Midjourney(MJ)、和Stable Diffusion(SD)各自展现了独特的风格和功能。由OpenAI开发的图像生成AI-DALL·E,更擅长根据用户的文本描述生成插画风格和仿3D的图像。它对于抽象概念的理解能力强,能创造出富有创意的视觉作品。尽管DALL·E在创意表达上表现卓越,但在生成真实感图像方面,尤其是复杂场景和细节处理(如人物面部和手部)上,仍有局限。其生成的图片往往带有明显的AI生成特征,缺乏一定的真实感。
Midjourney 与其他AI生图工具,例如Leonardo.ai使用的Stable Diffusion及其衍生版本,在技术基础上有显著的区别。Midjourney利用的是自主研发的闭源模型,这种独特的技术选择为其带来了更细腻的参数调整能力和卓越的艺术表现力,这也正是最初吸引了众多用户的原因。网络资料显示,Midjourney的模型训练参数高达300-400亿,相较之下,最新版的Stable Diffusion参数仅有66亿。Midjourney的图像因其出众的视觉效果而受到称赞,但这种优势伴随着较大的不确定性,一些用户比喻其体验类似于随机抽取,尽管每张图像都具有视觉冲击力,但常常在细节上未能完全达到用户的期望。这种较高的不确定性导致了使用Midjourney的成本增加,这里的成本不仅仅指金钱,更多指的是时间成本。由于不确定性的存在,用户在寻求一张满意图片的过程中需要投入更多的时间,并且必须不断学习和调整Prompt命令来控制图像生成效果。如果用户不愿意投入大量时间进行学习,那么使用Midjourney可能不会比使用其他工具获得更好的结果。
反观Stable Diffusion,作为一个开源模型,其设计初衷便是拥有出色的可扩展性,允许开发者根据自己的应用场景进行定制。虽然在起初,由于训练数据量有限,基于Stable Diffusion开发的模型在图像生成效果上通常不及Midjourney,但随着时间的推移,开源模型的可控性和扩展性的优势开始显现。这种开放性赋予了Stable Diffusion长期的发展前景,使其成为一个能够不断适应新挑战和需求的强大平台。
可在实际工作环境中,尽管Midjourney以其卓越的艺术表现力和细腻的图像质量受到了高度赞誉,但是在公司的实际应用过程中,Stable Diffusion(SD)却因其灵活性和开放性成为了更受青睐的选择。这一现象反映了在商业和技术决策中,可扩展性和自定义能力往往比单一的视觉效果更为重要。Stable Diffusion的开源特性允许公司根据特定的业务需求进行定制化开发,这种高度的适应性使其能够被广泛应用于不同的项目和任务中。无论是为营销材料生成引人注目的视觉内容,还是为产品设计提供创意灵感,SD都展现出了其强大的功能性和实用性。更重要的是,随着社区的共同努力和持续的技术迭代,基于SD的应用和工具正在快速进步,为企业提供了丰富的资源和灵活的解决方案。
SD的本地部署能力为企业提供了数据处理的安全性和私密性,这对于处理敏感信息或遵守特定数据保护法规的公司尤为重要。尽管这也带来了一定的部署复杂度和学习成本,但对于追求高度定制和控制的企业来说,这些投入是值得的。随着时间的推移,SD社区也在不断简化部署流程和降低使用门槛,使得更多公司能够轻松利用这一强大的技术。
AI 应用场景解码
尽管许多公司对AI充满期待,但如何将AI技术有效集成到现有的工作流程中?还是很迷茫的。这就像是知道目的地,却找不到合适的路一样让人挠头。在当前的商业环境下,诸多公司对于AI的态度可以概括为“知其好而不知其用”。这反映出一个广泛的现象:尽管AI的潜力被普遍认识到,但如何将其有效集成到具体的工作流程中仍然是一个挑战。前段时间我的一个师兄还在跟我说,他们公司业务对AI还是不知道怎么去用,都知道好就是没有应用场景,整个公司都很懵逼的状态。有点类似于知道变身成凹凸曼很厉害,但是让我来,我不知道怎么放技能。
所以刚开始很多公司在对于AI的应用策略上都是“摸着石头过河”,并不是所有尝试都取得了成功。IBM Watson在医疗领域的挑战、Google Allo的失败、Amazon Rekognition的争议、以及Microsoft Tay的公关灾难这些事件都是AI商业应用中值得关注的案例,从中也能吸取很多重要教训。我们就拿IBM Watson这个产品分析下它的商业应用价值和最终策略失败的真正原因:
IBM Watson 在医疗领域的挑战
IBM Watson 在医疗领域的尝试是人工智能技术商业应用的一个重要案例。Watson Health的目标是通过利用大数据和机器学习来改善医疗服务的质量和效率,尤其是在疾病诊断和个性化治疗方案的制定上。
- 个性化医疗:Watson Health旨在通过分析患者的医疗记录和最新的医学研究,为每个患者提供个性化的治疗方案。这种方法有潜力大幅提高治疗效果,尤其是对于癌症等复杂疾病。
- 效率提升:通过自动化分析医学文献和病例数据,Watson可以帮助医生和研究人员节省大量的时间,加快诊断和治疗决策过程。
- 决策支持:Watson提供的数据驱动决策支持有助于降低医疗过程中的错误,提升病人治疗的准确性和安全性。
然而,尽管初衷良好,Watson Health在商业化过程中遇到了诸多挑战,最终未能实现预期的商业价值。医疗数据的复杂性和不一致性对Watson提出了巨大挑战。非结构化的医疗记录、不同医疗机构的数据格式不统一以及隐私保护要求,都增加了数据整合和分析的难度。且Watson Health在技术上具有创新性,但其商业模式未能有效解决医疗行业的需求,包括如何融入现有的医疗流程中、医生和患者对AI技术的信任度不足,以及高昂的成本问题。
所以可以总结一下就是 IBM Watson在医疗领域的失败主要源于数据处理的困难以及其商业模式和市场接受度未能达到预期。IBM Watson在医疗领域的挑战,从一个更宽广的视角看,可以归咎于对AI 商业应用场景寻找的不是最佳的选择。Watson尝试解决的问题超出了当前AI技术能力的最佳应用范围,或者说,这个特定的应用场景并不是AI技术发挥最大价值的地方。
瑞幸借助AI 华丽逆袭
而AI真的没有好的应用场景吗,或者说AI只是可远观而不可用的能力?不。相信大家还记得之前瑞幸咖啡的“财务造假”的新闻吧,回看2020年的6月份,瑞幸因为财务造假被强行退市,截止到了2021年的8月居然开始实现盈利,短短一年的时间从起死回生到全行业第一,他中间到底做了什么?2023年他它的销售额超越星巴克、门店数量超过16,000家的壮观成绩,背后反映的其实是企业通过技术创新,尤其是AI的深度应用,实现的快速转型和增长。
即使今天瑞幸的管理层全部放假,他全国所有的门店依旧都可以照常经营的,丝毫不会受到影响。你觉得我说的太夸张?我们可以分析一下瑞幸的成功归结于哪几个关键策略和技术应用:
- 全价值链的自动化和智能化:从产品研发迭代、供应链管理、门店选址、组织监管到个性化营销和顾客服务,瑞幸通过构建一整套定制化的AI系统,实现了业务流程的自动化和智能化,极大地提升了效率和客户满意度。
- 个性化营销的深化应用:利用AI分析用户行为和偏好,瑞幸能够提供高度个性化的推广活动和产品推荐,提高了销售转化率和顾客忠诚度。
- 智能监管和预测系统:AI不仅用于顾客端的个性化推荐,还深入到门店运营管理中。通过实时监控订单流量、预测销量,AI帮助门店优化库存管理和员工效率,甚至在无需人工干预的情况下自动调整产品供应链。
- 迭代速度和新品开发:瑞幸的新品开发速度非常快,这得益于其AI系统能够快速分析市场反馈和销售数据,加速产品迭代周期,及时推出符合市场需求的新产品。
- 数据驱动的决策制定:在瑞幸,几乎所有的商业决策都是基于数据和AI分析结果来进行的,无论是市场营销策略、产品开发还是供应链优化,都以数据为基础,确保了决策的准确性和有效性。
瑞幸的故事也为其他企业提供了重要的启示:在大数据和AI技术不断进步的今天,企业可以通过技术创新,特别是智能化的应用,来实现业务的快速增长和市场竞争力的提升。同时,这也表明了未来商业竞争的一个重要趋势:应用先进的AI技术和数据分析能力将成为企业获得核心竞争力的关键。
实践案例 chat GPT 的应用场景
尽管AI技术在企业中的应用案例众多,有时我们仍然会发现自己对如何将AI融入日常工作以提高效率感到困惑。在众多AI产品中,OpenAI的ChatGPT无疑是最具潜力的工具之一。然而,如果我们仅将其视为一个高级搜索引擎,那么就大大低估了它的能力。
在探索AI如何优化工作流程的过程中,我开发了两个定制化的ChatGPT应用:一是PRD撰写助手,它能根据提供的项目信息自动生成产品需求文档,极大简化了文档编写工作;二是智能素材库管理助手,这个工具可以自动为上传的素材判断业务领域、类型,进行自动打标签和命名,有效提高了素材管理的效率。这两个案例展示了通过AI定制化开发,将ChatGPT嵌入到工作流程中,关键在于我们如何定义任务和提出问题。一旦我们掌握了这些技巧,ChatGPT便能成为提升工作效率的强大助力。我们能够针对具体的工作痛点设计解决方案,从而在各自的领域内实现工作效率的显著提升。
开胃小菜:需求文档GPT助手
这天领导突然让我产出一份PRD文档,11点开会评审的时候要用,当时已经是10点了。一个小时如何快速产出一份完善的PRD文档?这个时候GPT就派上用场了。但是项目背景、项目核心功能、产品目标什么的你一个一个地去和GPT聊,首先先不说它能不能形成连贯性思维,它可能会把你的问题逐个分析处理,但是不会数据留档,其次它所生成的内容会说的很空很概念化,会具备一定的参考价值,但是还需要你结合项目情况进行二次调整。有这个时间不如去小红书上找几个模板自己套一下。
Chat GPT 4 有一个很核心的功能就是自定义chat gpt,你可以创建属于你的专属GPT。你甚至可以通过大白话的形式和它交流,它会根据你的要求更新指令(prompt),并部署GPT。但是这个要求指令需要步步引导,且等待它理解你的意思并优化成相对规范的prompt 也是非常耗时间的。我们要学会利用格式规范,以ai可以快速理解的格式与之交流,不仅可以快速部署,且规范化指令会让GPT的输出更加稳定。
所以在我部署GPT之前,我会对prompt 进行三大要素的梳理:
规范性
专业性语言:通过整个描述,采用了专业术语,如“PRD文档框架-润色”、“专家级ChatGPT提示工程师”等,确保了沟通的专业性。
角色设定:明确了与用户互动的角色(专家级ChatGPT提示工程师)和用户的称呼(张老师),规范了双方的互动模式。
行动指引:对于每一步骤,给出了明确的动作指引,如“询问是否继续执行”、“确认活动中的专家角色”等,为用户提供了清晰的指导。
格式化
编号列表:采用了编号列表的格式,将整个流程分为17个步骤,每个步骤都有明确的编号,便于阅读和理解。
步骤清晰:每一步的任务都被清楚地分解和描述,格式一致,每个步骤都独立成段,易于跟踪和执行。
逻辑性
逻辑顺序:从用户的需求出发,到角色的确认,再到具体的执行步骤,最后是反馈和调整,整个过程呈现出明确的逻辑顺序。
条件逻辑:在一些步骤中嵌入了条件逻辑,比如如果用户同意或不同意,会有不同的后续行动,这样的设计提高了互动的灵活性和适应性。
反馈循环:在流程的最后阶段,通过询问用户的满意度和是否需要更改,形成了一个反馈循环,确保能够根据用户反馈进行调整,以达到用户的期望。
Chat GPT 接入项目场景
ok,这只是AI在工作效率提升方面的一个小示例。然而,AI的潜力不仅限于工作之外的领域,它也能深入工作场景中,为产品带来实质性的提升。目前,我正在公司开发一个内部素材库平台。实际上,每个公司都拥有自己的设计资源,但这些图片素材通常分散在各处——有些存放在公司的内部平台上,有些仍旧留在设计师的个人电脑中,而有些则遗失在公司的某个尘封文件夹中。问题在于,如何整合公司现有的素材,以便设计师能够在使用时迅速找到所需资源。一般来说,公司会建立素材库平台或指派专人管理内部素材来解决这一问题。但我在建设素材库时发现,简单地将所有素材汇集到一个平台上对设计师并不是很有帮助。他们还需要从中挑选所需素材。如果没有一套规则或系统对素材进行分类管理,使用者面对一大堆素材时会感到头痛。我知道我需要的素材就在这堆里,但就是找不到。到头来,我宁愿上网搜索一张进行修改,或者干脆自己GC一张。因此,对内部素材进行初步筛选变得十分必要:业务、素材类型。这涉及到按照公司内部业务进行分类,以及根据素材的现有类型(如3D、插画、真实图像、纹理氛围等)进行一级筛选,这是最基本的操作。
但由于公司内部许多素材都是GC的,命名往往是一串无规律的字符。即便利用算法支持的图像内容识别技术,通过图文搜索能力来快速筛选素材,准确性仍旧不尽如人意,无法全面覆盖所有素材,导致大量素材难以被有效检索。这就凸显了建立一个标签库的必要性。如果有一套完整的标签体系来管理和分类素材,那么通过标签搜索就成为了一种常见的管理方式,类似于在素材网站如花瓣、千图等可以看到的,每个素材下都有一些描述性的标签。这个方向是正确的,但是问题在于如何为初次上传的素材进行标记。理想的情况下,是通过算法基于模型分析图像内容后进行智能打标。
但这里又出现了一个问题,先不论算法打标的准确性,它真的就是识别素材内容后打上相应的元素标签,这样的复用性极低。比如,我上传了一百张素材,它可能会为我生成100个不同的标签。如果公司就3D风格的素材就有几万张,那么维护一个如此庞大的标签库就变得不现实,丧失了其意义。我点击一个标签可能只能筛选出一张图,这并没有有效地利用标签对素材进行管理。
因此,我开始尝试训练GPT来进行自动化打标,并限定在一个预设的标签池中进行选择。这样不仅能实现自动化打标,还能对标签库进行有效管理和维护。我们只需要按照固定的格式去投喂标签库的标签,这一步可以将格式给GPT,让GPT按照该格式针对素材类别进行分类总结,可以快速整理标签库,我以类别维度去搭建的标签格式:
一、主要类别(1)子分类 [具体标签]。
大概整理了17个主要类别,基本囊括80%的图片素材类别,后期也会定期维护更新。
解决了标签自动化的问题之后,我再次尝试上传素材,却发现效率并没有显著提高。因为每当我上传一张素材时,我需要选择业务归属、素材类型、标签,最后还得为素材进行命名。我开始思考,如果这所有的素材信息都能被自动填充,那将大大提高上传效率。因此,我首先对素材进行了全面的命名规范:
业务(判断)-素材类型(判断)-标签一、标签二、标签三-人物描述/物体名称(判断,不超过4个字)-动作/场景/特征(判断,不超过6个字)。
素材的名称即为:
人物描述/物体名称(判断,不超过4个字)-动作/场景/特征(判断,不超过6个字)。
例:一张女足的素材。全命名为“业务-3D-青年、运动健身、运动员-女孩-踢球”。
我们在prompt中加入现有业务并附带判断要求,及现有素材类型并附带判断要求:
然后我们对命名进行规范,和命名的输出规范:
最后针对于标签的打标进行具体的规则限制:
看一下效果:
完成这一切的部署,可以批量化上传素材,针对素材信息进行自动填充,人工只需要审核即可。写一个脚本进行批量上传后自动打标,在Agent中把逻辑设定好,每个图片对应一个json,一晚上GPT就可以打完所有的标签了。
Prompt 的有效输出
对于高效的Prompt输出,可以通过以下几点进行分述:
格式规范性:
- 格式的规范性是确保信息传达清晰的基础。它包括适当的使用空格、缩进和换行来区分不同部分和层级。
- 通过合理布局,使Prompt的结构清晰、易于阅读,有助于用户和AI系统更快地理解和执行。
逻辑严密性:
- Prompt应按照逻辑顺序组织信息,确保每一步都建立在前一步的基础之上,避免逻辑跳跃或矛盾。
- 逻辑的严密性确保了指令的明确性和执行的可行性,减少了解释的歧义。
善用标点符号:
- 通过适当使用标点符号来对指令进行层级区分和细节说明,可以提升命令的准确性和易懂性。
- 例如,使用逗号和分号分隔同级项目,括号内注明附加说明或条件,以清晰表达复杂的指令集。
深厚的专业知识:
- 编写专业级Prompt要求编写者不仅具备相关领域的深厚知识,还要了解特定领域内的术语和概念如何在AI系统中应用。
- 这包括选择合适的术语和表达方式,使其既准确又容易被AI系统理解和执行。
精确的语言表达:
- 高质量的Prompt输出需要精确的语言表达能力,以避免歧义和误解。
- 通过明确的指令和表述,减少AI执行时的错误率,提升整体的工作效率。
针对AI的优化:
- 考虑AI的理解能力和解析方式,在编写Prompt时进行优化,以确保AI能准确无误地执行指令。
- 这可能涉及调整表达方式、使用特定的结构或关键词,以适应AI处理的特点。
可以给大家再分享几个高效的Prompt:
总结
AI的强大之处无疑类似于一辆高性能跑车,具备惊人的速度和效率。然而,要让这辆跑车在实际工作场景中发挥其最大潜力,前期的准备工作至关重要。这不仅涉及到将路铺设好,还需要设置好护栏、道路信号和明确的指引。在AI的世界里,编写有效的Prompt相当于铺设道路,而格式化和规则的设定则如同增设护栏和道路信号,确保AI能够在正确的轨道上高效运行。
要让AI成功嵌入工作流中,并找到合适的应用场景,关键在于我们需要精心设计和部署这个场景,明确规则和限制条件。这意味着,我们需要深入理解AI的工作原理和能力范围,同时也要对工作流程有充分的把握。我们要预设那些可以由AI自动完成的任务,识别那些需要人类智慧介入的环节,从而构建出一个既能发挥AI优势又能符合实际工作需求的系统。精心编写的Prompt不仅要能够引导AI理解我们的具体需求,更要能够确保AI的输出符合预期,避免偏差和误解。格式化和规则的设置则进一步确保了AI在处理任务时的准确性和安全性,就像给跑车设置了正确的行驶路线和速度限制,既保证了运行效率,又避免了潜在的风险。
总之,将AI嵌入工作流中,要求我们不仅要了解AI的潜力,还要精心设计其运行的环境和条件。通过这种方式,我们才能确保AI像一辆得到精确指引的跑车,既能在工作中发挥出最佳性能,又能确保沿着正确的方向前进。对于AI的探索还在继续,让我们尽情期待!