全部版块 我的主页
论坛 数据科学与人工智能 人工智能 CAIE人工智能工程师认证
158 0
2025-07-24

PART4 Prompt进阶技术(30%)【应用】


4.1提示词的工作原理与结构

图片4.png

4.1.1用户指令(user

用户指令是整个提示词体系的起点,它代表着用户向AI传达的具体需求信息。

从表现形式上看,用户指令可以是一个简单的问题:

例如:如何快速提高英语听力水平?

也可以是一段详细的描述:

例如:我需要一份适合公司年会的活动策划方案,要求包含创意环节和预算安排。

其核心作用在于明确AI需要处理的任务方向,就如同给AI指明了一个目标位置。为了让AI能够更精准地理解需求,用户在表述指令时应尽量清晰、具体。

错误案例:写一篇文章

正确案例:写一篇关于环保主题的中学生议论文,要求论点明确,有具体案例


4.1.2系统指令(system

系统指令在提示词结构中用于限定AI的行为模式和思考框架。

常见的系统指令有很多

例如:你是一个专业的翻译工具

明确了AI在处理任务时应遵循翻译的规则和标准

例如:回答需保持客观中立

AI的回答风格设定了基调

系统指令的重要性在于它能确保AI的输出符合特定的场景需求。如在医疗咨询场景中,系统指令可以设定为你是一名专业的医生,回答需基于医学知识,不得提供未经证实的建议,这样AI就能在该框架下为用户提供更可靠的咨询服务。在实际应用中,合理设置系统指令能让AI的表现更加符合预期,避免出现偏离目标的情况。


4.1.3回复指令(assistant

回复指令是连接AI思考与最终输出的关键环节,它规定了AI生成回答的具体要求。

回复指令可以包含对回答内容的详细要求:

例如:请分点列出解决方案,每个要点需包含案例说明

也可以是对输出格式的规定:

例如:以表格形式呈现数据对比

回复指令的作用是引导AI将思考过程转化为符合用户期望的输出形式。如当用户需要一份市场分析报告时,回复指令可以设定为报告需包含市场现状分析、竞争对手评估和未来趋势预测三部分,每部分用小标题分隔,数据部分用图表展示,这样AI就能按照指定的结构和形式生成报告,提高输出的可读性和实用性。


4.2提示词的构成要素

图片5.png

4.2.1任务背景与受众

任务背景是指AI处理任务时所处的具体情境,它为AI提供了理解任务的上下文信息。

例如:在疫情防控常态化的背景下,制定企业复工复产方案

疫情防控常态化就是任务背景

受众则是指AI输出内容的接收对象,不同的受众具有不同的特点和需求。如给专业技术人员的报告需要使用严谨的术语和详细的技术分析,而给普通大众的科普文章则需要语言通俗易懂、生动形象。

明确任务背景和受众能帮助AI更好地把握内容的深度和表达方式。如为小学生设计的科学实验指导,任务背景可能是学校课堂教学,受众是小学生,那么在内容表述上就需要简洁明了,步骤说明要详细且具有可操作性。


4.2.2任务目标与目的

任务目标是指AI完成任务后需要达到的具体结果,它是衡量AI输出是否合格的标准。

例如,设计一个能提高用户活跃度的APP运营活动

提高用户活跃度就是任务目标

任务目的是指为什么要完成这个任务,它能让AI更深入地理解任务的意义和价值。如上述运营活动的目的可能是为了增加APP的用户粘性,促进产品的长期发展。

AI清楚地知道目标和目的后,就能在内容中突出重点,合理安排各个部分的内容比例。如在撰写产品推广文案时,目标是提高产品销量,目的是实现企业的盈利增长,那么文案中就需要重点突出产品的优势和特色,以及能给消费者带来的实际利益,从而吸引消费者购买。


4.2.3角色扮演

角色扮演是指赋予AI一个特定的身份,让其以该身份的视角来生成内容。这个身份可以是各种各样的。

例如:你是一位资深的美食评论家

例如:你是一名科幻小说作家

通过角色扮演,AI能够更好地融入特定的情境,生成更符合身份特点的内容。如当AI扮演美食评论家时,在评价一道菜时,会从菜品的色、香、味、形等方面进行专业的分析,使用更生动、形象的语言来描述美食的特点和口感。

在实际应用中,合理运用角色扮演能让AI的输出更加生动有趣,富有个性。如在给儿童讲解历史故事时,让AI扮演一位讲故事的老爷爷,用亲切、温和的语气讲述故事,能让儿童更容易接受和喜欢。


4.2.4风格与语气

风格与语气是指AI输出内容所呈现出的整体特色和情感倾向。风格可以有很多种,如正式、幽默、严谨、活泼等;语气则可以是温和、坚定、热情、客观等。

不同的任务和受众需要不同的风格和语气。如商务合作邮件需要正式、严谨的风格和礼貌、诚恳的语气;而社交媒体的文案则可以采用活泼、幽默的风格和热情、亲切的语气。

确定合适的风格和语气能让AI的输出更符合受众的阅读习惯和心理预期。如在撰写招聘启事时,采用正式、专业的风格和客观、诚恳的语气,能让求职者感受到企业的正规和诚意,从而吸引更多优秀的人才应聘。


4.2.5限制性约束

限制性约束是对AI输出内容的一些限制条件,可以防止AI生成不符合要求的内容。

常见的限制性约束包括字数限制:

例如:回答不超过200

内容范围限制:

例如:只能讨论国内市场的情况

禁止事项限制:

例如:不得涉及敏感话题

限制性约束的作用是确保AI的输出在规定的范围内,满足特定的需求。如在考试作文批改系统中,设定字数限制和内容范围限制,能让AI更准确地对学生的作文进行评估。在使用限制性约束时,需要明确、具体,避免出现歧义,这样AI才能更好地遵守这些约束条件。


4.2.6输出的形式与格式

输出的形式与格式指AI生成内容的具体呈现方式。形式可以是文章、报告、诗歌、对话等;格式可以是段落式、分点式、表格、图表等。

不同的任务需要不同的输出形式和格式。如数据分析结果适合用表格和图表的形式呈现,这样能更直观地展示数据之间的关系;故事创作则适合用段落式的形式,以增强故事的连贯性和可读性。明确输出的形式和格式能让AI的输出更加规范、整齐,便于用户阅读和理解。


4.3文生文提示词的设计策略

图片6.png

4.3.1清晰的说明与答案结构

说明需精准界定任务边界:

例如:撰写一份针对25-35岁职场女性的美妆产品月度营销方案,要求包含用户画像分析、社交媒体投放策略和ROI预估

通过年龄、人群属性、内容模块三重限定,让AI明确任务范畴

答案结构设计可采用--经典框架,先概述核心观点,再分点展开论据,最后总结升华。以影评写作为例,提示词可设定为:

示例:请从叙事结构、镜头语言、角色塑造三个维度分析《流浪地球2》的科幻美学,每个维度需结合具体电影情节,结尾需点明影片的人文价值

这种结构能引导AI产出层次分明的内容


4.3.2提示词符号的使用

符号在提示词中如同语法规则,能精准传递指令逻辑。

破折号“——”可用于补充说明:

例如:设计一款智能办公椅——需具备久坐提醒、脊椎支撑、温度调节功能

强化功能细节

括号()可标注限定条件:

例如:撰写春季新品发布会新闻稿(字数控制在800-1000字,需包含产品亮点、市场反馈、行业趋势分析)

分号可分隔并列要点:

例如:制定线上课程运营计划:1.确定目标学员群体;2.设计课程大纲;3.规划推广渠道;4.制定效果评估指标

对于复杂任务,可组合使用符号构建层级结构:

例如:目标用户画像——核心特征(年龄20-25岁,大学生/职场新人);消费习惯(月均网购3-5次,偏好高性价比商品);需求痛点(时间管理效率低、社交场景穿搭焦虑)


4.3.3零样本与少样本提示

零样本提示适用于AI缺乏先验知识的场景,需通过提示词完整构建任务逻辑。例如向AI询问如何用Python编写一个简单的网页爬虫,零样本提示需包含导入requestsBeautifulSoup发送HTTP请求解析HTML文档提取目标数据保存数据的完整流程说明,甚至需补充处理反爬机制(如设置请求头User-Agent等细节。

少样本提示则通过提供1-3个示例降低AI理解成本,示例需涵盖任务核心要素。以文案风格转换为例,提示词可设计为:

示例:将以下产品描述转为幽默风格:【原句】这款扫地机器人清洁效率高,续航时间长。’→【改写】扫地界的卷王来了!不吃不喝能扫一整天,连沙发底都不放过~请用同样风格改写:这款吹风机风速快,恒温护发效果好。’”

通过一个完整示例,AI能快速捕捉拟人化比喻+网络热词的风格特征。少样本提示的示例需具备代表性,避免引入歧义信息。


4.3.4任务拆分

复杂任务需通过拆分转化为AI可处理的子问题。

撰写某新能源汽车品牌年度传播策略为例:

可拆分为:“1.品牌现状分析(市场份额、用户口碑、竞品动态);2.传播目标设定(品牌知名度提升20%、线索量增长30%);3.核心传播主题提炼;4.渠道组合策略(社交媒体、线下活动、跨界合作);5.内容矩阵规划(短视频、白皮书、用户故事);6.执行排期与预算分配;7.效果评估指标

每个子任务可进一步细化,如品牌现状分析可再拆分为市场数据收集用户调研分析竞品策略拆解

任务拆分遵循“MECE原则(相互独立、完全穷尽),避免子任务重叠或遗漏。拆分后的子任务可按逻辑顺序排列,如背景分析目标设定策略制定执行规划效果评估,让AI按步骤产出内容,最终整合为完整方案。


4.3.5引导模型思考

引导AI思考需模拟人类的推理过程,通过提问式提示激发深度分析。

如分析短视频平台对青少年注意力的影响

提示词设计:“1.青少年使用短视频的平均时长是多少?(数据层面);2.短视频的碎片化内容对认知模式有何影响?(心理学层面);3.平台算法推荐机制如何影响信息获取习惯?(技术层面);4.家长和教育者应采取哪些干预措施?(解决方案层面)请逐一对上述问题展开分析,结合相关研究数据和案例

这种分层提问的方式能引导AI从不同维度切入,避免回答流于表面

对于创造性任务,可通过假设-论证链条引导思考,如假设你是城市规划师,需在老城区设计一个社区共享空间。请先列举3个老城区居民的核心需求,再说明共享空间如何满足这些需求,最后阐述空间设计中如何平衡实用性与文化传承,通过层层递进的提示,让AI的思考过程更具逻辑性。


4.3.6使用外部工具

当任务涉及专业数据或实时信息时,需提示AI调用外部工具:

例如:生成2024年全球新能源汽车销量排行榜(需包含品牌、车型、销量数据、同比增长率),并分析销量增长的主要驱动因素。数据来源需引用权威机构报告(如IEAEVVolumes),最新数据截止到2024Q2

明确工具调用要求

对于需要实时更新的信息,如天气查询、股票行情,提示词应包含获取实时数据的指令:

例如:为北京用户规划周末两天的旅游行程,需结合实时天气情况(提示:调用天气API获取未来48小时预报),推荐室内外搭配的景点,并注明交通路线和预算

使用外部工具时,需确保提示词中包含清晰的工具调用逻辑和数据验证要求,避免AI依赖过时或错误信息。


4.4文生图提示词的设计方法

图片7.png

4.4.1主体描述

需精准界定画面核心对象的物理特征与身份属性。

在描述主体时,不仅要涵盖基础属性如物种(人类/动物/器物)、数量(单一个体或群体),更要深入刻画细节特征。以人物为例,需明确年龄(如少年”“古稀老者)、体型(纤细/健壮)、面部特征(鹰钩鼻、酒窝)、发型(脏辫/波波头)及标志性装饰(如银耳环、机械义眼)。这种具象化描述能让AI准确抓取主体轮廓,避免生成模糊或偏离预期的形象。

例如:画面中央是一位佩戴青铜面具的武士,左脸裸露处有火焰状纹身,手持镶嵌红宝石的断刃,铠甲肩部覆盖着龙鳞纹理的护甲

图片8.png

4.4.2场景描述

需构建主体所处的三维空间坐标系,包括地理环境、时空设定与环境元素的交互关系。

地理环境要精确到地貌特征(沙漠绿洲/哥特式城堡庭院)、空间结构(环形剧场/悬浮空中的楼阁);时空设定需明确季节(飘落樱花的早春)、气候(雷暴中的黄昏)、光线条件(透过彩窗的晨光)。

例如:在冰川裂缝形成的天然拱门下,钟乳石状的蓝色冰晶垂落,地面倒映着极光的绿色光晕,远处浮冰群在潮汐中碰撞出碎冰

图片9.png


4.4.3定义风格

决定画面的艺术表现维度,需从视觉语言体系与美学流派双重角度设定。

视觉语言包括色彩调性(莫兰迪色系/高饱和赛博朋克色调)、光影处理(伦勃朗式侧光/全息投影冷光)、质感表现(哑光陶瓷/金属锈蚀痕迹);美学流派可指定具体艺术类型(超现实主义/浮世绘/低多边形风格)或参考大师作品(类似宫崎骏动画的水彩质感”“借鉴卡拉瓦乔的明暗对照法)。风格描述需避免模糊词汇,尽量用专业术语或具体案例锚定视觉方向。

例如:采用新艺术运动风格,画面以藤蔓状曲线构图,主体服饰布满鸢尾花纹样,背景融入蒂凡尼彩窗的蓝紫色渐变,光影呈现柔焦效果

图片10.png

4.4.4镜头语言

文生图的镜头语言需模拟摄影器材的光学特性,包括景别(大特写/航拍全景)、拍摄角度(鱼眼镜头的畸变效果/仰角营造的崇高感)、焦距(微距镜头下的细节呈现/长焦压缩的空间感)。

镜头语言设计需结合主体与场景的表达需求,如特写镜头适合展现材质细节,广角镜头适合营造宏大场景,同时要考虑画面构图的黄金分割比例。

例如:使用移轴镜头拍摄,画面中心的机械齿轮保持锐度,四周建筑呈现微缩模型般的虚化效果,视角从地面向上仰拍,突出齿轮组的金属质感

图片18.png

4.4.5氛围词

需构建画面的情感场域,通过通感词汇激活感官联想。

除基础情感词(忧郁/炽热/静谧)外,可加入温度(寒雾笼罩的清晨)、声音(远处传来风铃的破碎声)、气味(空气中弥漫着苦橙花的香气)等跨感官描述。

例如画面渗透着潮湿的海腥味,黄昏的光线将人物剪影染成铁锈色,废弃灯塔的玻璃碎片在地面折射出冷冽的蓝光,整体氛围如同褪色的老照片般怅惘

图片11.png

4.4.6细节修饰

细节修饰是提升画面真实感的关键,需聚焦于微观特征与材质表现。

包括纹理(树皮的皲裂走向/丝绸的斜纹织法)、光影细节(金属表面的反射光斑/露珠的棱镜折射)、动态痕迹(奔跑留下的泥渍脚印/蒸汽朋克装置的齿轮油渍)。

例如:少女裙摆的蕾丝花边带有氧化泛黄的痕迹,每朵刺绣蔷薇的花瓣尖端都凝结着一颗水珠,阳光穿过水珠在地面投射出彩虹色的光斑,裙摆褶皱处阴影呈现靛蓝色渐变

图片12.png


4.5视频与数字人生成的提示词设计

图片13.png

4.5.1主体描述

主体描述是提示词设计的基础,决定了视频与数字人生成的核心对象与关键特征。在进行主体描述时,需清晰界定主体的身份、外貌、服饰等具体信息。例如,若主体为数字人,可描述其年龄、性别、发型、面部特征(如眼睛形状、鼻梁高度等)、肤色,以及穿着的服装款式、颜色、材质等。通过细致的主体描述,能让生成的数字人或视频主体更具独特性与辨识度,为后续的场景、运动等描述奠定基础。

例如:一位20岁左右的女性数字人,拥有黑色长卷发,杏仁眼,白皙肤色,身着一袭白色蕾丝连衣裙,裙摆带有淡紫色花纹

图片14.png

4.5.2场景描述

场景描述用于构建主体所处的环境,包括空间位置、环境元素、时间设定等。空间位置可以是具体的地点,如客厅、森林、宇宙空间站等;环境元素涵盖场景中的物体、植物、建筑等,例如森林中的古木、溪流、野花,客厅里的沙发、电视、绿植等;时间设定包括季节、天气、具体时刻,像春季的午后、暴雨之夜、清晨日出时分。生动的场景描述能营造出真实的氛围,使主体更好地融入其中,增强视频的代入感。

例如:在秋日黄昏的森林中,阳光透过金黄的树叶洒在铺满落叶的小径上,不远处有一座古朴的木屋,屋顶冒着袅袅炊烟

图片15.png

4.5.3运动描述

运动描述关乎主体或场景中元素的动作与动态变化。对于数字人,要描述其肢体动作、面部表情、姿态等,如行走的步伐、挥手的幅度、微笑的神态、站立的姿势等;对于场景中的其他元素,如物体的移动、水流的速度、树叶的飘动等也需进行描述。准确的运动描述能让生成的内容更具动感与活力,使画面更加生动鲜活。

例如:数字人迈着轻盈的步伐在花丛中穿梭,时不时弯腰轻嗅花朵,脸上洋溢着愉悦的笑容,同时,一阵微风吹过,花瓣纷纷扬扬地飘落

图片16.png

4.5.4镜头语言

镜头语言是影响视频呈现效果的重要因素,包括镜头的类型、角度、运动方式等。镜头类型有特写、中景、全景、远景等,如特写数字人的手部动作,全景展示整个场景;镜头角度包括平视、俯视、仰视等,不同角度能带来不同的视觉感受,俯视可展现场景的全貌,仰视能突出主体的高大;镜头运动方式有推、拉、摇、移、跟等,推镜头可将观众的注意力集中到主体上,移镜头能展示场景的变化。合理运用镜头语言可以引导观众的视线,增强视频的叙事性和艺术性。

例如:先用全景镜头展示广阔的草原,然后镜头缓慢拉近,聚焦到正在奔跑的数字人,接着采用跟镜头跟随数字人的奔跑轨迹,同时镜头稍微上摇,展现蓝天白云下的奔跑场景

图片17.png

4.5.5氛围词

氛围词用于传达视频所希望营造的情感基调与整体氛围。常见的氛围词有温馨、紧张、浪漫、神秘、欢快、悲伤等。氛围词能让生成的内容更具情感色彩,使观众更容易产生情感共鸣。

例如:温馨的氛围中,数字人依偎在壁炉旁,手中捧着一本书,脸上带着宁静的微笑

例如:紧张的氛围笼罩着整个场景,数字人小心翼翼地在黑暗的走廊中前行,眼神中充满了警惕


CAIE官网网址:https://www.caieglobal.com/


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群