PART4 Prompt进阶技术(30%)【应用】

董祉韫

158

收藏 2025-07-24

PART4 Prompt进阶技术(30%)【应用】

4.1提示词的工作原理与结构

4.1.1用户指令（user）

用户指令是整个提示词体系的起点，它代表着用户向AI传达的具体需求信息。

从表现形式上看，用户指令可以是一个简单的问题：

例如：“如何快速提高英语听力水平？”

也可以是一段详细的描述：

例如：“我需要一份适合公司年会的活动策划方案，要求包含创意环节和预算安排。”

其核心作用在于明确AI需要处理的任务方向，就如同给AI指明了一个目标位置。为了让AI能够更精准地理解需求，用户在表述指令时应尽量清晰、具体。

错误案例：写一篇文章

正确案例：写一篇关于环保主题的中学生议论文，要求论点明确，有具体案例

4.1.2系统指令（system）

系统指令在提示词结构中用于限定AI的行为模式和思考框架。

常见的系统指令有很多

例如：“你是一个专业的翻译工具”

明确了AI在处理任务时应遵循翻译的规则和标准

例如：“回答需保持客观中立”

为AI的回答风格设定了基调

系统指令的重要性在于它能确保AI的输出符合特定的场景需求。如在医疗咨询场景中，系统指令可以设定为“你是一名专业的医生，回答需基于医学知识，不得提供未经证实的建议”，这样AI就能在该框架下为用户提供更可靠的咨询服务。在实际应用中，合理设置系统指令能让AI的表现更加符合预期，避免出现偏离目标的情况。

4.1.3回复指令（assistant）

回复指令是连接AI思考与最终输出的关键环节，它规定了AI生成回答的具体要求。

回复指令可以包含对回答内容的详细要求：

例如：“请分点列出解决方案，每个要点需包含案例说明”

也可以是对输出格式的规定：

例如：“以表格形式呈现数据对比”。

回复指令的作用是引导AI将思考过程转化为符合用户期望的输出形式。如当用户需要一份市场分析报告时，回复指令可以设定为“报告需包含市场现状分析、竞争对手评估和未来趋势预测三部分，每部分用小标题分隔，数据部分用图表展示”，这样AI就能按照指定的结构和形式生成报告，提高输出的可读性和实用性。

4.2提示词的构成要素

4.2.1任务背景与受众

任务背景是指AI处理任务时所处的具体情境，它为AI提供了理解任务的上下文信息。

例如：“在疫情防控常态化的背景下，制定企业复工复产方案”

疫情防控常态化就是任务背景

受众则是指AI输出内容的接收对象，不同的受众具有不同的特点和需求。如给专业技术人员的报告需要使用严谨的术语和详细的技术分析，而给普通大众的科普文章则需要语言通俗易懂、生动形象。

明确任务背景和受众能帮助AI更好地把握内容的深度和表达方式。如为小学生设计的科学实验指导，任务背景可能是学校课堂教学，受众是小学生，那么在内容表述上就需要简洁明了，步骤说明要详细且具有可操作性。

4.2.2任务目标与目的

任务目标是指AI完成任务后需要达到的具体结果，它是衡量AI输出是否合格的标准。

例如，“设计一个能提高用户活跃度的APP运营活动”

提高用户活跃度就是任务目标

任务目的是指为什么要完成这个任务，它能让AI更深入地理解任务的意义和价值。如上述运营活动的目的可能是为了增加APP的用户粘性，促进产品的长期发展。

当AI清楚地知道目标和目的后，就能在内容中突出重点，合理安排各个部分的内容比例。如在撰写产品推广文案时，目标是提高产品销量，目的是实现企业的盈利增长，那么文案中就需要重点突出产品的优势和特色，以及能给消费者带来的实际利益，从而吸引消费者购买。

4.2.3角色扮演

角色扮演是指赋予AI一个特定的身份，让其以该身份的视角来生成内容。这个身份可以是各种各样的。

例如：“你是一位资深的美食评论家”

例如：“你是一名科幻小说作家”

通过角色扮演，AI能够更好地融入特定的情境，生成更符合身份特点的内容。如当AI扮演美食评论家时，在评价一道菜时，会从菜品的色、香、味、形等方面进行专业的分析，使用更生动、形象的语言来描述美食的特点和口感。

在实际应用中，合理运用角色扮演能让AI的输出更加生动有趣，富有个性。如在给儿童讲解历史故事时，让AI扮演一位讲故事的老爷爷，用亲切、温和的语气讲述故事，能让儿童更容易接受和喜欢。

4.2.4风格与语气

风格与语气是指AI输出内容所呈现出的整体特色和情感倾向。风格可以有很多种，如正式、幽默、严谨、活泼等；语气则可以是温和、坚定、热情、客观等。

不同的任务和受众需要不同的风格和语气。如商务合作邮件需要正式、严谨的风格和礼貌、诚恳的语气；而社交媒体的文案则可以采用活泼、幽默的风格和热情、亲切的语气。

确定合适的风格和语气能让AI的输出更符合受众的阅读习惯和心理预期。如在撰写招聘启事时，采用正式、专业的风格和客观、诚恳的语气，能让求职者感受到企业的正规和诚意，从而吸引更多优秀的人才应聘。

4.2.5限制性约束

限制性约束是对AI输出内容的一些限制条件，可以防止AI生成不符合要求的内容。

常见的限制性约束包括字数限制：

例如：“回答不超过200字”

内容范围限制：

例如：“只能讨论国内市场的情况”

禁止事项限制：

例如：“不得涉及敏感话题”

限制性约束的作用是确保AI的输出在规定的范围内，满足特定的需求。如在考试作文批改系统中，设定字数限制和内容范围限制，能让AI更准确地对学生的作文进行评估。在使用限制性约束时，需要明确、具体，避免出现歧义，这样AI才能更好地遵守这些约束条件。

4.2.6输出的形式与格式

输出的形式与格式指AI生成内容的具体呈现方式。形式可以是文章、报告、诗歌、对话等；格式可以是段落式、分点式、表格、图表等。

不同的任务需要不同的输出形式和格式。如数据分析结果适合用表格和图表的形式呈现，这样能更直观地展示数据之间的关系；故事创作则适合用段落式的形式，以增强故事的连贯性和可读性。明确输出的形式和格式能让AI的输出更加规范、整齐，便于用户阅读和理解。

4.3文生文提示词的设计策略

4.3.1清晰的说明与答案结构

说明需精准界定任务边界：

例如：“撰写一份针对25-35岁职场女性的美妆产品月度营销方案，要求包含用户画像分析、社交媒体投放策略和ROI预估”

通过年龄、人群属性、内容模块三重限定，让AI明确任务范畴

答案结构设计可采用“总-分-总”经典框架，先概述核心观点，再分点展开论据，最后总结升华。以影评写作为例，提示词可设定为：

示例：“请从叙事结构、镜头语言、角色塑造三个维度分析《流浪地球2》的科幻美学，每个维度需结合具体电影情节，结尾需点明影片的人文价值”

这种结构能引导AI产出层次分明的内容

4.3.2提示词符号的使用

符号在提示词中如同语法规则，能精准传递指令逻辑。

破折号“——”可用于补充说明：

例如：“设计一款智能办公椅——需具备久坐提醒、脊椎支撑、温度调节功能”

强化功能细节

括号“（）”可标注限定条件：

例如：“撰写春季新品发布会新闻稿（字数控制在800-1000字，需包含产品亮点、市场反馈、行业趋势分析）”

分号“；”可分隔并列要点：

例如：“制定线上课程运营计划：1.确定目标学员群体；2.设计课程大纲；3.规划推广渠道；4.制定效果评估指标”。

对于复杂任务，可组合使用符号构建层级结构：

例如：“目标用户画像——核心特征（年龄20-25岁，大学生/职场新人）；消费习惯（月均网购3-5次，偏好高性价比商品）；需求痛点（时间管理效率低、社交场景穿搭焦虑）”。

4.3.3零样本与少样本提示

零样本提示适用于AI缺乏先验知识的场景，需通过提示词完整构建任务逻辑。例如向AI询问“如何用Python编写一个简单的网页爬虫”，零样本提示需包含“导入requests和BeautifulSoup库→发送HTTP请求→解析HTML文档→提取目标数据→保存数据”的完整流程说明，甚至需补充“处理反爬机制（如设置请求头User-Agent）”等细节。

少样本提示则通过提供1-3个示例降低AI理解成本，示例需涵盖任务核心要素。以文案风格转换为例，提示词可设计为：

示例：“将以下产品描述转为幽默风格：【原句】‘这款扫地机器人清洁效率高，续航时间长。’→【改写】‘扫地界的卷王来了！不吃不喝能扫一整天，连沙发底都不放过～’请用同样风格改写：‘这款吹风机风速快，恒温护发效果好。’”

通过一个完整示例，AI能快速捕捉“拟人化比喻+网络热词”的风格特征。少样本提示的示例需具备代表性，避免引入歧义信息。

4.3.4任务拆分

复杂任务需通过拆分转化为AI可处理的子问题。

以“撰写某新能源汽车品牌年度传播策略”为例：

可拆分为：“1.品牌现状分析（市场份额、用户口碑、竞品动态）；2.传播目标设定（品牌知名度提升20%、线索量增长30%）；3.核心传播主题提炼；4.渠道组合策略（社交媒体、线下活动、跨界合作）；5.内容矩阵规划（短视频、白皮书、用户故事）；6.执行排期与预算分配；7.效果评估指标”

每个子任务可进一步细化，如“品牌现状分析”可再拆分为“市场数据收集→用户调研分析→竞品策略拆解”

任务拆分遵循“MECE原则”（相互独立、完全穷尽），避免子任务重叠或遗漏。拆分后的子任务可按逻辑顺序排列，如“背景分析→目标设定→策略制定→执行规划→效果评估”，让AI按步骤产出内容，最终整合为完整方案。

4.3.5引导模型思考

引导AI思考需模拟人类的推理过程，通过提问式提示激发深度分析。

如分析“短视频平台对青少年注意力的影响”：

提示词设计：“1.青少年使用短视频的平均时长是多少？（数据层面）；2.短视频的碎片化内容对认知模式有何影响？（心理学层面）；3.平台算法推荐机制如何影响信息获取习惯？（技术层面）；4.家长和教育者应采取哪些干预措施？（解决方案层面）请逐一对上述问题展开分析，结合相关研究数据和案例”

这种分层提问的方式能引导AI从不同维度切入，避免回答流于表面

对于创造性任务，可通过“假设-论证”链条引导思考，如“假设你是城市规划师，需在老城区设计一个‘社区共享空间’。请先列举3个老城区居民的核心需求，再说明共享空间如何满足这些需求，最后阐述空间设计中如何平衡实用性与文化传承”，通过层层递进的提示，让AI的思考过程更具逻辑性。

4.3.6使用外部工具

当任务涉及专业数据或实时信息时，需提示AI调用外部工具：

例如：“生成2024年全球新能源汽车销量排行榜（需包含品牌、车型、销量数据、同比增长率），并分析销量增长的主要驱动因素。数据来源需引用权威机构报告（如IEA、EVVolumes），最新数据截止到2024年Q2。”

明确工具调用要求

对于需要实时更新的信息，如天气查询、股票行情，提示词应包含“获取实时数据”的指令：

例如：“为北京用户规划周末两天的旅游行程，需结合实时天气情况（提示：调用天气API获取未来48小时预报），推荐室内外搭配的景点，并注明交通路线和预算”

使用外部工具时，需确保提示词中包含清晰的工具调用逻辑和数据验证要求，避免AI依赖过时或错误信息。

4.4文生图提示词的设计方法

4.4.1主体描述

需精准界定画面核心对象的物理特征与身份属性。

在描述主体时，不仅要涵盖基础属性如物种（人类/动物/器物）、数量（单一个体或群体），更要深入刻画细节特征。以人物为例，需明确年龄（如“少年”“古稀老者”）、体型（纤细/健壮）、面部特征（鹰钩鼻、酒窝）、发型（脏辫/波波头）及标志性装饰（如银耳环、机械义眼）。这种具象化描述能让AI准确抓取主体轮廓，避免生成模糊或偏离预期的形象。

例如：“画面中央是一位佩戴青铜面具的武士，左脸裸露处有火焰状纹身，手持镶嵌红宝石的断刃，铠甲肩部覆盖着龙鳞纹理的护甲”

4.4.2场景描述

需构建主体所处的三维空间坐标系，包括地理环境、时空设定与环境元素的交互关系。

地理环境要精确到地貌特征（沙漠绿洲/哥特式城堡庭院）、空间结构（环形剧场/悬浮空中的楼阁）；时空设定需明确季节（飘落樱花的早春）、气候（雷暴中的黄昏）、光线条件（透过彩窗的晨光）。

例如：“在冰川裂缝形成的天然拱门下，钟乳石状的蓝色冰晶垂落，地面倒映着极光的绿色光晕，远处浮冰群在潮汐中碰撞出碎冰”

4.4.3定义风格

决定画面的艺术表现维度，需从视觉语言体系与美学流派双重角度设定。

视觉语言包括色彩调性（莫兰迪色系/高饱和赛博朋克色调）、光影处理（伦勃朗式侧光/全息投影冷光）、质感表现（哑光陶瓷/金属锈蚀痕迹）；美学流派可指定具体艺术类型（超现实主义/浮世绘/低多边形风格）或参考大师作品（“类似宫崎骏动画的水彩质感”“借鉴卡拉瓦乔的明暗对照法”）。风格描述需避免模糊词汇，尽量用专业术语或具体案例锚定视觉方向。

例如：“采用新艺术运动风格，画面以藤蔓状曲线构图，主体服饰布满鸢尾花纹样，背景融入蒂凡尼彩窗的蓝紫色渐变，光影呈现柔焦效果”

4.4.4镜头语言

文生图的镜头语言需模拟摄影器材的光学特性，包括景别（大特写/航拍全景）、拍摄角度（鱼眼镜头的畸变效果/仰角营造的崇高感）、焦距（微距镜头下的细节呈现/长焦压缩的空间感）。

镜头语言设计需结合主体与场景的表达需求，如特写镜头适合展现材质细节，广角镜头适合营造宏大场景，同时要考虑画面构图的黄金分割比例。

例如：“使用移轴镜头拍摄，画面中心的机械齿轮保持锐度，四周建筑呈现微缩模型般的虚化效果，视角从地面向上仰拍，突出齿轮组的金属质感”。

4.4.5氛围词

需构建画面的情感场域，通过通感词汇激活感官联想。

除基础情感词（忧郁/炽热/静谧）外，可加入温度（“寒雾笼罩的清晨”）、声音（“远处传来风铃的破碎声”）、气味（“空气中弥漫着苦橙花的香气”）等跨感官描述。

例如“画面渗透着潮湿的海腥味，黄昏的光线将人物剪影染成铁锈色，废弃灯塔的玻璃碎片在地面折射出冷冽的蓝光，整体氛围如同褪色的老照片般怅惘”

4.4.6细节修饰

细节修饰是提升画面真实感的关键，需聚焦于微观特征与材质表现。

包括纹理（树皮的皲裂走向/丝绸的斜纹织法）、光影细节（金属表面的反射光斑/露珠的棱镜折射）、动态痕迹（奔跑留下的泥渍脚印/蒸汽朋克装置的齿轮油渍）。

例如：“少女裙摆的蕾丝花边带有氧化泛黄的痕迹，每朵刺绣蔷薇的花瓣尖端都凝结着一颗水珠，阳光穿过水珠在地面投射出彩虹色的光斑，裙摆褶皱处阴影呈现靛蓝色渐变”

4.5视频与数字人生成的提示词设计

4.5.1主体描述

主体描述是提示词设计的基础，决定了视频与数字人生成的核心对象与关键特征。在进行主体描述时，需清晰界定主体的身份、外貌、服饰等具体信息。例如，若主体为数字人，可描述其年龄、性别、发型、面部特征（如眼睛形状、鼻梁高度等）、肤色，以及穿着的服装款式、颜色、材质等。通过细致的主体描述，能让生成的数字人或视频主体更具独特性与辨识度，为后续的场景、运动等描述奠定基础。

例如：“一位20岁左右的女性数字人，拥有黑色长卷发，杏仁眼，白皙肤色，身着一袭白色蕾丝连衣裙，裙摆带有淡紫色花纹”

4.5.2场景描述

场景描述用于构建主体所处的环境，包括空间位置、环境元素、时间设定等。空间位置可以是具体的地点，如客厅、森林、宇宙空间站等；环境元素涵盖场景中的物体、植物、建筑等，例如森林中的古木、溪流、野花，客厅里的沙发、电视、绿植等；时间设定包括季节、天气、具体时刻，像春季的午后、暴雨之夜、清晨日出时分。生动的场景描述能营造出真实的氛围，使主体更好地融入其中，增强视频的代入感。

例如：“在秋日黄昏的森林中，阳光透过金黄的树叶洒在铺满落叶的小径上，不远处有一座古朴的木屋，屋顶冒着袅袅炊烟”

4.5.3运动描述

运动描述关乎主体或场景中元素的动作与动态变化。对于数字人，要描述其肢体动作、面部表情、姿态等，如行走的步伐、挥手的幅度、微笑的神态、站立的姿势等；对于场景中的其他元素，如物体的移动、水流的速度、树叶的飘动等也需进行描述。准确的运动描述能让生成的内容更具动感与活力，使画面更加生动鲜活。

例如：“数字人迈着轻盈的步伐在花丛中穿梭，时不时弯腰轻嗅花朵，脸上洋溢着愉悦的笑容，同时，一阵微风吹过，花瓣纷纷扬扬地飘落”

4.5.4镜头语言

镜头语言是影响视频呈现效果的重要因素，包括镜头的类型、角度、运动方式等。镜头类型有特写、中景、全景、远景等，如特写数字人的手部动作，全景展示整个场景；镜头角度包括平视、俯视、仰视等，不同角度能带来不同的视觉感受，俯视可展现场景的全貌，仰视能突出主体的高大；镜头运动方式有推、拉、摇、移、跟等，推镜头可将观众的注意力集中到主体上，移镜头能展示场景的变化。合理运用镜头语言可以引导观众的视线，增强视频的叙事性和艺术性。

例如：“先用全景镜头展示广阔的草原，然后镜头缓慢拉近，聚焦到正在奔跑的数字人，接着采用跟镜头跟随数字人的奔跑轨迹，同时镜头稍微上摇，展现蓝天白云下的奔跑场景”

4.5.5氛围词

氛围词用于传达视频所希望营造的情感基调与整体氛围。常见的氛围词有温馨、紧张、浪漫、神秘、欢快、悲伤等。氛围词能让生成的内容更具情感色彩，使观众更容易产生情感共鸣。

例如：“温馨的氛围中，数字人依偎在壁炉旁，手中捧着一本书，脸上带着宁静的微笑”

例如：“紧张的氛围笼罩着整个场景，数字人小心翼翼地在黑暗的走廊中前行，眼神中充满了警惕”

CAIE官网网址：https://www.caieglobal.com/

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群