全部版块 我的主页
论坛 数据科学与人工智能 人工智能
2079 10
2025-07-17

从小白到设计师之间,隔着一个星流Agent——观察AI原生应用的交互体验新趋势

推荐理由

5月,号称“全球首个设计 Agent”的 Lovart 在海外爆火。7月3日,Lovart 的国内版——星流 Agent 正式上线,它为什么能在短时间内受到那么大的欢迎?我尝试借助星流 Agent 完成了一次个人设计,在真实创作环境下体验到了从小白到设计师的跨越。

如果把 AI 原生应用定义为一开始就将 AI 作为架构基础和功能核心的产品,那么星流 Agent 和 Cursor 正是其中的杰出代表。从它们身上,我们可以看到哪些 AI 原生应用 / Agent 的交互体验新趋势?

正文

楔子

继 Manus 引爆 Agent 应用后,5 月份曾有一款 Agent 应用在海外爆火——号称“全球首个设计 Agent”的 Lovart,主打一站式品牌 VI 设计,用户只需输入简单描述,即可一次性输出包括品牌 LOGO、海报、宣传视频等诸多营销物料。Lovart 在海外上线首日即在 X 引发超过 5000 条相关讨论帖,上线 5 天内等候名单突破 10 万,火爆程度相比 Manus 不遑多让。

7 月 3 日,Lovart 的国内版——星流 Agent 正式上线,由专注于 AIGC 模型托管和创作的 Liblib(哩布哩布)开发,针对中文语义、汉字、国风审美和本土使用场景进行了深度优化。那么“星流 Agent”真实使用效果如何呢?为什么能在短时间内受到那么大的欢迎?

星流 Agent 初体验

我不是设计师,平常也没什么设计需求。想起前段时间开发了一个记忆训练网站(《一个想法:每个人都有足够潜力成为“记忆大师”》),其中的扑克牌记忆训练环节使用了 emoji 字符形态的扑克牌,效果比较简陋:

能不能用星流 Agent 开发一套美观而个性化的扑克牌呢?

说干就干。我设想了一套中国风设计的扑克牌,其中对人物牌设计的要求如下(完整的扑克牌设计文档见附件):

……

JQK 人物设定方案(四大王朝)

  • 黑桃 (♠) - 秦汉雄风: 代表力量与开拓。

    • K (King): 秦始皇。身着玄色龙袍,眼神威严,背景是万里长城与古代战场。
    • Q (Queen): 吕雉。服饰华贵而不失沉稳,展现其果决与智谋。
    • J (Jack): 韩信。身披铠甲,手持兵书,英姿飒爽,彰显其军事才能。
  • 红桃 (♥) - 大唐盛世: 代表开放与繁荣。

    • K (King): 唐太宗李世民。气度恢弘,背景为大明宫,展现贞观之治的盛景。
    • Q (Queen): 杨贵妃。体态丰腴,身着华丽襦裙,手持牡丹,雍容华贵。
    • J (Jack): 李白。衣着飘逸,举杯邀月,神情豪放不羁,体现其诗仙气质。
  • 梅花 (♣) - 宋代雅韵: 代表文化与艺术。

    • K (King): 宋徽宗赵佶。着道袍,手持毛笔,气质儒雅,背景为瘦金体书法作品和珍禽花鸟画。
    • Q (Queen): 李清照。才情横溢,面带淡淡忧思,凭栏远望,尽显婉约词人之风。
    • J (Jack): 苏轼。身着学士服,手持东坡杖,豁达开朗,展现其文学家与美食家的双重身份。
  • 方块 (♦) - 明朝匠心: 代表财富与探索。

    • K (King): 明成祖朱棣。身着十二章纹龙袍,背景是郑和下西洋的宝船与舰队,展现其文治武功与开拓精神。
    • Q (Queen): 万贵妃。服饰精美,擅长宫廷乐器,体现明代宫廷的精致生活。
    • J (Jack): 解缙。明代大才子,《永乐大典》总编纂,手持书卷,目光睿智。

…… 接收到指令后,星流 Agent 就开始展开它的设计工作流,首先制定总体计划,然后查找知识库获取专业意见,并对你的设计要求进行细化和确认,接着就开始逐个绘制扑克牌图像,牌背、Ace、JQK……因为扑克牌张数较多,所以星流 Agent 会分批绘制,你可以对绘制输出的图片进行修正,或者补充绘制其他扑克牌。

绘制完的图片出现在画布上,设计风格跟需求的匹配度以及图像质量都非常令人惊喜,我没有多次抽卡,初次生成的图像就基本可用。一开始有些生成的扑克牌图像右下角字符没有颠倒显示,我在提示词里补充说明了注意点,后续生成就基本没问题了。

而且星流 Agent 能够保持创作过程中的上下文要求,我只在第一次输入了完整的设计要求,后续输出只需简单描述”补充绘制缺失的梅花 Q、红桃 10、方片 J”,它就能继续输出且保持图像风格的一致性。

更值得称道的是星流 Agent 并没有止于生成图片,而是提供了一系列的工具来解决从初稿到成品的加工问题。这一设计解决了传统创意工作流和早期 AI 工作流中的一个核心痛点:工具链的碎片化。

在过去,一个设计师可能需要先在 Midjourney 中生成概念图,然后导入 Photoshop 进行精修,再转到 Canva 进行排版布局,最后用 Runway 制作动画效果,整个过程需要在多个软件间切换,不仅效率低下,而且容易丢失创作的连贯性。

星流 Agent 将专业级的编辑功能直接集成到生成环境,用户可以直接在画布上利用提供的工具对选择的对象进行类似 Photoshop 的精细操作,如高清放大、扩图、移除背景,还可以添加文字、手工绘制等。这种编辑加工能力,意味着从初稿到精修的步骤可以在同一个界面内闭环,极大的提升了设计工作流的流畅度和创作效率。

综合来看,星流 Agent 提供了一种交互式的“Talk.Tab.Tune”工作流,将复杂的设计过程转变为一种直观、流畅的对话式体验,大大降低了技术门槛,让用户专注于创意本身。

Talk(对话) :用户无需学习复杂的提示词工程,只需像与一位创意总监沟通一样,用自然语言描述需求和想法。例如,输入“设计一款中国风的个性化扑克牌,加入中国传统文化元素”,Agent 就会解析这些高级指令,理解用户的创意意图。当然,如果你希望更确定性的风格,就需要输入更明确精细的提示词。 Tab(点选) :在 Agent 根据“Talk”阶段的指令生成初步的设计方案后,所有的设计图像都呈现在一个统一的画布上。用户可以通过点击(“Tab”)画布上的相关元素,选中它并输入自然语言指令进行局部修改。 Tune(精调) :当用户选定一个满意的设计方向后,可以使用画布上集成的类似 Photoshop 的智能编辑工具,对设计稿的某个图层或元素进行精细调整,包括增加文字、调整间距、颜色、元素大小和位置等,完成最终的润色。 下面是星流 Agent 基于我的指令输出的一整套扑克牌设计方案,除了个别几张人物牌生成了两次,基本是一次性输出。可以看到其中某些牌还有瑕疵,比如牌面花色数量不对,字符显示不完整等,但只要稍微多花点时间“Talk.Tab.Tune”两遍,都能解决问题。

P.S.:当前设计对 Token 的消耗量还是挺大的,我购买的月度标准会员包含 4000 积分,完成一套扑克牌设计后仅剩下不到 2000 积分,按照官方说法“会员首月消耗 5 折优惠”,那实际耗费积分已经花超了。

AI 原生应用交互体验的新趋势

星流 Agent 工作流中的“Tab”,一下子让人想到 Cursor 中便捷的“Tab”代码补全功能。当然,两者在实际语境下的含义完全不同,Cursor 的“Tab”是指按下键盘上的 Tab 键触发 AI 代码补全行为,而星流 Agent 的“Tab”是指点选某个设计方案后展开修改迭代——但两者给用户带来的心流体验如出一辙。

如果把 AI 原生应用定义为一开始就将 AI 作为架构基础和功能核心的产品,那么星流 Agent 和 Cursor 正是其中的杰出代表。星流 Agent 并非简单的图像生成器,而是一个完整的设计智能体;Cursor 也不仅仅是一个代码编辑器,而是一个以 AI 为核心的结对编程助手。它们的交互模式是围绕 AI 的能力全新构建的,如果移除 AI,整个产品将失去其设计初衷和核心功能。

尝试总结一下,或许可以从这两个典型的 AI 原生应用看到几个 Agent 交互体验趋势:

  • 自主规划: AI 的角色从执行工具变成了协调者,它能够自主的进行规划、任务分解、工具调用和执行,直到达成用户设定的高层次目标。比如星流 Agent 可以根据用户的简单描述,自主的规划出包含 Logo、海报、社交媒体模板等一系列任务,并调度内部的各种模型交付一整套设计资产。而 Cursor 也提供了 Agent 模式来自动完成复杂的编码任务,用户可以提出一整个功能需求,而不只是局部代码补全。
  • 协同共创: 在创作过程中,人和 AI 都可以在交互中主动发起行动,形成一种流动的、接续进行的对话。比如在星流 Agent 的“Talk.Tab.Tune”工作流中,人和 AI 协同交互,双方都可以为最终作品贡献创意和智慧。而开发者在 Cursor 中编写代码时,AI 会主动通过 Tab 补全提供建议;当开发者遇到难题时,可以主动向 AI 提问;当 AI 在代码中发现潜在错误时,也会提示并等待开发者的指令。人与 AI Agent 形成了双向动态的互动和交流。
  • 锚定上下文: AI 的高质量输出依赖于其对上下文的理解,优秀的应用让 AI 拥有更广泛、更持久的上下文记忆,还为用户提供了明确的工具来管理和“锚定”这个上下文。星流 Agent 的上下文管理基本是隐性的,它会自动记忆用户在交流初期确立的品牌风格,并在后续的所有创作中保持一致性。而在 Cursor 中则提供强大的 @ 语法,来主动关联代码段落、文件和参考文档,限定 AI 输出。
  • 统一工作空间: 为了减少用户认知负荷和上下文切换成本,AI 原生应用倾向于将原本分散在多个独立软件中的功能整合到一个统一无缝的工作空间中,从而帮助用户维持宝贵的心流状态。比如星流 Agent 的“无限画布” 就是一个典型的统一工作空间,它整合了创意构思、多模态内容生成、专业编辑工具,用户无需再像过去一样在 Midjourney、Photoshop 和 Runway 之间来回切换,大大提升了创作效率。Cursor 的集成开发环境也同样如此,将代码编写、AI 对话、实时调试、终端命令执行以及版本控制等开发全流程融为一体,开发者可以在一个窗口内完成绝大部分工作。
  • 个性化引擎: 理想的 AI Agent 不仅能完成任务,还能按照用户的特定风格、规则和偏好来引导创作过程。星流 Agent 提供了一系列定制化的 Lora 图像风格模型和预置工作流供用户选择;在 Cursor 中,开发者可以创建一个.cursorrules 文件来定义项目专属的编码规范或架构偏好,用以规范 AI 生成代码风格的一致性。目前两者的个性化模式还比较生硬,未来应该可以提供更好的机制让用户训练或配置 AI,使其成为一个真正懂得用户心思的个性化伙伴。 ‍

可以说,从小白到设计师之间,仅隔着一个星流 Agent——AI 将持续的降低技术门槛,增强人的专业能力。你是否还期待着未来的 AI 原生应用带来怎样的新变化呢?​

学习入口:https://edu.cda.cn/goods/show/3814?targetId=6587&preview=0

推荐学习书籍 《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~ 免费加入阅读:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2025-7-17 09:17:21
AI 的角色从执行工具变成了协调者,它能够自主的进行规划、任务分解、工具调用和执行,直到达成用户设定的高层次目标。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2025-7-17 09:17:30
在创作过程中,人和 AI 都可以在交互中主动发起行动,形成一种流动的、接续进行的对话。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2025-7-17 09:17:43
AI 的高质量输出依赖于其对上下文的理解,优秀的应用让 AI 拥有更广泛、更持久的上下文记忆,还为用户提供了明确的工具来管理和“锚定”这个上下文。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2025-7-17 10:38:52
支持楼主
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2025-7-17 13:45:53
thanks for sharing
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群