ComfyUI 重大更新 - 原生API节点可以编排生成任务

ComfyUI重大更新：原生API节点可以编排生成任务

ComfyUI 今天隆重推出了一项革新性的功能——“原生 API 节点 (Native API Nodes)”。这项新特性允许用户在其熟悉的工作流界面内，直接整合并调用众多主流的付费模型 API。目前已支持包括 Google Veo2、OpenAI GPT-4o image、Stability AI、Luma、Recraft、Pika 2.2、PixVerse、Ideogram 在内的 11 个模型系列，共计 65 个独立节点。

此举意味着，用户如今可以在单一的 ComfyUI 工作流程中，高效并行地调用图像生成、视频创作乃至文本转视频等多种类型的AI模型。整个过程无需离开当前操作界面，实现了生成任务的统一化编排与管理。

除上述核心功能外，ComfyUI 本次更新还带来了以下重要支持：

用户自持 API 密钥：允许用户沿用其在各外部平台已有的账户与API key。
API 请求并行处理：显著提升同时调用多个模型时的执行效率。
VIDEO 类型首次支持：实现了对原生视频生成任务的直接处理。
全新的 UI 视觉体系：融合了90年代动漫美学与Y2K科技潮流的设计风格，焕新用户体验。

值得强调的是，所有新增的 API 节点功能均为可选模块，ComfyUI 的核心本体依然保持其完全免费且开源的特性。

深入理解：ComfyUI 原生 API 节点

在本次更新之前，ComfyUI 主要作为一款以图形化节点驱动本地图像生成的工具，在 Stable Diffusion 用户群体中享有盛誉。而此次引入的“原生 API 节点”组件，则赋予了 ComfyUI 一项全新的核心能力：

原生 API 节点 (Native API Nodes)：
用户无需编写任何代码，也无需切换至其他平台，即可在 ComfyUI 环境内直接调用一系列主流的“外部付费大模型 API”。

这标志着用户可以在一个统一的工作流中，灵活地组合和调度多种商业级 AI 模型（涵盖图像、视频及多模态应用），从而实现创作效率的大幅跃升。

当前支持的模型与 API 概览

ComfyUI 新增了对以下 11 个知名模型系列的原生接入支持，总共提供了 65 个精心设计的节点，全面覆盖了图像处理、视频生成、文本转视频以及图像转视频等多样化的多模态任务。

重点支持模型包括：

用户仅需通过简单的拖拽操作即可调用这些模型的强大功能，无需逐一登录各个平台账户，并且支持将不同模型的节点组合使用，构建复杂的生成流程。

工作流中的实际应用指南

基本使用流程：

确保您的 ComfyUI 或 ComfyUI Desktop 已更新至最新版本。
登录或注册 ComfyUI 账户，购买新的 API 积分或绑定您在其他平台已有的 API 凭证。
在菜单中选择：Workflow → Browse Templates → Image API / Video API。
选取合适的模板即可直接运行，或以此为基础进行修改。

此外，用户亦可选择“自带 API 密钥 (Bring Your Own API Key)”模式，将您在 Pika、Luma、OpenAI 等平台上已有的订阅或额度与 ComfyUI 进行绑定。

支持高效的并行执行：

当工作流中涉及调用多个外部 API 时（例如，一个任务同时需要图像生成、视频合成及字幕添加），ComfyUI 会自动并行处理不同节点的请求，从而显著缩短整体的生成时间。

一个典型的多模型协作示例如下：

输入文本 → 利用 GPT-Image API 生成初步的人物素描。
素描图像 → 接入 Luma Photon API 增强真实感光照效果。
场景图像 + 提示词 → 通过 PixVerse API 生成动态视频片段。
视频片段 + 描述文本 → 调用 Pika API 生成带有动画和对白的镜头。

首次引入对 VIDEO 类型的原生支持

本次更新是 ComfyUI 发展历程中首次实现对“视频生成”类型节点（VIDEO类型）的原生支持，这具有里程碑式的意义：

ComfyUI 的能力不再局限于静态图像任务。
为构建复杂的视频-图像混合型工作流提供了可能。
支持跨模态协作，如图像到视频的转换、视频生成后再进行片段提取与重构等高级应用。
为未来进一步整合音频处理、3D模型生成等节点扩展奠定了坚实基础。

视觉与品牌形象的全面革新

除了核心技术功能的显著增强，ComfyUI 也正式发布了其全新的品牌视觉识别系统：

全新 Logo：设计由多个模块化单元构成，巧妙呼应了其“节点化图形工作流”的核心特性。
字体与配色方案：大胆融入了90年代经典动漫风格与Y2K数字美学元素，营造出独特的视觉感受。
品牌理念传递：在保留“自由、可拓展、可探索 (Hackerable)”的社区精神基础上，更加强调了 ComfyUI 作为一款专业工具的强大性与创作过程的开放性。

官方阐述如下：
“我们希望传达这样一个信息：ComfyUI 依然是那个自由、开放的平台。与此同时，它也已演进成为一款真正能够融入生产级流程的强大工具。”

核心价值亮点总结

统一化的多模型集成平台：在一个工作流中无缝整合多个主流 API 的调用能力，彻底告别在不同平台间切换、手动上传下载素材的繁琐操作。
免费核心与可选商业API的灵活组合： ComfyUI 主体程序持续开源免费，新增的 API 节点则根据用户需求按需选用。这既保障了创作者的自由度，也提供了接入商业级顶尖模型的能力。
真正面向创ポーター的“多模态生成管线”：实现了图像、视频、文本、结构化数据以及风格化处理的统一融合，并为未来集成音频、3D 等更多类型的节点预留了广阔空间。

新功能的目标用户群体：

各类图文内容创作者（例如微博博主、公众号运营者、短视频配图制作者）。
专业的 AI 视频编辑人员（特别是 Pika, Veo2, PixVerse 等工具的现有用户）。
Stable Diffusion 的高级玩家（希望将其他模型的优势融入现有工作流的用户）。
设计师及广告创意从业者（需要进行多种图像风格混搭与生成）。
教育内容开发者（例如需要将视频素材转化为图文教程，或为视频匹配 AI 生成的动画）。
产品经理与应用程序开发者（需要快速构建和验证 AI 驱动的工作流原型）。

官方详细介绍请参阅：https://blog.comfy.org/p/comfyui-native-api-nodes