当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > 融光— 开源全流程 AI 视频创作平台，自动化工作流

融光— 开源全流程 AI 视频创作平台，自动化工作流

2026-05-02 21:54:59 0浏览收藏

融光是什么

融光（AI Fusion Video）是一款开源、端到端的AI视频智能创作平台，采用先进的Agent架构，实现从创意构思、剧本撰写到分镜设计、图像生成、视频合成的全链路自动化。平台深度融合结构化剧本编辑、AI驱动的智能分镜拆解、多引擎协同绘图与视频生成能力，兼容OpenAI、Claude、Gemini、通义千问、DeepSeek、Ollama等主流大模型，后端基于Java 21 + Spring Boot 3.5构建，前端采用Next.js 16开发，支持Docker一键部署，显著提升内容创作者的视频生产效率与可控性。

融光的核心功能

剧本结构化管理：支持按集、按场景层级创建与编辑视频剧本，便于逻辑梳理与协作迭代。
AI智能分镜：自动将自然语言剧本解析为标准化分镜表，涵盖画面描述、镜头运动、时长建议与转场提示。
多源AI绘图：接入多个文生图模型，一键批量生成高质量分镜参考图，辅助视觉预演。
AI视频合成：依据分镜文本与参考图像，调用视频生成模型输出连贯片段，支持风格一致性控制。
统一素材中心：集中管理项目内所有图片、视频、音频及生成中间件资源，支持标签分类与快速检索。
开放模型生态：原生适配国内外主流大模型API，支持动态切换与效果对比，满足多样化创作需求。

如何上手融光

环境准备：推荐使用Docker；若本地开发，需提前安装JDK 21+、Node.js 20+、pnpm 9+，并配置MySQL与Redis服务。
获取代码：执行 git clone http://github.com/Stonewuu/ai-fusion-video.git 拉取最新源码。
快速启动：Docker用户直接运行 docker compose up -d；开发者可先启用中间件 docker compose -f docker-compose-middleware.yml up -d，再分别启动后端（./mvnw spring-boot:run）和前端（pnpm dev）。
系统初始化：访问 http://localhost:8080（Docker模式）或 http://localhost:3000（开发模式），在「系统设置」中配置AI服务商密钥及对象存储参数。
完整创作流：新建项目 → 编写/导入剧本 → AI生成分镜 → 批量绘制参考图 → 合成视频片段 → 导出成品与工程素材。

融光的关键技术特性与运行要求

开源协议：遵循MIT License，允许商用、二次开发与私有化部署，无授权限制。
硬件基础：需具备Docker运行环境，或本地JDK 21+运行条件；AI推理阶段建议配备充足内存（≥16GB）以保障多模型并发调用稳定性。
依赖组件：MySQL（持久化存储）、Redis（会话与缓存）为必选服务；对象存储（如MinIO/S3）为可选扩展项。
AI接入前提：需自行申请并配置OpenAI、Anthropic、Google等平台的API Key，平台不提供模型代理或账号共享服务。
部署灵活性：同时支持容器化一键上线与源码级定制开发，兼顾开箱即用与深度集成需求。

融光的独特价值亮点

全栈式AI工作流：打通“文本→结构化剧本→分镜→图像→视频”闭环，大幅压缩人工重复劳动。
异构模型自由调度：不依赖单一厂商，支持跨平台模型热插拔与A/B测试，提升生成质量与鲁棒性。
高度可扩展架构：MIT开源许可下，可无缝嵌入企业内部系统、对接私有大模型或定制Agent行为逻辑。
Pipeline可视化编排：每个AI处理节点状态实时呈现，创作路径清晰可见，便于问题定位与流程优化。
分镜为中枢的设计范式：以分镜作为核心中间表示层，确保语义意图精准传导至视觉产出，避免信息衰减。

融光的官方项目入口

GitHub仓库地址：http://github.com/Stonewuu/ai-fusion-video

融光与主流竞品横向对比

对比维度	融光 (AI Fusion Video)	HeyGen	Runway Gen-3
产品定位	开源Agent驱动全流程创作平台	云端AI数字人视频生成工具	专业AI视频编辑与生成平台
工作流模式	剧本→分镜→图像→视频的多阶段Pipeline	模板选择→数字人驱动→视频合成	素材上传→AI生成→多轨道后期编辑
可控性	高（分镜级精细控制，支持迭代调整）	中（依赖预设模板与数字人形象）	中高（运动笔刷、绿幕、相机控制等专业工具）
开源程度	完全开源（MIT协议，可私有化部署）	闭源SaaS服务	闭源SaaS服务
模型支持	多厂商兼容（OpenAI/Claude/Gemini/国产模型等）	自研模型为主	自研Gen-3系列模型为主
适用场景	专业创作者全流程管理、团队协作	营销视频快速生成、数字人播报	影视级广告制作、视觉特效、艺术短片