2 min read370 words

创意内容生成

AI 创意生成全景

多模态 AI 不仅能"理解"内容，还能"创造"内容。从文生图、视频生成到音乐创作，AI 正在重新定义创意生产流程。

graph TB A[AI 创意生成] --> B[图像生成] A --> C[视频生成] A --> D[音乐/音效] A --> E[3D/空间] B --> B1[Midjourney v6] B --> B2[DALL·E 3] B --> B3[Stable Diffusion 3] B --> B4[Flux.1] C --> C1[Sora] C --> C2[Runway Gen-3] C --> C3[Pika 2.0] C --> C4[Kling] D --> D1[Suno v4] D --> D2[Udio] D --> D3[ElevenLabs] E --> E1[Meshy] E --> E2[Tripo3D] E --> E3[Apple GAUDI] style A fill:#e3f2fd,stroke:#1976d2,stroke-width:3px style B fill:#fff3e0,stroke:#f57c00,stroke-width:2px style C fill:#c8e6c9,stroke:#388e3c,stroke-width:2px style D fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px

图像生成模型对比

模型	类型	质量	可控性	速度	成本	开源
Midjourney v6	Diffusion	★★★★★	★★★	★★★	$10/月起	❌
DALL·E 3	Diffusion	★★★★	★★★★★	★★★★	$0.04/张	❌
SD 3 Turbo	Diffusion	★★★★	★★★★	★★★★★	自部署	✅
Flux.1 Pro	DiT	★★★★★	★★★★	★★★	$0.05/张	部分
Ideogram 2	Diffusion	★★★★	★★★★	★★★★	$8/月起	❌

"""
创意生成工作流编排
"""
from dataclasses import dataclass
from enum import Enum
class MediaType(Enum):
IMAGE = "image"
VIDEO = "video"
AUDIO = "audio"
THREE_D = "3d"
@dataclass
class CreativeTask:
"""创意任务"""
prompt: str
media_type: MediaType
style: str = ""
aspect_ratio: str = "16:9"
duration_sec: int = 0
reference_image: str = ""
class CreativePipeline:
"""创意工作流"""
# 每种媒体类型的推荐模型
MODEL_ROUTING = {
MediaType.IMAGE: {
"高质量": "Midjourney v6",
"可控性": "DALL·E 3",
"低成本": "SD 3 Turbo (本地)",
"中文理解": "通义万相",
},
MediaType.VIDEO: {
"品质优先": "Sora",
"速度优先": "Runway Gen-3 Turbo",
"低成本": "Pika 2.0",
"中文优化": "Kling",
},
MediaType.AUDIO: {
"音乐": "Suno v4",
"语音": "ElevenLabs",
"音效": "Stability Audio",
},
}
def plan_workflow(self, task: CreativeTask) -> dict:
"""规划生成工作流"""
models = self.MODEL_ROUTING.get(task.media_type, {})
workflow = {
"task": task.prompt,
"type": task.media_type.value,
"steps": [],
}
# Step 1: Prompt 优化
workflow["steps"].append({
"step": "Prompt Enhancement",
"action": "用 LLM 优化和扩展原始提示词",
"model": "GPT-4o / Claude 3.5",
})
# Step 2: 生成
workflow["steps"].append({
"step": "Generation",
"action": f"使用 {list(models.values())[0]} 生成",
"model": list(models.values())[0],
"options": models,
})
# Step 3: 后处理
if task.media_type == MediaType.IMAGE:
workflow["steps"].append({
"step": "Post-processing",
"action": "超分辨率、去水印、格式转换",
})
elif task.media_type == MediaType.VIDEO:
workflow["steps"].append({
"step": "Post-processing",
"action": "插帧、音轨合成、字幕",
})
return workflow
# 营销场景示例
pipeline = CreativePipeline()
tasks = [
CreativeTask("电商产品主图：白色简约运动鞋", MediaType.IMAGE, style="商业摄影"),
CreativeTask("15秒产品展示视频", MediaType.VIDEO, duration_sec=15),
CreativeTask("品牌广告背景音乐，轻快节奏", MediaType.AUDIO),
]
for task in tasks:
workflow = pipeline.plan_workflow(task)
print(f"\n{workflow['type'].upper()}: {workflow['task']}")
for step in workflow["steps"]:
print(f"  → {step['step']}: {step['action']}")

商业创意工作流

graph LR A[创意需求] --> B[AI Prompt 优化] B --> C[批量生成候选] C --> D[人工筛选] D --> E[AI 后处理] E --> F[品控审核] F --> G[发布上线] style A fill:#e3f2fd,stroke:#1976d2 style D fill:#fff3e0,stroke:#f57c00 style G fill:#c8e6c9,stroke:#388e3c

流程环节	传统方式	AI 辅助	效率提升
创意构思	2-3天	30分钟	10×+
图片制作	设计师 1-2天	AI生成+微调 2小时	8×
视频剪辑	剪辑师 3-5天	AI生成+编辑 1天	4×
文案撰写	文案 1天	LLM 30分钟	12×
A/B 素材	一次 3-5 套	AI批量 20+ 套	5×

本章小结

AI 创意生成涵盖图像、视频、音乐和 3D 四大媒体类型
图像生成以 Midjourney 和 Flux.1 为质量标杆，SD 3 为开源首选
视频生成仍在快速发展，Sora 和 Runway 领先
商业创意工作流的关键是"AI 批量生成 + 人工筛选"的协作模式
创意生成可将营销素材制作效率提升 5-10 倍

下一章：进入工程实践环节，学习多模态系统的部署优化。