2 min read475 words

多模态输入与文件分析

把截图拖进对话框，Claude 能读懂表格数据；上传 PDF 年报，Claude 能提炼关键数字——多模态能力把 Claude 变成随时可用的分析师。

多模态处理流程

graph LR INPUT[输入类型] --> IMG[图片/截图] INPUT --> PDF[PDF 文档] INPUT --> CSV[CSV/Excel] INPUT --> CODE[代码文件] INPUT --> TXT[文本/Markdown] IMG --> I1[界面截图分析] IMG --> I2[图表数据提取] IMG --> I3[手写笔记识别] PDF --> P1[报告摘要提炼] PDF --> P2[合同条款分析] PDF --> P3[学术论文解读] CSV --> C1[数据统计分析] CSV --> C2[异常值检测] CSV --> C3[趋势解读] style IMG fill:#e3f2fd,stroke:#1565c0,stroke-width:2px style PDF fill:#c8e6c9,stroke:#388e3c,stroke-width:2px style CSV fill:#fff3e0,stroke:#e65100,stroke-width:2px

文件分析提示词库

"""
Claude 多模态分析提示词模板库
"""
from dataclasses import dataclass
from enum import Enum
class FileType(Enum):
IMAGE = "image"
PDF = "pdf"
CSV = "csv"
CODE = "code"
DOCUMENT = "document"
@dataclass
class AnalysisPrompt:
file_type: FileType
use_case: str
prompt_template: str
expected_output: str
tips: list[str]
class MultimodalPromptLibrary:
"""多模态分析提示词模板库"""
PROMPTS: list[AnalysisPrompt] = [
# ── 图片分析 ──────────────────────────────────
AnalysisPrompt(
FileType.IMAGE, "UI 截图审查",
"""分析这个 UI 截图，按以下维度给出反馈：
1. **可用性问题**：操作流程是否清晰，有无混淆点
2. **视觉层次**：信息优先级是否明确
3. **文案质量**：按钮/标签文字是否准确传达意图
4. **改进建议**：按优先级列出 3 个具体修改建议
用表格输出，包含问题描述、严重程度（高/中/低）、建议修改方式。""",
"UI 问题表格 + 优先级改进建议",
["上传完整页面截图而非局部", "说明目标用户群体", "告知设备类型（移动端/桌面端）"],
),
AnalysisPrompt(
FileType.IMAGE, "图表数据提取",
"""从这张图表中提取所有数据：
1. 识别图表类型（折线/柱状/饼图等）
2. 读取所有数轴标签和数据点
3. 整理成 Markdown 表格（第一列为时间/类别，后续列为数值）
4. 指出图表中最显著的趋势或异常点
5. 如数值无法精确读取，给出估算范围""",
"结构化数据表格 + 趋势分析",
["确保图表清晰，文字可读", "告知数据单位（如不明显）"],
),
# ── PDF 分析 ──────────────────────────────────
AnalysisPrompt(
FileType.PDF, "财务报告分析",
"""分析这份财务报告，提取以下关键信息：
1. **核心指标**：收入、利润、同比增长率（表格格式）
2. **业务亮点**：本期表现最好的 3 个业务/产品
3. **风险提示**：管理层提到的主要风险因素
4. **现金流状况**：运营/投资/筹资现金流概况
5. **前瞻指引**：公司对下一季度/年度的预期
输出格式：先给总结段（100字），再展开各项细节。""",
"关键财务数据表 + 风险摘要 + 前瞻指引",
["确保上传完整年报，非节选版", "告知报告所属会计年度"],
),
AnalysisPrompt(
FileType.PDF, "合同风险审查",
"""审查这份合同，重点关注以下风险点：
1. **违约责任**：双方违约的条款和赔偿上限
2. **不平等条款**：明显偏向一方的义务或权利
3. **模糊表述**：可能引发争议的含糊措辞（请引用原文）
4. **缺失条款**：常见合同应有但本合同缺少的保护条款
5. **建议修改**：高优先级修改建议（3条）
⚠️ 注意：此分析仅供参考，正式合同审核请咨询律师。""",
"风险条款清单 + 修改建议",
["可先提供合同类型和背景", "告知你是甲方还是乙方"],
),
# ── CSV/数据分析 ──────────────────────────────
AnalysisPrompt(
FileType.CSV, "销售数据分析",
"""分析这份销售数据，请：
1. 计算总销售额、平均订单价值、订单数量
2. 识别 Top 5 产品/客户/地区（按收入排序）
3. 分析月度/季度趋势，找出增长/下降的原因可能
4. 发现异常值（明显高于或低于均值的数据点）
5. 给出 3 条可操作的业务建议
以 Markdown 表格 + 文字分析混合格式输出。""",
"统计摘要 + 趋势分析 + 业务建议",
["确保 CSV 有列标题", "告知数据的时间范围", "说明货币单位"],
),
]
@classmethod
def get_prompt(cls, file_type: FileType, use_case: str) -> AnalysisPrompt | None:
for p in cls.PROMPTS:
if p.file_type == file_type and p.use_case == use_case:
return p
return None
@classmethod
def list_by_type(cls, file_type: FileType) -> list[AnalysisPrompt]:
return [p for p in cls.PROMPTS if p.file_type == file_type]
@classmethod
def print_library(cls):
for ft in FileType:
prompts = cls.list_by_type(ft)
if prompts:
print(f"\n=== {ft.value.upper()} 分析模板 ===")
for p in prompts:
print(f"\n  [{p.use_case}]")
print(f"  期望输出: {p.expected_output}")
print(f"  使用技巧:")
for tip in p.tips:
print(f"    • {tip}")
# 实战演示：对话结构建议
def demo_conversation_structure():
"""展示最佳对话结构"""
print("\n=== 多模态分析最佳对话结构 ===\n")
best_practices = {
"❌ 低效提问": [
"（直接上传图片不说任何话）",
"分析一下这个",
"这个表格什么意思",
],
"✅ 高效提问": [
"这是我们 Q3 的销售漏斗截图。请找出转化率最低的环节，并分析可能原因。",
"这份 PDF 是我们的年度合同续签协议。我是服务提供商（甲方），请标出所有对我不利的条款。",
"附件是本月 Google Analytics 导出数据（CSV）。请找出跳出率最高的 5 个页面，并给出优化建议。",
],
}
for label, examples in best_practices.items():
print(f"{label}:")
for ex in examples:
print(f"  {ex}")
print()
lib = MultimodalPromptLibrary()
lib.print_library()
demo_conversation_structure()

文件分析能力对比

文件类型	Claude 擅长	限制
PNG/JPG 截图	UI 分析、图表识别、手写识别	极小字体、低分辨率图片可能失准
PDF	报告摘要、合同审查、学术解读	超长 PDF 需分段上传
CSV/Excel	数据统计、趋势分析、异常检测	不能生成实际图表（仅文字描述）
代码文件	审查、重构建议、文档生成	超大代码库建议用 Claude Code
Markdown/TXT	改写、摘要、翻译	无限制

行动清单

[ ] 找 3 个日常工作中需要"看图理解"的场景（报表截图/界面设计/手写笔记），用 Claude 试一次
[ ] 将上方提示词模板库添加为 Project Knowledge Base，对话时直接引用模板
[ ] PDF 分析技巧：超过 50 页的文件，告诉 Claude "重点关注第 X-Y 页"以提升准确度
[ ] CSV 分析前先说明数据背景（什么产品、什么时间段、货币单位），结果质量显著提升
[ ] 合同审查：Claude 分析后必须标注"仅供参考，请律师复核"——AI 不替代法律专业判断
[ ] 建立个人"分析提示词库"文档，把常用的高效提示词保存备用，避免每次重新想

下一节：03-提示词模板与对话策略进阶 — 构建可复用的提示词模板系统，把对话效率提升 3 倍。