1、什么是财报三表勾稽?

所谓"三表",是企业财报的三大核心报表:

报表名称 核心内容 关键作用
资产负债表 资产、负债、所有者权益 反映企业某一时点的财务状况
利润表 收入、成本、费用、利润 反映企业某一期间的经营成果
纳税申报表 应税收入、应纳税额 反映企业某一期间的纳税情况

常见勾稽点包括:

  • 跨期一致性:资产负债表"期初数" = 上期"期末数";
  • 表内平衡:资产 = 负债 + 所有者权益;
  • 跨表勾稽:利润表"净利润" → 资产负债表"未分配利润"变动;
  • 税会差异:利润表"所得税费用" vs 纳税申报表"应纳所得税";
  • 现金流勾稽:经营活动现金流 vs 利润表营业收入规模。

三张表之间存在严密的数学勾稽关系,任何一处数字对不上,都可能意味着录入数据错误、虚增收入、隐匿负债或跨表造假等风险信号。传统做法是人工翻 PDF、手动录入 Excel、逐条公式核对,效率低且易出错。本次最佳实践通过WorkBuddy平台,基于腾讯云OCR表格识别能力打造的financial-statement-check Skill,成功将这一流程从数小时压缩至几分钟。

该技能已上架ClawHub社区:https://clawhub.ai/zt1314p-design/financial-statement-check


2、场景痛点:拆解财报审核的三重门槛

财报审核的难度是逐层递进的:

痛点1: 纸质材料量大,人工审阅耗时耗力

企业提交的财报通常是 PDF、扫描件甚至翻拍图片,动辄数十上百页。人工逐页翻阅、定位关键表格、抄录数字,一份年报仅数据录入就要数小时,准确率还难以保证。在批量审核场景下(如信贷审批一天过十几家),人力瓶颈尤为突出。

痛点2: 版式复杂、文件类型多样,常规工具无法理解

财报表格存在跨行合并、跨列嵌套、多级小计等复杂版式,且格式五花八门——有文字型 PDF、有扫描图片型 PDF、有拍照件。普通工具面对这些文件,要么无法读取图片内容,要么丢失表格结构,根本无法完成结构化提取。

痛点3: 深入内容层面,单位币种混乱、措辞不一、批量计算繁琐易错

即使拿到了数据,真正的挑战才刚开始。同一份财报里资产负债表可能用"万元",利润表用"元";涉外企业还夹杂美元、港币。不同企业对同一科目的措辞各异("应交税费"vs"应交税金"),三表之间数十条勾稽规则涉及跨期、跨表、税会差异等多维度校验。手工统一单位、对齐口径、逐条核算,多一个零少一个零都可能引发重大决策偏差。


3、最佳实践:基于WorkBuddy 平台实操演示

我们以腾讯公司 2025 年度财报为例,演示基于在 WorkBuddy 平台使用 financial-statement-check 技能的全流程实操。

📌 说明:上市公司公开年报格式规范,适合作为演示样本;实际场景中该流程同样适用于中小企业报表、银行流水财报等。

3.1 传统方案:人工 + Excel

步骤 耗时
定位三表页码 10~20 分钟
数据录入 Excel 60~90 分钟
公式设置与核对 30~60 分钟
差异复查 20~40 分钟
合计 2~4 小时

主要风险:手工录入错误率高,规则漏检高,扫描件/图片型 PDF 完全无法处理。

3.2 腾讯云OCR 表格识别方案:financial-statement-check 技能包

financial-statement-check 是一个API封装的Skill(技能包),它将腾讯云 OCR 表格识别能力、智能页码定位、三表字段映射、规则引擎校验等完整流水线封装为开箱即用的技能,核心资源包括:

  • scripts/table_ocr.py —— 腾讯云 RecognizeTableAccurateOCR 调用脚本(支持 PDF/图片、并行识别);
  • references/cross-check-rules.md —— 六大类勾稽校验规则定义;
  • references/field-mapping.md —— 三表科目字段映射、单位币种统一规则;

与直接调用腾讯云 API 不同,该技能在感知层(自动触发)、编排层(流水线串联)、输出层(结构化报告)做了完整封装,无需理解底层 API 即可使用。

如何使用?

确认技能已启用

在 workbuddy 等平台导入 financial-statement-check 技能。(Skill地址:https://clawhub.ai/zt1314p-design/financial-statement-check,支持CLI与Prompt安装)

配置腾讯云密钥

在环境变量中设置:

2 1export TENCENTCLOUD_SECRET_ID="你的SecretId"2export TENCENTCLOUD_SECRET_KEY="你的SecretKey"

🔗 密钥申请:腾讯云 API 密钥管理
🔗 OCR 服务购买:腾讯云文字识别 OCR(选择"表格识别高精度版")

发送财报文件,一句话触发

在 WorkBuddy 中,用户只需:

  1. 上传财报 PDF
  2. 发一句话,例如:"帮我对这份财报做三表勾稽检查"

技能会自动触发完整流水线,无需任何额外配置或编码。

接下里看看实际演示和效果。

Step 1: 上传财报 PDF,触发智能页码定位与并行 OCR 识别

上传腾讯 2025 年报 PDF 后,workbuddy 自动进入处理流水线。首先通过 PyMuPDF 提取全文文本进行页码定位,随后对定位到的页面并行调用腾讯云表格 OCR:

请在此添加图片描述

可以看到:

  • Step 0:通过关键词自动定位到利润表(第6、7页)、资产负债表(第8、9页),并识别出本公告不含纳税申报表
  • Step 1:仅对相关页面调用 OCR(节省配额),并行识别完成

Step 2: 全流程自动执行(Step 0 ~ Step 6)

整个 financial-statement-check 技能流水线包含 7 个步骤,自动串联执行:

请在此添加图片描述

各步骤摘要:

  • Step 0(页码定位):定位三表所在页
  • Step 1(OCR识别):并行识别,共提取 31 个表格
  • Step 2-4(字段映射 + 单位转换):单位从"百万元"自动转换为"万元",币种 CNY 无需折算
  • Step 5(勾稽校验):资产负债表平衡(差异=0)、毛利勾稽(差异=0)、净利润率 30.57%(合理区间)——全部通过
  • Step 6(报告输出):自动生成结构化审核报告

Step 3: 输出审核报告 — 基础信息与原始指标

技能最终输出标准化的审核报告,包含报告元信息、时间检查、原始指标等:

请在此添加图片描述

报告要点:

  • 元信息:自动标注报告期间、数据来源(PDF OCR 第6~9页)、金额单位(万元,已由百万元×100折算)
  • 时间检查:三表时间一致,年度申报,无错位
  • 原始指标:清晰列出资产负债表各科目(总资产、总负债、权益、货币资金等)和利润表经营指标(营业收入、成本、毛利、经营盈利等)

Step 4: 输出审核报告 — 税务指标与跨表校验

请在此添加图片描述

  • 税务指标:因本公告不含纳税申报表,相关项标记为"⚠️ 异常(未识别/未匹配)"——这正是系统的严谨之处,未找到数据不会捏造;
  • 核心指标检查:资产负债表平衡(差异=0)✅、毛利勾稽(差异=0)✅、净利润率 30.57% ✅;
  • 跨表校验:因无纳税申报表,相关跨表项标记为"无法校验"并说明原因。

除 WorkBuddy 外,CodeBuddy、Qclaw、OpenClaw、Hermes Agent等平台也可支持类似能力,大家可以参考以上实践。

3.3 不同方案效果对比

维度 人工+Excel Skills技能(推荐) 裸 API 自行开发
单份耗时 2~4 小时 3~8 分钟 开发后同等
录入错误率 5~8% <0.5% <0.5%
规则覆盖率 60~70% 90%+ 取决于实现
扫描件/图片处理
单位/币种统一 手工易错 ✅ 自动 需自行实现
上手门槛 需资深经验 零门槛 需开发资源
维护成本 技能自动更新 需持续维护

4. 技术支撑:腾讯云 OCR 表格识别 × Skill封装

4.1 底层能力:腾讯云 OCR 表格识别

技能的核心 OCR 能力来自腾讯云 RecognizeTableAccurateOCR(表格识别高精度版)接口:

  • 复杂表格支持:跨行合并、跨列嵌套、多级小计等财报常见版式均可准确识别;
  • 高精度:表格内容准确率 >97%,远超手工录入;
  • 结构化输出:返回 HTML/JSON 格式,便于后续字段映射和自动化处理;
  • 多格式兼容:支持文字型 PDF、扫描图片型 PDF、拍照件,Base64 和 URL 两种输入方式。

4.2 Skill 封装的增值能力

在原有 OCR API 基础上,financial-statement-check 技能还增加了:

能力 说明
智能页码定位 先用 PyMuPDF 文本扫描定位三表页码,再针对性调用 OCR,避免浪费配额
三表自动识别 根据表头关键词和字段映射规则,自动判定每个表格归属
字段标准化 将不同企业的措辞差异("应交税费" vs "应交税金"等)统一映射为标准字段名
规则引擎 内置数十条勾稽规则,覆盖时间一致性、表内平衡、跨表校验、税会差异等六大类
异常分级输出 区分"必输出"与"仅异常时输出",报告简洁高效
用户自定义检查 支持附带自定义关注点,灵活扩展

财报审核是一个典型的"规则密集 + 数据提取"型任务。基于腾讯云OCR表格识别能力打造的financial-statement-check 技能,在 workbuddy 平台本质上做了三件事:

  1. 给 AI 装上眼睛:腾讯云 OCR 解决了 PDF/图片财报的"视觉盲区"问题,扫描件、翻拍件、复杂合并表格——这些过去让工具束手无策的格式,现在都能被准确识别和结构化提取。
  2. 把经验固化为技能:资深审计师脑中的勾稽规则、行业常识、异常阈值,被封装为可复用、可更新的技能包。它不会因为疲劳而遗漏,不会因为经验不足而误判,覆盖率从人工的 60~70% 提升到 90% 以上。
  3. 让使用者零门槛:不需要写代码、不需要理解 API、不需要配置规则引擎——上传 PDF,一句话搞定。

除了本文演示的财报三表勾稽场景,腾讯云 OCR 技能矩阵还覆盖了更广泛的业务场景:

  • 财务报销场景:接入增值税发票识别技能,OpenClaw 可以自动读取发票金额、税率、购销方信息,告别手动填报;
  • 合规审查场景:接入营业执照、身份证识别技能,企业资质核验、KYC 流程秒级完成;
  • 跨境业务场景:接入多国护照识别技能,80+ 国家证件信息一键提取,国际化团队协作不再受语言壁垒所困;
  • 教育评测场景:接入试题批改 Agent,手写答案自动识别、知识点分析一气呵成。

同时,官方也上架了众多腾讯云OCR Skills在Skillhub、ClawHub等技能社区,满足不同的场景需要,用户可以根据自己的场景按需选择:

skills名称 链接 介绍
TencentCloud IDCard OCR tencentcloud-ocr-idcard 腾讯云身份证识别(IDCardOCR)接口调用技能。可识别身份证图片中中国大陆居民二代身份证正反面信息(姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限等),支持身份证图片照片裁剪和多种告警功能
TencentCloud BizLicense OCR tencentcloud-ocr-bizlicense 腾讯云营业执照识别(BizLicenseOCR)接口调用技能。可识别营业执照图片上的字段信息(统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限、经营范围等)时,支持复印件/翻拍件告警检测、有效期自动拼接、电子营业执照图片识别及非营业执照的营业类证件图片识别。
TencentCloud General OCR tencentcloud-ocr-general 腾讯云广告文字识别(AdvertiseOCR)接口调用技能。当用户需要从图片中识别文字内容时,应使用此技能。支持中英文、横排、竖排及倾斜场景的图片文字识别,支持90度、180度、270度翻转场景的图片识别,返回文本框位置与文字内容。
TencentCloud LicensePlate OCR tencentcloud-ocr-licenseplate 腾讯云车牌识别(LicensePlateOCR)接口调用技能。当用户需要对中国大陆机动车车牌进行自动定位和识别时,应使用此技能。支持返回车牌号码、车牌颜色、置信度和像素坐标信息,支持多车牌场景识别。
TencentCloud MLIDPassport OCR tencentcloud-ocr-mlidpassport 腾讯云护照识别(多国多地区)(MLIDPassportOCR)接口调用技能。当用户需要识别护照图片中中国大陆、港澳台地区或其他国家/地区的护照信息(护照ID、姓名、出生日期、性别、有效期、发行国、国籍、国家地区代码、MRZ码等)时,应使用此技能。支持图片Base64和URL两种输入方式,支持护照图片人像照片裁剪功能,支持80+国家/地区的可机读护照图片识别,同时支持复印件、翻拍、PS、反光、模糊、边框不完整等告警功能(仅国际站生效)
TencentCloud RecognizeTable OCR tencentcloud-ocr-recognizetableaccurate 腾讯云表格识别v3(RecognizeTableAccurateOCR)接口调用技能。当用户需要从表格图片或PDF中识别常规表格、无线表格、多表格的内容,提取每个单元格的文字信息,或将表格图片识别结果导出为Excel文件时,应使用此技能。支持中英文表格图片、旋转表格图片、嵌套表格图片等复杂场景,识别效果优于表格识别V2。
TencentCloud VatInvoice OCR tencentcloud-ocr-vatinvoice 腾讯云通用票据识别高级版(VatInvoiceOCR)接口调用技能。当用户需要识别发票图片中增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通/增值税专用)的全字段信息时,应使用此技能。支持识别发票图片中的发票代码、发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方/销售方信息、明细条目等全部字段,同时支持PDF格式发票图片识别。
TencentCloud VehicleLicense OCR tencentcloud-ocr-vehiclelicense 腾讯云行驶证识别(VehicleLicenseOCR)接口调用技能。当用户需要识别行驶证图片主页(车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期)或副页(号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录)信息时,应使用此技能。支持图片Base64和URL两种输入方式,支持复印件、翻拍、反光、模糊、边框不完整等告警功能,支持电子行驶证图片和拖拉机行驶证图片识别。
TencentCloud ExtractDoc OCR tencentcloud-ocr-extractdocagent 腾讯云实时文档抽取Agent(ExtractDocAgent)接口调用技能。当用户需要从图片或PDF中按自定义字段名称进行结构化信息抽取时,应使用此技能。支持自定义字段名称、字段类型(KV对或表格字段)和字段提示词,实现灵活的文档信息提取。适用于合同、发票、报告等各类文档的结构化数据抽取场景。
TencentCloud QuestionMark OCR tencentcloud-ocr-questionmarkagent 腾讯云试题批改Agent接口调用技能。当用户需要对试卷图片或试题图片中的K12试卷或试题进行自动批改、手写答案识别、知识点分析时,应使用此技能。支持整卷图片批改和单题图片批改,提供题目切题、正误判定、答案对比、错误分析、知识点输出等结构化评估结果。

当机械性的数据提取和规则核对被AI技能接管之后,财务人员才有更多时间去做高价值的事情:审视异常背后的商业逻辑,判断数字之外的经营风险,做出需要行业洞察和职业判断的决策。工具解决效率问题,人解决判断问题,这才是 AI 在专业领域的正确打开方式。

扫码加入腾讯云AI产品Skills交流群:

请在此添加图片描述

文章来源于腾讯云开发者社区,点击查看原文