【完整教程】天诺脚本如何调用 OCR 文字识别 API？自动识别屏幕文字实战（附代码）

张开发

• 2026/6/6 18:59:07 • 15 分钟阅读

分享文章

【完整教程】天诺脚本如何调用 OCR 文字识别 API自动识别屏幕文字实战附代码在自动化脚本领域尤其是天诺脚本用户很多人都会遇到一个问题脚本如何识别屏幕上的文字而不是只靠找图/找色答案就是OCR文字识别 API 接口调用本篇文章将带你从 0 到 1 实现天诺脚本调用 OCR 接口完整流程截图 → 上传 → 识别 → 获取文字可直接参考的示例代码常见问题与优化方案一、OCR 在天诺脚本中的作用OCROptical Character Recognition可以将图片中的文字转换为文本数据。在天诺脚本中的典型应用自动识别游戏界面文字自动判断任务状态如“领取”“完成”自动化流程执行数据采集与处理新手建议先看基础《文字识别通用OCR接口调用与功能说明》二、实现原理核心流程天诺脚本调用 OCR API 的流程如下标准步骤1️⃣ 截取屏幕图片2️⃣ 保存为本地文件3️⃣ 上传图片到 OCR API4️⃣ 获取返回 JSON 数据5️⃣ 提取识别结果三、OCR API 接口说明接口能力包括通用文字识别多语言识别自动纠偏高精度识别支持免费在线体验文档清晰提供各种语言的API接入示例https://market.shiliuai.com/general-ocr API 文档四、天诺脚本 OCR 实战步骤1️⃣ 截图保存// 截图保存到本地 capture(/sdcard/ocr.png, 0, 0, 720, 1280);2️⃣ 调用 OCR API// // API文档https://market.shiliuai.com/doc/advanced-general-ocr // public static string OCR_General_Easy(Image image, string appcode) { string url https://ocr-api.shiliuai.com/api/advanced_general_ocr/v1; var headers new Dictionarystring, string { {Authorization, APPCODE appcode}, {Content-Type, application/json} }; string body {\file_base64\:\ CustomHelp.ImageTobase64(image) \}; return CustomHelp.HttpPost(url, body, headers); }3️⃣ 输出返回结果成功示例 { code: 200, msg: OK, msg_cn: 成功, success: True, file_id: file id, request_id: request id, data: data, 具体看下面 } data { page_count: 5, // int, 文件页面总数 process_pages: 3, // int, 处理页面数 status: 2, // int, 处理状态0: 已加入队列, 1: 正在处理中, 2: 已完成同步时此值为2 wait_time: 0.0 // float, 大概还需等待时间同步时此值为0 // 如果status2: pages: [ { width: 2000, // int, 页面宽度 height: 2500, // int, 页面高度 prob_mean: 0.98, // float, [0, 1], 页面文字置信度平均值若is_line则不返回该项 prob_std: 0.11, // float, 页面文字置信度标准差若is_line则不返回该项 lines: [ { text: 你好, // string, 文字内容 prob: 0.995, // float, [0, 1], 文字内容置信度 keypoints: [[50, 20], [150, 20], [150, 60], [50, 60]] // list, [[xi, yi]], 文字区域角点位置以左上角为起点按顺时针排列若is_line则不返回该项 }, ...... ] }, ......, ] }4️⃣ 解析识别结果var data JSON.parse(result); if (data.code 200) { var text data.data.text; log(识别内容 text); } else { log(识别失败); }五、完整示例代码可直接参考// // 天诺脚本 OCR 自动识别示例 // API文档https://market.shiliuai.com/doc/advanced-general-ocr // var imgPath /sdcard/ocr.png; var apiUrl https://你的域名/api/ocr/general; public static string OCR_General_Easy(Image image, string appcode) { string url https://ocr-api.shiliuai.com/api/advanced_general_ocr/v1; var headers new Dictionarystring, string { {Authorization, APPCODE appcode}, {Content-Type, application/json} }; string body {\file_base64\:\ CustomHelp.ImageTobase64(image) \}; return CustomHelp.HttpPost(url, body, headers); } // 1. 截图 capture(imgPath, 0, 0, 720, 1280); sleep(500); // 2. 调用OCR接口 var result OCR_General_Easy(); log(返回数据 result); // 3. 解析JSON var data JSON.parse(result); if (data.code 200) { var text data.data.text; log(识别结果 text); } else { log(识别失败); }六、常见问题避坑指南❌ 1. 识别不准确原因截图模糊分辨率低图片内容复杂优化建议参考《图片变清晰 API 实战》❌ 2. 接口调用失败检查API地址是否正确图片路径是否存在网络是否正常❌ 3. JSON解析报错建议打印原始返回数据检查返回格式七、进阶玩法提升效果玩法1OCR 去水印自动清理图片 → 再识别参考《图片去水印 API 实战》玩法2OCR 高清化提高识别成功率参考《图片变清晰 API》玩法3自动化流程系统实现自动识别自动点击自动执行任务参考《OCR系统集成实战》八、总结通过本文你已经掌握✅ 天诺脚本调用 OCR API 的完整流程✅ 自动化识别屏幕文字实现方法✅ 可直接参考的示例代码延伸阅读《EasyClick OCR 教程》《懒人精灵 OCR 教程》《按键精灵 OCR 教程》《OCR识别优化指南》最后总结在自动化脚本领域天诺 / 按键精灵 / EasyClickOCR 是实现“智能化”的关键能力。建议直接体验接口https://market.shiliuai.com/doc/advanced-general-ocr支持免费测试提供完整的代码示例几分钟即可完成接入。

【完整教程】天诺脚本如何调用 OCR 文字识别 API？自动识别屏幕文字实战（附代码）

最新文章

Java Loom响应式迁移全链路拆解（从线程模型颠覆到Project Loom生产就绪）

从开发到分发：手把手教你用Inno Setup为Qt应用制作专业安装包（附脚本自定义技巧）

告别‘Hello World’就卡住：保姆级Android Studio安装与环境变量配置（Win/Mac通用）

保姆级教程：用STM32CubeIDE搞定STM32F407的USB虚拟串口（CDC）通信与速度测试

从老式工控机到树莓派：一文理清RS-232、RS-485和TTL电平的‘前世今生’与适用场景

Vitis自定义IP编译过了，Debug却卡在QEMU文件缺失？一个手动创建空文件的“土办法”救了我

推荐文章

相关文章

分享文章

更多文章

剪映专业版教程：制作魔方动画开场效果

如何快速管理原神成就：YaeAchievement终极实战指南

ESP32实战指南：ADC连续采样与摇杆数据采集

如何永久保存微信聊天记录？免费工具WeChatMsg终极解决方案

HTML5 脚本

基于大模型、SKills 的知识管理

Kimi K2.5 API 完全指南：性能实测、成本测算与接入方案（2026）

次元画室实战体验：输入文字秒出动漫角色，效果惊艳到尖叫

GLM-4.7-Flash多场景：科研论文润色、参考文献格式化、摘要生成

抖音弹幕监听完整实战指南：基于系统代理的高效抓包技术解析

SDXL 1.0免配置环境：支持NVIDIA Container Toolkit一键容器化

京东H5ST 4.9.7签名算法逆向实战：从环境模拟到参数生成