GLM-4v-9B新手入门:5步搞定中文图表识别AI系统

张开发
2026/5/30 11:28:55 15 分钟阅读
GLM-4v-9B新手入门:5步搞定中文图表识别AI系统
GLM-4v-9B新手入门5步搞定中文图表识别AI系统1. 环境准备与快速部署首先确保您的系统满足以下要求GPU至少24GB显存如NVIDIA RTX 4090操作系统Linux推荐Windows需WSL2Python 3.8执行以下命令一键安装依赖conda create -n glm4v python3.10 conda activate glm4v pip install torch transformers pillow2. 模型下载与加载GLM-4v-9B支持直接从HuggingFace加载from transformers import AutoModel, AutoTokenizer model AutoModel.from_pretrained( THUDM/glm-4v-9b, trust_remote_codeTrue, device_mapauto ).eval() tokenizer AutoTokenizer.from_pretrained( THUDM/glm-4v-9b, trust_remote_codeTrue )3. 基础图像识别功能上传图片并进行简单识别from PIL import Image image Image.open(chart.png).convert(RGB) question 这张图表展示了什么数据 inputs tokenizer.apply_chat_template( [{role: user, content: question, image: image}], add_generation_promptTrue, return_tensorspt ).to(model.device) output model.generate(inputs, max_new_tokens512) print(tokenizer.decode(output[0]))4. 中文图表解析实战针对中文图表特别优化处理# 上传包含中文的图表 image Image.open(sales_report.png) # 构造专业问题 questions [ 提取图表中的所有数据并整理成表格, 分析2023年各季度增长趋势, 预测下一年度的销售情况 ] for q in questions: inputs tokenizer.apply_chat_template( [{role: user, content: q, image: image}], add_generation_promptTrue, return_tensorspt ) output model.generate(inputs, max_new_tokens1024) print(fQ: {q}\nA: {tokenizer.decode(output[0])}\n)5. 常见问题解决问题1显存不足解决方案使用4bit量化版本from transformers import BitsAndBytesConfig quant_config BitsAndBytesConfig( load_in_4bitTrue, bnb_4bit_compute_dtypetorch.bfloat16 ) model AutoModel.from_pretrained( THUDM/glm-4v-9b, quantization_configquant_config, trust_remote_codeTrue )问题2中文识别不准确解决方案明确指定语言question 请用中文详细描述这张图表的内容获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章