# ai_note **Repository Path**: atp2p/ai_note ## Basic Information - **Project Name**: ai_note - **Description**: 人才简历识别和分析 pdf图形识别率 90% 以上。 采用人工大模型的算法,分析,归档 简历资料库 - **Primary Language**: Java - **License**: AGPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2025-04-25 - **Last Updated**: 2026-06-12 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # AI 学习笔记 ## llm_qa 模型合并及本地加载 pediatrics_llm_qa:儿科问诊小模型 本项目开源了基于儿科医疗指令微调的问诊模型:**pediatrics_llm_qa**,目前模型的主要功能如下: https://github.com/jiangnanboy/pediatrics_llm_qa ## OCR 图片文字识别 ### 功能概述 基于 PaddleOCR 实现图片文字识别,支持微信聊天记录等图片的文字提取和对话分类。 ### 主要功能 1. **图片文字提取**:使用 PaddleOCR 识别图片中的文字内容 2. **对话参与者识别**:自动识别聊天中的参与者(客户和我) 3. **消息分类**:根据对话框位置和底色判断消息归属 4. **时间顺序排序**:按垂直位置对消息进行排序,确保对话按时间顺序输出 5. **结果保存**:将识别结果保存到文本文件 ### 文件结构 ``` ocr/ ├── image_ocr.py # 主程序文件 ├── test.jpg # 测试图片 ├── requirements.txt # 依赖包配置 └── conversation_result.txt # 识别结果输出 ``` ### 使用方法 ```bash cd ocr python image_ocr.py ``` ### 依赖安装 ```bash pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple ``` ### 识别原理 1. **OCR识别**:使用 PaddleOCR 提取图片中的文字和边界框信息 2. **位置判断**:微信聊天界面中,自己的消息在右边(绿色气泡),对方的消息在左边(白色气泡) 3. **底色检测**:通过分析边界框区域的颜色特征,检测微信绿色气泡 4. **消息合并**:将同一气泡内的多行文字合并为完整消息 5. **排序输出**:按垂直位置排序,确保对话按时间顺序输出 ### 输出示例 ``` 【对话记录(按时间顺序)】 林 : 你建议用哪些手段来尝试捕捉微信聊天记录上的各个元素呢 我: 林经理,我刚刚在路上,您是企业微信还是个人微信?我记得好像上次您谈过是个人的? 林 : 个人 我: 可以采用截屏和ocr的方式 ```