# ai_note

**Repository Path**: atp2p/ai_note

## Basic Information

- **Project Name**: ai_note
- **Description**: 人才简历识别和分析  pdf图形识别率 90% 以上。 
采用人工大模型的算法，分析，归档 简历资料库
- **Primary Language**: Java
- **License**: AGPL-3.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 1
- **Created**: 2025-04-25
- **Last Updated**: 2026-06-12

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# AI 学习笔记

## llm_qa 模型合并及本地加载

pediatrics_llm_qa：儿科问诊小模型

本项目开源了基于儿科医疗指令微调的问诊模型：**pediatrics_llm_qa**，目前模型的主要功能如下：

https://github.com/jiangnanboy/pediatrics_llm_qa

## OCR 图片文字识别

### 功能概述

基于 PaddleOCR 实现图片文字识别，支持微信聊天记录等图片的文字提取和对话分类。

### 主要功能

1. **图片文字提取**：使用 PaddleOCR 识别图片中的文字内容
2. **对话参与者识别**：自动识别聊天中的参与者（客户和我）
3. **消息分类**：根据对话框位置和底色判断消息归属
4. **时间顺序排序**：按垂直位置对消息进行排序，确保对话按时间顺序输出
5. **结果保存**：将识别结果保存到文本文件

### 文件结构

```
ocr/
├── image_ocr.py      # 主程序文件
├── test.jpg          # 测试图片
├── requirements.txt  # 依赖包配置
└── conversation_result.txt  # 识别结果输出
```

### 使用方法

```bash
cd ocr
python image_ocr.py
```

### 依赖安装

```bash
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
```

### 识别原理

1. **OCR识别**：使用 PaddleOCR 提取图片中的文字和边界框信息
2. **位置判断**：微信聊天界面中，自己的消息在右边（绿色气泡），对方的消息在左边（白色气泡）
3. **底色检测**：通过分析边界框区域的颜色特征，检测微信绿色气泡
4. **消息合并**：将同一气泡内的多行文字合并为完整消息
5. **排序输出**：按垂直位置排序，确保对话按时间顺序输出

### 输出示例

```
【对话记录（按时间顺序）】
林 : 你建议用哪些手段来尝试捕捉微信聊天记录上的各个元素呢
我: 林经理，我刚刚在路上，您是企业微信还是个人微信？我记得好像上次您谈过是个人的？
林 : 个人
我: 可以采用截屏和ocr的方式
```