提取图片中的文字通常称为 OCR(光学字符识别),以下是几种常见的方法:
一、手机端工具
微信/QQ 提取文字
- 微信:打开图片 → 长按图片 → 点击“提取文字”。
- QQ:发送图片到聊天窗口 → 长按图片 → 点击“提取文字”。
- 支持语言:中英文为主,部分其他语言。
系统自带功能(部分手机)
- 小米/华为等:打开相机 → 对准文字 → 点击“扫一扫”或“识图”。
- 苹果手机:使用“备忘录” → 新建笔记 → 点击相机图标 → 选择“扫描文稿”。
第三方App
- Google Lens(安卓/iOS):拍照或导入图片 → 自动识别文字。
- Microsoft Lens(安卓/iOS):支持OCR并导出为Word/PDF。
二、电脑端工具
OneNote(微软办公套件)
- 插入图片 → 右键图片 → 选择“复制图片中的文本” → 粘贴到文档。
Adobe Acrobat DC
- 打开PDF或图片 → 点击“增强扫描” → 导出为可编辑文本。
WPS Office
- 插入图片 → 右键图片 → 选择“图片转文字”。
专业OCR软件
- ABBYY FineReader:高精度识别,支持多语言。
- 天若OCR(免费工具):截图后自动识别文字。
三、在线工具
百度OCR(免费)
- 访问 百度AI开放平台 → 上传图片 → 获取文字。
腾讯云OCR
- 进入 腾讯云文字识别 → 上传图片识别。
Google Drive
- 上传图片到Google Drive → 右键图片 → 用Google Docs打开 → 文字自动提取到文档。
在线网站
四、编程实现(适合开发者)
使用Python库 pytesseract
(需安装Tesseract引擎):
from PIL import Image
import pytesseract
# 安装Tesseract并配置环境变量
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
# 打开图片并识别文字
image = Image.open('image.jpg')
text = pytesseract.image_to_string(image, lang='chi_sim') # 中文用chi_sim
print(text)
注意事项
- 图片质量:清晰、无反光、文字排列整齐的图片识别率更高。
- 语言支持:部分工具需手动选择语言(如中英文混合需设置多语言模式)。
- 复杂排版:表格或特殊字体可能需要手动调整。
根据需求选择最适合的工具即可!