使用Python获取文件夹下所有图片并进行文字识别转换为Excel教程

在本教程中,我们将学习如何使用Python编写一个脚本,该脚本可以自动获取指定文件夹下的所有图片文件,并利用百度AI的文字识别服务将这些图片中的表格内容转换为Excel格式。这种功能在需要从大量图片中提取表格数据时非常有用。

使用Python获取文件夹下所有图片并进行文字识别转换为Excel教程

教程概览

  1. 环境准备:安装所需Python库。
  2. 目录遍历:获取指定文件夹下的所有图片文件。
  3. 百度AI文字识别:使用百度AI进行图片中表格的文字识别。
  4. 数据提取与保存:将识别结果保存为Excel文件。
  5. 关键词总结:列出教程相关的高搜索量关键词。
  6. 生成配图:为教程创建一张21:9尺寸的配图。

1. 环境准备

首先,我们需要安装一些Python库:

  • os:用于操作系统功能,如文件路径的遍历。
  • aip:百度AI的Python SDK,用于文字识别。
  • requests:用于发送网络请求,获取识别结果的下载链接。

可以使用pip命令安装aiprequests

pip install baidu-aip requests

2. 目录遍历

import os

work_path = "图片\\"
pictures = []

for root, dirs, files in os.walk(work_path):
    path = [os.path.join(root, name) for name in files]
    pictures.extend(path)

这段代码会遍历work_path指定的文件夹,并将所有文件的路径存储在pictures列表中。

3. 百度AI文字识别

要使用百度AI的文字识别功能,需要先在百度AI平台注册并创建应用,获取APP_IDAPI_KEYSECRET_KEY

from aip import AipOcr
import time

APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

4. 数据提取与保存

遍历图片列表,对每张图片进行表格文字识别,并将结果保存为Excel文件。

import requests

for picture in pictures:
    with open(picture, 'rb') as pic:
        img = pic.read()
        table = client.tableRecognitionAsync(img)
        request_id = table['result'][0]['request_id']

        result = client.getTableRecognitionResult(request_id)
        while result['result']['ret_msg'] != '已完成':
            time.sleep(2)
            result = client.getTableRecognitionResult(request_id)

        download_path = result['result']['result_data']
        excel_name = picture.split(".")[0] + ".xls"
        excel = requests.get(download_path)
        with open(excel_name, 'wb') as file:
            file.write(excel.content)
声明:本站所有文章,如无特殊说明或标注,均为本站(王大神)原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
指数词

自动签到脚本制作教程

2023-12-10 15:39:02

指数词

如何使用Python合并PDF文件并添加目录

2023-12-10 15:48:54

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索