如何用Python从大量pdf 中提取表格中的数据进行分析

2025-04-27 20:32:35
推荐回答(1个)
回答1:

我最近就在干这件事……简单来说,用pdftables就可以了
写完代码的补充:
转成excel后,因为python不能在已存在的excel文件上改,所以我的办法是用pandas df转成matrix。然后处理二维数组。
再写到最终的excel。
「老子终于写完了」
啊哈!听说过abbyy finerreader嘛!解决一切问题!