此脚本可以批量将表格内的文章(一行一个)分别导出成Markdown的.md文件。 需要安装运行所需库: pipinstallopenpyxl html2text markdownifyjsbeautifierrequests 保存为 xlsx_to_md.py 此处内容已隐藏,前往博客原文查看 请登录后查看特权 运行:python3 xlsx_to_md.py 将待转化文件命名为:待处理文件.xlsx 待处理文件....
用Doc2X识别 pdf 的时候,表格会变成 html,虽然保留了合并单元格但是无法修改。于是参考Excel&Word↔ 思源表格互转 - by 浅沧 - 动作信息 - Quicker (getquicker.net),让 ai 写了 Python 修改(本来块转换工具也能用自定义粘贴转换,但我怎么也没法保存,一怒之下怒了一下) 代码 importrefromlxmlimportetreede...
编程语言的源代码文件 Python (.py) JavaScript (.js) Java (.java) C/C++ (.c, .cpp, .h) HTML (.html, .htm) CSS (.css) 其他编程语言的源代码文件配置文件 JSON (.json) YAML (.yaml, .yml) XML (.xml) INI (.ini) Properties (.properties) 脚本文件 Shell脚本 (.sh) 批处理文件 (....