Excel输出 5. 图片OCR 需要切换到以下代码,通过LLM来识别图像。图像LLM识别代码 OCR输入图像 OCR结果 能够借助LLM识别并分析图片的内容 6. Audio音频 中文音频结果 英文音频结果 不支持中文音频,支持英文音频 尝试了传入LLM来解析中文音频,也不支持。7. HTML文件 HTML输入 HTML输出 Head 标签里面的内容都没输出,...
Word:将 Word 文档中的内容转换为 Markdown,保留基本的格式和结构。Excel图像(EXIF 元数据和 OCR 光学字符识别)音频(EXIF 元数据和语音转文字)HTML:将 HTML 文件中的内容转换为 Markdown,保留基本的格式和结构。CSV、JSON、XML:将 CSV、JSON 和 XML 文件中的数据转换为 Markdown 格式,便于进一步处理和...
3. Word文档 Word输入Word输出 保留大标题,小标题,图片有识别,转成一段base64的占位data 4. Excel文件 Excel输入Excel输出 5. 图片OCR 需要切换到以下代码,通过LLM来识别图像。 图像LLM识别代码OCR输入图像OCR结果 能够借助LLM识别并分析图片的内容 6. Audio音频 中文音频结果英文音频结果 不支持中文音频,支持英文...
Excel 图像(EXIF 元数据和 OCR 光学字符识别) 音频(EXIF 元数据和语音转文字) HTML:将 HTML 文件中的内容转换为 Markdown,保留基本的格式和结构。 CSV、JSON、XML:将 CSV、JSON 和 XML 文件中的数据转换为 Markdown 格式,便于进一步处理和分析。 ZIP 文件(迭代处理压缩包内的文件) 四、MarkItDown 的优势 4.1...
PDF 由 pdfminer 库处理,但缺少内置 OCR。你必须预处理 PDF 以进行文本提取。 6、将 MarkItDown 部署为 API MarkItDown 可以在本地运行,但将其作为 API 托管可以解锁额外的灵活性,使其易于集成到 Zapier 和 n8n 等工作流程中。 以下是使用 FastAPI 的 MarkItDown API 的简单示例: ...
集成OCR技术,提取图片中的文本。 支持音频文件转写为文本内容。 AI描述增强: 可结合大语言模型(如GPT)生成图片描述,增强Markdown文档的内容质量。 快速开始 MarkItDown的安装与使用非常简单,以下是入门指南。 安装 通过pip快速安装MarkItDown: 代码语言:txt ...
MarkItDown 是微软开源的多功能文档转换工具,能够将 PDF、PPT、Word、Excel、图像、音频、HTML 等多种格式的文件转换为 Markdown 格式。它支持 OCR 文字识别、语音转文字和元数据提取,适用于内容索引、数据挖掘、文档处理等场景。 MarkItDown 以开源免费、功能全面和开发者友好的特点,成为文档智能转换的利器。它极大地...
Excel输出5. 图片OCR 需要切换到以下代码,通过LLM来识别图像。 图像LLM识别代码 OCR输入图像 OCR结果 能够借助LLM识别并分析图片的内容 6. Audio音频 中文音频结果 英文音频结果 不支持中文音频,支持英文音频 尝试了传入LLM来解析中文音频,也不支持。 7. HTML文件 ...
用户通过该工具转换后,有助于文本索引、分析等多种应用场景,并支持开发者利用大型语言模型进行图像描述。IT之家附上 MarkItDown 库当前支持的文件格式如下:PDF (.pdf)PowerPoint (.pptx)Word (.docx)Excel (.xlsx)Images (EXIF metadata, and OCR)Audio (EXIF metadata, and speech transcription)HTML (special...
微软最近推出了一款名为MarkItDown的Python工具,专门用于将各种文件格式转换为Markdown格式。这个工具在GitHub上获得了23.7k的星星,受到了广大用户的喜爱。MarkItDown支持的文件格式非常丰富,包括但不限于: PDF PowerPoint Word Excel 图像(支持EXIF元数据和OCR) ...