OpenDataLab provides access to numerous significant open-source datasets.1.3k followers China https://opendatalab.org.cn OpenDataLab@pjlab.org.cn Overview Repositories 38 Projects Packages People 7 README.md 🏡 Homepage 👋 Discord 💬 WeChat Group English🌎|简体中文🀄 🔥🔥...
OpenDataLab has 18 repositories available. Follow their code on GitHub.
OpenDataLab AI 开源数据社区:opendatalab.org.cn AI结构化数据提取开源工具 MinerU 最新版本发布。本次更新进行了大量代码重构,降低了硬件需求,数据提取性能及易用性“双提升”。(点击查看MinerU介绍→登顶GitHub Trending,开源工具MinerU助力复杂PDF高效解析提取) 全新版本 MinerU 接入了新的表格模型 StructTable-In...
如果您正在面对从PDF中提取内容的挑战,GitHub项目PDF-Extract-Kit可能是您正在寻找的解决方案。 如果您正在面对从PDF中提取内容的挑战,GitHub项目PDF-Extract-Kit可能是您正在寻找的解决方案。这个工具包以其全面的高质量PDF内容提取方法脱颖而出,具有先进的组件,如布局检测、公式检测、公式识别和OCR功能。它特别值得注意...
在线体验地址:https://opendatalab.com/OpenSourceTools/Extractor/PDF 项目地址:https://github.com/opendatalab/MinerU,如果觉得项目有帮助到您,请帮我们点一个star,这对我们快速推进迭代项目至关重要。 如果遇到相关问题,请私信联系我们。项目还在不断完善中,请大家多多包涵,欢迎给我们提issue。 1.5万 0 转发 ...
在线体验地址:https://opendatalab.com/OpenSourceTools/Extractor/PDF 项目地址:https://github.com/opendatalab/MinerU,如果觉得项目有帮助到您,请帮我们点一个star,这对我们快速推进迭代项目至关重要。 如果遇到相关问题,请私信联系我们。项目还在不断完善中,请大家多多包涵,欢迎给我们提issue。 1.5万 0...
事件简要经过: OpenDataLab 在6月末发布的miner-pdf-benchmark中直接将mathpix识别的结果作为验证集,构成验证集造假. 官方仓库已经删除,但开发者仓库仍在更新 验证集造假证据如下(fork的他们开发者仓库): https://github.com/Muxv/Miner-PDF-Benchmark/commit/963e540df4cd0e391c5a6bf873b7d7feabf1955d ...
OpenDataLab的哔哩哔哩直播间,OpenDataLab 为大模型提供高质量的开放数据集 中国大模型语料数据联盟开源数据服务指定平台弹幕,礼物,道具,活动多种玩法,bilibili 直播让您拉进与小伙伴们之间的距离。
它不仅涵盖丰富的任务类型,如回答采集、偏好收集和内容评估等,还支持多模态数据标注,包括图像、视频和音频。Label-LLM具备预标注载入功能,能大幅提升工作效率,并提供全方位的任务管理与可视化分析,确保标注质量。快来体验这款强大的标注平台吧![部署文档](https://github.com/opendatalab/LabelLLM)...
Label-LLM 部署文档: github.com/opendatalab/ 更多数据处理宝藏工具,尽在 OpenDataLab GitHub仓库: github.com/opendatalab 还有超好用的多模态标注工具 LabelU: github.com/opendatalab/ 不要吝啬你的star! 更多精彩数据内容,尽在OpenDataLab:https://opendatalab.org.cn/ ...