CAIL_bert.zip (746.93M) 下载 File Name Size Update Time bert_model/config.json 571 2023-12-01 23:34:42 bert_model/model.safetensors 411553788 2023-12-01 23:28:04 bert_model/pytorch_model.bin 411577189 2023-04-28 21:00:52 bert_model/tokenizer.json 268943 2023-12-01 23:02:18 bert...
CAIL2018—SMALL数据集中罪名预测任务数据来自“中国裁判文书网”公开的刑事法律文书,包括19.6万份文书样例,其中每份数据由法律文书中的案情描述和事实部分组成,包括每个案件被告人被判的罪名,数据集共包含202项罪名,被告人罪名通常涉及一项至多项。以数据集中某一法律文书为例: "公诉机关指控,2009年12月18日22时许,...
CAIL2018中国法研杯数据集 喜爱 0 CAIL2018中国法研杯数据集 Maquse默 2枚 CC0 情绪识别文章标签自然语言处理 0 6 2023-02-24 详情 相关项目 评论(0) 创建项目 文件列表 final_all_data.zip final_all_data.zip (960.78M) 下载 File Name Size Update Time final_all_data/exercise_contest/data_test.json...
本文将以CAIL2018-SMALL数据集的罪名预测任务为例,介绍如何利用PaddleNLP和ERNIR3.0进行文本分类。CAIL2018-SMALL数据集是一个包含法律判决文书的文本分类数据集,目标是对给定的法律判决文书进行罪名预测。该数据集具有多标签的特点,即一个样本可能对应多个罪名。 首先,我们需要对数据进行预处理。预处理是文本分类任务中...
$ tree data data ├── raw │ └── CAIL2019-SCM-big │ └── SCM_5k.json ├── test │ ├── ground_truth.txt │ └── input.txt └── train └── input.txt raw存放原始数据集文件。train、test则是划分产生的固定训练测试集,用于快速测试模型的可用性和性能。
游客hfg22irzyoq4o2022-05-1411410CC-BY-SA-NC 4.0 描述 cail_small 数据列表 数据名称上传日期大小下载 test.csv2022-05-1442.81MB dev.csv2022-05-1442.37MB train.csv2022-05-14200.01MB 文档 目录
以一人多罪,数罪并罚的多罪名预测任务为导向,建立以 Seq2Seq+attention、 Transformer 等为基础的序列生成模型,同时借鉴机器翻译任务的预测机制, 使用生成模型进行多罪名预测并取得良好效果,完成在 RCV1-V2、AAPD、CAIL、CJO 等多标签数据集上的模型训练及使用。 软件架构 软件架构说明 安装教程 xxxx xxxx xxxx 使用...
法律数据集 文件组成 cail2018_big.json: 171w 数据组成 数据中涉及 183个法条、202个罪名,均为刑事案件 数据清洗 数据中筛除了刑法中前101条(前101条并不涉及罪名),并且为了方便进行模型训练,将罪名和法条数量少于30的类删去。 数据格式 数据利用json格式储存,每一行为一条数据,每条数据均为一个字典 字段及意...
CAIL2018 数据集:于 2018 年由清华大学、北京大学、中国科学院软件研究所和中国司法 大数据研究院联合发布。CAIL2018是第一个用于判决预测的大规模中国法律数据集,收录 了中国最高人民法院公布 260 万件刑事案件,是现有判决预测工作中其他数据集的数倍。 对判断结果的注释也更加详细和丰富。它由适用的法律条款、指控...
元宇宙数据集 智能安防 智能安防 家居生活 家居生活 人脸识别 人脸识别 ChatGPT数据集 ChatGPT数据集 公开数据集 Home 公开数据集 其他数据集 • Others 选择频道搜索 公开数据集 AI技术百科 人工智能数据集交易平台 人工智能模型 人工智能论文 cail2018small 267.3M 681 浏览 1 喜欢 8 次下载...