MNBVC:中文语料集开源项目 MNBVC数据集(NLP语料数据集)不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据均来源于互联网搜集。
MNBVC:超大规模中文语料数据集目标是收集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词等各种形式的纯文本中文数据。不但包括主流文化,也包括各个小众文化甚至火星文的数据。项目目前进度为19.96%,总数据量为7984GB。目标是达到ChatGPT的40T数据!该项目欢迎有热情和能力的网友加入一起创建。
商标名称 MNBVC 国际分类 第31类-饲料种籽 商标状态 商标注册申请 申请/注册号 54902319 申请日期 2021-04-02 申请人名称(中文) 卡里特有限公司 申请人名称(英文) - 申请人地址(中文) - 申请人地址(英文) - 初审公告期号 - 初审公告日期 - 注册公告期号 - 注册公告日期 - 专用权期限 -至 - 类似群 - ...
爱企查为您提供MNBVC2023年企业商标信息查询,包括企业商标注册信息、商标logo,商标类别等企业商标信息查询,让您更轻松的了解MNBVC商标信息,查询更多关于MNBVC商标信息就到爱企查官网!
为处理大规模的中文语料,MNBVC项目组的同学在现有开源软件基础上做了优化,提供了更高效的版本: 更快速且准确的中文编码检测工具:charset_mnbvc 将txt批量转成jsonl并挑出段落重复度高的文件:deduplication_mnbvc 代码仓库爬虫工具 现有各个开源代码语料集都有很严重的人为过滤现象,这让追赶chatGPT变得更为困难。为避免...
京东优评,为您推荐的“MNBVC鱼缸/水族箱”相关产品的购买用户评价高端大气(27) , 做工精细(25) , 尺码合适(20) , 漂亮时尚(20) , 使用方便(13) , 安装简便(10) , 清澈透亮(8) , 做工精致(5) , 水质清澈(5) , 透明度好(4) . 猜你喜欢 米家(MIJIA)小米米家智能生态鱼缸半年免换水补仓一次三月...
本吧热帖: 1-哈哈哈,没人 2-mnbvc吧吧主招募结果公示 3-[公告]关于撤销 XS我的世界大神 吧主管理权限的说明 4-mnbvc吧吧主竞选:NO.0001号候选人
回答:mop not bt, very certainly
查看mnbvc的博客:小说博客加为好友和我聊天 我在外国当土豪 安澜君 大类:都市言情小类:都市生活字数:173018字阅读:1691254次 更新:20年06月27日状态:完成 简介:程序员苏晨,获得了一份来自枫叶国的遗产!自此,苏晨在枫叶国开启了悠闲土豪生活!没事捕捕鱼,种种田!骑骑马!别人养狗他养熊!别让养猫他养虎!悠闲的...
查看mnbvc的博客:小说博客加为好友和我聊天 我能推演未来走向 小小的T 大类:科幻网游小类:星际科幻字数:1332297字阅读:17753856次 更新:22年01月03日状态:完成 简介:世界的走向,每分每秒都有无数种可能性。陆杰获得了推演系统,能将那些可能性推演出来,创造新的平行时空,引领或更改这些世界的走向。为此,他为了让自...