这套AMSR-E/AMSR2 统一 Level-2B 数据集报告了瞬时地表降水率和降水类型(陆地和海洋)以及降水剖面(海洋)。 这些数据是将 AMSR-E/AMSR2 统一算法应用于 EOS 高级微波扫描辐射计(AMSR)(AMSR-E)和 AMSR2 仪器获得的 L1R 数据而得出的。 摘要 AMSR-E/AMSR2 Unified L2B Global Swath Surface Precipitation是一...
BCI比赛数据集简介-BCI competition IV 2bmp.weixin.qq.com/s/Xdf1lgN_SSUeE6ekMNNslg BCI competition IV Data Set 2b BCI competition IV 公共数据集 Data sets 2b,是基于视觉诱发的左右手运动想象的脑电数据集。该数据集采集了9名右利手、视力正常或达到矫正后正常的实验者的脑电信号作为数据集。 对受...
近日,来自多家中国科研机构的研究团队重磅发布了名为Infinity-MM的超大规模多模态数据集,并基于该数据集训练出了一个性能卓越的AI模型Aquila-VL-2B。这一突破为多模态AI发展注入了新动力。Infinity-MM数据集规模惊人,共包含四大类数据:1000万条图像描述、2440万条通用视觉指令数据、600万条精选高质量指令数据,以及...
laion-5b数据集是从网页数据Common Crawl中筛选出来的图像-文本对数据集,它包含5.85B的图像-文本对,其中文本为英文的数据量为2.32B,这就是laion2B-en数据集。 laion2B数据集下载地址https://huggingface.co/datasets/kakaobrain/coyo-700m/tree/main/data 共有128个.snappy.parquet文件,每一个文件中约有1800万...
BCI competition IV Data Set 2b是基于视觉诱发的左右手运动想象的脑电数据集。此数据集包含9名右利手、视力正常或达到矫正后正常的实验者的脑电信号。实验要求受试者右利手、视力正常或达到矫正后正常,且坐在距离电脑显示屏幕约1米的扶手座椅上。脑电信号数据由c3、cz、c4这3个电极记录运动想象。同...
近日,来自多家中国机构的研究团队成功创建了 “Infinity-MM” 数据集,这是目前最大规模的公开多模态 AI 数据集之一,同时训练出了一款性能卓越的小型新模型 ——Aquila-VL-2B。 该数据集主要包含四大类数据:1000万条图像描述、2440万条一般视觉指令数据、600万条精选高质量指令数据,以及300万条由 GPT-4和其他 AI...
https://huggingface.co/IlyaGusev/gemma-2-2b-it-abliterated sky_bai 其他 gamme 0 3 2025-02-15 详情 相关项目 评论(0) 创建项目 文件列表 gemma-2-2b-it-abliterated.zip gemma-2-2b-it-abliterated.zip (7891.13M) 下载反馈建议功能升级啦! •预置高频标签帮你快速锁定问题 •在线交流、邮件、...
IndexError Traceback (most recent call last) Cell In[1], line 41 37 text = processor.apply_chat_template( 38 messages, tokenize=False, add_generation_prompt=True 39 ) 40 image_inputs, video_inputs = process_vision_info(messages) ---> 41 ...
深度学习数据集的数据清洗 数据清洗基础与实践,一、前言上两期文章中,我们已经了解到“数据”是一个庞大的体系(如下图所示);并用了菜市场的例子,为大家讲解数据来源的含义,用买菜的例子,为大家讲解数据采集的步骤;而今天小陈主要给讲解,我们“买完菜”以后,怎样
1. 使用lora微调gemma-2b-it模型,数据集为Alpaca_cleaned_data 2. 在truthfulQA数据集上评估模型效果 数据集介绍 Alpaca 是由 OpenAI 的 text-davinci-003 引擎生成的包含52000条指令和演示的数据集。这些指令数据可用于为语言模型进行指令调整,使语言模型更好地遵循指令。cleaned数据集修复了原数据集一些不合理的...