1. Cryptocurrency Reddit 评论数据集(Cryptocurrency Reddit Comments Dataset) —— 此数据集包含来自 r/cryptocurrency 子reddit 的评论。这些数据包括2017年11月至2018年3月共5个月发布的评论。2. Reddit 特朗普评论(Donald Trump Comments on Reddit) —— 一个简单的数据集,包含了来自 Reddit 的数千条提到...
原文链接:https://www.reddit.com/r/Open_Diffusion/comments/1dnnovb/dataset_of_datasets_ie_i_will_not_spam_the_group/ 数据集地址: 完整的 Wikiart。215k 张图片。包含标题,但最好将它们作为“助手”,但仍然让我们选择的 VLLM 进行字幕制作。链接:https ://huggingface.co/datasets/matrixglitch/wikiart ...
对 2014 年 10 月和 11 月的数据进行了早期验证实验和模型开发。 更多数据集参考 https://github.com/dingidng/reddit-dataset http://files.pushshift.io/reddit/comments/ 展开 文件列表 reddit_adj.npz reddit.npz reddit.zip reddit_adj.npz (30.87M) 下载...
download_reddit_data("comments21.csv", "comment", subreddit, start_date, end_date) 数据预处理 在拥有POST和comments数据帧之后,我们希望清理和预处理数据。 对于每一次提交,我们将“title”和“self-text”字段连接起来,以获得文章的一个文本字段,对于评论,我们使用“body”字段获得文本。我们删除了“[deleted...
获取大量 reddit 评论数据 与任何机器学习项目一样,只有获得用于训练模型的数据,才能启动项目。 我用来微调模型的数据来自之前检索到的 reddit 评论大型数据库:https://bigquery.cloud.google.com/dataset/fh-bigquery:reddit_comments?pli=1 。有一个正在进行的项目(https://www.reddit.com/r/bigquery/wiki/datasets...
生成自己的合成数据集 「Why is our data better?」 就像在网站上介绍到的那样,让你快速、高精度、高准确度地寻找到合适的图像数据集。 感兴趣的朋友,可以戳下方链接去试试哦~ 网站地址: https://datasets.bifrost.ai/ 参考链接:https://www.reddit.com/r/MachineLearning/comments/i6fsl6/p_we_built_an_...
数据:the-numbers.com、CPI计算器 工具:python: matplotlib 项目: https://github.com/itaidagan/FranchiseRevenueComparison 原文: https://www.reddit.com/r/dataisbeautiful/comments/bgf3ye/oc_franchise_earnings_comparison_over_20_years/ 2 The average color of each frame of Game of Thrones season 8 ...
4.科学家们筹划大型欧洲人工智能中心与美国竞争https://www.reddit.com/r/MachineLearning/comments/8ekmqy/scientists_plan_huge_european_ai_hub_to_compete/ 在这个话题中,你会发现来自欧洲和美国各地的数据科学家和机器学习研究人员们参与了讨论--关于ML(机器学习)在两大洲的结构如何塑造和工资水平如何。你可以通...
目前而言Home首页和Popular页的广告加载率大约为10%(平均每10条信息流一则推广帖),但在用户流量聚集最大的每个帖子的“Comments讨论区”,Reddit在广告插入上还非常谨慎,除了一般在帖子下方有插入广告外,讨论区很少见到频繁的广告的插入,海豚君草根调研大约只有1-2%左右。综合下来看,Reddit在广告加载率上,相比同行明显...
就像在网站上介绍到的那样,让你快速、高精度、高准确度地寻找到合适的图像数据集。 感兴趣的朋友,可以戳下方链接去试试哦~ 网站地址: https://datasets.bifrost.ai/ 参考链接:https://www.reddit.com/r/MachineLearning/comments/i6fsl6/p_we_built_an_easy_way_to_find_image_datasets/...