可以看出绝大多数数据都分布在500w以下,所以我们将播放量范围限制在500w以下再进行观察。 sns.distplot(ted_df[ted_df['观看数'] < 5e6]['观看数']) 可以看出播放量呈现左偏态分布,绝大多数播放量分布在100w周围。 最后我想知道最受欢迎的10个Ted Talks分别是什么,我们可以通过播放量来衡量一个演讲的受欢迎程...
项目源码 欢迎点击项目连接,在在线数据分析协作工具K-Lab中运行及调试代码~ 项目链接:可视化分析TED演讲数据集
数据结构 ? 544.94M * 以上分析是由系统提取分析形成的结果,具体实际数据为准。 README.md Context TED is devoted to spreading powerful ideas in just about any topic. These datasets contain over 4,000 TED talks including transcripts in many languages. If you would like a dataset for a language...
df=pd.read_csv('ted_main.csv')df.colums#数据集的首行表头Index([u'comments',u'description',u'duration',u'event',u'film_date',u'languages',u'main_speaker',u'name',u'num_speaker',u'published_date',u'ratings',u'related_talks',u'speaker_occupation',u'tags',u'title',u'url',u'vie...
TED.com网站上的TED Talks数据截至2017年9月21日 这些数据集包含有关在2017年9月21日之前上传到TED.com官方网站的TED演讲的所有音频记录的信息。 1. Overview These datasets contain information about all audio-video recordings of TED Talks uploaded to the officialTED.comwebsite until September 21st, 2017...
本数据集包含了2017年9月21日之前上传到官方网站TED.com的所有TED Talks演讲录制信息。 如何在线使用数据集 Python用户,创建项目后,输入 !ls ../input/tedtalk/ 查看数据路径R用户,创建项目后,输入 !list.files('../input/tedtalk') 查看数据路径 数据说明 文件列表该数据集包含两个文件: ted_main.csv: 包...
TED Talks are influential videos from expert speakers on education, business, science, tech and creativity, with subtitles in 100+ languages. Ideas free to stream and download.
当我看到Kaggle上的TED数据集时,竟然发现观看次数极为分散:从五万到四千七百万多(平均数为100万左右)。到底是什么原因使得某些演讲独占鳌头, TED组织者和演讲者能否抓住这个秘诀制造下一个"爆款"呢? 下文中,我们尝试着从预测TED演讲的受欢迎程度出发,来分析最具影响力的因素。
David McCandless 将复杂的数据集(如世界范围的军事开支、媒体 buzz、Facebook 的状态)转换成美观,简单的图表,从而梳理出看不见的模式和联系。他认为,好的设计是解决信息过剩的最好方法,这也可能改变我们看待世界的方式。 (https://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization/up-next...
本套演讲集的简略互动版可点击此处通过iPad的iTunesU教学课程应用获取。 概述 导读 St. Lawrence University的Robin Lock和Patti Frazer Lock教授、Duke University的Kari Lock Morgan和Eric Lock博士以及Iowa State University的Dennis Lock携手以可视化数据艺术与研究为主题,确立了TEDTalks在统计学领域的地位。 查看导读...