本项目利用python对Ted Talks数据集进行,该数据集包含了截止到2017年9月21号为止由上传到http://Ted.com上的所有Ted演讲的有关数据。数据集地址: Ted Talks dataset一、理解数据该数据集大小为2534row * 17col,…
项目源码 欢迎点击项目连接,在在线数据分析协作工具K-Lab中运行及调试代码~ 项目链接:可视化分析TED演讲数据集
df=pd.read_csv('ted_main.csv')df.colums#数据集的首行表头Index([u'comments',u'description',u'duration',u'event',u'film_date',u'languages',u'main_speaker',u'name',u'num_speaker',u'published_date',u'ratings',u'related_talks',u'speaker_occupation',u'tags',u'title',u'url',u'vie...
TED.com网站上的TED Talks数据截至2017年9月21日 这些数据集包含有关在2017年9月21日之前上传到TED.com官方网站的TED演讲的所有音频记录的信息。 1. Overview These datasets contain information about all audio-video recordings of TED Talks uploaded to the officialTED.comwebsite until September 21st, 2017...
你会如何给他评分呢?会觉得无比惊奇?或是缺乏说服力?还是玩的就是搞笑呢?(翻译:Ting Gao,审译:Snow Lee) 立即播放 课程免费缓存,随时观看~ 扫码下载网易公开课APP 收藏 课程列表 【第1集】【TED】TEDTalks的谎言与统计数据译
David McCandless 将复杂的数据集(如世界范围的军事开支、媒体 buzz、Facebook 的状态)转换成美观,简单的图表,从而梳理出看不见的模式和联系。他认为,好的设计是解决信息过剩的最好方法,这也可能改变我们看待世界的方式。 (https://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization/up-next...
当我查看Kaggle上的TED数据集(rounakbanik/ted-talks)时,有不少发现。首先,由于数据集包含许多TED演讲的字幕,因此我们有了一个非常丰富、语言学上结构良好的语料。其次,由于该语料具备良好的语言学属性,它很可能和Reuters 20 News Group或者古登堡语料库差不好。这让我灵机一动:...
David McCandless 将复杂的数据集(如世界范围的军事开支、媒体 buzz、Facebook 的状态)转换成美观,简单的图表,从而梳理出看不见的模式和联系。他认为,好的设计是解决信息过剩的最好方法,这也可能改变我们看待世界的方式。 (https://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization/up-next...
David McCandless 将复杂的数据集(如世界范围的军事开支、媒体 buzz、Facebook 的状态)转换成美观,简单的图表,从而梳理出看不见的模式和联系。他认为,好的设计是解决信息过剩的最好方法,这也可能改变我们看待世界的方式。 (https://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization/up-next...
当我看到Kaggle上的TED数据集时,竟然发现观看次数极为分散:从五万到四千七百万多(平均数为100万左右)。到底是什么原因使得某些演讲独占鳌头, TED组织者和演讲者能否抓住这个秘诀制造下一个"爆款"呢? 下文中,我们尝试着从预测TED演讲的受欢迎程度出发,来分析最具影响力的因素。