目标,统计近一个月来,QQ群在一天24个时间段的发言量。 Step1:获取QQ聊天记录 这个简单无脑了。。。直接导出消息记录即可。详情参考这里。导出时,记得要保存为txt格式,并和python文件放到同一文件夹下(只是为了方便)。 Step2:开始撸码 环境:python3+pycharm+xlsxwriter 上代码: 1 2 3 4 5 6 7 8 9 10 11 ...
目标,统计近一个月来,QQ群在一天24个时间段的发言量。 Step1:获取QQ聊天记录 这个简单无脑了。。。直接导出消息记录即可。详情参考这里。导出时,记得要保存为txt格式,并和python文件放到同一文件夹下(只是为了方便)。 Step2:开始撸码 环境:python3+pycharm+xlsxwriter 上代码: 1 2 3 4 5 6 7 8 9 10 11 ...
制作聊天时间分布图。使用matplotlib展示坐标的一些坑点已经解决。保存图片到本地。 将各个文本合并生成班级主题词云。保存图片到本地。 观察词云的词是否有不该出现的词语,分析原因对数据进行二次去噪。我当时就是因为第一次写的正则没有匹配"2018-05-07 13:48:39 2班xxxxxxx@qq.com...
http://www.cnblogs.com/buzhizhitong/p/5701299.html 这里用python做了一个QQ聊天记录时间的简单分析,感兴趣来看看吧。 这里用到了python3+pycharm+re+xlsxwriter.放张最后的效果图。
1:分析整个聊天记录的时间分配。并且用matplotlib展示出来。并把整个聊天的关键词做成词云。 2:融入snownlp情感分析,分析每个同学的词云分布,每个同学的发言次数情况,以及每个同学文本的情绪走势以及展示。 等等 总的来说就是先试试水,然后再做第二个。用到的库有:jieba分词,wordcloud词云,numpy数组,matplotlib可视化,sn...
之前,写了这篇文章,用python提取全部群成员的发言时间,并简单做了下分析。先补充一下,针对特定单个群成员(这里以 小小白 为例)消息记录的获取。 代码比较简单,主要是正则表达式的书写。(附:聊天文件记录的导出请参考上面提到的文章) 代码如下: #2016/9/14#从QQ聊天数据导出特定人发言的日期时间和发言内容 ...