写了几年代码,看到这些年大数据,AI闹得火热火热,也想系统学习下大数据方面的东西,给自己充电一下。其实随着IT技术的发展,我们行业(地理信息)也已经开始拥抱大数据了。越来越多的带有位置的非结构化的数据需要处理,需要进一步挖掘。好了,废话不多说了。下面开始分享下,学习大数据这门过程中的一些心得。其实,大数据这门...
写了几年代码,看到这些年大数据,AI闹得火热火热,也想系统学习下大数据方面的东西,给自己充电一下。其实随着IT技术的发展,我们行业(地理信息)也已经开始拥抱大数据了。越来越多的带有位置的非结构化的数据需要处理,需要进一步挖掘。好了,废话不多说了。下面开始分享下,学习大数据这门过程中的一些心得。其实,大数据这门...
中科院的ICTCLAS工具是目前国内有名的中文分词工具,分词准确率很高且具有词性标注的功能,在ICTCLAS的官方网站上可以下到最新的免费版供研究使用。前段时间搞情感分类时用了一下,效果不错,不过好像分词结果中没有去掉停用词,如果想去掉停用词的话得自己写个过滤程序,不过这也简单。用了一下,给这个工具的评价很高,可以...