Google Books Ngrams:Google Books中的一系列文字。 https://aws.amazon.com/datasets/google-books-ngrams/ Blogger Corpus:收集了来自blogger.com的681,288篇博文,每篇博文至少包含200个常用英语单词。 http://u.cs.biu.ac.il/~koppel/BlogCorpus.htm 维基百科链接数据:维基百科的全文,包含来自400多万篇文章的...
Google Books Ngrams:https://aws.amazon.com/datasets/google-books-ngrams/。来自Google图书的一系列文字。 Blogger Corpus:http://u.cs.biu.ac.il/~koppel/BlogCorpus.htm。收集来自blogger.com的681,288篇博客文章。每个博客至少包含200个常用英语单词。 维基百科链接数据:https://code.google.com/p/wiki-li...
google.com -173.194.38.131 answers.google.com -173.194.38.131 apis.google.com -173.194.38.131 appengine.google.com -173.194.38.131 apps.google.com -173.194.38.131 appspot.l.google.com -173.194.38.131 bks0.books.google.com -173.194.38.131 bks1.books.google.com -173.194.38.131 bks10.books.google...
(http://www.csuldw.com/2016/11/05/2016-11-05-simulate-zhihu-login/) -- WSpider.pu:封装的WSpider类,包括日志输出函数 +- SinaLogin:模拟登录新浪微博,详细步骤参见[模拟新浪微博登录-原理分析到实现](http://www.csuldw.com/2016/11/10/2016-11-10-simulate-sina-login/) +- ZhiHuPro:模拟登录...
https://trends.google.com/trends/explore 好搜指数 http://index.so.com/ 微博指数 http://data.weibo.com/index 网络消费指数 https://research.antgroup.com/research/consumeScale.htm 头条指数 https://index.toutiao.com 微信指数 微信指数只能在微信客户端使用,微信搜索框中输入“微信指数”搜索使用。
mdBook - A command line utility to create books from markdown files Mega - A monorepo & monolithic codebase management system that supports Git, also is an unofficial open source implementation of Google Piper. mirrord - Connect your local process and your cloud environment, and run local code...
基础应用:搜索引擎:匹配query和document相似度(文本匹配)、返回相关广告、知识图谱;智能音箱;机器翻译;情感分类和意见挖掘;与社会科学交叉(Google Book N-gram:链接); NLP基本问题:词的表示问题 词的表示问题:把词转换成机器能理解的词 目标:完成词之间的相似度计算、发现词之间的语义关系; ...
Google Books Ngrams:Google Books中的一系列文字。 https://aws.amazon.com/datasets/google-books-ngrams/ Blogger Corpus:收集了来自blogger.com的681,288篇博文,每篇博文至少包含200个常用英语单词。 http://u.cs.biu.ac.il/~koppel/BlogCorpus.htm ...
Google Books Ngrams:Google Books中的一系列文字。 https://aws.amazon.com/datasets/google-books-ngrams/ Blogger Corpus:收集了来自blogger.com的681,288篇博文,每篇博文至少包含200个常用英语单词。 http://u.cs.biu.ac.il/~koppel/BlogCorpus.htm ...