scikit-learn-doc-cn sklearn库作为目前机器学习非常流行的python库,一个易读的文档更有助于工具库的理解和使用,虽然做机器学习方面的学生和工程师阅读英文并没有很大压力,但是在阅读速度上还是会有些影响。 寻找已久没找到相关的中文文档,而且翻译的过程也是对知识熟悉的过程,您可以在学习某一个章节的过程顺便翻译
self.wnl = WordNetLemmatizer() ... def __call__(self, doc): ... return [self.wnl.lemmatize(t) for t in word_tokenize(doc)] ... >>> vect = CountVectorizer(tokenizer=LemmaTokenizer()) # doctest: +SKIP (请注意,这不会过滤标点符号。)例如,以下例子将英国的一些拼写变成美...
scikitlearn学习笔记..doc,简介: 主要特点: scikit-learn安装:(ubuntu版本14.04.1) Classification 2 1.监督学习 1.1广义线性模型: 1.2 支持向量机 1.3 随机梯度下降 1.4 最近邻 1.5 Gaussian Processes 13 1.6 Cross decomposition 14 1.7 Naive Bayes 14 1.8 Decisi
贡献者: https://github.com/apachecn/scikit-learn-doc-zh#贡献者 关于我们: http://www.apachecn.org/organization/209.html 1.9. 朴素贝叶斯 朴素贝叶斯方法是基于贝叶斯定理的一组有监督学习算法,即“简单”地假设每对特征之间相互独立。 给定一个类别 和一个从 到 的相关的特征向量, 贝叶斯定理阐述了...
贡献者:https://github.com/apachecn/scikit-learn-doc-zh#贡献者 关于我们:http://www.apachecn.org/organization/209.html 注意: 正在翻译中 。。。 2.2. 流形学习 Look for the bare necessities The simple bare necessities Forget about your worries and your strife ...
贡献者:https://github.com/apachecn/scikit-learn-doc-zh#贡献者 关于我们:http://www.apachecn.org/organization/209.html 4.2. 特征提取 模块sklearn.feature_extraction可用于提取符合机器学习算法支持的特征,比如文本和图片。 Note 特征特征提取与特征选择有很大的不同:前者包括将任意数据(如文本或图像)转换为...
贡献者: https://github.com/apachecn/scikit-learn-doc-zh#贡献者 1.1. 广义线性模型 下面是一组用于回归的方法,其中目标期望值 y是输入变量 x 的线性组合。 在数学概念中,如果 是预测值 value.在整个模块中,我们定义向量 作为coef_ 定义作为intercept_. ...
贡献者:https://github.com/apachecn/scikit-learn-doc-zh#贡献者 关于我们:http://www.apachecn.org/organization/209.html 1.8. 交叉分解 交叉分解模块主要包含两个算法族: 偏最小二乘法(PLS)和典型相关分析(CCA)。 这些算法族具有发现两个多元数据集之间的线性关系的用途:fitmethod (拟合方法)的参数X和Y...
[译] scikit-learn(sklearn) 中文文档 && 示例 (感谢社区翻译人员) 翻译 https://github.com/apachecn/sklearn-doc-zh 示例 https://scikit-learn.org/stable/
如果