过去绘制学习曲线都是以算法类的某个参数的取值为横坐标,今天来使用sklearn中自带的绘制学习曲线的类learning_curve,在这个类 中执行交叉验证并从中获得不同样本量下的训练和测试的准确度。 #首先导入需要的模块和库 import numpy as np import matplotlib.pyplot as plt from sklearn.naive_bayes import Gaussi...
from sklearn import datasetsiris = datasets.load_iris()from sklearn.naive_bayes import GaussianNBgnb = GaussianNB()y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)print("Number of mislabeled points out of a total %d points : %d" % (iris.data.shape[0],(iris.target != y_p...
score(X,y[,sample_weight]):基于报告决定系数\(R^2\)评估模型。 set_prams(**params):创建模型参数。 二、GaussianNB GaussianNB模型类似于MultinomiaNB模型,两者区别之处在于,前者更适合解决特征值为连续值,而后者更适合解决特征值为多元离散值的情况。 三、Bernoulli Bernoulli模型类似于MultinomiaNB模型,两者区...
class sklearn.naive_bayes.GaussianNB(priors=None) priors:先验概率大小,如果没有给定,模型则根据样本数据自己计算(利用极大似然法)。 对象 class_prior_:每个样本的概率 class_count:每个类别的样本数量 theta_:每个类别中每个特征的均值 sigma_:每个类别中每个特征的方差 多项式分布贝叶斯 适用于服从多项分布的特征...
fromsklearn.naive_bayesimportGaussianNB clf=GaussianNB()#拟合数据clf.fit(X,Y)#进行预测clf.predict([[-0.8,-1]]) 2.2. MultinomialNB类 MultinomialNB假设特征的先验概率为多项式分布,即如下式: MultinomialNB参数比GaussianNB多,但是一共也只有仅仅3个 ...
classsklearn.naive_bayes.GaussianNB(priors=None) priors:先验概率大小,如果没有给定,模型则根据样本数据自己计算(利用极大似然法)。 对象 class_prior_:每个样本的概率class_count:每个类别的样本数量theta_:每个类别中每个特征的均值sigma_:每个类别中每个特征的方差 ...
模型越简单#logistic回归log=LogisticRegression(C=1)#C是正则化强度的权衡系数,C越大,模型较复杂,拟合效果越好,但可能出现过拟合#线性支持向量机linearSVC=LinearSVC(C=10)#C是正则化强度的权衡系数,C越大,模型较复杂,拟合效果越好,但可能出现过拟合#朴素贝叶斯分类器 GaussianNB(连续数据)、BernoulliNB(二分类数据)...
最后通过评定参数accuracy_score、recall_score、f1_score,print预测值与标记值的准确率 from sklearn.metrics import accuracy_score,recall_score,f1_score from sklearn.naive_bayes import GaussianNB,BernoulliNB #用贝叶斯方法时,数据为离散值的情况下可能表现会更好一些...
fromsklearn.naive_bayesimportGaussianNB gsn=GaussianNB()''' __init__函数 def __init__(self, priors=None): self.priors = priors priors=None,先验概率 用法: gsn.fit(X_train, y_train) y_pred = gsn.predict(X_test) ''' 12. 逻辑回归 ...