首先说明概念1:版本空间(version space)是概念学习中与已知数据集一致的所有假设(hypothesis)的子集集合。即是版本空间是假设空间中于样本满足一致的“假设集合”, 是基于样本决定的。 GB 是最大泛化正假设边界(maximally General positive hypothesis Boundary); SB 是最大精确正假设边界(maximally Specific positive hyp...
1.假设空间 监督学习(supervised learning)的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。 模型属于由输入空间到输出空间的映射的集合,这个集合就是假设空间(hypothesis space)。 我们也可以将学习过程看作一个在所有假设组成的空间中进行搜索的过程,搜索目...
版本空间(version space)是概念学习中与已知数据集一致的所有假设(hypothesis)的子集集合。 对于二维空间中的“矩形”假设(上图),绿色加号代表正类样本,红色小圈代表负类样本。 GB 是最大泛化正假设边界(maximally General positive hypothesis Boundary), SB 是最大精确正假设边界(maximally Specific positive hypothesis...
归纳是从特殊到一般的“泛化”,演绎是从一般到特殊的“特化” B. 对于西瓜来说,若色泽、根蒂、敲声皆有3种取值,加上某种属性什么都不取和没有好瓜这个概念,则好瓜的假设空间共有4 X 4 X 4 + 1 =65种假设(规则) C. 与训练集一致的假设的集合称为“版本空间” D. 对新样本,不同假设可能输出不...
芝诺的乌龟悖论存在逻辑陷阱 | 由该悖论推导出时间与空间无法无限细分是不合理的。 把龟人赛跑放到现实当中看。由于乌龟提前跑了一段路程,即便人的速度>龟的速度依然会落后与龟一段时间(a)而后持平乌龟(b)最终超越乌龟(c)。芝诺的乌龟悖论(至少网传版本)存在逻辑陷阱。该悖论中并非人无法超越乌龟,而是悖论本身将...
假设空间:所有属性的可能取值所组成的集合, 比如西瓜:色泽属性可取(青绿,乌黑,浅白,*),根蒂属性可取(蜷缩,稍蜷,硬挺,*),敲声属性可取(浊响,清脆,沉闷,*),以及好瓜假设不存在。即西瓜问题的假设空间大小为(4*4*4+1=65)。 版本空间:根据已获取的信息(数据集)对假设空间进行剪枝,即找到一个与数据集匹配的...
版本空间是指能够拟合训练数据的模型集合(函数集合),以上例为基础,假设给定x=1,y=3,那么能够拟合该数据的有1和2两个函数,显然版本空间由于训练数据的引入是包含于假设空间的,但是版本空间的大小同样可能无穷大,为了说明该问题引用周志华的西瓜书插图: 现在将定义域和值域放到实数集上,能够拟合图中6个数据点的曲线理...
首先说明概念1:版本空间(version space)是概念学习中与已知数据集一致的所有假设(hypothesis)的子集集合。即是版本空间是假设空间中于样本满足一致的“假设集合”, 是基于样本决定的。 GB 是最大泛化正假设边界(maximally General positive hypothesis Boundary); ...