简介 离散化 —— 把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率,即:在不改变数据相对大小的条件下,对数据进行相应的缩小。 离散化本质上可以看成是一种 \(哈希\),其保证数据在哈希以后仍然保持原来的 全/偏序 关系。 描述 离散化用于处理一些个
离散化是指,将无限的数据,映射到有限的空间中并保留原来的全 /偏序关系。 举个例子: 一维数据 二维数据 (每个维度分别做离散化) 字符串 (按照字典序排列) 实现原理 以下以一维数组给出示例,将数据离散化到[0, n-1]的范围 例: 观察发现10 -> 4,3 -> 0,8 -> 2,9 -> 3,4 -> 1这正式排序后的...
离散化是离散数学中的概念。离散化算法,指把无限空间中的离散数据映射到一个有限的存储空间中,并且对...
离散化(discretization)可以理解为一种哈希映射,把无限空间中有限的个体映射到有限的空间中去。 具体来说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。 如下述数据: html 原数据 : 20, 9, 1000, 4009离散化后数据: 2, 1, 3, 4 ...
1.什么是离散化 数据离散化是一个非常重要的思想。 为什么要离散化?当以权值为下标的时候,有时候值太大,存不下。 所以把要离散化的每一个数组里面的数映射到另一个值小一点的数组里面去。 打个比方,某个题目告诉你有104个数,每个数大小不超过1010,要你对这些数进行操作,那么肯定不能直接开1010大小的数组,但...
一、等宽离散化 等宽离散化是指将数据按照相同的区间长度进行划分,每个区间代表一个取值范围。该方法适用于数据较为均匀分布的情况下。 步骤: 1. 确定划分区间数k,计算出每个区间的长度l=(max-min)/k。 2. 将数据按照大小排序,并将其划分为k个区间。 3. 对于落在某个区间内的数值,都赋予相同的标识符或编码...
离散化是一种将连续数据离散化为有限个数值的技术,主要应用于数据压缩、分类和聚类等领域。它的目的是将连续的数据转化为离散的数据,便于统计和分析。例如,在金融行业中,对于连续的股票价格数据,离散化可将其转化为五分钟或十分钟的时间片段,以便于分析行情。离散化的方法可以分为无监督和有监督两种...
比如说有100个数据,要离散成5个区间,那每个区间就大概有20个数据。它会根据数据的排序,然后按照数量来划分区间。这就好比是量体裁衣,根据数据的实际情况来确定区间。不过这个方法计算起来可能会稍微复杂一点,不像等宽离散化那么直来直去。 2.2 适用场景。 等频离散化在数据分布不均匀的时候就大显身手了。如果数据...
离散化,简单来说,是将连续的无限空间中的数据映射到一个有限的区间内,以此提高算法的效率。在我的理解中,离散化就像一场数字版的缩小游戏,它保持了原始数据间的相对大小关系,而不会改变数据的内在性质。为了更准确地阐述,我们来看看标准定义:离散化是一种将连续空间中的数据转化为离散状态的技术...