sc.pp.filter_genes(): 过滤低表达基因。 sc.pp.normalize_total(): 数据归一化。 sc.pp.log1p(): 对数据进行对数转换。 2. 降维和聚类 sc.tl.pca(): 主成分分析(PCA)。 sc.pp.neighbors(): 构建邻近图。 sc.tl.leiden(): Leiden聚类算法。 sc.tl.umap(): UMAP降维。 3. 细胞注释 细胞注释是...
from liana.method.sp importRandomForestModel, LinearModel, RobustLinearModel adata = sc.read("test.h5ad") adata.layers['counts'] = adata.X.copy() sc.pp.normalize_total(adata, target_sum=1e4) sc.pp.log1p(adata) sc.pl.spatial(adata, color=[None, 'celltype_niche'], size=1.3, palett...
import scanpy as sc import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 读取表达量矩阵 adata = sc.read_csv('counts.txt', sep='\t', index_col=0) # 数据预处理 sc.pp.normalize_total(adata, target_sum=1e4) sc.pp.log1p(adata) sc.pp.highly_variable_genes(ada...
sc.pp.filter_cells(adata, min_counts=5000) sc.pp.filter_cells(adata, max_counts=35000) adata = adata[adata.obs["pct_counts_mt"] < 20] sc.pp.filter_genes(adata, min_cells=10) 9.归一化/高变基因 sc.pp.normalize_total(adata, inplace=True) sc.pp.log1p(adata) sc.pp.highly_variab...
sc.pp.normalize_total(adata,target_sum=1e4)sc.pp.log1p(adata)adata.raw=adata # 高变基因 sc.pp.highly_variable_genes(adata,n_top_genes=2000)# 归一化 sc.pp.scale(adata)sc.pp.pca(adata)sc.pp.neighbors(adata,n_pcs=15)sc.tl.leiden(adata,flavor="igraph",n_iterations=2,resolution=0.5...
Seurat的NormalizeData函数默认使用的是LogNormalize方法,这个方法首先对每个细胞的基因表达量进行归一化处理,使得每个细胞的总表达量相同(默认是1e4),然后对归一化后的表达量加1后取对数(使用自然对数)。这个过程实质上包含了与Scanpy中sc.pp.normalize_total后跟sc.pp.log1p相似的步骤,只是Seurat将其整合在了一个...
sc.pp.filter_cells(adata,min_genes=200) 去除低表达基因 去除一些在大多数细胞中表达量极低的基因: sc.pp.filter_genes(adata,min_cells=3) 归一化数据 接下来进行数据的归一化,以便更好地进行后续分析: sc.pp.normalize_total(adata,target_sum=1e4)sc.pp.log1p(adata) ...
#sc.pp.filter_genes(adata, min_counts=1) #adata 1. 2. 3. 4. 5. 6. AI检测代码解析 # 这个是第一种读取方法 adata = sc.read_10x_mtx( './filtered_gene_bc_matrices/hg19/', # the directory with the `.mtx` file var_names='gene_symbols', # use gene symbols for the variable name...
sc.pp.normalize_total(adata, target_sum=1e4) # 对数据进行log sc.pp.log1p(adata) # 高变基因 sc.pp.highly_variable_genes(adata, min_mean=0.0125, max_mean=3, min_disp=0.5) # 查看每个基因的指标 adata.var.head() 查看前10个高变化基因(因为scanpy和seurat的高变化基因默认参数不同,所以找出...
sc.pp.normalize_total(adata,target_sum=1e4)# 对数据进行log sc.pp.log1p(adata)# 高变基因 sc.pp.highly_variable_genes(adata,min_mean=0.0125,max_mean=3,min_disp=0.5)# 查看每个基因的指标 adata.var.head() 查看前10个高变化基因(因为scanpy和seurat的高变化基因默认参数不同,所以找出的基因也不...