tips

Some tips used during learning

1、去除含有缺失值的行 gwas <- na.omit(gwas)

2、在一列中添加字母X gwas$chr <- paste("X",gwas$chr,,sep="")

3、R中通过tidyr将两列数据合成一列 gwas <- unite(gwas,"chr_pos",chr,pos,sep = "-" remove= FALSE) 将gwas中的列chr和列pos合并为一列，名为chr_pos，用-隔开，remove为TRUE表示将原来的两列删除，为FALSE表示将原来的两列保留

4、用coloc进行共定位分析 result <- coloc.abf(dataset1=list(pvalues=input$pval, type="cc", s=0.01164, N=2085803), dataset2=list(pvalues=input$pval_nominal, type="quant", N=nrow(eqtl)), MAF=input$maf) 修改s和N对结果的影响不大，因此就算s和N不准确影响也不大

5、使用R中merge()函数合并数据 input <- merge(eqtl,gwas,by = "rs_id",all = FALSE) all为FALSE的含义是仅返回两数据框中匹配的数据行

6、给R中的列重命名默认为dplyr中的rename dplyr和plyr中的rename函数是不一样的 dplyr::rename(data,new=old) plyr::rename(data,c(old=new)) dplyr::rename(d, two=old2, three=old3) plyr::renmame(d,c("old2" = "two","old3" = "three")) alp <- rename(alp,rs_id = snpid)

7、用CMplot画多track的曼哈顿图 CMplot(alp_a2_b2_c2, plot.type="m", LOG10=TRUE, ylim=c(0,80), threshold=c(1e-6,1e-4),multracks = TRUE threshold.lty=c(1,2),threshold.lwd=c(1,1), threshold.col=c("black","grey"), amplify=F, file="jpg",memo="",dpi=1200, file.output=TRUE,verbose=TRUE,cex = 0.1)

8、用subset函数提取数据 subset(data,pval <= 5e-8) 格式为subset(data,列名<数值) 注意这里需要用<=不能用<-

9、用separate函数将一列分解为多列，以某种字符为分隔标志 separate函数是dplyr包里的 gwas <- separate(gwas,col = "chr_position",into = c("chr","pos"),sep = "_",remove = FALSE) remove为FALSE表示不去除原来的列

10、提取GWAS数据中显著性位点的上下游区域 #假定显著位点是rs3131972，他的位置是817341，那么我们提取上下游100kb的位点的话，范围就是chr1:717341-917341,代码就是: gwas_coloc=gwas %>% filter(chr %in% "1") %>% filter(pos>717341 & pos<917341)

11、寻找独立显著位点的方法——使用FUMA鉴定独立SNP和LeadSNP 独立显著位点的p小于5e-8，位点之间的r2小于0.6，r2指的是LD的r2值，不是相关性，0.6是主流，但是也有设置成其他数值的 Lead SNP是独立显著位点中r2小于0l的，同样，只是主流是0.1 FUMA(https://fuma.ctglab.nl/snp2gene)

12、 GRCh38相当于hg38，GRCh37相当于hg19

13、从原始数据中提取某一列为缺失值的行 ALP bad.ALP <- is.na(ALP$variant_id) # bad.ALP为和ALP行数一致的对应的布尔值变量若某一行variant_id这一列为NA则该行对应的布尔值为TRUE 随后提取行 ALP_NA <- ALP[bad.ALP,] # ALP_NA为variant_id这一列为缺失值的行数据 ALP_not_NA <- ALP[!bad.ALP,] # ALP_not_NA为variant_id这一列为非缺失值的行数据

14、R中大小写字母转换 tolower()将大写字母转换为小写字母 toupper()转换为大写字母

15、去除缺失值所在的行 ALP_not_NA_gwas <- na.omit(ALP_not_NA_gwas) na.omit()返回的是去除了缺失值所在的行之后的变量，然后将此变量赋给原变量，即可得到去除了缺失值所在行的变量

16、将两个列完全一致的数据框合并在一起 ALP_not_NA_final <- rbind(ALP_not_NA,ALP_not_NA_gwas)

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
1.jpg		1.jpg
2.jpg		2.jpg
3.jpg		3.jpg
4.png		4.png
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

tips

About

Releases

Packages

zczali4403/tips

Folders and files

Latest commit

History

Repository files navigation

tips

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages