这个GWAS关联分析SNP的数量,关联分析群体的基因组平均连锁距离有关,平均连锁距离越大需要的SNP序列越少; 这个可以用群体遗传进化分析中的LDdecay分析得到群体平均连锁距离。 并不是SNP数量越多越好,因为处在同一个连锁区段的SNP,选取其中一个SNP代表这个单倍型就行。
回答于 2023-01-31 23:30
三代的数据可以用pacbio的isoseq工具得到转录本序列,用cdhit去冗余之后的序列输入PASA就行; 如果觉得三代的质量好就设置这些ID到:FL_accs.txt 注意:gmap和blat,minimap的功能一样。我们的基因注释docker镜像中PASA用gmap比对可能得不到结果,所有没有设置,用minimap和lbat效果一样的 参考: https://github.c...
回答于 2023-01-30 12:16
export LD_LIBRARY_PATH=/share/work/biosoft/python/Python-v3.9.16/lib:$LD_LIBRARY_PATH
回答于 2023-01-29 10:09
检查你的输入文件:popid.txt 里面的样本ID和vcf文件里面的样本ID是不是一致,看看下面这句提示 sub Group Population szie is too small, SubGroup sample size: 0
回答于 2023-01-26 09:52