不可以。 虽然microRNA 的转录也会有ployA这样的结构,理论上通过转录组测序,能检测到miRNA前提的转录本,但是: 1. 常规转录组建库,筛选的片段都在大于200bp, 很多miRNA的前天就被筛掉了 2. miRNA的前体会进行加工剪切为成熟的micoRNA。 成熟的microRNA才是起功能作用的分子。
回答于 2018-07-11 13:21
这个的原因是,临床信息非常的复杂,有不同格式的文件,而我们需要下载的patient对应的格式只有XML格式,所以需要在GDCquery 时指定file.type="xml" 即可。 project <- "TCGA-COAD" data_category <- "Clinical" data_type <- "Clinical Supplement" file_type = "xml" legacy <- FALSE query <- GDCquery...
回答于 2018-07-11 10:39
问题分析: 出现这种情况,一般可能是由于工作目录下的manifest 文件(记录下载那些数据需要下载)中的ID 不对。 解决方案: 1. 建议将目录中下载相关的文件和文件夹都删除,重新下载数据 2. 或者换一个新的工作目录去下载数据
回答于 2018-07-10 17:02
lncRNA(long noncoding RNA): 长链非编码RNA主要的一点,就是无法编码一个完整的蛋白质,基于这个特点,有很多方法可以对蛋白编码潜能进行预测,比如序列相似性,密码子的分布情况等特征,再结合一些机器学习的算法,基于这些特征进行预测。1. CPC 2. CPAT 3. CNCI 4.phyloCSF
回答于 2018-07-10 12:42
这个需要了解一下TCGA的样品编码方式(barcode): 其中sample 指示的位置,标记了不同的样品类型,具体如下表所示: 01 Primary Solid Tumor TP(实体瘤)02 Recurrent Solid Tumor TR03Primary Blood Derived Cancer - Peripheral Blood TB (血液相关癌)04Recurrent Blood Derived Cancer - B...
回答于 2018-07-10 10:46
这个需要了解一下TCGA的样品barcode编码方式:如果是临床信息的话,记录的是每一个病例的临床信息,也就是说,其barcode长度为前12位。 如果是基因表达文件的话,记录的是每一个病例的不同组织样品的基因表达情况,其barcode为15位。 所以只需要将基因表达文件中的barcode 提取前12位,就可以得到病例的编号。
回答于 2018-07-10 10:35
stingtie -h 可以查看使用帮助 root@c5809ddb4597: stringtie -h StringTie v1.3.0 usage: stringtie <input.bam ..> [-G <guide_gff>] [-l <label>] [-o <out_gtf>] [-p <cpus>] [-v] [-a <min_anchor_len>] [-m <min_tlen>] [-j <min_anchor_cov>] [-f <min_iso...
回答于 2018-07-10 09:47
转录因子(Transcriptionfactor,TF)是一个能与特异DNA序列结合的蛋白,可以单独或与其他蛋白形成复合体,提高或阻断特性基因对RNA聚合酶的招募,调控着基因的表达。转录因子特点是它包含一个或多个DNA结合域(DNA-binding domain, DBDs),通过这些结合域与基因附近的DNA序列结合,从而完成调控 可以参考我的文章《什么是...
回答于 2018-07-04 13:39