从品牌网站建设到网络营销策划,从策略到执行的一站式服务
本篇内容介绍了“如何使用TCGAbiolinks下载TCGA的数据”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
天桥网站建设公司创新互联,天桥网站设计制作,有大型网站制作公司丰富经验。已为天桥1000多家提供企业网站建设服务。企业网站搭建\外贸营销网站建设要多少钱,请找那个售后服务好的天桥做网站的公司定做!
TCGAbiolinks是一个分析处理TCGA数据的R包,通过GDC API来查询和下载TCGA的数据,同时提供了差异分析,生存分析,富集分析等常见的分析功能,网址如下
http://bioconductor.org/packages/release/bioc/html/TCGAbiolinks.html
这个R包的基本用法如下
和在线查询类似,只不过是将网页上的各种可选的属性变成了对应的参数,基本用法如下所示
以project
为核心进行查询, 其他参数用来对数据进行过滤,常用的有以下几个参数
datga.category
data.type
workflow.type
experimental.strategy
platform
access
以上参数和和网页上的的各项选择菜单相对应,示意如下
除此之外,还有几个重要参数,legacy
参数的默认值为FALSE
,表示从harmonized database进行查询,TRUE
表示从 GDC legacy archive进行查询;barcode
参数用于选择其中部分样本的数据。
查询结果的基本单位为Files, 可以通过以下代码进行查看
datatable(getResults(query))
结果是一个html的表格,通过网页进行查看,每行代表一个表格,示意如下
除了查看检索结果外,还可以下载检索结果,用法如下
这里分成了两个步骤,第一步从GDC下载原始数据,可以使用API或者gdc-clinet进行下载, API的速度相对快一点;第二步对原始数据的结果进行整理,从GDC下载的原始数据是每个文件单独分开的,需要先对结果进行整理,才可以用于后续分析。以表达谱数据为例,需要进行样本的合并,样本ID的转换等,所有这些都可以通过GDCprepare
完成。
整理好的结果存放在data
对象中, 样本的信息可以通过如下方式进行查看
结果示意如下
表达量矩阵的信息查看方式如下
结果示意如下
数据下载并整理好之后,就可以进行分析了。不同类型的数据对应的分析方法也不同,具体的分析方法请参考官方文档。
“如何使用TCGAbiolinks下载TCGA的数据”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站,小编将为大家输出更多高质量的实用文章!
成都网站建设公司地址:成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网! | 成都网站建设哪家好? | 网站建设地图