覆盖20068份拟南芥成绩单组数据,翟继贤研究组开发了google风格的查询工具

来源:网络  时间:2020-09-21 18:12:52

在过去的十年里,随着测序成本的降低和文库建设方法的发展,RNA-seq已成为研究基因芯片后基因表达的金标准。到目前为止,公共数据库发布的...

在过去的十年里,随着测序成本的降低和文库建设方法的发展,RNA-seq已成为研究基因芯片后基因表达的金标准。到目前为止,公共数据库发布的与拟南芥相关的rna-seq库的数量已经超过了20000。这些海量的数据资源为研究不同发育阶段的基因转录调控、组织特异性、应激处理和基因表达提供了有价值的资源。然而,如何有效地利用如此大量的高通量测序数据资源,对于研究人员来说是一个巨大的挑战,特别是对于缺乏编程基础或缺乏计算资源的研究团队的研究人员而言。

2020年8月4日,南方科技大学生物系植物与食品研究所研究组翟继贤发表了在线资源,可以快速查询2万多个分子植物公共rna-seq库。这篇论文的题目是acomprehensiveonlinedatabaseforexploring~20000publicarabidopsisrna-seqlibraries.该数据库(arabidopsisrna-seqdatabase,ars)集成了来自geo、sra、ena和ddbj数据库的20068个拟南芥rna-seq数据,并提供了一个在线的google风格的查询工具。本研究对所有文库进行了定量分析和共表达网络分析,并对所有文库进行了分类,共涉及1176个突变体、1102个处理条件、12个组织和176个发育阶段。同时,对突变体和处理条件进行了分析,并与相应的对照组进行了比较。

图1:Web数据集和功能描述(上图)、主页和部分按钮描述(下图)

为了提高实验人员搜索海量数据的效率,ARS不仅支持基因搜索,而且还提供库、项目编号、关键字和任何不同的查询方法组合。ARS具有快速发现基因表达、组织特异性、突变和加工响应的功能,并以多种图表返回搜索结果,同时支持搜索结果的下载。用户可以根据自己的需要,在搜索前后对表格的结果进行过滤,并点击绘图区域获取相应库的信息。此外,该网站还部署了一个在线基因组浏览器(IGV),使实验室更容易查看每个库的详细比较。为了在研究人员之间快速共享最新的搜索结果,ARS提供网页共享功能,并定期更新图书馆资源。研究人员可以通过共享按钮来分享当前的结果。

图2:基因表达结果显示(图),IGV显示视图序列对齐(图下)

南方科技大学生物系副教授翟继贤是论文的传播者,研究助理张红、研究助理张飞、博士生于一明为第一作者。郭宏伟教授和生物系助理李波生教授参与了部分研究工作。该研究由基金委员会、广东省创新和创业团队以及深圳科技创新委员会资助。

https://www.cell.com/molecular-plant/fulltext/s1674-2052(20)30257-4

翟继贤研究组主页上的季先斋链接:

www.jixianzhai.org

贡献:翟继贤研究组

文字,图片:张红,余一明

[资料来源:生物艺术植物]

声明:本文转载是为了传递更多的信息。如果有源标记错误或侵犯您的合法权益,请持有所有权证书联系本网络,我们将及时更正和删除,谢谢。电子邮件地址:newmedia@xxcb.cn