尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着新一代测序技术的发展,越来越多的基因组正在或将要被测序,使得搭建良好的基因组注释平台变得日益重要。随着基因组学相关研究的深入,RNA基因、重复序列等元件的注释已成为真核基因组注释流程中的重要组成部分。重复序列中的转座元件在基因组进... 展开 随着新一代测序技术的发展,越来越多的基因组正在或将要被测序,使得搭建良好的基因组注释平台变得日益重要。随着基因组学相关研究的深入,RNA基因、重复序列等元件的注释已成为真核基因组注释流程中的重要组成部分。重复序列中的转座元件在基因组进化中扮演着重要角色,它们在植物中含量非常高。本文首先在新测序的黄瓜基因组中搭建了流程化的RNA基因和重复序列的注释平台,而后将转座元件的注释扩展到7种测序植物基因组中,并展开了大系统发育尺度上的转座元件的比较研究。 我们首先基于黄瓜基因组进行了RNA基因和重复序列注释平台的搭建。RNA基因注释采用BLAST、tRNAscan-SE、Snoscan和INFERNAL软件,对rRNA、tRNA、snoRNA、snRNA和miRNA基因进行了预测,共获得1,592个RNA基因序列。对于两类重复序列,我们使用Tandem Repeats Finder对串联重复序列进行了简单识别和分类;而转座元件(transposable elements,简称TEs)的注释则采用了基于相似性的方法和de novo方法相结合的策略,为此,我们首先构建了一个黄瓜特异的de novo TE库,并对其进行逐级分类,然后整合多个已知TE数据库在全基因组水平上进行注释,共预测了72,291条串联重复序列和232,938条转座元件序列,它们在黄瓜基因组中的含量分别为4.31%和24.22%。 基于已经搭建的流程化的注释平台,我们将转座元件的注释扩展到7种测序植物基因组(拟南芥、木瓜、黄瓜、葡萄、水稻、杨树和高梁)中,获得了统一标准的TE注释数据集;而后基于相似性对TE序列进行统一的家族(family)分类;将TE的各分类等级分别映射到物种分类树和TE分类树上,对各基因组的TE相对含量进行分析。结果发现,TE家族的数量有随基因组大小增大而增加的趋势;各基因组中子类(subclass)水平上较高的TE含量一般是由于不同的超家族(superfamily)所贡献;共有的TE家族在基因组间的共享比率在单子叶和双子叶植物中有比较明显的不同,而特异TE家族的扩增与物种发育无明显关系。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。