采用新一代高通量测序技术Illumina HiSeq 2000对鸟巢蕨转录组(Asplenium nidus)进行测
序,共获得29 254 595个序列读取片段(reads),包含了5 908 586 517个碱基序列(bp)信息。对reads
进行序列组装,共获得42 907个单基因簇(Unigene),平均长度936 bp,序列信息达到了40.16 Mb。数
据库中的序列同源性比较表明,24 993个Unigene与其他物种的已知基因具有不同程度的同源性。鸟巢蕨
转录组中的Unigene根据GO功能大致可分为细胞组分、分子功能和生物学过程3大类51个分支,其中
有大量的Unigene与代谢进程、结合活性、催化活性和细胞进程相关。将Unigene与COG数据库进行比
对,根据其功能大致可分为24类。KEGG数据库作为参考,依据代谢途径可将Unigene定位到116个代
谢途径分支。SSR位点查找发现,从42 907个Unigene中共找到6 067个SSR位点。SSR不同重复基序
类型中,出现频率最高的为AG/CT,其次是AC/GT、A/T和AGG/CCT。针对这些序列,设计了20对引
物进行了扩增效率和多态性检测,其中7对引物在不同蕨类材料中表现出多态性。