昆虫学报 ›› 2016, Vol. 59 ›› Issue (6): 622-631.doi: 10.16380/j.kcxb.2016.06.005
刘柏琦, 乔梁, 许柏英, 郑学令, 陈斌*
LIU Bai-Qi, QIAO Liang, XU Bo-Ying, ZHENG Xue-Ling, CHEN Bin*
摘要: 【目的】鉴定中华按蚊Anopheles sinensis基因组上的CPF家族表皮蛋白基因,分析其基因结构和特征,推测其可能的生物学功能;同时比较研究代表性蚊种的CPF家族基因,提供CPF家族基因的信息框架。【方法】基于中华按蚊An. sinensis、冈比亚按蚊An. gambiae、微小按蚊An. minimus、埃及伊蚊Aedes aegypti、致倦库蚊Culex quinquefasciatus和黑腹果蝇Drosophila melanogaster全基因组序列,以冈比亚按蚊CPF家族基因序列为询问序列,采用BLASTP,TBLASTN和HMM方法鉴定这些物种的CPF家族基因;利用生物信息学方法预测中华按蚊CPF家族基因的结构、剪切模式、信号肽、跨膜区、结构域和3D结构等;采用最大似然法(maximum likelihood, ML)构建这些物种的系统发生关系,推断CPF家族基因的起源和进化。【结果】中华按蚊、冈比亚按蚊、微小按蚊、埃及伊蚊、致倦库蚊和黑腹果蝇全基因组共有4, 4, 4, 3, 3和3个CPF家族基因。中华按蚊的CPF基因被分别命名为AsCPF1,AsCPF2,AsCPF3和AsCPF4,这些AsCPF基因的全长cDNA序列分别为736,2 021,531和1 001 bp,分别编码219,345,148和185个氨基酸。AsCPF1,AsCPF2和AsCPF3仅含有一个内含子,但AsCPF4含有3个内含子,所有内含子均为0位内含子。AsCPF1, AsCPF2, AsCPF3和AsCPF4分别有3, 2, 1和2个不同的选择性剪切子。AsCPF3的表达量最高,其次是AsCPF4,AsCPF2和AsCPF1。推测的AsCPF1,AsCPF2,AsCPF3和AsCPF4的理论分子量分别为22.86,36.47,15.08和18.66 kD,等电点分别为9.08,8.97,9.44和9.16。AsCPF家族蛋白含有保守的44个氨基酸基序和C-末端基序;AsCPF1, AsCPF3和AsCPF4具有信号肽,为分泌型蛋白,而AsCPF2缺乏信号肽,为非分泌蛋白。二级结构分析显示,4个AsCPF均具有α-螺旋,无规卷曲和延伸链,只有AsCPF4有一段跨膜片段,位于第5-27位氨基酸。系统发育分析显示,CPF3基因可能是最早分化出来的CPF家族基因,CPF1和CPF2基因可能是同一祖先基因经过一个基因重复事件分化形成的,CPF4基因很可能是按蚊所特有的,是最晚分化出来的CPF基因。以冈比亚按蚊为对照,替换率分析显示,中华按蚊CPF表皮蛋白的Ka/Ks值均小于1,表现出纯化选择。【结论】对中华按蚊CPF家族基因在全基因组上的鉴定和特征分析,及对代表性蚊虫CPF家族基因的比较分析,揭示了蚊虫CPF家族基因的多样性、结构和氨基酸特征以及起源和进化,这为该家族基因的进一步研究和利用提供了信息基础。