技术专题
蛋白质组和转录组联合研究果蝇生命发育周期
文章来源:genecreate
作者:genecreate
发布时间:2018-09-26 16:41
题目:the developmental proteome of drosophila melanogaster
黑腹果蝇发育蛋白质组学研究
期刊:genome research
影响因子:10.101
主要技术:label free,转录组
研究背景
果蝇(drosophila melanogaster)是用于研究发育和衰老的最佳模式生物。在其生命周期中,它的发育阶段包括胚胎、幼虫、蛹和成体,经历了完整的表型变态。目前虽然已经在rna水平上对果蝇进行了深入研究,但仍然缺少涵盖整个生命周期的全面蛋白质组学研究。
研究内容及结果
1. 果蝇整个生命发育周期的蛋白质组学分析
作者选择了果蝇整个生命发育周期(胚胎、幼虫、蛹、成虫)中15个代表性时间节点的全动物样本进行label free蛋白质组学分析(图1a),每个时间节点进行4次生物学重复,每个重复样本进行5h深度质谱上机检测。因在果蝇幼虫阶段的食物中包含酵母蛋白,作者在质谱下机数据搜库分析中分别选用了酿酒酵母和果蝇的数据库。在本次实验中,作者共鉴定到9627个蛋白质,其中1078个酵母蛋白质(几乎完全局限于幼虫阶段)和8549个果蝇蛋白质(图2a)。随后作者选择了至少有两次重复鉴定到的蛋白(7952个)进行层次聚类分析和pca分析,发现在同一时间点内重复样品具有非常高的相关性(r = 0.84-0.98),而且pca分析有很清晰的蛋白聚类,表明作者的实验条件从生物系统到质谱测量具有非常高的重现性(图1,图2)。
图1 果蝇发育生命周期蛋白质组学分析
图2 label free蛋白鉴定及相关性分析
2. 核心蛋白质组及蛋白表达动态变化
作者发现,有4627个蛋白质存在果蝇整个生命发育周期中(图3a)。随后,对这些连续表达的蛋白进行go注释富集分析,研究它们主要参与的功能(图3b),结果显示这些核心蛋白富含代谢和细胞过程中的基本活动。作者又分析了所有蛋白质的发育表达动力学,有1386个蛋白在果蝇的整个生命周期中稳定表达,如微管蛋白、肌动蛋白、热休克蛋白等。
图3 果蝇发育蛋白质组表征
3. 发育进程中差异蛋白分析
为了研究不同发育阶段表达特异性蛋白,作者进行了anova分析(fdr <0.01),发现有1535个差异表达蛋白。go富集分析结果显示,与有丝分裂调控、细胞周期、发育所需的激酶系统相关的蛋白得到显著富集(图4a)。基于上述结果,作者分离了早期和晚期胚胎发生阶段:早期阶段(0-6小时)的特征在于参与细胞骨架组织、微管结合蛋白的蛋白质的高表达;晚期阶段(12-20h)的特征在于参与组织形态发生的蛋白质高表达(图4b)。在幼虫和蛹阶段,角质层蛋白和表皮蛋白等出现高表达,成虫阶段则是气味结合蛋白(obp83b、obp57a)、参与肌肉收缩的蛋白质(flightin(fln)、eaat1)、涉及光感和光转导的蛋白质(arr1和arr2)和视网膜变性蛋白a(rdga)高度表达(图4b)。总体而言,作者将蛋白质表达与果蝇发育过程中形态学变化有效联系起来。
结合转录组数据,作者发现蜕皮激素诱导的基因家族71e(eig71e)在蛹阶段中mrna表达水平和蛋白质的表达谱之间存在有趣的差异:eig71e家族的mrna表达在早期蛹阶段三个时间节点可以检测到(l3c节点的eig71ee,p1节点的eig71ed,p2节点的eig71ek),但相应的eig71e蛋白显示延长高表达水平直至p5节点(图4c,d)。而大多数情况下,在单个时间点检测蛋白质,其rna在多个时间点可检测到(图 3e)。综上所述,转录组学可能不能直接预测蛋白质水平,这表明蛋白质组数据用于研究果蝇发育的必要性。
图4 不同发育阶段相关蛋白分析
4. 成年果蝇性别特异性蛋白模式的比较
性别特异性蛋白质一直是研究的重点,因此,作者将果蝇成虫时间节点的蛋白质组学数据与已有的silac数据集进行了比较,发现性别特异性蛋白质高度重叠(r = 0.84),表明作者的发育蛋白质组囊括了以前的研究。此外,作者发现308个雄性和374个雌性相关特异性蛋白质(图5a)。雄性特异性蛋白包括精子特异性鞭毛蛋白(tektin-a、tektin-c)和雄性发育中起作用的蛋白质(lectin-46ca、lectin-46cb、lectin-30a)等,雌性特异性蛋白中包括卵黄膜(vm32e)、绒毛蛋白(cp15,cp18、cp36)、卵黄蛋白原(yp1、yp2、yp3)和脂肪酸去饱和酶fad2等。
图5 性别特异性蛋白质组分析
5. 比较转录组和蛋白质组以研究转化延迟
作者将胚胎发育蛋白质组与转录组进行了联合分析比较,结果表明,胚胎发生过程中一般蛋白质复杂性增加(图6a),转录组与蛋白质组只有中等相关性(最大r = 0.5),并且最佳相关性是非同步的,蛋白组延迟约4-5h(图6b)。通过多维缩放然后聚类分析,作者将mrna /蛋白质表达谱分组成六个簇(图 6c)。在大多数情况下,mrna表达在早期时间点更丰富,而蛋白质表达在后期达到峰值。除了簇1之外,剩余的簇说明了胚胎发生过程中mrna和蛋白质的不同行为。在第5和第6簇中观察到时间蛋白质组延迟:当rna表达在约7小时达到峰值时,蛋白质在胚胎发生后期稳定上调,这可能是由于翻译控制机制。
图6 转录组和蛋白质组联合分析
文章小结
作者完成了果蝇的胚胎发育和整个生命周期高质量的蛋白质组数据集,缩小了蛋白质表达系统发育研究的空白。此外,与可用的转录组数据的比较,揭示了mrna和蛋白质之间差异相关性,强调了蛋白质组学在研究发育中的重要性。胚胎发生蛋白质组与组织特异性数据的整合揭示胚胎发育的时空特异性,可用于进一步研究功能尚未表征的蛋白质。
解析文献
casas-vila n, bluhm a, et al. the developmental proteome of drosophila melanogaster. genome research, 2017 , 27 (7) :1273
参考文献
1. butter f, bucerius f, et al. comparative proteomics of two life cycle stages of stable isotope-labeled trypanosoma brucei reveals novel components of the parasite’s host adaptation machinery. mol cell proteomics. 2013, 12: 172–179.
2. cox j, hein my, et al. accurate proteome-wide label-free quantification by delayed normalization and maximal peptide ratio extraction, termed maxlfq. mol cell proteomics.2014, 13: 2513–2526.
3. dejung m, subota i, et al. quantitative proteomics uncovers novel factors involved in developmental differentiation of trypanosoma brucei. plos pathog. 2016, 12: e1005439.
4. fabre b, korona d, et al. analysis of drosophila melanogaster proteome dynamics during embryonic development by a combination of labelfree proteomics approaches. proteomics. 2016, 16: 2068–2080.