新闻中心
客户文章分享:通过综合分析玉米的蛋白质丰度,转录水平和组织多样性揭示其发育调控的规律
文章来源:genecreate
作者:genecreate
发布时间:2018-01-11 15:23
基本信息
题目:an integrated analysis of protein abundance, transcript level and tissue diversity to reveal developmental regulation of maize
期刊:journal of proteome research
影响因子:4.268
合作技术:swath
期刊:journal of proteome research
影响因子:4.268
合作技术:swath
研究背景
植物组织和器官由分生组织特殊结构中的干细胞分化而来,包括根顶端分生组织(ram)、芽顶端分生组织(sam)和维管系统。不同特定器官的发育是从时间和空间上由同一基因组编码的不同细胞类型的特定基因的选择性表达所调控。全面系统的转录组分析为研究玉米不同生命周期中器官和组织特异性基因组表达模式研究提供了丰富的数据。定义基因在各个器官或组织中的表达水平对于了解玉米的发育至关重要。
然而,不同的组织或器官,包括主根,根毛,叶,核和木质部汁液中的mrna表达水平与相应蛋白质的丰度无法一一映射,这是由mrna转录和转录后调节,包括mrna的加工和翻转以及蛋白质的翻译和翻转所导致的。由于蛋白质是生物过程、细胞成分和性状的直接参与者或调控者,联合转录组和蛋白质组可以协同增强我们对组织结构或器官发生的理解。本研究中,作者采用了swath-ms技术对四种玉米组织中的蛋白质进行定量分析:包括未成熟雌穗(在v7阶段),未成熟雄穗(在v8阶段),授粉后20天(20_dap)的幼胚和14日龄幼苗的根。并且对蛋白质组和转录组进行了关联分析。作者尝试鉴定组织特异性高表达的基因和蛋白质,以了解组织结构和器官发生的调节机制。这些数据为研究玉米发育生物学提供了新的线索。
然而,不同的组织或器官,包括主根,根毛,叶,核和木质部汁液中的mrna表达水平与相应蛋白质的丰度无法一一映射,这是由mrna转录和转录后调节,包括mrna的加工和翻转以及蛋白质的翻译和翻转所导致的。由于蛋白质是生物过程、细胞成分和性状的直接参与者或调控者,联合转录组和蛋白质组可以协同增强我们对组织结构或器官发生的理解。本研究中,作者采用了swath-ms技术对四种玉米组织中的蛋白质进行定量分析:包括未成熟雌穗(在v7阶段),未成熟雄穗(在v8阶段),授粉后20天(20_dap)的幼胚和14日龄幼苗的根。并且对蛋白质组和转录组进行了关联分析。作者尝试鉴定组织特异性高表达的基因和蛋白质,以了解组织结构和器官发生的调节机制。这些数据为研究玉米发育生物学提供了新的线索。
研究内容及结果
1. 数据分析和蛋白质的特性
合并来自四个组织样本的蛋白质组学数据,作者通过swath实验共获得646,658个图谱。用不同的置信度阈值和错误发现率(fdr)来评估swath-ms的检测能力。作者发现,在一定程度上,相对较低的阈值可以鉴定到更多独特的肽和蛋白质(图1a,1b)。在置信度0.85和fdr 0.05的标准下,检测到的多肽和蛋白质的数量与使用更严格的阈值标准——置信度0.90和fdr 0.02相比检测到的多肽和蛋白数量稍有增加(图1a,1b),但差异蛋白质的数量变化不大(图1d)。因此,最终选择置信度0.85和fdr 0.05的阈值来检测本研究中的肽和蛋白质,因为该阈值能检测到更多的蛋白质来扩增蛋白质组数据,但不会显著增加差异蛋白质的数量。共有117,184个unique谱图匹配到10,606个unique肽段,最后共鉴定到4,551个蛋白质(图1e)。蛋白质丰度在重复实验中重复性很好,相关系数在0.84-0.90之间(图s1)。在雌穗,雄穗,幼胚和幼根中分别鉴定到3916、3707、3702和2871种蛋白质,在这四种组织中共鉴定到2269种蛋白质(图1e)。大多数蛋白质(70%)被不少于2个unique谱图覆盖,主要由10至25个氨基酸组成(图s2a,s2b)。大约64%的蛋白质显示出> 5%的蛋白序列覆盖率度,84%的蛋白质的分子质量> 20kda。
合并来自四个组织样本的蛋白质组学数据,作者通过swath实验共获得646,658个图谱。用不同的置信度阈值和错误发现率(fdr)来评估swath-ms的检测能力。作者发现,在一定程度上,相对较低的阈值可以鉴定到更多独特的肽和蛋白质(图1a,1b)。在置信度0.85和fdr 0.05的标准下,检测到的多肽和蛋白质的数量与使用更严格的阈值标准——置信度0.90和fdr 0.02相比检测到的多肽和蛋白数量稍有增加(图1a,1b),但差异蛋白质的数量变化不大(图1d)。因此,最终选择置信度0.85和fdr 0.05的阈值来检测本研究中的肽和蛋白质,因为该阈值能检测到更多的蛋白质来扩增蛋白质组数据,但不会显著增加差异蛋白质的数量。共有117,184个unique谱图匹配到10,606个unique肽段,最后共鉴定到4,551个蛋白质(图1e)。蛋白质丰度在重复实验中重复性很好,相关系数在0.84-0.90之间(图s1)。在雌穗,雄穗,幼胚和幼根中分别鉴定到3916、3707、3702和2871种蛋白质,在这四种组织中共鉴定到2269种蛋白质(图1e)。大多数蛋白质(70%)被不少于2个unique谱图覆盖,主要由10至25个氨基酸组成(图s2a,s2b)。大约64%的蛋白质显示出> 5%的蛋白序列覆盖率度,84%的蛋白质的分子质量> 20kda。
2. 蛋白质组与转录组的关联分析
基于doreen ware实验室的转录组数据,以及从qteller中下载的rna-seq数据,作者对蛋白质组和转录组数据进行了关联分析。首先,将每个组织中的蛋白质丰度与相应的mrna水平进行比较。然后过滤掉那些低mrna水平(rpkm<1)的蛋白质,总共保留了4,314种(94.8%)蛋白,其中雌穗3554个,雄穗3404个,幼胚3417个和幼根2370个(图2a)。其中,四个组织中共鉴定到2045个蛋白,这表明大量检测到的蛋白存在于各个组织中。此外,还鉴定到了组织特异性高度表达的蛋白,其中幼胚253个,幼根181个,雌穗123个和雄穗43个(图2a)。其次,尽管蛋白质丰度与组织中的mrna水平呈正相关,但pearson相关系数很低,从0.35(幼根)到0.43(幼胚)(图2b),这表明转录水平并不总是与蛋白质丰度一一对应。
去掉组织特异性高度表达的蛋白质,以变化倍数> 2倍和p值<0.01,fdr <0.05为筛选条件,共有3714个差异蛋白至少在两个组织中共同鉴定到。结果表明,在雌穗和雄穗之间鉴定到227个差异蛋白,在雌穗和幼根之间鉴定到799个差异蛋白(图2d-e)。差异蛋白质的数量反映了各组织形态和功能的差异。
为了探究蛋白质与转录本丰度相关性较低的原因,作者将这些差异蛋白质分成如下三个亚组:i)正相关亚组(pc):mrna水平与蛋白质丰度正相关;ii)低相关性亚组(lc):编码差异蛋白的转录本与蛋白质丰度相关但不显著;iii)负相关亚组(nc):mrna水平与蛋白质丰度呈负相关。作者发现大约50%的差异蛋白质可以归类到pc亚组中(图2e),这表明过半的差异蛋白质的差异丰度主要由这些基因的表达差异所决定。然而,大约42%的差异蛋白,从31%到62%不等,归类到到lc亚组(图2e)。这种现象通常是由于rna转录,加工和转换以及蛋白质翻译和转换的所导致的。4.9%至15%蛋白质归类到nc亚组(图2e),这表明转录组不能完全解释在组织或器官的不同功能和形态的分子基础上的蛋白质组,由此突出了蛋白质组学研究的重要性。
去掉组织特异性高度表达的蛋白质,以变化倍数> 2倍和p值<0.01,fdr <0.05为筛选条件,共有3714个差异蛋白至少在两个组织中共同鉴定到。结果表明,在雌穗和雄穗之间鉴定到227个差异蛋白,在雌穗和幼根之间鉴定到799个差异蛋白(图2d-e)。差异蛋白质的数量反映了各组织形态和功能的差异。
为了探究蛋白质与转录本丰度相关性较低的原因,作者将这些差异蛋白质分成如下三个亚组:i)正相关亚组(pc):mrna水平与蛋白质丰度正相关;ii)低相关性亚组(lc):编码差异蛋白的转录本与蛋白质丰度相关但不显著;iii)负相关亚组(nc):mrna水平与蛋白质丰度呈负相关。作者发现大约50%的差异蛋白质可以归类到pc亚组中(图2e),这表明过半的差异蛋白质的差异丰度主要由这些基因的表达差异所决定。然而,大约42%的差异蛋白,从31%到62%不等,归类到到lc亚组(图2e)。这种现象通常是由于rna转录,加工和转换以及蛋白质翻译和转换的所导致的。4.9%至15%蛋白质归类到nc亚组(图2e),这表明转录组不能完全解释在组织或器官的不同功能和形态的分子基础上的蛋白质组,由此突出了蛋白质组学研究的重要性。
3. 组织特异性高表达蛋白的功能分类
基于蛋白质丰度,作者在四种组织中共鉴定了600种组织特异性高表达的蛋白质(图3a)。在细胞的整个蛋白质组中,蛋白质的低覆盖率是众所周知的,在所有现有的蛋白质组技术,包括swath-ms都有明显的缺陷。这种低覆盖率可能导致对组织特异性高表达蛋白的数量的过高估计。因此,作者检索了来自于qteller的全长转录组数据和rna-seq数据中编码600个组织特异性高表达蛋白的基因的表达水平,发现大部分基因(84.3%)在多种组织中都有表达,只有94种蛋白编码基因(15.7%)显示出组织特异性表达模式(图3a)。
另外,共有26种蛋白质在雌穗和雄穗中共表达,称为花序特异性蛋白质。此外,作者利用qrt-pcr交叉验证了18个基因的表达水平。其中15个基因为组织特异性表达基因,3个基因为呈现出花序特异性表达模式(图3b,3d)。此外,作者还利用western blot验证了2个幼胚特异性蛋白(grmzm2g354013和grmzm2g054916)(图3c,3e)。
作者鉴定了94个组织特异性蛋白,其中幼根60个,幼胚27个,雌穗5个和雄穗2个。幼根特异性蛋白质直接或间接地与氧化还原过程和脱氢有关,包括12个过氧化物酶超家族蛋白,3个还原酶和8个水解酶活性蛋白,表明对氧化胁迫的响应在幼根的发育和生长中起重要作用。在27个幼胚特异性蛋白中,有5种植物脂质转移蛋白/种子储存相关蛋白质,3种氧化还原酶活性蛋白质和2种已知的与光形态相关的蛋白质转录因子(atpif1和atspt转录因子)。7个花序特异性蛋白与花序结构和花器官的发育高度相关。值得注意的是,有18种蛋白质在雌穗和雄穗中都有很高的丰度,但其mrna水平在四个组织中都呈现出的低水平或没有被检测到。
另外,共有26种蛋白质在雌穗和雄穗中共表达,称为花序特异性蛋白质。此外,作者利用qrt-pcr交叉验证了18个基因的表达水平。其中15个基因为组织特异性表达基因,3个基因为呈现出花序特异性表达模式(图3b,3d)。此外,作者还利用western blot验证了2个幼胚特异性蛋白(grmzm2g354013和grmzm2g054916)(图3c,3e)。
作者鉴定了94个组织特异性蛋白,其中幼根60个,幼胚27个,雌穗5个和雄穗2个。幼根特异性蛋白质直接或间接地与氧化还原过程和脱氢有关,包括12个过氧化物酶超家族蛋白,3个还原酶和8个水解酶活性蛋白,表明对氧化胁迫的响应在幼根的发育和生长中起重要作用。在27个幼胚特异性蛋白中,有5种植物脂质转移蛋白/种子储存相关蛋白质,3种氧化还原酶活性蛋白质和2种已知的与光形态相关的蛋白质转录因子(atpif1和atspt转录因子)。7个花序特异性蛋白与花序结构和花器官的发育高度相关。值得注意的是,有18种蛋白质在雌穗和雄穗中都有很高的丰度,但其mrna水平在四个组织中都呈现出的低水平或没有被检测到。
4. 差异表达蛋白的功能分类
通过go富集确定差异蛋白的功能类别。相对于其他组织对,在雌穗和雄穗之间鉴定到的差异蛋白更少,这些差异蛋白主要富集到“细胞分裂素介导的信号调节”,“乙酰辅酶a代谢过程”和“分生组织生长”(图4a),表明细胞分裂素介导的信号在雌穗和雄穗之间的细胞分裂活性上存在差异。雄穗中ub3的蛋白质丰度比雌穗中高1.7倍,表明ub蛋白质积累的增加可能支持雄穗长枝的长出。雌穗和幼胚之间的差异蛋白主要富集到“脂质生物合成过程”,“分生组织起始”和“生殖结构发育”条目。在雄穗和幼胚之间的的差异蛋白也富集到这些go条目(图4b,4c)。差异蛋白中不同的go类别反映了花序和幼胚之间的生理和发育上的差异。
此外,雌穗/雄穗和幼根之间的差异蛋白显著富集到“对无机物质的响应”和“有机酸生物合成过程”(图4d,4f)。幼胚和幼根之间的差异蛋白主要富集到“有机酸代谢过程”,“对无机物质的反应”和“氧化还原”(p = 2.6 e-12)等。与“脂质生物合成过程”和“脂肪酸生物合成过程”有关的蛋白质在幼胚中显著富集,而涉及“响应无机物质”,“氧化还原”和“醇代谢过程”的蛋白质在幼根中显著富集。
此外,雌穗/雄穗和幼根之间的差异蛋白显著富集到“对无机物质的响应”和“有机酸生物合成过程”(图4d,4f)。幼胚和幼根之间的差异蛋白主要富集到“有机酸代谢过程”,“对无机物质的反应”和“氧化还原”(p = 2.6 e-12)等。与“脂质生物合成过程”和“脂肪酸生物合成过程”有关的蛋白质在幼胚中显著富集,而涉及“响应无机物质”,“氧化还原”和“醇代谢过程”的蛋白质在幼根中显著富集。
文章小结
swath-ms具有独立的数据采集模式,能够扫描样品中所有电离物质的碎片离子谱,具有高重复性,高定量准确性以及定量动态范围更广等优点。作者利用swath-ms技术在玉米的4种组织中共鉴定到4551种蛋白质,与之前利用itraq技术鉴定到的蛋白数目相当。基于蛋白质组和转录组数据的关联分析,作者推断出蛋白质丰度与mrna水平呈正相关,具有弱到中等的相关系数。
然而,一些特定组织中与功能或结构相关的一些关键蛋白质在转录水平上被时空调控,在4种研究组织中不同的蛋白表现出不同的表达模式。此外,组织特异性高表达的蛋白和差异蛋白能富集到不同的go类别中。组织特异性高度表达的蛋白质亚组通过交叉实验验证可作为潜在的生物标志物。这些蛋白质组学数据加深了对玉米组织和器官发育的分子机制的理解,并为其生物标志物的发现提供了全面的线索。
然而,一些特定组织中与功能或结构相关的一些关键蛋白质在转录水平上被时空调控,在4种研究组织中不同的蛋白表现出不同的表达模式。此外,组织特异性高表达的蛋白和差异蛋白能富集到不同的go类别中。组织特异性高度表达的蛋白质亚组通过交叉实验验证可作为潜在的生物标志物。这些蛋白质组学数据加深了对玉米组织和器官发育的分子机制的理解,并为其生物标志物的发现提供了全面的线索。
解析文献
jia ht, sun w, li mf, et al. an integrated analysis of protein abundance, transcript level and tissue diversity to reveal developmental regulation of maize [j]. j. proteome res, december 18, 2017.
参考文献
1. du, y.; liu, l.;et al. unbranched3 regulates branching by modulating cytokinin biosynthesis and signaling in maize and rice. new phytol. 2017, 214(2), 721-733.
2. anjo, s. i.; santa, c.; manadas, b. swath-ms as a tool for biomarker discovery from basic research to clinical applications. proteomics 2017, 17(3-4), 1600278
3. cheng, z.; teo, g.; et al. differential dynamics of the mammalian mrna and protein expression response to misfolding stress. mol. syst. biol. 2016, 12(1), 855.
4. walley, j. w.; sartor, r. c.; et al. integration of omic networks in a developmental atlas of maize. science 2016, 353:814-818.
5. pautler, m.; eveland, a. l.; et al. fasciated ear4 encodes a bzip transcription factor that regulates shoot meristem size in maize. plant cell 2015, 27(1), 104-120.
参考文献
1. du, y.; liu, l.;et al. unbranched3 regulates branching by modulating cytokinin biosynthesis and signaling in maize and rice. new phytol. 2017, 214(2), 721-733.
2. anjo, s. i.; santa, c.; manadas, b. swath-ms as a tool for biomarker discovery from basic research to clinical applications. proteomics 2017, 17(3-4), 1600278
3. cheng, z.; teo, g.; et al. differential dynamics of the mammalian mrna and protein expression response to misfolding stress. mol. syst. biol. 2016, 12(1), 855.
4. walley, j. w.; sartor, r. c.; et al. integration of omic networks in a developmental atlas of maize. science 2016, 353:814-818.
5. pautler, m.; eveland, a. l.; et al. fasciated ear4 encodes a bzip transcription factor that regulates shoot meristem size in maize. plant cell 2015, 27(1), 104-120.