馬紅梅,楊東偉,黃海,宋宇
無輔助因子放線菌抗生素合成關鍵酶Dpgc的生信分析
馬紅梅1,2,3,楊東偉1,黃海1,2,3,宋宇1,2,3
1. 海南熱帶海洋學院, 海南 三亞 572022 2. 海南省熱帶海洋漁業資源保護與利用重點實驗室, 海南 三亞 572022 3. 熱帶海洋生物資源利用與保護教育部重點實驗室, 海南 三亞 572022
為研究萬古霉素等抗生素合成關鍵酶的特征,通過多種生信工具對Dpgc的序列進行分析、預測其理化性質及結構功能。結果顯示:Dpgc分布于細胞質中,無信號肽,為親水性可溶性蛋白,有7個潛在的磷酸化位點。預測到一個結構域,屬于巴豆酸酶/烯酰輔酶A(CoA)水合酶超家族,其二級結中主要以螺旋和無規則卷曲為主;
三級結構預測到5種模型,其中模型4的誤差小,以它為基礎,預測到一個體積為171.52 ?3的催化口袋。采用swiss-model進行同源建模,結果表明:Dpgc建模結構可靠,可為該酶活性的進一步分析提供理論參考。Dpgc關鍵酶的生信分析佐證了該酶結構的一些實驗研究的結果,為萬古霉素等抗生素合成產量的提高提供了參考。
放線菌; 抗生素合成酶; 生物信息
放線菌是產抗生素的主要菌種,能產生多種在臨床應用的抗生素,其中萬古霉素被譽為“抗生素的最后一道防線”[1],是臨床上治療由甲氧西林耐藥金黃色葡萄球菌(MRSA)引起的嚴重感染的一線抗生素[2]。該抗生素是抗革蘭氏陽性菌的一種糖肽類抗生素,最初從東方擬無枝酸菌()的發酵液中分離。對萬古霉素生物合成的研究中發現,聚酮體酶DpgA以丙二酰CoA為底物,經過水合酶(DpgB或DpgD)、脫氫酶(Dpgc)、轉氨酶(Pgat)的作用,合成3,5-二羥基苯基甘氨酸(Dpg)[3],整個反應過程中,Dpgc是放線菌合成抗生素代謝鏈中非蛋白質氨基酸生物合成途徑中的關鍵酶,屬于加氧酶中的一種[4]。大多數特征化的加氧酶利用結合的過渡金屬,如利用鐵、銅、黃素或蝶呤輔因子來激活三重態氧進行氧化反應,而Dpgc是一類不依賴有機輔助因子或金屬離子即可結合并利用分子氧的雙氧化酶[5],是萬古霉素和太古霉素合成中的關鍵酶[6]。目前該抗生素的生產主要通過微生物發酵后提純發酵液中的成分,在提取工藝優化的情況下,其產量和品質的提高主要取決于Dpgc酶的活性。論文利用生信分析中的不同工具對Dpgc的生化性質與結構進行了預測,為該酶作用的充分發揮提供了理論研究基礎。
從GenBank中獲取已公布的放線菌和建模外源菌的Dpgc氨基酸序列Dpgc氨基酸序列登錄號:登錄號:G4V4T6;
HCCB10007登錄號:AEI58890;
sp.登錄號:QUQ69271;
登錄號:AMO93225;
登錄號:BAU09325;
登錄號:AAM80546;
登錄號:AYA22307;
登錄號:VBA40025;
登錄號:PPR39952;
登錄號:ABN80424。
利用Mega軟件對序列比對后作進化樹。利用在線網址https://web.expasy.org/protparam/分析其理化性質;
https://services.healthtech.dtu.dk/services/SignalP-5.0/及6.0預測Dpgc的信號肽;
https://services.healthtech.dtu.dk/service.php?TMHMM-2.0對其進行跨膜分析;
https://psort.org/documentation/index.html對Dpgc進行亞細胞定位。https://services.healthtech.dtu.dk/中的NetPhos 3.1對其磷酸化位點分析;
https://web.expasy.org/protscale/對其親水性和疏水性分析,利用https://heliquest.ipmc.cnrs.fr/對其雙親性螺旋分析;
https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html對其二級結構分析;
http://bioinf.cs.ucl.ac.uk/psipred對其二級結構預測;
https://robetta.bakerlab.org/對其三級結構進行預測,并利用在線工https://proteins.plus/#dogsite對預測的最佳模型進行催化口袋分析;
https://swissmodel.expasy.org/進行同源建模。
選用放線菌與細菌的Dpgc序列作進化樹分析,由圖1可知,與HCCB1007聚為一支,進化距離最小,同源性最高。與sp.聚為一支,與聚為一支,進化距離小,同源性較高,、、三種細菌與其他放線菌(除外)的進化距離大,同源性低。
圖 1 10種微生物Dpgc的同源性分析
2.1.1 理化性質由ProtParam預測結果顯示:Dpgc中氨基酸數目為434個,理論相對分子質量為47088.68,理論等電點為5.50,原子總數為6647,分子式為C2062H3337N611O624S13,不穩定系數為44.26,為不穩定蛋白,脂溶系數為96.36,酸性氨基酸殘基總數(Asp+Glu)為62,堿性氨基酸殘基總數為54。不同氨基酸的數目及比例見表1。由表1可知:Ala的數目最多,占比15.2%,其次為Leu (L)和Arg (R),其他氨基酸的占比均小于10%,其中Cys (C)和Trp (W)的數目少,比例相差不大,分別為0.7%和0.5%??偲骄杷詾?GRAVY)為-0.127,初步分析表明該酶為親水性可溶性蛋白。
表 1 氨基酸組成分析
2.1.2 疏水性分析因氨基酸的親水性與疏水性是構成蛋白折疊的主要驅動力之一,因此蛋白質親水性分布圖可反映蛋白質的折疊情況。使用ProtScale軟件中的Hydropath. / Kyte & Doolittle標度分析酶的疏水性。當氨基酸的打分值大于0,表示疏水,正值越大,疏水性越強;
負值表示親水,負值越小,表示親水性越強。值在-0.5~0.5間的氨基酸為兩性。由圖2可知,Dpgc多肽鏈中第301處苯丙氨酸的值最大為2.233,表明此處氨基酸疏水性最強,多肽鏈上第111和第112位點處分別為精氨酸和谷氨酸,兩者得分均為-2.989,表明此兩種氨基酸的親水性最強。0~86處氨基酸密集式親水,總得分小于0,故Dpgc酶蛋白為親水性蛋白。
圖 2 Dpgc疏水性圖譜
2.3.1 磷酸化分析磷酸化是蛋白質翻譯后的一種修飾,是一種動態的生物調節過程,與DNA損傷修復、轉錄調節、信號傳導、細胞凋亡的調節等生物學功能密切相關。磷酸化多肽主要指肽鏈中的Ser、Tyr和Thr殘基的側鏈羥基被修飾成酸式磷酸酯多肽。由NetPhosbac預測Dpgc結果見圖3。
圖 3 Dpgc磷酸化位點
由圖3可知,酶蛋白中共有7個潛在的磷酸化位點得分大于0.5,6個是serine,1個是threonine,其中得分最高的為78T,其次為272S,表明此兩處位點的磷酸化置信度高,磷酸化置信度最低處為222S,9S,35S,37S和131S處的得分介于最高與最低之間,說明這4個位點被磷酸化修飾的置信度介于中間。
2.3.2 Dpgc雙親性螺旋分析采用HeliQuest中的anlysis預測Dpgc的雙親性螺旋,它通過螺旋的氨基酸序列(-螺旋、3-10螺旋、3-11螺旋或π螺旋)計算其物理化學性質和氨基酸組成,并使用結果篩選數據庫以識別具有此特征的蛋白質片段相似的特征。文中采用HeliQuest中的模板analysis確定α螺旋類型的疏水性、疏水力矩、凈電荷(z)和氨基酸組成等特性,windows size選36,預測分析結果顯示:1-36位構成一個雙親性螺旋,疏水性為0.341,疏水力矩<μH>為0.256,極性殘基占52.78%,不帶電荷的殘基+GLY為GLN 1、HIS 1、SER 4、THR 3、GLY 2;
帶電殘基為LYS 1、ARG 2、GLU 1、ASP 4,非極性殘基占47.22%,非極性殘基中無芳烴殘基,特殊殘基為CYS 0, PRO 4,預測結果見圖4,其疏水面為L V M L P L。
氨基酸序列:1MTTDSPTLSLSPGLDHRALAKAAQRVDELLDGLPSP36
2.3.3 Dpgc信號肽分析信號肽位于蛋白質的N端,一般由16-26個殘基組成,可將蛋白質引導定位至不同的細胞器。采用signal 5.0中的gram-positive預測信號肽,結果見圖5(A)。Dpgc蛋白具有信號肽的可能性為0.0122,具有雙精氨酸轉移信號肽(TAT)的可能性為0.0123,具有脂蛋白信號肽(Sec/SPII)的可能性為0.0021,為其它類型蛋白質的可能性是0.9734,說明Dpgc沒有信號肽,可能是其它類型蛋白質。signal 6.0是最新版本,可預測各種類型的微生物,預測結果見圖5(B),預測結果與signal 5.0預測結果一致。
圖 5 Dpgc信號肽預測結果
2.3.4 Dpgc跨膜分析膜蛋白是一類結構獨特的蛋白質,廣泛存在于各種細胞中,為神經信號分子、激素和受體等組成成分之一,是各種離子跨膜的通道,也是多種藥物分子的靶點,可分外在膜蛋白、內在膜蛋白和脂錨定膜蛋白3種類型。由TMHMM-2.0預測結果見圖6,結果顯示:膜蛋白為跨膜螺旋數量為0,跨膜螺旋氨基酸期望值為0.13815,蛋白前60個氨基酸中跨膜螺旋的氨基酸量的期望值為0,由此知N端預測的跨膜螺旋區不存在信號肽,此結果與信號肽預測結果一致,也不存在跨膜區。
圖 6 Dpgc跨膜區分析
2.3.5 亞細胞定位由Psortb 3.0 亞細胞定位計算結果顯示,該酶在細胞膜中定位得分僅為1.15,在細胞壁中定位得分為0.62,在細胞質中定位得分為7.5分,據此判斷該酶分布于細胞質中。
2.4.1 Dpgc結構域分析利用NCBI的CDD數據庫對該酶結構域進行分析,結果見圖7。其E-value為2.32e-40,小于閾值10-6,其中序列167-383氨基酸處有一結構域,屬于巴豆酸酶/烯酰輔酶A (CoA)水合酶超家族。該家族包含多種酶:烯酰輔酶A水合酶、萘甲酸合酶、肉桂酸消旋酶、3-羥基丁酰輔酶A脫水酶和十二烷酰輔酶A δ異構酶。源自?;o酶A底物的烯醇陰離子中間體在氧陰離子空穴(OAH)中穩定,在大多數情況下由兩個保守的主鏈NH基團形成。除了保守的結構核心外,該家庭成員的寡聚狀態各不相同。有些形成三聚體或六聚體(三聚體的二聚體)或九聚體(三聚體的三聚體),底物結合位點位于三聚體中兩個亞基之間的界面,每個三聚體包含三個底物結合位點。
圖7 Dpgc的結構域分析
2.4.2 Dpgc的二級結構分析蛋白質多肽鏈的二級結構主要形式有-螺旋、-折疊、-轉角和無規卷曲。由SOPMA預測Dpgc結果見圖8。結果顯示:DPGC的二級結構主要由四個部分組成,其中螺旋占54.85%、轉角占6.91%,無規則卷曲占29.26%,及延伸鏈(也叫片層)占8.99%,由此可知Dpgc主要由螺旋構成,其次為無規則卷曲,少數為片層和轉角。
圖 8 Dpgc的二級結構分析
注:H為螺旋,T為轉角,E為片層,為無規則卷曲
2.4.3 Dpgc的三級結構預測及催化口袋分析采用RobeTTA對Dpgc結構進行在線預測,置信度為 0.87(滿分為1),共獲5個預測結構,每個結構中預測到1個結構域,結果見圖9。從各模型的誤差估算圖可知,其中模型4具有相對較小的誤差,可以此基礎進行進一步結構解析。利用模型4對其催化口袋進行分析,建立了一個體積為171.52 ?3的催化口袋,結果如圖10,參數信息見表2。
圖 9 Dpgc的三級結構預測
圖 10 基于PDB結構模擬的Dpgc的催化口袋
表 2 Dpgc催化口袋基本信息
2.4.4 Dpgc的三級結構預測及其同源建模分析采用SWISS-MODEL網站預測蛋白質結構,以P21, A319C突變巴豆酶超家族雙加氧酶和2np9.1.A巴豆酸酶超家族雙加氧酶的Dpgc晶體結構為模板進行建模,結果見圖11。對其質量評估結果顯示:相似度值比對后結果為69.72%,說明待預測蛋白與模板蛋白結構具有很高的同源性,該模板可用于預測該酶蛋白的三維結構,且預測模型的可信度高。建模結構的GMQE值為0.89,在0~1之間,比較接近1,說明建模質量很好;
其QMEAN值為-0.36,在-4-0區間,接近0,說明模型匹配度高,由此可知,運用同源建模的方法預測得到的蛋白質結構準確可靠。并以此為模板采用拉式圖評價預測模型質量,使用拉式圖評價預測建立的Dpgc三級結構模型,結果見圖12,有97.20%的氨基酸殘基落在綠色最佳區域,說明模型結構可靠,可用于后續工作和研究。
圖 11 Dpgc的三級結構
圖 12 Dpgc的拉式構象
抗生素是以放線菌為主要生產菌代謝合成的次級代謝產物,其調控關鍵酶都在合成階段被合成,酶與氧結合和活化是參與分解代謝、合成代謝等多種細胞過程的基本部分[7]。多數加氧酶使用血紅素或非血紅素鐵來結合和激活加氧,而Dpgc是一類為數不多的不依賴輔因子的雙加氧酶,有關其與氧結合的機制研究較多。Kunhua L與Fielding EN等介紹了DpgC與雙氧結合的機制[8,9]。隨著萬古霉素等抗生素的耐藥性問題突顯,對新糖肽類抗生素的開發及組合生物合成的研究越來越多,而基因分子水平上的操作是組合生物合成的重要手段,因而對酶的生信分析是基因水平操作的前提。
該酶屬于親水性蛋白,其中Arg和Glu的含量較高,極性氨基酸組成較非極性氨基酸含量高,這兩種氨基酸在在底物識別和催化中具有重要的作用[9]。該酶雖預測到7個磷酸化位點,但目前還未有實驗證實,可作為今后研究的一個方向。對其結構預測中,不同在線生信工具都預測到Dpgc有一個結構域,屬于巴豆酸酶/烯酰輔酶A (CoA)水合酶超家族,其成員對?;o酶A底物進行各種各樣的化學轉化,有實驗證據表明Dpgc的保守活性位點殘基與其他巴豆激酶家族成員之間沒有顯著重疊[10,11]。預測的三級結構置信度高,誤差較小,可作為后續研究的基礎。
[1] 周良輔.萬古霉素臨床合理應用中國專家共識[J].中國新藥與臨床雜志,2011,8(30):561-573
[2] Nagarajan R. Antibacterial activities and modes of action of vancomycin and related glycopeptides [J]. Antimicrobial Agents and Chemotherapy, 1991,35(4):605-609
[3] Chen H, Tseng CC, Hubbard BK,. Glycopeptide antibiotic biosynthesis: Enzymatic assembly of the dedicated amino acid monomer ()-3,5-dihydroxyphenylglycine [J]. Proceedings of the National Academy of Sciences, 2001,98(26):14901-14906
[4] Widboom PF, Bruner SD. Complex oxidation chemistry in the biosynthetic path-ways to Vancomycin/Teicoplanin antibiotics [J]. Chem Bio Chem, 2009,10:1757-1764
[5] Tseng CC, Vaillancourt HF, Bruner DS,. DpgC is a metal- and cofactor-free 3,5-Dihydroxyphenylacetyl-CoA 1,2-Dioxygenase in the vancomycin biosynthetic pathway [J]. Chemistry & Biology, 2004,11(9):1195-1203
[6] Ortega P, Zanchet A, Sanz-Sanz C,. Dpgc-catalyzed peroxidation of DPA-CoA: insights into the spin-forbidden transition and charge transfer mechanisms [J]. Chemistry, 2021,27(5):1700-1712
[7] Laden BP, Tang Y, Porter TD. Cloning, heterologous expression, and enzymological characterization of human squalene monooxygenase [J]. Arch. Biochem. Biophys, 2000,374:381-388
[8] Kunhua L, Fielding EN, Condurso HL,. Probing the structural basis of oxygen binding in a cofactor-independent dioxygenase [J]. Acta Crystallographica Section D Structural Biology, 2017,73(7):573-580
[9] Fielding EN, Widboom PF, Bruner SD. Substrate recognition and catalysis by the cofactor-independent dioxygenase Dpgc [J]. Biochemistry, 2007,46(49):13994-14000
[10] Sleeman MC, Sorensen JL, Batchelar ET,. Structural and mechanistic studies on carboxymethylproline synthase (CarB), a unique member of the crotonase superfamily catalyzing the first step in carbapenem biosynthesis [J]. J. Biol. Chem. 2005,280:34956-34965
[11] Truglio JJ, Theis K, Feng Y,. Crystal structure ofMenB, a key enzyme in vitamin K2 biosynthesis [J]. J. Biol. Chem, 2003,278:42352-42360
Bioinformatics Analysis of the Cofactor-Independent Key Enzyme Dpgc for Antibiotic Synthesis inspp
MA Hong-mei1,2,3, YANG Dong-wei1, HUANG Hai1,2,3, SONG Yu1,2,3
1.5720222.572022,572022
To investigate the characteristics of key enzymes in antibiotic synthesis such as vancomycin, the sequence of Dpgc was analyzed and its physicochemical properties, structure, and functions were predicted using various biological information tools. The results showed that Dpgc was distributed in the cytoplasm without signal peptide, and was a hydrophilic soluble protein with 7 potential phosphorylation sites. It was predicted that a domain belongs to the crotonase /enoyl coenzyme A (CoA) hydratase superfamily, and its secondary structure was mainly composed of α Mainly spiral and irregular curl;
five models had been predicted for the tertiary structure, one of which the error of model 4 was smaller. Based on it, a volume of 171.52 ?3 had been predicted Catalytic pocket. The results of homologous modeling using swiss model indicated that the structure of Dpgc modeling was reliable and can provide a theoretical reference for further analysis of the enzyme activity. Bioinformatics analysis of the key enzyme of Dpgc corroborated the results of some experimental studies on the enzyme structure, providing a reference for improving the production of antibiotics such as vancomycin.
spp.; antibiotic synthetase; bioinformatics
Q811.4
A
1000-2324(2023)02-0208-08
10.3969/j.issn.1000-2324.2023.02.008
2022-12-05
2023-02-04
海南省高等學校教育教學改革研究重點項目(Hnjg2020ZD-35);海南自然科學基金(421RC591)
馬紅梅(1976-),女,教授,研究方向為微生物代謝調控. E-mail:mahongmei612@163.com
猜你喜歡登錄號信號肽殘基基于各向異性網絡模型研究δ阿片受體的動力學與關鍵殘基*生物化學與生物物理進展(2022年6期)2022-07-21基于DNA條形碼進行金花茶組種間鑒別種子(2021年2期)2021-03-31“殘基片段和排列組合法”在書寫限制條件的同分異構體中的應用中學生數理化(高中版.高考理化)(2021年2期)2021-03-19含氟新農藥的研究進展浙江化工(2019年5期)2019-06-04小反芻獸疫病毒F基因的序列分析動物醫學進展(2018年11期)2018-12-05運用計算機軟件預測木質部寄生屬信號肽浙江農業學報(2017年3期)2017-04-08電子版館藏數據回溯中的交叉、重疊、阻滯問題處理辦公室業務(2016年19期)2016-11-25煙草野火病菌Pseudomonas syringae pv. tabaci yuexi-1信號肽預測及分析中國煙草學報(2016年1期)2016-11-16蛋白質二級結構序列與殘基種類間關聯的分析池州學院學報(2015年3期)2016-01-05內源信號肽DSE4介導頭孢菌素C?;冈诋叧嘟湍钢械姆置诒磉_華東理工大學學報(自然科學版)(2015年4期)2015-12-01