<ol id="ebnk9"></ol>
    1. 自抗基因導向的微生物天然產物挖掘

      發布時間:2025-06-20 18:19:52   來源:心得體會    點擊:   
      字號:

      董 華,明燈明

      (1.南京工業大學 藥學院,江蘇 南京 211800;2.南京工業大學 生物與制藥工程學院,江蘇 南京 211800)

      天然產物(natural products,NPs)是源自生物體次級代謝的有機小分子,其高活性及成藥潛力一直備受人們關注,絕大多數抗癌、抗感染和抗菌藥物都來源于天然產物及其衍生物。天然產物主要存在于微生物和植物中,而微生物相較于植物因其較小的基因組和易培養的特性,所以人們對微生物來源的天然產物的研究更多且更深入。對天然產物生物合成基因的廣泛研究表明,編碼合成天然產物所需酶的基因其在基因組中通常緊密相連地排列在一起,形成所謂的生物合成基因簇(biosynthetic gene clusters,BGCs)。這些基因編碼天然產物合成過程所需要的不同的酶,共同負責特定天然產物的生物合成[1]。近年來,基因組測序技術的快速發展徹底改變了天然產物的發現模式。借助生物信息學工具[2-3],人們已從微生物基因組中鑒定出了數以萬計的BGCs,其數目遠遠超過了實驗表征的天然產物數量。在已鑒定的BGCs中,據估計只有不到10%與生物活性天然產物相關,另外90%以上的基因簇產物未知[4]。這些BGCs的共同特征是轉錄沉默,從而形成所謂的生物合成暗物質?,F代微生物基因組學的快速發展,催生了數據驅動的天然產物挖掘方法,它使用模式識別技術在海量的基因組數據中尋找暗物質,挖掘新天然產物,從而加速基于天然產物的藥物發現。

      大多數天然產物是生物體產生的,通過抑制必需的管家酶來殺死或限制競爭性生物體生長。如果相同的酶靶標在生產者中是保守且必需的,那么天然產物對生產者也會有同樣的毒性。因此,生產者必須存在自我保護機制,以賦予自身對該合成天然產物的抗性[5]。編碼自抗性機制的基因是微生物生產者的特征性狀,而自抗性的表達通常不利于生產者自身的生長與存活,因此自抗性的表達通常僅在天然產物生物合成時一同表達[6-7]。生產者的自抗性策略,一般包括其對天然產物本身的修飾和降解,對作用天然產物靶標的修飾、保護以及替換,以及廣泛利用轉運蛋白外排天然產物等[8]。在充分掌握天然產物與靶標相互作用的基礎上,人們可以通過計算識別抗性基因及其作用機制來甄別新的BGCs。

      綜述了微生物生產者在天然產物生物合成過程中的自我抗性機制,整理了近年來文獻報道的抗性基因數據庫和相關計算工具。文章簡述了通過識別自抗性基因從微生物中發現產生天然產物的潛在 BGCs的方法,并展望了開發結合基因組注釋和蛋白質結構進行天然產物的挖掘方法。

      自抗性通常是基因編碼的,可以通過多種機制表現,包括現有基因的過度表達、復制和由點突變獲得全新基因。新的測序技術和計算方法,使得人們可以在海量的細菌和真菌基因組中快速地鑒定和表征天然產物生物合成基因簇,同時挖掘出越來越多的自抗性基因,從而對各種抗性作用機制獲得比較深入的認識[9]。細菌(真菌)已經進化出多種復雜的機制,可以針對自身的活性小分子進行自我防御;很多時候它們同時擁有多種抗性機制,以確保完全抵御它們產生的生物活性分子傷害自身[10]。這些機制一般包括:外排天然產物、產物修飾、產物降解、天然產物靶標修飾等[11](圖1)。本文重點介紹微生物在合成天然產物過程中激發的典型的自抗機制類型,并為每個類型提供了具體示例。

      圖1 自抗性機制[11]

      1.1 外排泵

      外排泵與所有原核或真核細胞對有毒化合物的抗性相關,它們存在于所有生物中,從人類(對抗癌藥物的抗性)到細菌(對抗生素的抗性)[12]。對于產生天然產物的微生物生產者來說,天然產物的外排是一種普遍的自抗機制,通常會與其他機制一起發生,例如,天然產物或靶標的修飾[10]。細菌通常擁有多藥外排泵,從細胞中主動輸出活性小分子,已經發現了一些外排泵,它們基因的突變和過度表達會增加有毒物質從細胞內流出,使細胞內毒物濃度保持在較低水平,防止達到抑制濃度[13]。

      研究發現,外排泵可分為5個結構家族(表1)。腺嘌呤核苷三磷酸結合盒(adenosine triphosphate binding cassette,ABC)轉運蛋白,利用腺嘌呤核苷三磷酸(adenosine triphosphate,ATP)的結合和水解來轉運底物,它們是一個廣泛的蛋白質家族,承擔原核生物和真核生物中物質的輸入和輸出[14]。主要協助轉運蛋白超家族(the major facilitator superfamily,MFS)包括一組轉運蛋白,使用質子動力作為運輸底物的能源[15]。多藥與有毒物質外排轉運蛋白(the multidrug and toxic compound extrusion,MATE)分為3個亞家族,基于它們的氨基酸序列相似性,分為多藥耐藥蛋白NorM(multidrug resistance protein NorM)、DNA損傷誘導蛋白DinF(DNA damage-inducible protein F)和真核亞家族[16-17]。MATE轉運蛋白在功能上更通用,可以使用 H+或 Na+電化學梯度輸出藥物[18]。葡萄球菌多藥耐藥轉運蛋白(the staphylococcal multi-resistance,SMR)使用質子動力來排出有毒化合物[19]??剐越Y瘤和細胞分裂超家族(the resistance nodulation and cell division superfamily,RND)外排泵廣泛分布在革蘭氏陰性微生物中,該復合物由3種不同的蛋白質形成,分別是可利用質子動力排出底物且嵌入細胞內膜中的二級主動外排泵蛋白、外膜蛋白和膜融合蛋白,將位于兩個膜上的蛋白質跨周質空間連接起來[20]。

      表1 5種外排泵

      在抗藥性外排泵系統中,研究得最多的系統之一是吖啶抗性蛋白A/B-外膜因子TolC(AcrAB-TolC)系統(圖2),屬于RND轉運蛋白家族,該泵組件包括外膜通道TolC、位于內膜的二級轉運蛋白AcrB和連接二者的周質膜融合蛋白AcrA[21]。RND 泵起到質子反向轉運蛋白的作用,AcrAB-TolC能夠以矢量方式運輸各種化學相似性很小的化合物,因此對廣譜抗生素具有抗性[22],能夠運輸多種底物,對四環素、氯霉素、某些β-內酰胺類、新生霉素、夫西地酸和氟喹諾酮類藥物產生抗性[23]。它是少數已經獲得復合物完整結構的外排泵之一,在許多的革蘭氏陰性菌中都發現了RND的同源復合物,包括動物和植物的病原體中[20],是生物代謝物和抗菌化合物的輸出者,在細菌抗性中發揮重要的作用。

      圖2 AcrAB-TolC系統的結構[24](PDB:5ng5)

      1.2 天然產物的修飾

      給天然產物小分子結構上添加修飾(例如,磷酸鹽、乙酸鹽)是一種較為普遍且靈活的自抗性機制?;瘜W修飾包括O-?;?、N-?;?、O-磷酸化、O-核苷酸化、O-核糖基化、O-糖基化和硫醇轉移等。這些共價修飾策略都需要活性的共底物,包括ATP、乙酰輔酶A、煙酰胺腺嘌呤二核苷酸(NAD+)、二磷酸尿苷葡萄糖(UDPG)或谷胱甘肽。因此,這些酶通常只有在細胞質中具有活性[25]。

      博萊霉素BLM(bleomycin)是鏈霉菌(Streptomycesverticillus)產生的糖肽類衍生抗生素?;騜lmB是在博萊霉素生物合成基因簇內發現的抗性元件,blmB編碼一種N-乙酰轉移酶[26],命名為BlmB,它通過將乙?;鶊F從乙酰輔酶A轉移到β-氨基丙氨酸部分的伯胺,即BLM金屬離子結合域的軸向配體,賦予宿主自抗性(圖3)。雖然乙?;煌耆柚菇饘倥cBLM結合,但可以抑制金屬螯合配位物與分子氧配位和還原分子氧,從而防止形成活化的BLM。

      圖3 博萊霉素自抗性機制[26]

      1.3 天然產物的降解

      天然產物中經常包含酰胺鍵和酯鍵等易被分解的化學鍵,其完整性對生物活性至關重要。生物體中有些酶可以靶向切割這樣的鍵,為生物體提供了一種新的自我抗性手段[25]。

      β-內酰胺酶是其中最為典型的一種降解酶,它的作用是水解β-內酰胺類抗生素中的β-內酰胺鍵。多種微生物體中都有編碼β-內酰胺酶的基因[27]。β-內酰胺酶本身并不是必需的細菌蛋白質,據推測它可能是從一些會產生β-內酰胺類代謝物的細菌,如鏈霉菌中的青霉素結合蛋白(penicillin-binding proteins,PBPs)進化而來的,因為這些細菌必須要有一些針對β-內酰胺類抗生素的自我保護策略[28-29]?;诎被嵝蛄械南嗨菩?β-內酰胺酶分為A、B、C、D四類[30],其中A 類(青霉素水解)、C 類(頭孢菌素水解)和 D 類(苯唑西林水解)β-內酰胺酶的活性位點都是絲氨酸,稱為絲氨酸-β-內酰胺酶,它們從β-內酰胺的細胞靶標PBPs進化而來,并在鍵裂解過程中使用催化絲氨酸[31](圖4(a))。B 類β-內酰胺酶需要兩個鋅離子的活性,稱為金屬-β-內酰胺酶,它們利用活性位點鋅離子來協調親核氫氧化物以促進鍵斷裂[32](圖4(b))。因此,β-內酰胺酶采用兩種主要的分子策略來水解裂解抗生素的β-內酰胺環:通過活性位點絲氨酸親核試劑的作用以及通過Zn2+中心激活水[30, 33-34]。

      圖4 β-內酰胺酶作用機制[25]

      1.4 分子靶標的修飾

      自抗性還可以通過突變或修飾天然產物靶標蛋白來實現。一般情況下,這種自抗機制有很大的可能性是通過特定基因(管家酶)中的點突變產生的,從而使生產者獲得相對快速和簡單的抗性,而且這種抗性對生產者適應性的影響最小。生產者會重新編碼出與管家酶功能等效的自抗酶,它屬于管家酶的變體;自抗酶在序列上與管家酶高度相似、仍保持自身原有的活性,但突變使自抗酶對天然產物不敏感。

      地霉素(dityromycin)是一種肽抗生素,從土壤微生物鏈霉菌Streptomycessp.AM-2504的培養液中分離出來。結構研究表明,地霉素以30S 核糖體亞基中的核糖體蛋白 S12為靶標,通過阻斷tRNA來抑制蛋白質合成[35]。宿主菌株對次級代謝產物地霉素的自抗性源于核糖體的特定修飾:位于抗生素結合位點 S12 的蛋白高度保守區域有2個氨基酸替換,分別是Val36Thr和Arg59Lys[36],這些突變使地霉素對 30S 核糖體亞基的親和力顯著降低,從而保護宿主菌株免受抗生素的毒性作用。

      由于抗生素的廣泛應用,所以抗生素耐藥性機制研究最為普遍。目前,現有的抗生素抗性基因數據庫通常是網絡在線平臺,提供耐藥性相關的參考以及用于抗性基因序列分析和注釋的網絡工具。這些平臺接收用戶的核苷酸或蛋白質序列查詢并返回抗性基因預測結果,包含帶有置信度值的注釋以及指向外部資源的鏈接[37]。下文描述了當前部分可用的抗生素抗性基因數據庫(表2)。

      表2 抗性基因數據庫

      在抗性基因相關的數據庫中,抗生素抗性基因數據庫(antibiotic resistance genes database,ARDB)是第一個建立的手動管理的抗性基因序列資源,其中每個基因都注釋了抗性類型、機制和本體[38]。目前不再更新,但所有的ARDB序列都集成到了抗生素耐藥性綜合數據庫(the comprehensive antibiotic resistance database,CARD)中。

      CARD提供了與抗菌素耐藥性分子基礎相關的數據和模型,是抗性基因及其產物和相關表型的生物信息學數據庫[39]。目前擁有4 834個抗性基因本體、3 339個參考序列、1 788個單核苷酸多態性、2 774個已報道的抗性基因、3 385個抗菌檢測模型。CARD集成了許多預測和分析工具,包括用于分析和注釋序列的局部序列比對基本檢索工具(basic local alignment search tool,BLAST),用于預測抗性基因的抗性基因鑒定器(resistance gene identifier,RGI)。CARD 2020中最顯著的更新是一個新的抗性突變體模塊,它提供了對來自88個病原體、9 560條染色體、21 362個質粒、102 181個全基因組測序組裝和222 011個計算機預測分析的全基因組耐藥變體,RGI分析工具的存在也增強了CARD在預測基因組或宏基因組數據中抗生素耐藥性方面的效用[40]。

      Resfam數據庫包含一系列精選的蛋白質家族,而定義每個蛋白質家族均使用了與某種抗性功能相關的蛋白質的序列。這些序列經一種叫隱馬爾可夫模型(hidden markov model,HMM)的統計算法即生成了具有某種抗性功能的蛋白質代表模型。其使用抗性蛋白數據來自CARD、內酰胺酶工程數據庫(lactamase engineering database,LacED)和其他精選的β-內酰胺酶Lahey等。相對于其他一些主要關注病原體相關抗性基因的平臺,該數據庫還提供了抗性基因所處的環境概況的描述。與基于BLAST的搜索結果相比,其檢索結果對于土壤和人類腸道微生物群中的抗性基因鑒定率提高了64%[41-43]。另一方面,由于用戶需要考慮到HMM方法可能會以較差的特異性為代價,因此可能會產生大量的假陽性預測,有時可能無法區分具有密切相關功能的抗性基因[37]。

      ResFinder數據庫是在ARDB數據庫的基礎上,附加收錄通過水平轉移獲得的耐藥基因數據而成的。此庫分為15種耐藥小庫、3 097條耐藥基因序列,分類全面,更新及時,目前已經更新到4.1版本,并且支持本地化安裝使用。目前,除了可以查找分析已知的耐藥基因序列外,該數據庫可使用一種基于全基因組測序數據預測耐藥性染色體突變的工具(PointFinder)來識別染色體上的靶基因的點突變。這些突變信息的識別,對于研究耐藥突變的發生機制和新型抗生素的開發等方面具有重要的意義。

      由于β-內酰胺酶的范圍和臨床重要性,絕大多數專業數據庫都關注了該家族。β-內酰胺酶數據庫(beta-lactamase database,BLDB)包含所有類別的β-內酰胺酶的信息,包括從文獻、國際生物技術中心信息檢索數據庫(national center for biotechnology information,NCBI)和蛋白質數據庫PDB中的蛋白質三維結構收集的抗性模式。該數據庫結合了動力學和突變信息,為理解β-內酰胺酶的結構和功能之間的關系奠定了基礎。除了能夠訪問結合配體的蛋白質結構和理化特性的信息外,該數據庫還提供與外部蛋白質和核苷酸資源的鏈接[44]。

      產生天然產物的酶促途徑會在連續的生物合成基因簇中編碼。每個基因簇都編碼至少一個與其同源天然產物相關的抗性基因[51]??剐曰虺霈F的位置通常與合成基因簇的位置非??拷?存在于基因簇中或者出現在連續的基因簇附近,確保當天然產物開始在細胞內積累時,抗性基因能及時發揮作用進行防御[52]。出現在基因簇中的抗性基因,其發生的位置呈無規則分布,目前還沒有研究揭示抗性基因出現的相對位置對天然產物有什么具體的影響。自 2017 年以來,抗生素抗性目標搜尋器(antibiotic resistant target seeker,ARTS)促進了靶向(自抗)基因組挖掘的方法,以便通過將管家酶和已知抗性基因與 BGC 鄰近、復制和水平基因轉移事件快速聯系起來,優先考慮生產具有假定新作用模式的抗生素的菌株[53-54],體現了自抗基因對天然產物挖掘的重要作用。

      基因組測序技術和生物信息分析方法的最新進展表明,人們使用傳統方法僅僅發現了微生物的天然產物的一小部分,嚴重低估了微生物次級代謝的化學廣度。將天然產物與其合成基因簇連接起來的研究方法,以及不斷積累的關于生物合成過程的邏輯知識,催生了基于基因組的天然產物挖掘這一新領域[11]。Tang[55]等研究表明,事先預判生物合成基因簇中的抗性基因,可以在研究發現天然產物的結構和作用機制之前確定它們的分子靶標[55]。這種挖掘策略不僅可以識別已知的抗性基因,而且可以發現潛在地靶向尚未表征的天然產物的新抗性基因。

      根據已知活性的天然產物及其靶標定位到生物合成基因簇。Tang等[55]最早使用了這種挖掘策略,他們發現了一組脂肪酸合酶Ⅱ(fatty acid synthase Ⅱ,FASⅡ)抑制劑。通過篩查 86 個鹽孢菌屬菌株的基因組,確定了管家基因的重復拷貝,其中一些與FASⅡ基因有關。特別是tlmE基因,編碼飽和脂肪酸合成酶B/F(FabB/F)的同源物,它與合成FASⅡ抑制劑platensimycin和platencin的BGC的特征自抗蛋白PtmP3和PtnP3 有高度的序列相似性,所以tlmE被推定為自抗性基因。將該自抗基因相關聯的BGC異源表達,證明該BGC與已知的FASⅡ抑制劑硫代乳霉素TLM(thiolactomycin)[56]以及3種類似化合物的產生有關。他們遵循類似的方法從Streptomycesafghaniensis中識別出相關的 BGC,編碼兩個FabB/F 同源物,TtmE和TtmJ,推定為自抗性基因。異源表達表明該基因簇可以產生一系列新的TLM類似物。Tang等[55]證實了推定的抗性基因TtmE和TtmJ發揮自我抗性。

      針對選定的管家酶靶標,尋找特定功能的天然產物。Yan等[57]在最近的一項研究中發展了自抗基因導向的基因組挖掘技術,以新的作用模式在真菌基因組數據庫中篩查新的除草劑先導化合物[57]??紤]到該化合物的作用靶標是管家酶乙酰羥酸脫水酶(dihydroxy-acid dehydratase,DHAD),通過尋找與已知植物的DHAD相匹配的真菌密切同源物,獲得了含有編碼DHAD重復拷貝的BGC,推定該重復拷貝是自抗性基因。研究確定了一個保守的基因簇,其中編碼了一段DHAD的重復拷貝基因AstD,與所有真菌中存在的保守的管家酶DHAD具有 60% 的相似度。然后將來自土曲霉的生物合成核心基因在異源宿主中重組表達產生化合物,產生一種已知的倍半萜烯天然產物,生物學靶標未知。Yan等[57]證明了該化合物是DHAD的競爭性抑制劑,而重復拷貝的AstD確實對化合物具有抗性,是該化合物的自抗性基因。

      通過自抗基因定位到生物合成基因簇進而確定天然產物的生物活性。Panter等[58]使用相似的方法,用五肽重復蛋白(pentapeptide repeat proteins,PRP)作為靶標從粘細菌中發現了新型拓撲異構酶抑制劑。Baumann等[59]先是使用人們以往表征的模板序列,在其粘細菌基因組數據庫中搜索獲得了相似蛋白PRP;有研究表明該蛋白賦予針對拓撲異構酶的化合物的自抗性。隨后,他們在Pyxidicoccusfallax基因組中的聚酮生物合成基因簇中鑒定出了編碼 PRP的基因,該基因簇編碼合成兩個新的天然產物,pyxidicycline A和B。Panter等[58]研究證實了pyxidicycline A和B都是拓撲異構酶的選擇性抑制劑。盡管這里的抗性基因并不是靶向拓撲異構酶的直接重復拷貝,但該實驗驗證了使用自抗性基因發現具有所需生物活性的新天然產物的可能性[58]。

      這些研究使用的共同策略是,使用所需的生物合成核心酶在基因組數據庫中搜索攜帶編碼推定的自抗性基因的BGC,然后注釋每個基因的功能,從而識別抗性基因。研究表明,這種通過自抗基因引導挖掘發現天然產物的方法確實可以發現具有新作用模式的天然產物[60]。

      本文綜述的自抗基因導向的天然產物挖掘策略,其原理是抗菌化合物的生產者必須具有某種形式的固有抗性機制,以確保自我保護免受活性化合物的傷害。這些自我抗性基因通常出現在BGC中與代謝產物組裝的核心基因一起,這就使得這些抗性基因能夠與代謝產物一起表達,為天然產物生產者提供立即免疫。正如本文第3節中所描述的例子,這些抗性基因(ttmE、astD等)的功能、在基因組中出現的位置,都可以作為一種潛在的BGC合成的天然產物的生物活性和作用機制的挖掘策略。

      然而,目前自抗基因導向的天然產物挖掘還面臨不少的挑戰?,F有的生物合成知識還比較有限,常常缺乏對于謝產物組裝的核心基因功能的完整表征,這使得研究人員們對于BGCs的預測有時可能不準確,對于BGC中自抗基因的預判也不準確[5]。例如,實際的天然產物可能并不是按照預測的方式參與自我抗性作用,也可能預測的管家酶同源物不參與自抗機制,而是作為生物合成所必需的合成酶而存在。這就需要大規模的拓展現有的BGCs知識庫,在比較基因組學的基礎上系統地研究BGCs的進化規律,克服可能存在的基因組數據中BGCs元件碎片化和不完整性的認識問題。隨著微生物基因組序列信息數量的指數增長和BGCs工作元件數量的不斷積累,相信計算機識別BGCs 的能力和精確度也會不斷增強。

      準確地預測自抗基因,特別是對于那些可能在生物合成途徑中發揮關鍵作用的酶,正確地解析其結構與功能,這無疑是自抗基因導向的天然產物挖掘所面臨的一項挑戰任務。隨著生物合成酶學知識的積累、計算模擬工具的改進,對自抗基因的預測準確度也有望得到快速提升。特別是,近兩年計算結構生物的重大突破,包括蛋白質結構預測工具AlphaFold2和RoseTTAFold的開源等,使得人們可以在更為準確的結構基礎上解析自抗基因的功能,分析其與小分子和其他蛋白質相互作用。這為系統地研究自抗基因的功能提供了前所未有的機遇。有望基于自抗基因導向挖掘天然產物的方法,在不久的未來可能開發出集序列、結構和其他特性為一體的工具,應用于天然產物的生物合成挖掘,并為新藥的研發儲備資源。

      猜你喜歡基因簇內酰胺酶靶標產β-內酰胺酶大腸桿菌研究現狀今日畜牧獸醫(2022年10期)2022-12-23“百靈”一號超音速大機動靶標軍民兩用技術與產品(2021年10期)2021-03-16納米除草劑和靶標生物的相互作用世界農藥(2019年3期)2019-09-10冬瓜高通量轉錄組測序及分析西北農林科技大學學報(自然科學版)(2019年8期)2019-07-17復雜場景中航天器靶標的快速識別光學精密工程(2016年4期)2016-11-07β-內酰胺酶抑制劑合劑的最新研究進展國外醫藥(抗生素分冊)(2016年3期)2016-07-12前列腺特異性膜抗原為靶標的放射免疫治療進展腫瘤影像學(2015年3期)2015-12-09產β-內酰胺酶大腸埃希菌的臨床分布及耐藥性分析現代檢驗醫學雜志(2015年2期)2015-02-06腸球菌萬古霉素耐藥基因簇遺傳特性遺傳(2015年5期)2015-02-04海洋稀有放線菌 Salinispora arenicola CNP193 基因組新穎PKS 和NRPS基因簇的發掘海洋科學(2014年12期)2014-12-15
      国产另类无码专区|日本教师强伦姧在线观|看纯日姘一级毛片|91久久夜色精品国产按摩|337p日本欧洲亚洲大胆精

      <ol id="ebnk9"></ol>