Tập hợp phiên mã De Novo và khám phá gen của thân thịt Cistanche Deserticola-Ⅱ
Sep 18, 2024
Phân loại chức năng của tất cả các bản phiên mã được biểu thị dựa trên bản thể gen và cơ sở dữ liệu KEGG
Chú thích Gene Onology (GO) được lấy từ tệp liên kết nhận dạng và chú thích UniProt. Tổng cộng có 20.907 bản phiên mã, chiếm 32,69% tổng số trình tự được biểu thị, được gán cho 1.745 thuật ngữ chức năng. Trong tổng số thuật ngữ GO chức năng, nhiệm vụ cho quá trình sinh học chiếm phần lớn (1.116, 63,95%), tiếp theo là thành phần tế bào (329, 18,85%) và chức năng phân tử (300, 17,20%). Các chức năng được chỉ định của các bản phiên mã được biểu thị bao gồm nhiều loại GO và 10 thuật ngữ GO hàng đầu có bản phiên mã được chú thích nhiều nhất được liệt kê trong Bảng 3. Chúng tôi cung cấp tất cả phân phối bản phiên mã được biểu thị trong ba danh mục Bản thể gen (Chức năng phân tử, Thành phần tế bào và quá trình sinh học) trong tệp bổ sung (Bộ dữ liệu S3). Các thuật ngữ GO liên quan đến chức năng liên kết và hoạt động transferase chủ yếu được trình bày trong danh mục chức năng phân tử. Về chức năng liên kết, liên kết cation (4.394 bản phiên mã) chiếm nhiều nhất, tiếp theo là liên kết nucleotide/nucleoside (trung bình 3.404 bản phiên mã) và liên kết protein (2.422 bản phiên mã). Trong khi ở nhóm có hoạt tính transferase nhiều nhất là nhóm có nhóm chuyển chứa phospho (2.256 bản phiên mã, chiếm 65,77%). Trong số các loại thành phần tế bào, các bản phiên mã nằm ở nội bào nhiều hơn (trung bình 10.581 bản phiên mã), trong khi trong loại quá trình sinh học, các bản phiên mã tham gia nhiều hơn vào quá trình trao đổi chất polyme sinh học (trung bình 6.683 bản phiên mã), tiếp theo là sự điều hòa quá trình tế bào (4.841 bản phiên mã). ), biểu hiện gen (4.678 bản phiên mã) và vận chuyển (3.512 bản phiên mã).

CISTANCHE TUBULOSA TỰ NHIÊN ĐỂ PHÒNG NGỪA BỆNH ALZHEIMER PHGS75% ECH 30% ACT 12%
Để khai thác các gen liên quan đến quá trình sinh tổng hợp lignin và PhG, 21.358 trình tự protein tiềm năng không dư thừa đã được tìm kiếm dựa trên trình tự gen của 13 sinh vật thực vật trong cơ sở dữ liệu KEGG và chúng được chỉ định cho 275 con đường KEGG với ít nhất 5 lần truy cập. 10 con đường hàng đầu với hầu hết các trình tự thẳng hàng được liệt kê trong Bảng 4. Hầu hết các con đường đều tham gia vào các quá trình trao đổi chất sơ cấp, chẳng hạn như chuyển hóa axit amin hoặc protein (ko01230, ko04141 và ko04120), chuyển hóa carbohydrate (ko01200 và ko00500), và nucleotide hoặc chuyển hóa nucleoside (ko03018, ko00230 và ko00240). Ngoài ra, còn có 27 con đường liên quan đến trao đổi chất thứ cấp (Hình 2), chẳng hạn như sinh tổng hợp xương sống terpenoid, sinh tổng hợp phenylpropanoid, sinh tổng hợp carotenoid, sinh tổng hợp alkaloid isoquinoline và sinh tổng hợp tropane, piperidine và pyridine. Những kết quả này cung cấp thêm dấu hiệu cho thấy các quá trình trao đổi chất tích cực đang diễn ra trong cơ thể.C. sa mạcmô thân cây. Tất cả các bản ghi được thể hiện liên quan đến lộ trình KEGG đã được liệt kê trong tệp bổ sung (Bộ dữ liệu S4). Mặc dù có một số con đường thay đổi đáng kể giữa C. Deserticola và các loại thực vật khác, chẳng hạn như lúa (Bộ dữ liệu S5), mục tiêu chính của chúng tôi trong nghiên cứu này là tiết lộ toàn bộ hồ sơ phiên mã của thân cây C. Deserticola và hình dung các con đường liên quan đến quá trình sinh tổng hợp PhG có thể hữu ích cho việc hướng dẫn trồng trọt.

Các gen ứng cử viên mã hóa các enzyme tham gia vào quá trình sinh tổng hợp lignin
Lignin là loại polyme tự nhiên trên mặt đất phổ biến thứ hai trong thế giới thực vật, chiếm tới 1/3 lượng vật chất được tìm thấy trong thành tế bào thực vật. Là một thành phần quan trọng của thành tế bào, lignin giúp vận chuyển nước, cung cấp hỗ trợ cơ học và tính toàn vẹn cấu trúc, đồng thời bảo vệ chống lại mầm bệnh và động vật ăn cỏ. Những vai trò đó của lignin rất có giá trị trong việc hỗ trợ sự phát triển cương cứng dưới lòng đất của C. Deserticola trên sa mạc. Trong nghiên cứu này, chúng tôi đã trình bày bức tranh hoàn chỉnh về con đường sinh tổng hợp lignin ở C. Deserticola (Hình 3), trong đó các monome lignin được sinh tổng hợp từ phenylalanine thông qua một loạt các phản ứng enzyme, bao gồm quá trình hydroxyl hóa, methyl hóa, khử và quá trình trùng hợp oxy hóa. Các enzyme liên quan đến sinh tổng hợp lignin đã được phát hiện ở ba dạng tổng hợp chủ yếu trong mô mạch máu (p-hydroxyl-phenyl (H), guaiacyl (G) và syringyl (S) lignin) và 5-hydroxyl-guaiacyl lignin chỉ được xác định ở những cây bị thiếu COMT (axit caffeic 3-O-methyltransferase, EC 2.1.1.68) (chẳng hạn như bị ngã).

Phenylalanine amoniac-lyase (PAL, EC 4.3.1.24) là enzyme chủ chốt đầu tiên trong quá trình sinh tổng hợp lignin (Hình 3) biến đổi phenylalanine thành axit cinnamic bằng cách khử amin không oxy hóa. Tổng cộng có 6.297 lượt đọc PAL đã được giải trình tự và 7 bản phiên mã PAL được tập hợp ở C. Deserticola (Bảng 5). Bằng cách so sánh các điểm tương đồng về trình tự, chúng tôi nhận thấy rằng 4 trong số chúng (comp28550_c1_seq1/2/3/5) có độ tương tự hơn 95% với trình tự mRNA đã biết của C. Deserticola (gi| 289595227|gb|ADD12041.1|), trong khi comp28550_c1_seq4 và comp25940_c0_seq1 có độ tương tự lần lượt là 77% và 82%. Dự đoán ORF cho thấy 5 bản phiên mã có tiềm năng mã hóa protein và mang miền lyase axit amin thơm (PF00221.14). Trong số đó, chỉ có bản phiên mã comp{33}}c1_seq4 mới có thể mã hóa chuỗi protein hoàn chỉnh gồm 718 gốc axit amin. Có báo cáo cho rằng PAL được mã hóa bởi một họ đa gen nhỏ ở hầu hết các loài thực vật, chẳng hạn như 4 ở Arabidopsis thaliana, 5 ở Populus trichocarpa, 3 ở Scutellaria baicalensis và 7 ở Cucumis sativus, v.v. Phân tích phát sinh gen của chúng tôi cho thấy rằng có 4 Các gen mã hóa PAL ở C.


Deserticola và chúng tôi đặt tên chúng lần lượt là CdPAL1, CdPAL2, CdPAL3 và CdPAL4 (Hình S2). 4-coumarate-CoA ligase (4CL, EC 6.2.1.12) và trans-cinnamate 4-monooxygenase (CYP73A, EC 1.14.13.11) là hai enzyme chịu trách nhiệm biến đổi axit cinnamic thành dicoumarol-CoA theo hai chiều ngược lại đơn đặt hàng. Chúng cũng nằm trong mạng trục và giá trị FPKM biểu thức của chúng lần lượt là 39,57 và 51,93.

Bốn loại lignin được sinh tổng hợp bằng các con đường khác nhau được kiểm soát bởi ba enzyme chính là cinnamoyl-CoA reductase (CCR, EC 1.2.1.44), shikimate o-hydroxycinnamoyltransferase (HCT, EC 2.3.1.133) và lên men{{1{ {56}}}}hydroxylase (F5H, EC 1.14.-.-). CCR được báo cáo là điểm kiểm soát của con đường lignin [50, 51] xúc tác X-CoA (X bao gồm dicoumarol, caffeoyl, feruloyl, 5-hydroxyl-feruloyl và sinapoyl) thành Y-aldehyde (Y bao gồm p -cougar, caffeoyl, coniferyl, 5-hydroxyl-coniferyl và snap), trong khi HCT xúc tác p-coumaroyl-CoA thành p-coumaroyl axit shikimic/axit p-coumaroyl quinic. Hai enzyme này, giống như một công tắc, điều chỉnh quá trình sinh tổng hợp P-hydroxyl-phenyl lignin hoặc ba loại lignin còn lại. F5H là một công tắc nhánh khác điều chỉnh syringyl lignin và 5-hydroxyl-guaiacyl lignin. Các enzym quan trọng khác bao gồm axit caffeic 3-O-methyltransferase (COMT, EC 2.1.1.68), caffeoyl-CoA O-methyltransferase (CCoAOMT, EC 2.1.1.104) và cinnamyl-alcohol dehydrogenase (CAD, EC 1.1.1.195) ) cũng được phát hiện thể hiện. Thông tin biểu hiện chi tiết được liệt kê trong Bảng 6. Những gen enzyme được xác định trong nghiên cứu này sẽ cung cấp nguồn tài liệu quý giá cho các nghiên cứu về chức năng gen ở cây thuốc quan trọng này. 10 gen liên quan đến quá trình sinh tổng hợp lignin trong Bảng 6 đã được chọn để xác minh RT-qPCR để xác nhận kết quả RNAseq của chúng tôi (Hình 4) và mối tương quan cao của chúng (hệ số tương quan Pearson: 0,90343) cho thấy độ chính xác và độ tái lập cao của phân tích bảng điểm của chúng tôi. Bộ dữ liệu S1 liệt kê các trình tự mồi được sử dụng trong phân tích này.

CISTANCHE TUBULOSA TỰ NHIÊN ĐỂ CẢI THIỆN CHỨC NĂNG TÌNH DỤC PHGS75% ECH 30% ACT 12%
Các gen ứng cử viên mã hóa các enzym tham gia vào quá trình sinh tổng hợp PhG
Phenylethanoid glycoside (PhGs) được biết đến là hoạt chất chính trong C. Deserticola với các hoạt động cải thiện khả năng tình dục, loại bỏ các gốc tự do và chống lão hóa. Ba thành phần hóa học của PhG là axit hữu cơ, sacarit và aglycon phenyletanol (Hình 3). Các axit hữu cơ bao gồm axit caffeic, axit ferulic và axit coumalic là sản phẩm của con đường sinh tổng hợp phenylpropanoid. Các thành phần của sacarit bao gồm glucose và rhamnose là sản phẩm của các con đường chuyển hóa carbohydrate, như chuyển hóa tinh bột và sucrose, chuyển hóa đường amin và đường nucleotide, chuyển hóa fructose và mannose, v.v. Tuy nhiên, con đường sinh tổng hợp phần phenylanol vẫn chưa rõ ràng. Ở đây, chúng tôi đã đề xuất hai con đường sinh tổng hợp phenyletanol khả thi dựa trên dữ liệu trình tự của chúng tôi. Một là con đường axit caffeic hoặc axit ferulic đã được báo cáo, còn được gọi là con đường axit cinnamic tương tự như con đường chính sinh tổng hợp lignin. Một phương pháp khác dựa trên con đường chuyển hóa phenylalanine (Hình 3), trong đó quá trình chuyển hóa phenylalanine thành phenylanol được thực hiện bằng 'con đường Enrlich' được biết đến lần đầu tiên được tìm thấy trong nấm men cách đây một thế kỷ và được xác nhận trong hoa dạ yên thảo, cà chua và hoa hồng. Bốn gen enzyme mã hóa aspartate/tyrosine aminotransferase, histidine-phosphate aminotransferase và amine oxidase chính chịu trách nhiệm chuyển đổi phenylalanine thành phenylanol đã được phát hiện biểu hiện trong thân của C. Deserticola. Sản phẩm của phenyl ethanol có thể bị oxy hóa thêm bởi monooxygenase hoặc bị methyl hóa bởi methyltransferase thành các dẫn xuất của nó (phenyl ethanol aglycon) tham gia vào quá trình sinh tổng hợp PhG. Tóm lại, hai con đường sinh tổng hợp giả định của phenyletanol aglycon đã được đề xuất choC. sa mạcnhưng vẫn cần nghiên cứu thêm.
Thảo luận
Trong những năm gần đây, bộ gen thực vật đã phát triển nhanh chóng với việc áp dụng công nghệ giải trình tự thế hệ tiếp theo, trong khi rất ít nghiên cứu tập trung vào bộ gen của cây thuốc sa mạc. Điều cần thiết là phải thực hiện nghiên cứu về bộ gen hoặc phiên mã để hiểu sự thích nghi của nó với môi trường hạn hán và nhiễm mặn cũng như con đường sinh tổng hợp của các thành phần hoạt tính sinh học chính. Việc phát hiện ra bản phiên mã de novo của một số cây thuốc,


chẳng hạn như nhân sâm Panax, Ginkgo biloba và Glycyrrhiza uralensis lần đầu tiên được khai thác bằng cách sử dụng nền tảng Roche 454 vì độ dài đọc dài của nó. Do khả năng lắp ráp hiệu quả với các lần đọc ngắn, đặc biệt là các lần đọc kết thúc được ưu tiên, trình tự và lắp ráp phiên mã dựa trên Illumina cũng đã được sử dụng rộng rãi cho các sinh vật mô hình và không phải mô hình. Trong nghiên cứu hiện tại, chúng tôi đã tạo ra khoảng 8G gồm 101 bp lượt đọc kết thúc và tạo ra các chuỗi unigene dài hơn với độ dài trung bình 725 bp. Dữ liệu phiên mã đặc trưng của thân cây quy mô lớn có thể cung cấp dữ liệu tham khảo hữu ích và được sử dụng để khai thác quá trình chuyển hóa thứ cấp của các thành phần hoạt tính sinh học của C. Deserticola. Có 81,62% tổng số lần đọc thô đã vượt qua các bộ lọc chất lượng nghiêm ngặt (bao gồm cắt bộ chuyển đổi và loại bỏ các lần đọc chất lượng thấp) trước khi lắp ráp, cho thấy chất lượng cao của dữ liệu giải trình tự của chúng tôi và 82,08% số lần đọc chất lượng cao rất hữu ích cho việc lắp ráp. Các lần đọc khác không được sử dụng để lắp ráp có thể đến từ lỗi trình tự, tham số lắp ráp và cộng sự. Những lần đọc chất lượng cao chưa được sử dụng này vẫn hữu ích trong việc cải thiện quá trình lắp ráp de novo kết hợp với các lần đọc dài hơn từ nền tảng khác (chẳng hạn như Roche 454) trong tương lai.

CISTANCHE TUBULOSA TỰ NHIÊN ĐỂ CẢI THIỆN CHỨC NĂNG TÌNH DỤC PHGS75% ECH 30% ACT 12%
Một số lượng lớn các bản phiên mã được lắp ráp (30.098) cho thấy sự tương đồng về trình tự cao với các gen đã biết trong cơ sở dữ liệu công cộng, cho thấy rằng dữ liệu kết hợp dựa trên Illumina của chúng tôi bao gồm một phần đáng kể các bản phiên mã của C. Deserticola. Các bản phiên mã không có lần truy cập BLAST có thể là do các vùng chưa được dịch mã 3' hoặc 5', RNA không mã hóa hoặc trình tự gen mới của C. Deserticola. Các bản phiên mã được biểu thị được chú thích theo nhiều loại GO và các con đường KEGG (Bảng 3 và 4), trong đó nhiều bản phiên mã được gán cho các con đường liên quan đến trao đổi chất thứ cấp. Như chúng ta đã biết, phenylpropanoid có thể hoạt động như một hợp chất kháng khuẩn cảm ứng rất tốt cho lối sống dưới lòng đất [1], đồng thời cũng hoạt động như một phân tử tín hiệu trong tương tác thực vật-vi khuẩn bên cạnh công dụng chữa bệnh của nó [68, 69]. Terpenoid được sử dụng để sinh tổng hợp các thành phần có hoạt tính sinh học (chẳng hạn như 6- deoxycatalpol) [70]. Chúng tôi nhận thấy các gen liên quan đến quá trình sinh tổng hợp xương sống phenylpropanoid và terpenoid rất phong phú ở C. Deserticola. Quan trọng hơn, việc phát hiện ra các con đường sinh tổng hợp lignin được thể hiện rõ ràng (Hình 3) cho thấy quá trình trao đổi chất tích cực của lignin trong thân cây C. Deserticola. Tất cả các gen enzyme đã biết liên quan đến quá trình sinh tổng hợp lignin (Hình 3) đều được phát hiện biểu hiện và bốn enzyme chủ chốt bao gồm PAL, CCR, HCT và F5H có mức độ biểu hiện thấp hơn (FPKM 26,47, 3,89, 3,4 và 3,83, tương ứng) so với các gen enzyme khác (Bảng 6). Liệu sự thay đổi biểu hiện của ba gen đó có thể ảnh hưởng đến việc sản xuất lignin ở C. Deserticola hay không là điều đáng được nghiên cứu thêm. PAL là enzyme chủ chốt trong quá trình sinh tổng hợp lignin và cũng tham gia vào quá trình sinh tổng hợp phenylpropanoid, resveratrol, flavonoid và coumarin [71–74]. Chúng tôi đã phát hiện bốn gen PAL riêng biệt trong bộ gen của C. Deserticola (S2 Fig), điều này trùng hợp với việc PAL được mã hóa bởi một họ đa gen nhỏ [39, 43, 45–49] và chứng minh thêm rằng nó có thể đóng vai trò quan trọng trong dòng carbon trao đổi chất .
PhG là thành phần hoạt chất chính trong C. Deserticola. Các gen liên quan đến quá trình sinh tổng hợp phenylanol rất quan trọng đối với chất lượng của C. Deserticola. Chúng tôi đã suy ra hai con đường sinh tổng hợp khác nhau của phenyl ethanol và 17 gen enzyme liên quan đến sinh tổng hợp PhG ở thân cây C. Deserticola. Các quá trình hậu caffeic/axit ferulic có thể xảy ra (Hình 3) cũng lần đầu tiên cũng được suy ra dựa trên công thức cấu trúc của các chất trung gian và tính chất xúc tác của các enzyme tương ứng, trong đó axit caffeic/ferulic lần đầu tiên sẽ bị oxy hóa thành dẫn xuất phenylpyruvate; sau đó, nhóm carboxyl bị loại bỏ bởi decarboxylase; cuối cùng, nhóm aldehyd được chuyển trở lại thành nhóm rượu nhờ dehydrogenase. Đây là ứng dụng đầu tiên của công nghệ giải trình tự kết hợp Illumina để nghiên cứu toàn bộ bản phiên mã của C. Deserticola và tập hợp các lần đọc RNA-seq mà không cần bộ gen tham chiếu. Nghiên cứu này sẽ cung cấp những nguồn tài liệu và trình tự gen hữu ích cho nghiên cứu về gen chức năng và protein học trên C. Deserticola trong tương lai.
Kết luận
Trong nghiên cứu này, chúng tôi đã mô tả sơ lược bản phiên mã của thân cây C. Deserticola dựa trên dữ liệu giải trình tự thông lượng cao, xác định các gen liên quan đến con đường sinh tổng hợp lignin và lần đầu tiên cũng suy ra con đường sinh tổng hợp tiềm năng của PhG, điều này chắc chắn sẽ đẩy nhanh sự hiểu biết. về các quá trình sinh lý mơ hồ và giá trị y học to lớn ở cấp độ phân tử. Cho đến nay, đây là nỗ lực đầu tiên nhằm tập hợp toàn bộ bản phiên mã của thân cây C. Deserticola và phát hiện con đường sinh tổng hợp các thành phần thuốc bằng cách sử dụng bộ dữ liệu giải trình tự dựa trên Illumina. Nghiên cứu của chúng tôi có thể thúc đẩy sự phát triển của các loại thuốc tự nhiên và việc lựa chọn các giống cây trồng có đặc điểm dược liệu.

CISTANCHE TUBULOSA TỰ NHIÊN ĐỂ CẢI THIỆN CHỨC NĂNG TÌNH DỤC PHGS75% ECH 30% ACT 12%







