So Sánh Giữa QPCR Và RNA‑seq Tiết Lộ Những Thách Thức Trong Định Lượng Biểu Hiện HLA Phần 2

May 25, 2023

bình thường hóa

Chúng tôi đã sử dụng ước tính biểu thức trong bảng điểm trên một triệu (TPM), đây là phép chuẩn hóa tiêu chuẩn do Salmon tạo ra và tương ứng với số lượng tương đối của bảng điểm nhất định trong một mẫu. Đối với bất kỳ gen cụ thể nào, ước tính chỉ đơn giản là tổng số TPM cho các bản phiên mã của nó. Trong một số trường hợp khi chúng tôi hiển thị các ước tính được chuyển đổi chuẩn thông thường, chúng tôi đã thực hiện chuyển đổi chuẩn thứ hạng của dữ liệu RNAseq bằng cách sử dụng gói GenABEL R (Aulchenko et al. 2007), ví dụ, thường được áp dụng trong các mô hình tuyến tính của ánh xạ eQTL (Delaneau và cộng sự 2017).

Lập bản đồ QTL là phương pháp nghiên cứu cơ chế điều hòa biểu hiện gen bằng cách so sánh mối liên quan giữa biểu hiện gen và tính đa hình gen trong quần thể. Mô hình tuyến tính là phương pháp lập bản đồ eQTL thường được sử dụng, có thể sử dụng mô hình hồi quy tuyến tính để ước tính mối tương quan giữa biểu hiện gen và tính đa hình của gen.

Hệ thống miễn dịch là một hệ thống sinh học phức tạp giúp bảo vệ cơ thể khỏi nhiễm trùng và các bệnh như ung thư. Quy định về biểu hiện gen đóng một vai trò quan trọng trong hệ thống miễn dịch và có thể ảnh hưởng đến sự phát triển, biệt hóa và chức năng của các tế bào miễn dịch.

Do đó, các mô hình tuyến tính của ánh xạ eQTL có thể được sử dụng để phân tích mối quan hệ giữa các cơ chế điều hòa biểu hiện gen và khả năng miễn dịch. Ví dụ, nghiên cứu mối tương quan giữa một kiểu gen nhất định và sự biểu hiện của một gen miễn dịch quan trọng trong quần thể có thể cho thấy ảnh hưởng của kiểu gen này trong việc điều chỉnh biểu hiện gen miễn dịch. Nghiên cứu như vậy có thể cung cấp sự hiểu biết quan trọng cho việc điều trị và phòng ngừa các bệnh miễn dịch. Điều này cho thấy tầm quan trọng của khả năng miễn dịch, vì vậy chúng ta cần nâng cao khả năng miễn dịch mỗi ngày. Thịt băm cũng có tác dụng chống vi rút, chống ung thư và các tác dụng khác, có thể tăng cường khả năng miễn dịch của hệ thống khả năng chống lại và cải thiện khả năng miễn dịch của cơ thể.

cistanche wirkung

Nhấp vào lợi ích sức khỏe của cistanche

Đọc liên kết với bộ gen tham chiếu

Để phân tích mức độ bao phủ đọc ở các gen HLA được báo cáo trong Hình S7, chúng tôi đã căn chỉnh các lần đọc với bộ gen tham chiếu GRCh38 với STAR v2.7.3a (Dobin et al. 2013), sử dụng chú thích gen Gencode v37. Để kiểm soát sự sai lệch ánh xạ tại các gen HLA, chúng tôi đã xử lý thêm các tệp BAM bằng hlamapper v4.3 (Castelli et al. 2018).

mô phỏng

Dữ liệu thực tế

Để tạo dữ liệu mô phỏng, trước tiên chúng tôi chạy Salmon v1.3.0 (Patro et al. 2017) trên mẫu thực #66K00003 để tìm hiểu các mức biểu thức của bản ghi Gencode v37. Sau đó, chúng tôi đã sử dụng gói Polyester (v1.26.0) để tạo 50 mẫu tổng hợp với các mức biểu thức trên toàn bộ phiên mã giống hệt nhau, ngoại trừ HLA-A, -B và -C. Mức độ biểu hiện của các gen này dựa trên 50 cá thể được chọn ngẫu nhiên từ dữ liệu thực của chúng tôi (chúng tôi có sẵn dữ liệu alen HLA). Đối với mỗi gen HLA, chúng tôi đã chọn các dạng đồng phân chiếm ít nhất 90 phần trăm tổng biểu hiện bản phiên mã mã hóa protein trong cá hồi chạy trên bộ dữ liệu thực (dẫn đến chỉ có 1 bản phiên mã cho mỗi gen) và cá nhân hóa trình tự phiên mã theo Các alen HLA được mang bởi mỗi cá nhân.

Quy trình này cho phép chúng tôi tạo tổng hợp 50 cá thể có các mức biểu thức nền giống hệt nhau, nhưng có biểu thức HLA thay đổi và với tính đa hình HLA được tích hợp trong các lần đọc mô phỏng.

Để phản ánh dữ liệu thực của chúng tôi, ba mươi triệu lượt đọc kết thúc được ghép nối 126 bp với kích thước phân đoạn trung bình là 261 bp đã được mô phỏng cho từng cá nhân, sử dụng giá trị mặc định cho các tham số polyester khác (ví dụ: độ lệch chuẩn của độ dài phân đoạn=25 bp, tỷ lệ lỗi=0.005, phân phối số lần đọc đồng đều và không sai lệch). Polyester xuất ra các tệp FASTA, từ đó chúng tôi tạo ra các tệp FASTQ với điểm chất lượng không đổi (ký hiệu tương ứng "F").

Số liệu về độ chính xác

TPM được tính toán trên số lượng mô phỏng với độ dài bản sao và kích thước đoạn trung bình là 261 bp. Tỷ lệ "TPM ước tính/TPM thực" được sử dụng để đánh giá hiệu suất trong việc khôi phục các mức biểu thức mô phỏng và cho phép chúng tôi quan sát đánh giá thấp hoặc đánh giá quá cao.

đồ họa

Chúng tôi đã chuẩn bị tất cả các biểu đồ trong bài viết này bằng cách sử dụng gói ggplot2 v3.3.2 (Wickham 2016) trong R.

cistanche effects

Kết quả

Độ chính xác của định lượng RNA‑seq HLA

Do không có phương pháp có thể được coi là tiêu chuẩn vàng thử nghiệm để định lượng biểu thức HLA từ dữ liệu RNA-seq, ban đầu chúng tôi đã đánh giá độ chính xác của phương pháp định lượng RNA-seq cho HLA bằng cách sử dụng dữ liệu mô phỏng trong đó các mức biểu thức thực được biết kể từ khi chúng được tạo ra trong một máy tính để mô phỏng các thí nghiệm thực tế. Điều này đã được thực hiện để chọn phương pháp tính toán tốt nhất trong số các phương pháp dựa trên RNA-seq, cho phép tương phản tiếp theo với các phương pháp không phải RNA-seq.

Chúng tôi đã mô phỏng thử nghiệm RNA-seq cho 50 cá nhân sử dụng gói Polyester (Frazee et al. 2015). Các cá thể tổng hợp này có các mức biểu hiện giống nhau đối với tất cả các gen trong bộ gen, ngoại trừ HLA-A, -B và -C, mà chúng tôi đã thay đổi các mức biểu hiện. Chúng tôi cũng đã cá nhân hóa các trình tự phiên mã HLA được chú thích từ Gencode v37 để giới thiệu biến thể di truyền thực sự được quan sát thấy ở các cá thể được chọn ngẫu nhiên từ bộ dữ liệu gồm 96 cá thể (được tạo kiểu gen HLA theo trình tự Sanger như mô tả bên dưới). Kết quả bản sao được cá nhân hóa có nhận dạng trình tự trung bình với tham chiếu lớn hơn 95 phần trăm cho tất cả các locus HLA.

Chúng tôi đã so sánh các ước tính về biểu hiện HLA thu được bằng hai phương pháp tin sinh học: (1) "Bản phiên mã tham chiếu", sử dụng Salmon (Patro et al. 2017) để sắp xếp các lần đọc cho bản phiên mã tham chiếu tiêu chuẩn, định lượng mức độ phong phú của bản phiên mã và (2) "Được cá nhân hóa", cũng sử dụng Cá hồi, nhưng bản đồ đọc thành bản sao HLA được cá nhân hóa, phản ánh kiểu gen HLA của cá nhân (Hình 1). Phương pháp "Cá nhân hóa" mở rộng chiến lược trước đây của chúng tôi (Aguiar et al. 2019) bằng cách sử dụng bảng điểm được cá nhân hóa, thay vì một trình tự mã hóa chính tắc duy nhất cho từng alen do cá nhân mang.

cistanche in store

Phương pháp "Bản sao tham chiếu" đã đánh giá thấp các mức biểu hiện, đặc biệt đối với các alen có tỷ lệ khác biệt trình tự lớn hơn liên quan đến bộ gen tham chiếu (Hình 1). Điều này được mong đợi vì tỷ lệ không khớp cao hơn giữa các lần đọc và tham chiếu tác động tiêu cực đến sự liên kết (Brandt et al. 2015). Cách tiếp cận này cũng đánh giá quá cao biểu thức HLA-C đối với một số cá nhân, hệ quả của việc đọc từ HLA-B được ánh xạ tới bảng điểm tham chiếu HLA-C (Hình S1). Mặt khác, phương pháp "Cá nhân hóa" kiểm soát độ lệch ánh xạ và đạt được độ chính xác tối ưu.

Mặc dù mô phỏng của chúng tôi cung cấp các kết quả đáng khích lệ về việc định lượng biểu thức HLA bằng RNAseq, nhưng chúng tôi phải xem xét một số lưu ý. Chúng tôi đã sửa đổi trình tự của các đồng dạng được chú thích theo các alen HLA của từng cá nhân bằng cách sử dụng một bộ đồng dạng duy nhất cho tất cả các alen tại một gen HLA nhất định. Các trình tự đó đã được sử dụng cả trong mô phỏng số lần đọc cũng như trong định lượng biểu thức; do đó, chúng tôi mong đợi độ chính xác tối ưu. Trong một kịch bản thực tế, các alen HLA khác nhau có thể được liên kết với các dạng đồng phân khác nhau. Ở phần sau của bài báo này, chúng tôi thảo luận về một ví dụ cụ thể mà chúng tôi quan sát được đối với HLA-A, phù hợp với giả thuyết rằng một số dạng đồng phân nhất định chỉ dành riêng cho các alen cụ thể. Tuy nhiên, do chúng tôi chủ yếu quan tâm đến các ước tính biểu hiện ở cấp độ gen và cấp độ alen HLA, chúng tôi hy vọng rằng các trình tự được cá nhân hóa thể hiện sự cải thiện so với một bản phiên mã tham chiếu duy nhất bằng cách giảm sai lệch ánh xạ.

Ước tính biểu hiện HLA từ dữ liệu RNA‑seq thực

Chúng tôi đã thực hiện ước tính biểu thức trên dữ liệu RNA-seq toàn bộ phiên mã cho 96 cá nhân, trong đó qPCR cho các mức biểu hiện bề mặt HLAA, -B và -C và HLA-C đã được ước tính trước đó (Kulkarni et al. 2013; Ramsuran et al. 2015, 2017) và có thể được sử dụng để so sánh với kết quả RNAseq (xem Hình S2 để biết các phân tích QC trên dữ liệu RNA-seq).

Với độ chính xác cao hơn của phương pháp được cá nhân hóa trong mô phỏng, chúng tôi so sánh phương pháp ước tính biểu thức dựa trên RNA-seq này với phương pháp của các phương pháp không phải RNA-seq khác, nhưng cung cấp kết quả cho các phương pháp dựa trên phiên mã tham chiếu trong "Thông tin bổ sung. " Chúng tôi đã cá nhân hóa các trình tự phiên mã dựa trên các kiểu gen HLA riêng lẻ thu được bằng trình tự Sanger. Chúng tôi đã chạy HLApers (Aguiar et al. 2019) và Kourami (Lee và Kingsford 2018) để suy ra các alen trực tiếp từ dữ liệu RNA-seq và xác nhận các cuộc gọi Sanger (xem "Vật liệu và phương pháp").

Các ước tính biểu hiện ở cấp độ gen cho thấy HLA-B có biểu hiện cao nhất trong số các locus HLA trong bộ dữ liệu của chúng tôi, tiếp theo là HLA-C và HLA-A (Hình 2A). Thứ tự này nhất quán với bộ dữ liệu máu toàn phần GTEx (GTEx Consortium 2020) và với phương pháp RNAseq thu giữ HLA trước đó được áp dụng cho PBMC (Yamamoto et al. 2020). Tuy nhiên, mô hình này khác với mô hình của Boegel và cộng sự (2018), người đã quan sát các mức độ tương tự giữa các gen bằng cách sử dụng một chiến lược khác để xử lý việc đọc ánh xạ tới nhiều locus, điều này có thể góp phần vào việc thiếu sự khác biệt giữa các locus về mức độ biểu hiện ). Các nghiên cứu trong tương lai sẽ phải phân tích sự đóng góp của sự khác biệt trong phương pháp luận hoặc thành phần loại tế bào đối với những khác biệt này.

cistanche cvs

So sánh RNA‑seq và qPCR trên dữ liệu thực

Tiếp theo, chúng tôi so sánh các ước tính biểu hiện RNA-seq với các ước tính thu được bằng qPCR (Hình 2 B). Mặc dù mối tương quan giữa biểu hiện RNA-seq và qPCR có ý nghĩa thống kê đối với tất cả các gen (p=0.024, 0.002, 0,000000016, đối với HLA-A, -B và -C, tương ứng; thử nghiệm của Spearman về mối liên hệ tích cực), mức độ của các mối tương quan là khiêm tốn đối với HLA-A và -B, và cao hơn đối với -C. Việc sử dụng một tài liệu tham khảo được cá nhân hóa cho RNA-seq đã làm tăng một cách khiêm tốn mối tương quan với qPCR so với một tài liệu tham khảo tiêu chuẩn (Hình S3). Điều này đồng ý với quan sát trước đây của chúng tôi rằng các ước tính biểu hiện ở cấp độ gen không khác biệt đáng kể giữa các phương pháp tiếp cận dựa trên bộ gen tham chiếu hoặc được cá nhân hóa đối với các gen HLA loại I (Aguiar et al. 2019), với lợi ích chính của các phương pháp được cá nhân hóa là các ước tính ở mức cấp độ alen HLA mà chúng tôi khám phá bên dưới. Việc sử dụng hiệu chỉnh độ lệch trong Salmon (độ lệch GC, độ lệch cụ thể theo trình tự và độ lệch cụ thể theo vị trí) cải thiện mối tương quan với qPCR, với tác động cao nhất đối với HLA-B (so sánh Fig. 2B và S4, đối với dữ liệu đã sửa và chưa sửa, tương ứng).

cistanche vitamin shoppe

So sánh mức độ mRNA với biểu hiện bề mặt

Vì sự biểu hiện RNA cung cấp thông tin về các bước đầu tiên của quá trình truyền tín hiệu và phản ứng của tế bào đối với các kích thích, nên việc phân tích mối quan hệ của nó với các kiểu hình phân tử xuôi dòng (chẳng hạn như biểu hiện protein trên bề mặt tế bào) có thể giúp chúng ta hiểu được vai trò của quá trình điều hòa sau phiên mã và sau dịch mã trên biểu hiện HLA. Sự khác biệt giữa sự phong phú của RNA và protein được mong đợi vì chúng phải tuân theo các chế độ điều chỉnh riêng biệt. Các hiệu ứng kỹ thuật cũng có thể tạo ra sự khác biệt do các kỹ thuật RNA và protein khác nhau và bị ảnh hưởng bởi các loại lỗi không tương quan (Li và Biggin 2015; Kaur và cộng sự 2017; Carey và cộng sự 2019). Hơn nữa, trong trường hợp nghiên cứu của chúng tôi, biểu hiện gen được đo trên tổng số PBMC, trong khi biểu hiện protein được đo trên các tế bào cộng với CD3 đã sắp xếp. Với sự khác biệt này, chúng tôi đã đo lường mức độ mà protein HLA trên bề mặt tế bào có thể được dự đoán bằng biểu hiện mRNA. Phân tích này được thực hiện riêng cho HLA-C vì đây là locus duy nhất có sẵn một kháng thể có thể liên kết tất cả các alen có ái lực như nhau. Điều thú vị là có mối tương quan cao giữa biểu hiện mRNA và protein đối với HLAC, với mối tương quan cao hơn một chút đối với RNA-seq (Hình 2C).

Mức độ biểu hiện alen HLA

Các gen HLA chứa các yếu tố điều hòa liên quan đến phiên mã cấu thành và phiên mã được kích hoạt động (René et al. 2016). Do đó, biểu hiện HLA khác nhau giữa các mô và có thể được điều chỉnh bởi các mạng lưới điều tiết được kích hoạt bởi các kích thích khác nhau (Anderson 2018; Carey et al. 2019). Người ta ngày càng quan tâm đến việc tìm hiểu xem liệu các alen HLA riêng biệt có liên quan đến các mức độ biểu hiện cơ bản và các chương trình điều tiết khác nhau hay không (Aguiar và cộng sự. 2019; Gutierrez-Arcelus và cộng sự 2020) và liệu biến thể này có góp phần tạo nên kiểu hình bệnh hoặc kết quả cấy ghép hay không (Petersdorf và cộng sự cộng sự 2014, 2015; René và cộng sự 2016; Bettens và cộng sự 2022; Johansson và cộng sự 2022). Do đó, ước tính mức độ biểu hiện alen HLA cho qPCR và RNA-seq đã được so sánh. Bởi vì các alen riêng lẻ thường khá hiếm trong bộ dữ liệu, nên chúng tôi đã nhóm chúng theo dòng alen (nghĩa là các nhóm alen được xác định về mặt phát sinh gen bởi mối quan hệ của các exon) (Elsner et al. 2002).

Chúng tôi đã xếp hạng các dòng theo mức độ biểu hiện của chúng dựa trên cả dữ liệu RNA-seq và qPCR, đồng thời đánh giá mức độ phù hợp của thứ hạng giữa các phương pháp (Hình 3). Cách tiếp cận RNA-seq được cá nhân hóa của chúng tôi trực tiếp cung cấp các ước tính ở cấp độ alen, vì trình tự alen HLA được sử dụng để lập chỉ mục cho sự sắp xếp, vì vậy chúng tôi đã sắp xếp các dòng alen theo mức độ biểu hiện trung bình của chúng. Do các ước tính biểu hiện qPCR của chúng tôi ở cấp độ gen và không trực tiếp cung cấp các ước tính ở cấp độ alen, nên chúng tôi đã sắp xếp các dòng alen theo tác động của chúng trong một mô hình tuyến tính về các mức biểu hiện được giải thích bởi kiểu gen HLA (xem Ramsuran et al. 2015). Trong Hình 3, các giá trị biểu thức được vẽ hai lần cho mỗi cấp độ đối với từng alen của cá thể và đối với qPCR, nó chỉ đơn giản là biểu hiện cấp độ gen được vẽ hai lần, phản ánh sự hiện diện của hai alen.

cistanche uk

Thứ tự của các ước tính biểu thức giống nhau hơn giữa RNA-seq và qPCR đối với HLA-C so với -A và -B (chênh lệch thứ tự tuyệt đối trung bình, trong đó chênh lệch thứ tự đề cập đến sự khác biệt quan sát được ở các vị trí trong thứ tự được xếp hạng của các giá trị biểu thức , giữa định lượng RNA-seq và qPCR, là 2,3 đối với HLA-C, 3,1 đối với -A và 3,9 đối với -B), tuân theo mô hình tương tự về sự đồng thuận với mô hình biểu hiện ở cấp độ gen mà chúng tôi đã tìm thấy mối tương quan cao nhất giữa RNA-seq và qPCR cho HLA-C.

Trong số các dòng có sự khác biệt lớn nhất giữa RNA-seq và qPCR là A*11. Chúng tôi đã đo biểu hiện bề mặt trên một tập hợp con các dị hợp tử đối với A*03 hoặc A*11 bằng cách sử dụng một kháng thể có ái lực như nhau đối với cả hai dòng và quan sát thấy rằng qPCR tương quan mạnh mẽ hơn với biểu hiện bề mặt tế bào của hai kiểu mẫu này so với RNA-seq (Hình. S5). Tiếp theo, chúng tôi trình bày một đánh giá sâu rộng hơn về thứ tự alen thông qua so sánh với các nghiên cứu trước đây về biểu hiện HLA mRNA.

Mặc dù có mối quan tâm đến việc so sánh sự khác biệt về biểu hiện giữa các alen HLA, nhưng các nghiên cứu khác nhau cho thấy rằng sự thay đổi trong biểu hiện trong một alen hoặc dòng alen thường khá cao và sự khác biệt giữa các alen thuộc các bậc khác nhau thường nhỏ và không đáng kể. Do đó, có thể không thực tế khi mong đợi duy trì thứ hạng trên nhiều alen và có thể tốt hơn là so sánh các ước tính biểu thức cho các alen ở các cực của biểu thức.

Đối với dữ liệu RNA-seq của chúng tôi, chúng tôi so sánh các ước tính của mình với dữ liệu từ hai phương pháp tiếp cận RNA-seq phù hợp với HLA trước đây trên PBMC. Có một sự phù hợp tổng thể tốt với Yamamoto et al. (2020), trong đó A*24, A*02, C*04 và C*06 được thể hiện ở mức độ cao và A*03, C*03 và B*15 được thể hiện ở mức độ thấp, mặc dù chúng tôi cũng nhận thấy sự khác biệt như vậy đối với B*35, điều này sẽ phù hợp hơn với dữ liệu qPCR của chúng tôi. Khi chúng tôi so sánh dữ liệu RNA-seq của mình với Johansson et al. (2021), tuy nhiên, chúng tôi thấy nhiều điểm khác biệt hơn, mặc dù chúng có các mẫu rất nhỏ đối với nhiều dòng.

Chúng tôi cũng đối chiếu kết quả của mình với kết quả từ hai nghiên cứu qPCR trước đó đã áp dụng các mồi đặc hiệu cho alen. Bettens et al. (2014) đã sử dụng đoạn mồi đặc hiệu alen cho một số dòng HLAC và thấy C*04 và C*06 được biểu hiện cao, trong khi C*07 và C*03 được biểu hiện ở mức thấp, phù hợp với những gì chúng tôi có cho cả RNA-seq và qPCR. René et al. (2015) đã áp dụng các đoạn mồi dành riêng cho alen cho HLA-A và quan sát thấy A*02 (cao) và A*29 (thấp) ở các thái cực của biểu hiện, điều này phù hợp hơn với kết quả RNAseq của chúng tôi so với qPCR của chúng tôi; tuy nhiên, chúng tôi thấy nhiều điểm khác biệt ở các dòng alen khác

Trong một số trường hợp, chúng ta cũng có thể đánh giá sự đồng thuận với các nghiên cứu chức năng. Ví dụ: các phân tích trước đây về các vị trí liên kết yếu tố phiên mã (TFBS) và hoạt động của trình khởi động (được đánh giá trong Anderson 2018) và các nghiên cứu về quy định miRNA (Kulkarni et al. 2011), cho thấy C*03 và C*07 là các alen biểu hiện yếu, đồng ý với các quan sát của chúng tôi đối với cả RNA-seq và qPCR.

Nguồn tiềm năng cho sự khác biệt

Tiếp theo, chúng tôi đã điều tra xem liệu việc xử lý các mẫu được sử dụng cho RNA-seq có thể góp phần vào sự khác biệt giữa các ước tính biểu hiện thu được với qPCR và RNA-seq hay không.

Một mối quan tâm cụ thể là khoảng thời gian các mẫu được bảo quản trong tủ đông –80 độ (khoảng 4 năm giữa các thử nghiệm qPCR và RNA-seq), cũng như các bước khác dành riêng cho thử nghiệm RNA-seq, bao gồm cả việc làm tan băng các mẫu. Để giải quyết vấn đề này, chúng tôi đã thực hiện một thí nghiệm RNAseq thứ hai trên máu tươi được vẽ lại từ 11 cá thể, là một tập hợp con của 96 cá thể được phân tích trong nghiên cứu này và chúng tôi đã so sánh các ước tính biểu hiện giữa hai điểm thời gian. Mặc dù xét nghiệm thứ hai này mang cả sự khác biệt về kỹ thuật và sinh học liên quan đến thí nghiệm RNA-seq đầu tiên (Hình S6A và B), mối tương quan trên toàn bộ phiên mã trong ước tính biểu thức giữa các điểm thời gian là cao (Hình S6C).

Mặc dù việc đánh giá mối tương quan với 11 cá thể có thể gây ồn ào, nhưng mối tương quan ở các gen HLA là một trong những mối tương quan khôn ngoan về gen lớn nhất giữa hai mẫu (Hình S6D và F). Chúng tôi cũng đã tính toán tỷ lệ alen bên trong từng cá thể, là tỷ lệ biểu hiện giữa hai alen HLA của một cá thể dị hợp tử và so sánh chúng giữa các thời điểm. Mối tương quan lớn hơn 0.94 đối với HLA-A, -B và -C (Hình S6E). Do đó, chúng tôi không thấy bằng chứng nào về sự đóng góp lớn của sự thoái biến RNA để giải thích mối tương quan thấp giữa RNA-seq và qPCR trong mẫu ban đầu của chúng tôi.

Một đóng góp khả dĩ khác cho sự khác biệt giữa RNA-seq và qPCR là alen HLA cụ thể có thể sai lệch hơn trong phương pháp này hay phương pháp khác, trong trường hợp đó, các cá thể mang alen như vậy sẽ góp phần tạo ra sự khác biệt lớn. Ví dụ: đối với những cá thể mang A*03 hoặc đối với thể đồng hợp tử C*07, có mối quan hệ ngược chiều giữa qPCR và RNA-seq (Hình 4A).

cistanche sleep

Một nguồn bổ sung khác biệt giữa các phương pháp có thể phát sinh từ thực tế là, trong phương pháp RNA-seq của chúng tôi, chúng tôi cá nhân hóa tất cả các bản phiên mã được chú thích Gencode cho mọi alen HLA; tuy nhiên, sự đa dạng phiên mã thực sự và mối liên hệ của nó với các alen HLA cụ thể vẫn chưa được hiểu rõ. Ví dụ, Kulkarni et al. (2017) cho thấy A*01 và A*11 tạo ra 3′-UTR ngắn hơn. Để điều tra xem liệu chúng tôi có thể sao chép nguồn tài trợ đó trong dữ liệu RNA-seq của mình hay không, chúng tôi đã ánh xạ các lần đọc tới bộ gen tham chiếu và sửa lỗi ánh xạ sai lệch tại các gen HLA bằng một công cụ ánh xạ hla (Castelli et al. 2018). Thật vậy, đối với những cá nhân mang A * 01 hoặc A * 11, phạm vi đọc ở 3′-UTR của HLA-A cho thấy mức giảm mạnh ở mức ~ 120 bp trước khi kết thúc gen chú thích (Hình S7).

cistanche capsules

Bởi vì giá trị bản ghi trên một triệu (TPM) được tính toán có tính đến độ dài tham chiếu, nên việc sử dụng tham chiếu dài hơn bản ghi thực sẽ dẫn đến đánh giá thấp biểu thức. Chúng tôi đã cố gắng kiểm soát khả năng có các bản ghi ngắn hơn như vậy bằng cách đưa một phiên bản của mỗi bản ghi HLA-A với 3′-UTR rút gọn vào chỉ mục của chúng tôi để căn chỉnh đọc. Tuy nhiên, chúng tôi không tìm thấy bằng chứng nào về biểu hiện của đồng dạng ngắn hơn (Hình S8), có thể là do các đồng dạng ngắn hơn này được chứa trong các đồng dạng có độ dài bình thường và việc triển khai của Salmon gán tất cả các lần đọc cho đồng dạng lớn hơn. Thật thú vị, biểu thức ở cấp độ đồng dạng cho thấy một đồng dạng có 5′-UTR dài hơn dành riêng cho A * 11, đóng góp một tỷ lệ lớn trong tổng biểu thức cho alen này (Hình S8).

Chúng tôi cũng đã thử nghiệm chuẩn hóa các ước tính biểu thức của mình, trong đó chúng tôi đã điều chỉnh độ dài đọc dựa trên phạm vi đọc hỗ trợ đầu cuối 3′-UTR gần hoặc xa (trung bình có trọng số của độ dài bản ghi sử dụng phạm vi đọc làm trọng số). Mặc dù chúng tôi quan sát thấy mức tăng tới 20% ở các mức độ biểu hiện đối với những cá nhân mang A*01 và/hoặc A*11, nhưng chúng tôi chỉ thấy một sự cải thiện nhỏ trong mối tương quan với qPCR sau lần điều chỉnh này (từ rho=0. 20 trong Hình 2 đến rho=0.24 trong Hình 4B).

A*01 và A*11 nằm trong số các alen có sự khác biệt về thứ hạng lớn nhất giữa RNA-seq và qPCR (Hình 3) và sự thể hiện không hoàn hảo của các bản phiên mã liên quan của chúng trong chú thích có thể gây sai lệch trong ước tính RNA-seq của chúng tôi.

Cuối cùng, các phương pháp chuẩn hóa được sử dụng để thu được ước tính biểu thức cuối cùng từ dữ liệu qPCR thô cũng có thể là nguồn gốc của sự khác biệt giữa ước tính qPCR và RNA-see. Xét nghiệm PCR định lượng đối với gen HLA Loại I thường khuếch đại các vùng trong exon 1 đến 4 và tiêu chuẩn hóa bằng biểu hiện của gen giữ nhà như B2M ( 2-microglobulin) thường được thực hiện (như trường hợp trong nghiên cứu hiện tại ). Cơ sở lý luận cho quy trình này là nếu các mức biểu thức được chuẩn hóa bằng một tham chiếu được biểu thị ổn định, thì các ước tính cho các cá nhân khác nhau được đặt trên cùng một thang đo, do đó cho phép so sánh giữa các cá nhân.

B2M mã hóa cho chuỗi nhẹ trong phân tử HLA Lớp I, và điều hợp lý là các gen B2M và HLA lớp I có một số sự phối hợp biểu hiện, vì chúng có chung cấu trúc trình tự khởi đầu (Kobayashi và van den Elsen 2{{1{{12} }}}12; Vijayan và cộng sự 2019) và có thể được điều chỉnh bởi các yếu tố phiên mã được chia sẻ (ví dụ: NLRC5/CITA tạo ra biểu hiện của cả HLA lớp I và B2M trong các dòng tế bào Jurkat (Meissner và cộng sự al. 2{{20}}10). Việc chuẩn hóa biểu hiện gen HLA bằng các giá trị tương quan có thể gây ra sai lệch trong các ước tính qPCR của chúng tôi, đặc biệt là đối với HLA-B, mà chúng tôi thấy tỷ lệ cao tương quan với biểu thức B2M (Hình 4). Việc chia tỷ lệ một biến theo một biến khác nhưng có tương quan với nhau có thể gây ra nhiễu loạn bằng cách đưa các giá trị cực trị vào giữa phân phối và giảm phương sai; phù hợp với giả thuyết này, các hệ số biến thiên cho dữ liệu qPCR là 0,61 và 0,50 đối với HLA-A và -C, nhưng giảm xuống 0,17 đối với HLA-B (để so sánh, CV đối với dữ liệu RNA-seq là 0,20, 0,14 và 0,29 đối với HLA-A, -B và -C , tương ứng). Tuy nhiên, sử dụng cùng một thiết kế qPCR, Ramsuran et al. (2017) đã chuẩn hóa biểu hiện HLA-B bằng gen B2M, GAPDH, 18 giây và b-Actin, đồng thời quan sát thấy các kết quả rất nhất quán, không hỗ trợ tác động của quá trình chuẩn hóa B2M đối với các ước tính qPCR.

Cuộc thảo luận

Các ước tính đáng tin cậy về biểu hiện bảng điểm HLA có thể đóng góp vào các câu hỏi nghiên cứu đa dạng và mặc dù kết quả bệnh thường được khám phá trong bối cảnh biến thể mã hóa HLA, mức độ biểu hiện cũng có khả năng giải thích sự thay đổi trong kết quả lâm sàng (được đánh giá trong Dendrou et al. 2018; và trong Johansson và cộng sự 2022). Mức độ biểu hiện cũng có khả năng thông báo các quyết định khi lập kế hoạch ghép tế bào gốc tạo máu; ví dụ: nếu không có kết quả khớp hoàn hảo trong lựa chọn đối với người cho dị hợp, thì có vẻ có lợi khi chọn những người không khớp ở các alen biểu hiện thấp (Petersdorf et al. 2014, 2015). Các ước tính đáng tin cậy về biểu hiện phiên mã cũng có thể hỗ trợ xác định các eQTL làm cơ sở cho việc kiểm soát biểu hiện HLA, có thể được tích hợp vào các phát hiện của GWAS, bằng cách truy vấn xem các lần truy cập đã biết trong vùng MHC có trùng khớp với các eQTL đối với các gen HLA hay không (xem, ví dụ, Bảng S6 trong Aguiar và cộng sự 2019). Tổng quát hơn, các ước tính được cải thiện về biểu hiện phiên mã HLA sẽ giúp chúng ta hiểu cấu trúc di truyền của quy định HLA, xác định sự đóng góp tương đối của các biến thể hoạt động cis (nghĩa là những biến thể ở vùng lân cận của gen HLA mà chúng điều hòa) và các biến thể giao dịch (những biến thể ở xa vị trí bộ gen, bao gồm cả trên các nhiễm sắc thể khác). Điều này sẽ cung cấp thông tin về mức độ biến đổi trong biểu hiện HLA là đặc tính của alen so với đặc điểm giữa các cá thể độc lập với bản sắc alen (xem Bettens et al. 2022).

Các kỹ thuật PCR định lượng đã cho phép chúng tôi phát hiện ra mối liên hệ giữa biểu hiện HLA và kiểu hình bệnh. Gần đây, RNA-seq đã trở thành phương pháp được lựa chọn để đánh giá biểu hiện gen trong bộ dữ liệu toàn bộ phiên mã lớn của các quần thể khác nhau. Có thể trích xuất thông tin chính xác cho biểu hiện HLA từ dữ liệu đó là một thách thức quan trọng và nhiều phương pháp đã được đề xuất để đạt được mục tiêu này. Tuy nhiên, mức độ mà các kết quả xuất hiện từ các phân tích RNA-seq phù hợp với những kết quả được tích lũy bằng cách sử dụng qPCR hiện chưa được biết. Mặc dù các phương pháp này nhắm đến cùng một kiểu hình phân tử (sự phong phú của RNA), nhưng chúng khác nhau rõ rệt về kỹ thuật thử nghiệm được sử dụng, các hình thức phân tích và chuẩn hóa dữ liệu, quy trình tin sinh học và các sai lệch mà chúng phải tuân theo.

Theo hiểu biết của chúng tôi, các nghiên cứu trước đây so sánh các phương pháp tiếp cận RNA-seq tùy chỉnh của HLA với qPCR bao gồm các mẫu nhỏ. Ví dụ, Johansson et al. (2021) đã xác thực RNA-seq nhắm mục tiêu HLA của họ bằng qPCR chỉ trên 5 mẫu tại HLA-C, tài trợ cho hệ số tương quan Pearson là 0,9, hệ số này không đáng kể (p=0.08) .

Trong nghiên cứu hiện tại, chúng tôi đã so sánh các ước tính biểu hiện PCR và RNA-seq định lượng cho gen HLA lớp I cổ điển HLA-A, -B và -C trong một nhóm 96 cá thể phù hợp. Chúng tôi đã tìm thấy những mối tương quan khiêm tốn nhưng có ý nghĩa trong biểu hiện trên một mẫu gồm 96 cá nhân. Do thiếu một tiêu chuẩn vàng để so sánh các ước tính này, các lỗi và sai lệch ước tính liên quan đến cả hai phương pháp có thể góp phần vào kết quả chung.

Chúng tôi đã khám phá tác động của các yếu tố khác nhau có thể giải thích mối tương quan thấp giữa các ước tính RNA-seq và qPCR, chẳng hạn như ước tính biểu hiện kém đối với các alen HLA cụ thể và chuẩn hóa bởi một gen giữ nhà duy nhất trong qPCR. Kết quả của chúng tôi không thể được khái quát hóa cho mọi thiết kế qPCR hoặc đường ống RNA-seq, trong đó có nhiều cách tiếp cận khác nhau. Tuy nhiên, theo hiểu biết của chúng tôi, đây là so sánh trực tiếp đầu tiên giữa qPCR và RNA-seq để ước tính biểu hiện HLA.

Nghiên cứu của chúng tôi đề xuất các lĩnh vực cần cải thiện trong việc xác định biểu thức bảng điểm HLA. Ví dụ: so sánh giữa RNA-seq và qPCR nên sử dụng quy trình xử lý mẫu thống nhất giữa các phương pháp (ví dụ: cùng một giao thức phân lập RNA, thời gian lưu trữ/rã đông, tính toàn vẹn của RNA) để hạn chế sự khác biệt nhân tạo liên quan đến các phương pháp này. Ánh xạ các lần đọc ngắn tới các bộ gen hoặc bộ phiên mã tham chiếu duy nhất tạo ra các sai lệch và các chiến lược ánh xạ các lần đọc chiếm đa hình HLA là cần thiết. Cho rằng có một số chiến lược để thực hiện điều này (Boegel và cộng sự. 2012; Lee và cộng sự. 2018; Aguiar và cộng sự. 2019; Gutierrez-Acelus và cộng sự. 2020; Darby và cộng sự. 2020), đây sẽ là chìa khóa để so sánh độ chính xác tương đối của các phương pháp này.

Cũng cần phải phát triển các phương pháp giải thích đầy đủ cho biến thể đồng dạng, không chỉ để cung cấp một lớp thông tin khác mà còn ước tính biểu thức chính xác hơn, vì việc chuẩn hóa số lần đọc theo độ dài bản ghi không chính xác là một nguồn lỗi tiềm ẩn. Trong bối cảnh này, dữ liệu đọc lâu, trực tiếp tạo ra thông tin bản ghi đầy đủ, có thể là một công cụ mạnh mẽ (Cornaby et al. 2022). Cuối cùng, biến thể số bản sao, một tính năng đã biết đối với một số locus HLA (ví dụ: DRB), cũng nên được xem xét khi định lượng các mức biểu thức.

Sự nhìn nhận

Chúng tôi cảm ơn Tatiana Torres (Đại học São Paulo), Yang Luo (Trường Y Harvard) và các thành viên của Hiệp hội Sinh học Chung ở Boston vì những cuộc thảo luận hữu ích của họ.

Đóng góp của tác giả

Diogo Meyer, Mary Carrington, Richard M. Single và Vitor RC Aguiar đã đóng góp vào ý tưởng và thiết kế của nghiên cứu. Maureen P. Martin, Veron Ramsuran, Smita Kulkarni, Arman Bashirova, Danillo G. Augusto và Mary Carrington thực hiện việc chuẩn bị vật liệu, thu thập dữ liệu và thí nghiệm. Phân tích dữ liệu được thực hiện bởi Vitor RC Aguiar, Erick Castelli, Richard M. Single, Maria Gutierrez-Acelus và Diogo Meyer. Bản thảo được viết bởi Vitor RC Aguiar và Diogo Meyer. Tất cả các tác giả đã đọc, đóng góp và phê duyệt bản thảo cuối cùng.

Kinh phí

Cơ quan tài trợ São Paulo (FAPESP, http://www.fapesp. br/en/) đã tài trợ cho DM (2012/18010-0 và 2013/22007-7) và cho VRCA (2014/{{ 5}} và 2016/24734-1). Viện Y tế Quốc gia, Hoa Kỳ đã tài trợ cho DM (NIH R01 GM075091), hỗ trợ một phần cho hậu tiến sĩ VRCA. Conselho Nacional de Desenvolvimento Científco e Tecnológico (CNPq) & Bộ Y tế, Brazil đã tài trợ cho các thí nghiệm RNA-seq và các chuyến tham quan nghiên cứu, như một phần của đề xuất chung giữa Hoa Kỳ và Brazil được trao cho MC và DM (470043/{{13} }). NIH/NIAID R01AI157850 hỗ trợ SK. VR được tài trợ bởi Hội đồng Nghiên cứu Y khoa Nam Phi (SAMRC) với kinh phí của Bộ Khoa học và Công nghệ (DST); và cũng được hỗ trợ một phần thông qua Mạng lưới Nghiên cứu Xuất sắc về Lao/HIV ở Châu Phi cận Sahara (SANTHE), một Sáng kiến ​​DELTAS Châu Phi (Grant # DEL-15-006) của AAS.

Dự án này đã được tài trợ toàn bộ hoặc một phần bằng quỹ liên bang từ Phòng thí nghiệm Nghiên cứu Ung thư Quốc gia Frederick, theo Hợp đồng số HHSN261200800001E. Nội dung của ấn phẩm này không nhất thiết phản ánh quan điểm hoặc chính sách của Bộ Y tế và Dịch vụ Nhân sinh, cũng như không đề cập đến tên thương mại, sản phẩm thương mại hoặc tổ chức ngụ ý sự chứng thực của Chính phủ Hoa Kỳ. Nghiên cứu này được hỗ trợ một phần bởi Chương trình Nghiên cứu Nội bộ của NIH, Phòng thí nghiệm Quốc gia Frederick, Trung tâm Nghiên cứu Ung thư.

Dữ liệu sẵn có

Dữ liệu RNA-seq được trình bày trong ấn phẩm hiện tại đã được gửi vào và có sẵn từ cơ sở dữ liệu dbGaP dưới sự gia nhập dbGaP phs003177.v1.p1.


Người giới thiệu

1. Aguiar VRC, César J, Delaneau O, et al (2019) Ước tính biểu hiện và lập bản đồ eQTL cho các gen HLA bằng một quy trình được cá nhân hóa. PLoS Genet 15:e1008091.

2. Alcina A, Abad-Grau MDM, Fedetz M và cộng sự (2012) Biến thể có nguy cơ mắc bệnh đa xơ cứng HLA-DRB1*1501 có liên quan đến biểu hiện cao của gen DRB1 ở các quần thể người khác nhau. PLoS One 7:e29819.

3. Anderson SK (2018) Sự tiến hóa phân tử của các yếu tố kiểm soát sự biểu hiện HLA-C: Thích ứng với vai trò là một thụ thể giống như globulin miễn dịch của tế bào sát thủ và phối tử điều chỉnh chức năng của tế bào sát thủ tự nhiên. HLA 92:271–278.

4. Apps R, Meng Z, Del Prete GQ và cộng sự (2015) Mức độ biểu hiện tương đối của protein HLA lớp I trong tế bào bình thường và tế bào nhiễm HIV. Miễn dịch J 194:3594–3600.

5. Apps R, Qi Y, Carlson JM, et al (2013) Ảnh hưởng của mức độ biểu hiện HLA-C đối với việc kiểm soát HIV. Khoa học 340:87–91.

6. Arshad N, Laurent-Rolle M, Ahmed WS và cộng sự (2023) Các protein phụ kiện của SARS-CoV-2 ORF7a và ORF3a sử dụng các cơ chế riêng biệt để điều chỉnh giảm biểu hiện bề mặt MHC-I. Proc Natl Acad Sci USA 120:e2208525120.

7. Aulchenko YS, Ripke S, Isaacs A, van Duijn CM (2007) GenABEL: một thư viện R để phân tích liên kết trên toàn bộ bộ gen. Tin sinh học 23:1294–1296.

8. Bachtel ND, Umviligihozo G, Pickering S, và cộng sự (2018) Quá trình điều chỉnh giảm HLA-C bởi HIV-1 thích nghi với kiểu gen HLA của vật chủ. PLoS Pathog 14: e1007257.

9. Bettens F, Brunet L, Tiercy JM (2014) Tính biến thiên alen cao trong biểu hiện HLA-C mRNA: liên kết với các haplotypes mở rộng HLA. Gen miễn dịch 15:176–181.

10. Bettens F, Ongen H, Rey G và cộng sự (2022) Điều chỉnh biểu hiện HLA lớp I bằng các biến thể gen không mã hóa. PLoS Genet 18:e1010212

11.Boegel S, Bukur T, Castle JC, Sahin U (2018) Trong Silico Đánh máy các alen HLA cổ điển và phi cổ điển từ các lần đọc RNA-Seq tiêu chuẩn. Phương pháp Mol Biol 1802:177–191.


For more information:1950477648nn@gmail.com





Bạn cũng có thể thích