1/5 gen của con người không phải là 'thật'

Nghiên cứu mới có thể thay đổi bộ mặt của y sinh; bộ gen người được phát hiện là chứa ít gen “thực” hoặc mã hóa protein hơn nhiều so với người ta tin trước đây.

DNA của chúng ta có thể chứa ít gen 'thực' hơn nhiều so với những gì chúng ta nghĩ ban đầu.

Vào đầu những năm 1990, các nhà khoa học đã lập bản đồ toàn bộ chuỗi DNA của bộ gen người.

Cái gọi là Dự án bộ gen người nhằm mục đích tìm kiếm các liên kết di truyền với các bệnh và tìm hiểu chức năng và cấu trúc của các yếu tố khác nhau của bộ gen, chẳng hạn như gen mã hóa protein và yếu tố nào điều chỉnh sự biểu hiện gen.

Kết quả ban đầu của Dự án bộ gen người dự đoán rằng có 40.000 gen có thể mã hóa protein, các phân tử lớn rất quan trọng cho hoạt động tốt của các mô và cơ quan trong cơ thể.

Tuy nhiên, khi dự án kết thúc vào năm 2003, ước tính cho con số đó đã giảm xuống còn khoảng 20.000–25.000 gen mã hóa protein.

Kể từ thời điểm đó, các nhà khoa học đã cố gắng tìm ra proteome cuối cùng - tức là tổng số protein có thể được biểu hiện bởi gen - và đang tập trung vào việc tìm hiểu cách thức biểu hiện di truyền của những protein này bị đột biến trong một số bệnh.

Để đạt được mục tiêu này, một nhóm các nhà nghiên cứu quốc tế do Michael Tress đứng đầu, từ Đơn vị Tin sinh học Trung tâm Nghiên cứu Ung thư Quốc gia Tây Ban Nha ở Madrid, Tây Ban Nha, hiện đã kiểm tra các gen được coi là mã hóa protein bằng cơ sở dữ liệu proteome chính có sẵn.

Tress và các đồng nghiệp đã công bố kết quả nghiên cứu của họ trên tạp chí Nghiên cứu axit nucleic. Federico Abascal, thuộc Viện Wellcome Trust Sanger ở Hinxton, Vương quốc Anh, là tác giả đầu tiên của bài báo.

Ít nhất 2.000 gen là 'pseudogenes'

Các nhà nghiên cứu đã so sánh các proteome từ ba bộ sưu tập trình tự protein và chú thích di truyền: GENCODE / Ensembl, RefSeq và UniProtKB.

Tress và nhóm nghiên cứu phát hiện ra rằng, trong tổng số 22.210 gen được liệt kê là mã hóa protein, chỉ có 19.446 gen có trong cả ba bộ sưu tập.

Sau đó, họ phóng to sự khác biệt của 2.764 gen, kiểm tra bằng chứng thí nghiệm và thông tin có sẵn từ các chú thích.

Bằng chứng cho thấy phần lớn các gen này là “gen không mã hóa hoặc gen giả”.

Ngoài ra, các nhà khoa học phát hiện ra rằng thêm 1.470 gen - được liệt kê là mã hóa protein trong ba bộ sưu tập - không có các đặc điểm chức năng hoặc sự tiến hóa điển hình của gen mã hóa protein.

Do đó, các nhà nghiên cứu “tin rằng ba cơ sở dữ liệu tham khảo hiện đang ước tính quá cao số lượng gen mã hóa của con người lên ít nhất 2.000, làm phức tạp và thêm nhiễu cho các thí nghiệm y sinh quy mô lớn”.

“Việc xác định gen mã hóa tiềm năng nào không mã hóa cho protein là một nhiệm vụ khó khăn nhưng cực kỳ quan trọng vì proteome tham chiếu của con người là trụ cột cơ bản của hầu hết các nghiên cứu cơ bản và hỗ trợ hầu hết các dự án y sinh quy mô lớn.”

Định hướng cho nghiên cứu trong tương lai

Tress chia sẻ cách các nhà nghiên cứu đang tiếp tục phát hiện của họ. Ông giải thích: “Chúng tôi đã có thể phân tích chi tiết nhiều gen này và hơn 300 gen đã được phân loại lại thành không mã hóa.”

“Thật ngạc nhiên,” đồng tác giả nghiên cứu, David Juan, cho biết “một số gen bất thường này đã được nghiên cứu kỹ lưỡng và có hơn 100 công bố khoa học dựa trên giả định rằng gen này tạo ra một loại protein”.

Do đó, kết quả có thể thay đổi lĩnh vực y sinh như chúng ta đã biết. Tuy nhiên, nghiên cứu thêm là cần thiết.

Abascal cho biết thêm: “Bằng chứng của chúng tôi,“ gợi ý rằng con người có thể chỉ có 19.000 gen mã hóa, nhưng chúng tôi vẫn chưa biết [đó] 19.000 gen đó là gì. ”

none:  thời kỳ mãn kinh rối loạn nhịp tim hoạt động quá mức-bàng quang- (oab)