Giới thiệu ngành Công nghệ Sinh - Tin học (kỳ 2)

Hoàng Kiếm , Đỗ Phúc

5. Điều hoà phiên mã – một nghiên cứu trong sinh học

Những protein gắn kết DNA đóng vai trò trọng tâm trong tất cả các mặt của hoạt động di truyền trong bộ phân cơ thể, chúng tham gia vào những quá trình như là sự phiên mã, đóna’gói, tái sắp xếp, sao lại hay sửa chữa. Phần nay, trình bàu các nghiên cứu nhằm tìm hiểu sự điều hoà phiên mã trong những bộ phận cơ thể khác nhau. Qua ví dụ này, chúng ta sẽ chứng minh được các kỹ thuật sinh tin học đã được dùng để nâng cao kiến thức về hệ thống sinh học và cũng minh họa những ứng dụng thực tế của những lãnh vực khác nhau đã được phác thảo trước đây.

Trước tiên cần xem xét đến những phân tích cấu trúc về cách protein gắn kết DNA nhận diện trình tự cơ bản. Sau đó sẽ lược qua những nghiên cứu bộ gen đặc trưng những yếu tố phiên mã trong các bộ phận cơ thể khác nhau, và những phương pháp được dùng để nhận diện vị trí kết hợp điều hoà trong vùng ngược dòng. Cuối cùng là một khái quát những phân tích biểu hiện gen đã được hướng dẫn gần đây vả đề nghị sử dụng trong tương lai Tất cả những kết qủa mô tả được tìm thấy nhờ vào các nghiên cứu kỹ thuật tính toán.

5.1. Những nghiên cứu có cấu trúc

Vào tháng 8 2000, có 379 cấu trúc của phức hợp protein DNA trong PDB. Những phân tích của cấu trúc cung cấp các hiểu biết giá trị theo các nguyên lý trong hóa học lập thể của việc kết hợp bao gồm cách nhận dạng các trình tự cơ dở, cách sửa đổi các liên kết của cấu trúc DNA .

Nguyên tắc phân loại có cấu trúc của protein gắn kết DNA, tương tư đều thể hiện trong SCOP và CATH, đầu tiên được đề xuất bởi Harrison [72] và cập nhật một cách định kỳ để chứa những cấu trúc mới khi chúng được giải quyết [73]. Sự phân loại gồm có hệ thống hai lớp: mức đầu tiên gom protein thành 8 nhóm mà chia sẻ tổng đặc trưng có cấu trúc cho DNA gắn kết, và thứ hai gồm 54 họ protein mà tương đồng với nhau một cách có cấu trúc. Sự lắp ráp của một hệ đơn giản hóa sự so sánh của những phương pháp kết hợp khác nhau; chúng làm nổi bật tính đa dạng của protein – những cấu trúc hình học DNA phức được tìm thấy trong tự nhiên, nhưng cũng nhấn mạnh điểm quan trọng của những giao thức giữa hình xoắn và đường nét DNA chính, phương thức chính của việc kết hợp hơn phân nữa họ protein. Trong khi số những cấu trúc thể hiện trong PDB không phản ánh một cách thiết yếu điều quan trọng liên quan của những protein khác nhau trong tế bào, rõ ràng là hình xoắn-sang-hình xoắn, zinc-coordinating và leucine zipper motif được sử dụn lập lại. Điều này cung cấp khuôn khổ rắn chắc có mặt hình xoắn trên bề mặt của những protein dẫn xuất một cách có cấu trúc. Ở mức tổng quát, có thể làm nổi bật những điểm khác nhau giữa những phạm vi yếu tố sao chép mà “chỉ” gắn kết DNA từ mặt đơn và vị trí thành đưỡng rãnh để giao tiếp với cạnh cơ bản. Sau đó nói chung phủ lớp nền, dùng mạng phức tạp của cấu trúc thế hệ thứ hai và lặp lại.

Tập trung trên protein với hình xoắn, cấu trúc biểu diễn nhiều sự biến đổi, cả chuỗi acid amino và hình học chi tiết. Chúng tiến triển một cách độc lập theo những đòi hỏi trong ngữ cảnh mà chúng được tìm thấy. Khi đạt được điều chỉnh chặt chẽ giữa hình xoắn và đường nét chính, có đủ tính linh hoạt cho phép cả protein và DNA để chấp nhận hình thể cấu tạo phân biệt. Tuy nhiên, một vài nghiên cứu đã phân tích những hình học kết hợp của hình xoắn đã trình bày rằng hầu hết chấp nhận hình thể hoàn toàn giống nhau bất chấp họ protein. Nói chung, chúng được thêm vào đường nét chính, với chiều dài trục xem như song song với độ dốc phác họa bởi DNA trụ cột.

Hầu hết bắt đầu N điểm dừng trong đưỡng nét chạy dài, hoàn tất 2 đến 3 lần theo khoảng cách tiếp xúc của acid nucleic. [75,76].

Cho sự định hướng kết hợp tương đương, bất ngờ phát hiện những giao tiếp giữa mỗi vị trí acid amino dọc theo hình xoắn và nucleotides trên DNA thay đổi có thể xem như giữa họ protein khác nhau. Tuy nhiên, bằng việc phân loại acid amino ứng những độ dài của chuỗi cạnh, theo hợp thức hóa những mẫu giao tiếp khác nhau. Luật của những giao tiếp được dựa trên giả thuyết đơn giản cho một vị trí thặng dư được cho trên hình xoắn trong những hình thể tương tự, acid amino nhỏ giao tiếp với nucleotides gần theo khoảng cách và acid amino lớn với những giao tiếp đó thì xa hơn [76,77]. Những nghiên cứu tương đương cho việc kết hợp bởi những motif có cấu trúc khác giống -hairpins, cũng được quản lý[78]. Khi xem xét những giao tiếp này, điều quan trọng là vùng khác nhau của bề mặt protein cũng cung cấp những bề mặt chung với DNA.

Điều này mang đến cái nhìn mức nguyên tử những giao tiếp giữa các cặp acid amino riêng biệt. Những phân tích như vậy dựa trên giả thiết mà sự cân đối có ý nghĩa của kết hợp DNA được hợp thức hóa bởi mã phổ quát của sự nhận diện giữa acid amino và nền cơ bản, i.e phần còn lại protein chắc chắn tốt nhất giao tiếp với nucleotide riêng biệt bất chấp loại protein-DNA phức [79]. Những nghiên cứu được xem xét sự liên kết hydrô, những tiếp xúc Van der Waals, sự liên kết nước làm trung gian [80-82]. Những kết qủa chỉ ra rằng khoảng 2/3 của những tác động qua lại thì cùng với DNA trụ cột và vai trò chính của chúng là một trong sự ổn định độc lập chuỗi. Trái lại, những tác động qua lại với những cơ bản hiển thị một vài quyền ưu tiên mạnh, bao gồm những tác động qua lại của arginine hay lysine với guanine, asparagine hay glutamine với adenine và threonine với thymine. Những quyền ưu tiên như vậy được giải thích qua sự kiểm tra hóa học lập thể của chuỗi cạnh acid amino hay những cạnh cơ bản. Làm nổi bật thì cũng phức tạp hơn những kiểu tác động qua lại nơi acid amino đơn tiếp xúc đồng thời với nhiều hơn một bước đơn, theo cách đó nhận diện DNA ngắn. Những kết quả này đề nghị rằng những nét đặc trưng phổ quát, một được quan sát tất cả protein- DNA phức, quả thực tồn tại. Tuy nhiên, nhiều tác động qua lại bình thường được xem như không cụ thể như là những tác động đó với DNA trụ cột, có thể cũng cung cấp đặc trưng phụ thuộc ngữ cảnh mà chúng được tạo ra.

Trang bị một sự hiểu biết cấu trúc protein, những motif gắn kết DNA và chuỗi cạnh hóa học lập thể chuỗi cạnh, một ứng dụng chính là sự dự đoán của việc gắn kết bởi những protein đã biết để chứa những motif riêng biệt hoặc những protein đó với cấu trúc đã được tháo gỡ trong hình dạng không phức tạp. Nói chung hầu hết là những dự đoán chonhững tác động qua lại đường nét chính của hình xoắn- chuỗi acid amino đã cho mà chuỗi DNA nhận diện [77,83]. Trong một cách tiếp cận khác, kỹ thuật giả lập phân tử đã được dùng cắt ngắn toàn bộ protein và DNA trên nguyên tắc cơ bản của những tính toán quanh 2 phân tử [84,85]

Hai phương pháp chỉ đi đến những thành công giới hạn bởi vì những trường hợp đơn giản như kết hợp hình xoắn, có nhiều những yếu tố khác phải được xem xét. So sánh giữa cấu trúc acid nucleic kết hợp hay không kết hợp chỉ ra rằng việc gắn kết DNA là một đặc trưng chung của những liên hợp được hình thành bởi những yếu tố sao chép [74,86]. Điều này và những yếu tố khác như tĩnh điện và sự tác động lấy nước làm trung gian giúp việc nhận diên gián tiếp của chuỗi nucleotide, mặc dù chúng chưa hiểu rõ. Như vậy, những luật chi tiết cho sư gắn kết DNA sẽ là họ cụ thể nhưng dưới xu hướng những tác động qua lại arginine-guanine

5.2. Những nghiên cứu hệ gen

Bởi tính phong phú của dữ liệu hóa sinh luôn sẵn có, những nghiên cứu gen trong sinh tin học tập trung trên mô hình cơ thể và sự phân tích hệ thống điều tiết không là ngoại lệ. Sự đồng nhất những yếu tố sao chép trong hệ gen có tính không thay đổi phụ thuộc vào chiến lược nghiên cứu sự tương đồng thừa nhận mối liên hệ chức năng và tiến triển giữa những protein tương đương. Trong E.coli, những nghiên cứu ước lượng khoảng từ 300 đến 500 những điều tiết sao [87] và PEDANT [88], một CSDL của những chức năng gen kết nối tự động, chỉ ra rằng điển hình 2-3% gen prokaryotic và 6-7% gen eukaryotic bao gồm những protein gắn kết DNA. Khi sự phân công chỉ hoàn tất 40-60% hệ gen như tháng 8 năm 2000, những minh họa này hầu như trên dữ liệu thực. Tuy nhiên, chúng đại diện cho số lượng lớn protein và có nhiều điều chỉnh sao chép trong eukaryotes hơn loại khác. Điều này không có gì ngạc nhiên, xem xét những cơ quan đãphát triển một cơ chế sao chép phức tạp có liên quan.

Từ kết luận của những nghiên cứu có cấu trúc, chiến lược tốt nhất cho việc đặc trưng hóa gắn kết DNA của những yếu tố sao chép giả định trong mỗi hệ gen là để nhóm chúng lại bởi tính tương đồng và phân tích những họ riêng biệt. Sự phân loại như vậy được cung cấp trong CSDL chuỗi thế hệ thứ hai mô tả trước và sự phân loại đó đặc biệt hóa trong những điều tiết protein như là RegulonDB [89] vàTRANSFAC [90]. Cùng sử dùng lớn hơn là sự cung cấp của sự phân công có cấu trúc đối với protein; cho một một yếu tố sao chép, nó hữu dụng để biết motif có cấu trúc dùng cho việc gắn kết, như vậy cung cấp sự hiểu biết tốt hơn làm thế nào nó nhận biết chuỗi gốc. Hệ gen có cấu trúc qua sinh tin học ấn định những cấu trúc đối với sản phẩm protein của hệ gen bởi việc chứng minh tính tương đồng đối những protein của cấu trúc đã biết [91]. Những nghiên cứu này chỉ ra rằng những yếu tố sao chép prokaryotic hầu như thường chứa motif hình xoắn-sang-hình xoắn [87,92] và yếu tố eukaryotic chứa loại homeodomain hình xoắn-sang-hình xoắn, zinc finger hay leucine zipper motif. Từ những phân loại protein của mỗi gen, rõ ràng rằng những kiểu khác nhau của protein điều tiết khác biệt nhiều và những họ khác biệt kích thước 1 cách đáng kể. Một nghiên cứu bởi Huynen và van Nimwegen [93] chỉ ra rằng những thành viên của một họ đơn có những chức năng giống nhau, nhưng đòi hỏi những chức năng này biến đổi vượt thời gian, vì vậy làm những thể hiện của mỗi hệ gen trong hệ gen.

Hầu như gần đây, dùng sự kết hợp của chuỗi và dữ liệu có cấu trúc, kiểm tra sự giao hợp của chuỗi acid amino giữa protein gắn kết DNA liên quan và ảnh hưởng sự biến đổi có trên việc nhận diện chuỗi DNA. Những họ có cấu trúc mô tả ở trên đã được mở rộng bao gồm protein có liên hệ bởi sư tương đồng chuỗi, nhưng toàn bộ cấu trúc không được tìm ra. Ngoài ra, những thành viên của cùng một họ thì tương đồng, và dẫn xuất từ tổ tiên chung.

Những giao kết acid amino được tính toán cho những liên kết đa chuỗi của mỗi ho [94]. Nói chung, vị trí liên kết tác động với DNA được bảo quản tốt hơn phần còn lại của bề mặt protein, mặc dù những mẩu chi tiết của việc giao kết là hoàn toàn phức tạp. Những phần còn lại tiếp xúc với DNA trụ cột được bảo quản cao trong tất cả họ protein, cung cấp một sự ổn định những tác động chung đối với tất cả protein tương đồng. Những giao cấu của những vị trí liên kết mà tiếp xúc những cơ sở, và nhận diện chuỗi DNA, thì càng phức tạp và hợp lý hóa bởi định nghĩa mô hình 3 lớp cho DNA gắn kết. Đầu tiên, họ protein gắn kết một cách không cụ thể thường chứa một vài phần còn lại tiếp xúc cơ bản được bảo quản; không ngoại lệ, những tác động qua lại được là bởi đường nét nhỏ màở đó có sự phân biệt nhỏ giữa những loại cơ bản. Những tiếp xúc nói chung để ổn định sự biến dạng trong cấu trúc acid nucleic, đặc biệt trong việc nới rộng đường nét nhỏ DNA. Lớp thứ hai bao gồm những họ thành viên nhằm làm cho tất cả chuỗi nucleic đích giống nhau; Ở đây, những vị trí tiếp xúc cơ bản được bảo quản tuyệt đối hay cao hơn cho phép những protein liên quan đạt chuỗi giống nhau. Lớp thứ ba, đáng chú ý, bao gồm những họ mà trong việc gắn kết cụ thể những thành viên khác nhau gắn kết những chuỗi cơ bản phân biệt. Phần còn lại của protein này thường xuyên trải qua đột biến, và những thành viên họ hàng có thể dẫn xuất từ những họ con tương ứng chuỗi acid amino tại vị trí tiếp xúc cơ bản; những thành viên đó trong cùng một họ con được dự đoán bởi gắn kết cùng chuỗi DNA và những thành viên của những họ con khác nhau gắn kết chuỗi phân biệt. Tổng quát, những họ con tương ứng tốt với những chức năng của protein và những thành viên của cùng một họ con được tìm để điều tiết cách thức sao chép tương đương. Những phân tích phối hợp của chuỗi và dữ liệu có cấu trúc mô tả bởi nghiên cứu này cung cấp một sự hiểu biết sâu sắc làm thế nào nền tảng gắn kết DNA tương đồng đạt được những đặc trưng khác nhau bởi biến đổi những chuỗi acid amino của chúng. Trong việc làm như vậy, protein tiến triển những chức năng phân biệt, cho phép một cách có cấu trúc những yếu tố sao chép điều chỉnh biểu thức của gen khác nhau. Như vậy, tính phong phú tương đối của những họ điều tiết sao chép trong hệ gen phụ thuộc vào tầm quan trọng của một chức năng protein đặc trưng, nhưng cũng có khả năng thích ứng của những motif gắn kết DNA để nhận diện chuỗi nucleic phân biệt. Trong trường hợp này có vẻ như được cung cấp bởi những motif gắn kết đơn giản, như zincd fingers.

Những kiến thức của những điều tiết sao chép được chứa trong mỗi cơ quan, và một sự hiểu biết làm thế nào nhận diên chuỗi DNA, thật thú vị để tìm những vị trí gắn kết then chốt của chúng với chuỗi gen, hầu hết những phân tích liên qua dữ liệu kết hợp trên những vị trí gắn kết được biết qua thực nghiệm cho những protein đặc trưng và tạo nên chuỗi liên ứng kết hợp chặt chẽ bất kỳ sự biến đổi trong nucleic. Những vị trí thêm vào được tìm thấy bởi việc quản lý so từ tìm kiếm trên toàn hệ gen và đánh dấu những vị trí ứng viên bởi sự tương đương [96-99]. Không ngạc nhiên, hầu hết của những vị trí được dự đoán được tìm trong những vùng mã hóa của DNA [96] và kết quả của những nghiên cứu thường được hiện diện trong CSDL như RegulonDB [89]. Hướng tiếp cận tìm tiếp liên ứng thường được thực thi bởi những nghiên cứu gen tương đối tìm kiếm ngược dòng những vùng của những gen orthologous trong những cơ quan liên quan một cách chặt chẽ. Qua hướng tiếp cận như vậy, nó phát hiện ra rằng có ít nhất 27% của motif điều tiết DNA E.coli đã biết được bảo quản trong một hay nhiều vi khuẩn liên quan cách xa nhau [100].

Sự phát hiện những vị trí điều tiết trong eukaryotes đặt ra một vấn đề khó hơn bởi vì khuynh hướng chuỗi liên ứng cho là ngắn nhiều hơn, biến đổi, và phân tán trên khoảng cách rất rộng. Tuy nhiên, những nghiên cứu khởi đầu trong S. cerevisiae đã cung cấp một quan sát đáng chú ý cho protein GATA trong sự điều tiết trao đổi chất nitrogen. Trong khi chuỗi liên ứng 5 cặp cơ bản GATA được tìm thấy hầu hết mỗi nơi trong hệ gen, một vị trí gắn kết đơn lập thiếu sử dụng chức năng điều tiết [101]. Những nét đặc trưng như vậy của hoạt tính GATA xuất phát từ sự lặp lại của chuỗi liên ứng với những vùng đối nghịch của những gen được kiểm soát trong nhiều sao chép. Một nghiên cứu khởi đầu sử dụng quan sát này để dự đoán những vị trí điều tiết mới, bởi việc tìm kiếm trên oligonucleotide, được biểu trưng trong những vùng mã hóa của men và hệ gen ký sinh [102,103].

Việc phát hiện những vị trí điều tiết gắn kết, có vấn đề của việc định nghĩa gen thực sự đã được điều tiết, thuật ngữ chung là regulon. Nói chung, vị trí gắn kết giả sử rằng được định vị trực tiếp đối nghịch của regulons; tuy nhiên, có những vấn đề khác nhau kết hợp với thừa nhận này phụ thuộc vào cơ quan. Đối với prokaryotes, nó làm rắc rối thêm bởi sự hiện diện của operons; định vị gen đã điều tiết với một operon khi nó có thể nằm trong một vài gen xuôi dòng của chuỗi điều tiết là rất khó. Khó có thể dự đoán tổ chức của operons [104], đặc biệt để định nghĩa gen mà được tìm thấy tại đầu, và thường có một sự thiếu hụt của sự bảo quản lâu dài trong trình tự gen giữa những tổ chức liên quan [105]. Vấn đề trong eukaryotes thậm chí rất gay gắt; những vị trí điều tiết thường hành động theo hai hướng, những vị trí gắn kết thường cách xa regulons, và việc điều tiết sao chép là kết qủa của hành động kết hợp bởi nhiều yếu tố sao chép trong một kiểu tổ hợp.

Mặc dù, những vấn đề thành công trong việc thừa nhận cách thức điều tiết sao chép của những hệ thống đặc trưng hóa tốt như hệ thống phản ứng va chạm hơi nóng [99]. Thêm vào đó, để kiểm tra một cách thực nghiệm bất kỳ những dự đoán, hầu hết dùng dữ liệu diển giải gen.

5.3. Những nghiên cứu diễn giải gen

Nhiều nghiên cứu tập trung trên phát minh những phương pháp để phân cụm gen bởi sự tương đồng trong mô tả sơ lược diễn giải. Điều này để định rõ protein được biểu diễn cùng nhau dưới điều kiện tế bào khác nhau. Ngắn gọn, những phương pháp chung nhất đang phân cụm có thứ bậc. Những phương pháp có thứ bậc nguồn gốc dẫn xuất từ những thuật toán để xây dựng cây phát sinh loài, nhóm gen trong kiểu từ dưới lên; gen với những mô tả sơ lược diễn giải tương tự nhất được phân cụm đầu tiên, và những gen nàyvới nhiều mô tả sơ lược biến đổi được bao gồm lặp đi lặp lại [106-108]. Trái lại, bảng đồ tự tổ chức [109-110] và phương pháp K-means [111] dùng hướng tiếp cận trên xuống để dùng định nghĩa trước số phân cụm cho tập dữ liệu. Những phân cụm khởi đầu gán trị ngẩu nhiên, và những gen được nhóm lặp đến khi chúng được phân cụm một cách tối ưu.

Những phương pháp đã cho liên quan đến dữ liệu diễn giải thuộc tính khác như cấu trúc, chức năng và sự định vị tế bào con của mỗi sản phẩm gen. Aùnh xạ những thuộc tính này cung cấp một sự hiểu biết bên trong những đặc trưng của protein mà được diễn giải cùng với nhau, và cũng đề nghị những kết luận đáng quan tâm về toàn thể hóa sinh của tế bào. Trong men, những protein ngắn hơn có khuynh hướng được diễn giải ở mức cao hơn những protein dài hơn, có lẽ bởi vì sự không ràng buộc liên hệ mà chúng được tạo ra [112]. Nhìn vào nội dung của acid amino, những gen được diễn giải ở mức cao nói chung giàu alanine và glycine, và làm suy yếu trong asparagine; những điều này được suy xét để phản ánh những đòi hỏi của acid amino dùng trong cơ thể; nơi sự tổng hợp của alinine và glycine thì cao hơn asparagine. Xoay cấu trúc protein, mức diễn giải của TIM barrel và những nhánh hydrolase NTP là cao nhất, trong khi mức diễn giải đó cho những nhánh leucine zipper, zinc finger và màng chuyển dịch chứa helix là thấp nhất. Điều này liên quan đến những chức năng kết hợp với những nhánh này; những vấn đề trước liên quan đến cách thức trao đổi chất và vấn đề sau liên quan những tiến trình chuyển tín hiệu hay chuyền tải [113]. Điều này phản ánh trong mối liên hệ với sự định vị tế bào con của protein, nơi diễn giải của những protein cytoplasmic là cao, nhưng những protein nhân và màng có khuynh hướng trở nên thấp.

Những mối quan hệ càng phức tạp cũng được đánh giá. Những hiểu biết quy ước các sản phẩm gen tác động lẫn nhau có thể có những sơ lược diễn giải tương tư hơn nếu chúng không tác động [116,117]. Tuy nhiên, một nghiên cứu gần đây chỉ ra rằng mối liên hệ này không quá đơn giản [118]. Trong khi những sơ lược diễn giải thì tương đương những sản phẩm gen kết hợp thường xuyên, ví dụ trong một đơn vị con ribosomal, những mô tả khác biệt chủ yếu đối với những sản phẩm chỉ kết hợp ngắn, bao gồm những thuộc loại đó đối với cách thức trao đổi chất như nhau.

Theo những mô tả ở trên, một trong những tác động dẫn xuất chính dưới sự phân tích diễn giải là để phân tích những dòng tế bào ung thư [119]. Nói chung, những dòng tế bào khác nhau (ví dụ tế bào epithelial và ovarian) có thể được phân biệt trên cơ bản của những mô tả diễn giải, và những mô tả sơ lược này được duy trì khi tế bào được chuyển dịch từ một môi trường in vivo đến một môi trường in vitro [120]. Cơ bản cho những khác biệt vật lý rõ ràng trong biểu thức gen cụ thể; ví dụ mức độ diễn giải sản phẩm gen cần thiết cho tiến trình qua chu trình tế bào. Đặc biệt gen ribosomal tương quan với nhau tốt trong những biến đổi trong tỷ lệ phát triển tế bào. Sự phân tích so sánh có thể được mở rộng đến tế bào u bướu mà nguyên nhân cơ bản của ung thư có thể được hé mở bởi vùng rất nhỏ của sự biến đổi sinh học so sánh với những tế bào thường. Ví dụ, trong tế bào vú, gen liên quan đến sự phát triển tế bào và cách thức chuyển đổi luồng dấu hiệu IFN điều tiết được tìm thấy để được làm điều tiết [52,121]. Một trong những khó khăn trong trị bệnh ung thư mục tiêu chữa bệnh 1 cách cụ thể đối với loại ung bướu phát sinh bệnh khác biệt, để tối ưu hóa tính hiệu quả và cực tiểu hóa đặc tính độc. Như vậy, những cải thiện trong phân loại ung thư, tập trung để thúc đẩy trong trị bệnh ung thư. Mặc dù những khác biệt giữa hình thức của bệnh ung thư – ví dụ những lớp con của bệnh bạch cầu cấp tính được chính thức hóa, và chưa thể thiết lập một chẩn đoán buồng trứng trên nền tảng một kiểm tra đơn giản. Trong một nghiên cứu gần đây bệnh bạch cầu myeloid cấp tính được phân biệt thành công dựa trên những mô tả diễn giải của những tế bào này [53]. Khi những phương pháp không đòi hỏi kiến thức sinh học của những căn bệnh, nó cung cấp một chiến lược chung cho việc phân loại tất cả các loại bệnh ung thư.

Rõ ràng, một khía cạnh then chốt của việc hiểu biết dữ liệu diễn giải nằm trong sự hiểu biết nền tảng của sự điều tiết chuyển dịch. Tuy nhiên, sự phân tích trong vùng này vẫn bị giới hạn đến những phân tích sơ bộ của mức diễn giải trong men mutants thiếu thành phần then chốt của sự sao chép khởi đầu phức tạp.

Kỳ sau: Những ứng dụng thực nghiệm

No comments: