Xərçəng xəstəliyində birdən çox sürücü yolunun eyni vaxtda müəyyən edilməsi

Xərçəngdən məsul olan somatik mutasiyaların ( sürücü mutasiyalarının) təsadüfi, sərnişin mutasiyalarından fərqləndirilməsi xərçəng genomikasında əsas problemdir. Sürücü mutasiyaları ümumiyyətlə birdən çox gendən ibarət olan hüceyrə siqnalını və tənzimləyici yolları hədəf alır. Bu heterojenlik, müxtəlif nümunələrdə sürücü yollarında müxtəlif mutasiyaların birləşməsi müşahidə edildiyi üçün sürücü mutasiyalarının nümunələr arasında təkrarlanması ilə müəyyən edilməsini çətinləşdirir. Biz yollar çox sürücü eyni zamanda müəyyən edilməsi üçün Multi-Dendrix alqoritm təqdim de novobir qrup xərçəng nümunəsindən alınan somatik mutasiya məlumatlarında. Alqoritm bir sürücü yolundakı mutasiyaların iki kombinator xüsusiyyətinə əsaslanır: yüksək əhatə dairəsi və qarşılıqlı eksklüzivlik. Bu xassələri nümayiş etdirən mutasiyalar dəstini tapan tamsayı xətti bir proqram əldə edirik. Glioblastoma, döş xərçəngi və ağciyər xərçəngi nümunələrindən gələn somatik mutasiyalara Multi-Dendrix tətbiq edirik. Multi-Dendrix, Rb, p53, PI (3) K və hüceyrə dövrü yolları da daxil olmaqla, bilinən yollarla üst-üstə düşən genlərdəki mutasiyalar dəstini və bir neçə transkripsiya faktorunda və ya digər genlərdə olan mutasiyalar da daxil olmaqla, qarşılıqlı eksklüziv mutasiyaların yeni dəstlərini müəyyən edir. transkripsiya tənzimləməsində. Bu dəstlər əvvəlcədən heç bir məlumatı olmayan birbaşa mutasiya məlumatlarından əldə ediliryolların və ya genlərin qarşılıqlı təsiri. Göstəririk ki, Multi-Dendrix, mutasiyaların birləşməsini təyin etmək üçün digər alqoritmləri üstələyir və eyni zamanda genom miqyaslı məlumatlarda daha böyük əmrlərə malikdir. Proqram təminatı: http://compbio.cs.brown.edu/software.

Müəllif Xülasəsi

Xərçəng, əsasən bir insanın həyatı boyunca somatik mutasiyaların yığılması nəticəsində yaranan bir xəstəlikdir. Genom sıralamasının azalan xərcləri artıq yüzlərlə xərçəng genomunda somatik mutasiyaların ölçülməsinə imkan verir. Əsas problem xərçəngdən məsul olan sürücü mutasiyalarını təsadüfi sərnişindən ayırmaqdırmutasiyalar. Bu problem, eyni xərçəng tipli fərqli xəstələrdə fərqli sürücü mutasiyalarının fərqli kombinasiyalarının müşahidə edilməsi ilə müşayiət olunur. Bu heterojenliyin bir səbəbi sürücü mutasiyalarının bir çox uğursuzluq nöqtəsi olan siqnal və tənzimləmə yollarını hədəf almasıdır. Bu yolları yalnız xəstələrin bir qrupu arasındakı mutasiyalar arasındakı qarşılıqlı eksklüzivlik nümunələrindən tapmaq üçün bir Multi-Dendrix alqoritmi təqdim edirik. Əvvəlki yanaşmalardan fərqli olaraq, eyni anda birdən çox yol tapırıq ki, bu da birdən çox yolun narahat olduğu xərçəng genomlarının təhlili üçün vacib bir xüsusiyyətdir. Alqoritmimizi yüzlərlə glioblastoma, döş xərçəngi və ağciyər adenokarsinoması xəstələrinin mutasiya məlumatlarına tətbiq edirik. Məlum yollarla üst -üstə düşən qarşılıqlı təsir göstərən genlər qruplarını müəyyən edirik,və alt tipə xas olan mutasiyalar olan gen dəstləri. Bu nəticələr göstərir ki, çoxlu xərçəng yolları mutasiya məlumatlarındakı nümunələrdən birbaşa müəyyən edilə bilər və daim böyüyən xərçəng mutasiyası məlumat dəstlərini təhlil etmək üçün bir yanaşma təmin edir.

Sitat:Leiserson MDM, Blokh D, Sharan R, Raphael BJ (2013) Xərçəngdə Birdən çox Sürücü Yolunun Eşzamanlı Kimi. PLoS Comput Biol 9 (5): e1003054. https://doi.org/10.1371/journal.pcbi.1003054

Redaktor:Niko Beerenwinkel, ETH Zurich, İsveçrə

Alındı:29 Avqust 2012; Qəbul:26 Mart 2013; Nəşr:23 may 2013

Müəlliflik hüququ:© 2013 Leiserson et al. Bu, Creative Commons Attribution Lisenziyasının şərtləri əsasında yayılmış, hər hansı bir mühitdə məhdudiyyətsiz istifadəyə, paylanmaya və çoxalmağa icazə verən, orijinal müəllifə və mənbəyə hesab verilmək şərti ilə açıq bir məqalədir.

Maliyyə:Bu iş NSF qrant IIS-1016648 tərəfindən dəstəklənir. BJR, Burroughs Wellcome Fund-dan Elmi Arayüzdə Karyera Mükafatı, Alfred P. Sloan Araşdırma Təqaüdü və NSF CAREER Mükafatı (CCF-1053753) tərəfindən dəstəklənir. RS, İsrail Elm Vəqfinin (qrant no. 241/11) bir araşdırma qrantı ilə dəstəkləndi. MDML, NSF GRFP DGE 0228243 tərəfindən dəstəkləndi. Maliyyələşdirənlərin iş dizaynında, məlumatların toplanmasında və təhlilində, nəşr etmək qərarında və ya əlyazmanın hazırlanmasında heç bir rolu yox idi.

Rəqabət edən maraqlar:Müəlliflər heç bir rəqabət aparan maraqların olmadığını bəyan etdilər.

Giriş

Xərçəng, bir insanın həyatı boyu toplanan somatik mutasiyalar nəticəsində yaranan bir xəstəlikdir. Azalan genom sıralama xərcləri artıq bu somatik mutasiyaların çox sayda xərçəng genomunda ölçülməsinə imkan verir. Xərçəng Genomu Atlası (TCGA) və Beynəlxalq Xərçəng Genomu Konsorsiumu (ICGC) kimi layihələr bu vəzifəni onlarla xərçəng növündən yüzlərlə nümunədə götürür. Bu məlumatların təfsirində əsas problem xərçəng inkişafı üçün vacib olan funksional sürücü mutasiyalarını təsadüfi sərnişindən ayırmaqdırxərçəng üçün heç bir nəticəsi olmayan mutasiyalar. Bir mutasiyanın sürücünün və ya sərnişinin olub olmadığını müəyyənləşdirən əsas amil bioloji funksiyasını yoxlamaqdır. Bununla birlikdə, somatik mutasiyaların aşkar edilməsi qabiliyyəti, onların funksiyalarını eksperimental olaraq yoxlamaq qabiliyyətini çox üstələdiyi üçün sürücü mutasiyalarını proqnozlaşdıran hesablama yanaşmaları təcili prioritetdir. Təkamülün qorunması, zülal quruluşu və s. Əlavə bioloji biliklərdən istifadə edərək somatik mutasiyaların funksional təsirini birbaşa proqnozlaşdırmaqdır və bu yanaşmanı həyata keçirən bir sıra metodlar tətbiq edilmişdir (bax [1] - [4]). Bu üsullar bəzi mutasiyaların təsirini proqnozlaşdırmaqda müvəffəqiyyətlidir, lakin ümumiyyətlə məlumatları müxtəlif növ mutasiyalara (tək nukleotid, indellər, daha böyük nüsxə sayı sapmaları və s.) Birləşdirmir; üstəlik,bu üsullar daha az konservləşdirilmiş/öyrənilmiş zülallar üçün daha az müvəffəqiyyətlidir.

DNT sıralama xərclərinin azaldığını nəzərə alaraq, sürücünü sərnişin mutasiyalarından fərqləndirmək üçün standart bir yanaşma, təkrarlananları müəyyən etməkdir.Xərçəng xəstələrinin böyük bir qrupunda müşahidə olunan tezliyi gözləniləndən çox yüksək olan mutasiyalar [5], [6]. TCGA [7] - [10] və digər layihələr [5], [11], [12] də daxil olmaqla, demək olar ki, bütün xərçəng genomu sıralama sənədləri əhəmiyyətli dərəcədə mutasiyaya uğramış genlərin siyahısını bildirir. Bununla birlikdə, sürücü mutasiyaları xərçəng xəstələri arasında, hətta eyni (alt) xərçəng növü olan xəstələr arasında çox fərqlənir və bu heterojenlik, təkrarlanma testləri ilə sürücü mutasiyalarını aşkar etmək üçün statistik gücü əhəmiyyətli dərəcədə azaldır. Bu mutasion heterojenliyin əsas bioloji izahlarından biri, sürücü mutasiyalarının təkcə fərdi genom lokuslarını (məsələn, nukleotidlər və ya genlər) deyil, həm də hüceyrə siqnalında və tənzimləmə yollarında genlərin hədəf qruplarını hədəf almasıdır. Nəticədə,fərqli xərçəng xəstələri, xərçəng inkişafı üçün əhəmiyyətli bir yolun müxtəlif üzvlərində mutasiyalara sahib ola bilərlər. Beləliklə, ayrı -ayrı lokusları və ya genləri bir qrup xəstədə təkrarlanan mutasiya üçün yoxlamağa əlavə olaraq, tədqiqatçılar gen qruplarının təkrar -təkrar mutasiya olub -olmadığını da yoxlayırlar. Bütün gen qruplarının hərtərəfli sınağı qadağandır böyük nümunə ölçüləri olmadan mümkün olmadığından (zəruri çoxlu fərziyyə test korreksiyası səbəbindən), mövcud yanaşmalar, bilinən yollar (məsələn, KEGG [13 ]) və ya funksional qruplar (məsələn, GO [14] -dən) və bu cür əvvəlcədən təyin edilmiş gen qruplarında zənginləşdirmə axtaran üsullar tətbiq edilmişdir (məsələn [15]-[17]). Bu yaxınlardaNetBox [18], MeMO [19], HotNet [20] və EnrichNet [21] kimi protein-protein qarşılıqlı şəbəkələrində təkrarlanan mutasiyaya uğramış alt şəbəkələri müəyyən edən metodlar da hazırlanmışdır.

İnsanlarda gen və zülal qarşılıqlı əlaqələri haqqında məlumat yarımçıq qalır və mövcud yol məlumat bazaları və qarşılıqlı əlaqə şəbəkələri, müəyyən bir xərçəng hüceyrəsində meydana gələn yolları və qarşılıqlı təsirləri tam olaraq əks etdirmir. Belə ki, bu məlumat mənbələrində qeydə alınan mutasiyaların birləşməsinə diqqəti məhdudlaşdırmaq, yeni bioloji kəşflər ehtimalını məhdudlaşdıra bilər. Buna görə də bu məhdudiyyəti qoymayan alqoritmlər - həm də hərtərəfli sayma ilə əlaqəli çoxlu hipotez test problemlərindən qaçınmaq - arzuolunandır. Bu yaxınlarda sürücü yollarını kəşf etmək üçün RME [22] və De novo Driver Exclusiveivity (Dendrix) [23] alqoritmləri təqdim edildi.sürücü mutasiyalarının yollarda necə göründüyünə dair bioloji biliklərdən əldə edilən kombinator məhdudiyyətlərdən istifadə etməklə [24], [25]. Xüsusilə, hər bir xərçəng xəstəsi nisbətən az sayda sürücü mutasiyasına malikdir və bu mutasiyalar çoxlu hüceyrə yollarını pozur. Beləliklə, hər bir sürücü yolu hər bir xəstəyə təxminən bir sürücü mutasiyasını ehtiva edir. Bu , yolun müxtəlif genlərindəki mutasiyalar arasında qarşılıqlı eksklüzivlik nümunəsinə gətirib çıxarır . Bundan əlavə, bir çox xəstədə əhəmiyyətli bir sürücü yolu mutasiya edilməli və ya mutasiyalarla yüksək əhatə dairəsi olmalıdır . Beləliklə, sürücü yolları bir çox xəstələrdə mutasiyaya uğramış, lakin mutasiyaları bir -birini istisna edən və ya təxminən belə olan genlər dəstinə uyğundur. Vurğulayırıq kiqarşılıqlı eksklüzivlik və yüksək əhatə dairəsi nümayiş etdirən sürücü yolları ümumiyyətlə daha kiçik və daha diqqətlidirƏdəbiyyatda və yol məlumat bazalarında izah edilən əksər yollardan daha çoxdur. İkincisi ümumiyyətlə bir çox gen ehtiva edir və bir çox fərqli funksiyanı yerinə yetirir; məsələn, KEGG -də "hüceyrə dövrü" yolu 143 gen ehtiva edir. Hamıya məlumdur ki, bu daha böyük, çoxfunksiyalı bioloji yollarda birgə əmələ gələn (yəni müstəsna deyil) mutasiyalar müşahidə olunur [25]. RME və Dendrix alqoritmləri yüksək əhatəli və qarşılıqlı eksklüzivliyə malik olan gen dəstlərini tapmaq üçün fərqli yanaşmalardan istifadə edir: RME, cütlüklə seçilmiş eksklüzivlikdən gen dəstləri qurur, Dendrix isə bir sıra genlərin qarşılıqlı eksklüzivliyi üçün bir bal hesablayır və tapır. ən yüksək bal toplusu. Yuxarıda göstərilən MeMO alqoritmi [19], mutasiyalar arasında qarşılıqlı eksklüzivliyi də nəzərdən keçirir, ancaq zülal-protein qarşılıqlı şəbəkəsində qarşılıqlı təsirləri qeyd edən cüt cüt genlər üçün. Beləliklə,MeMO sürücü yollarını müəyyən etməyə çalışmırde novo və yalnız mövcud qarşılıqlı şəbəkələrdə alt şəbəkələri təyin edə bilər. Qarşılıqlı eksklüzivliyin ən güclü siqnalları bilinən qarşılıqlı təsirləri olan genlər arasında olsa da, aşağıda xərçəng məlumatlarında bilinməyən birbaşa yinelemələri olmayan genlər arasında qarşılıqlı eksklüziv mutasiyaların nümunələrini göstəririk.

İki mövcud de novo alqoritmlər, RME və Dendrix yalnız aşkar hesab vahid mutasiyalar arasında qarşılıqlı seçilmiş model sürücü cığır. Ancaq məlumdur ki, xərçəng üçün ümumiyyətlə bir neçə yolun mutasiyalarına ehtiyac var [26]. Fərqli yollardakı mutasiyaların bir-birini istisna edəcəyini düşünmək üçün çox az səbəb var və bunun əksinə olaraq xəstələr arasında əhəmiyyətli bir ortaqlıq nümunələri göstərə bilər. Alqoritmi iterativ olaraq işlətməklə, hər əvvəlki iterasiyada olan genləri aradan qaldırmaqla bu alqoritmlərdən istifadə edərək bir çox yollar kəşf edilə bilər və Dendrix üçün belə bir yanaşma tətbiq edilmişdir [23]. Bununla belə, bu cür təkrarlanan yanaşmanın optimal yollar toplusunu təmin etməsinə zəmanət verilmir.

Burada Dendrix alqoritmini üç şəkildə genişləndiririk. Birincisi, tam bir xətti proqram (ILP) olaraq yüksək əhatə dairəsi olan eksklüziv və ya təxminən eksklüziv gen dəstləri tapmaq problemini formalaşdırırıq. Bu düstur, müxtəlif ölçülü optimal sürücü yollarını birbaşa tapmağa imkan verir - Dendrixdə istifadə olunan xəsis yaxınlaşma və Markov Chain Monte Carlo alqoritmlərindən fərqli olaraq. İkincisi, ILP -ni ümumiləşdirərək eyni anda birdən çox sürücü yolu tapırıq . Üçüncüsü, əsas alqoritmi əlavə təhlillərlə artırırıq: alt tipə xas olan mutasiyalar üçün gen dəstlərini araşdırmaq, fərqli yolların sayı və ölçüsündə nəticələrin sabitliyini ümumiləşdirmək və gen dəstlərinin daha çox eksklüzivliyini tətbiq etmək.

Multi-Dendrix adlı yeni alqoritmi dörd somatik mutasiya məlumat sisteminə tətbiq edirik: Xərçəng Genomu Atlasından (TCGA) [7] 261 glioblastoma (GBM) xəstələrində bütün ekzom və nüsxə sayı dizisi məlumatları, bütün exome və surət nömrəsi TCGA [8] 'dən 507 döş xərçəngi (BRCA) xəstəsində, TCGA [7] çox formalı glioblastoma (GBM) olan 84 xəstədə 601 ardıcıl gen və 188 ağciyər Adenokarsinomu olan 623 ardıcıl gen [27]. Hər bir verilənlər bazasında Multi-Dendrix, çox eksklüziv olan və hər qrupun bir çox xəstədə mutasiya edildiyi bioloji cəhətdən maraqlı gen qruplarını tapır. Bütün məlumat dəstlərində bunlara xərçəng inkişafı üçün kritik yolların üzvləri olan gen qrupları daxildir: Rb, p53 və RTK/RAS/PI (3) GBM və p53 və PI (3) K/AKT siqnal yolları döş xərçəngi.Multi-Dendrix bu yolları yalnız qarşılıqlı eksklüzivlik modelindən uğurla bərpa edirbu genlər arasındakı qarşılıqlı təsir haqqında əvvəlcədən heç bir məlumat yoxdur . Üstəlik, Multi-Dendrix, bu tanınmış yollarla qarşılıqlı müstəsna olan və potensial olaraq yollar arasındakı yeni qarşılıqlı əlaqələri və ya kəsişməni təmsil edən mutasiyaları da müəyyən edir. Görkəmli nümunələr arasında qarşılıqlı eksklüzivlik var: PI (3) K siqnal yolundakı mutasiyalar və glioblastomada PRDM2 (və PDPN) amplifikasiyası; p53, GATA3 və döş xərçəngində kadherin genlərindəki mutasiyalar.

Nəhayət, Multi-Dendrix-i qarşılıqlı eksklüziv dəstlər axtaran digər iki alqoritm olan Dendrix [23] və ya RME [22] -nin təkrar tətbiq edilməsinin alternativ bir yanaşması ilə müqayisə edirik. Göstəririk ki, bu təkrarlanan yanaşmalar adətən simulyasiya edilmiş məlumatlarda optimal yollar toplusunu tapa bilmir, Multi-Dendrix isə çoxlu yalançı pozitiv mutasiyaların mövcudluğunda belə düzgün yolları tapır. Real xərçəng sıralama məlumatlarına görə, Multi-Dendrix tərəfindən tapılan gen qruplarına, bilinən bioloji qarşılıqlı təsirləri olan daha çox gen daxildir. Üstəlik, Multi-Dendrix, bu digər alqoritmlərə nisbətən daha böyük miqyaslı əmrlərdir ki, bu da Multi-Dendrix-in Dendrix və RME-nin imkanlarından çox kənarda olan yüzlərlə nümunə üzrə ən son bütün exome məlumat məcmularına qədər ölçülənməsinə imkan verir.Multi-Dendrix, bir-birini istisna edən bir çox mutasiya qrupu tapmaq üçün yeni və praktik bir yanaşmadır və yollar, qarşılıqlı təsir şəbəkələri, zülal quruluşu və ya protein ardıcıllığının qorunması haqqında bioloji məlumatlardan istifadə edərək sürücü mutasiyalarının birləşməsini proqnozlaşdıran digər yanaşmaları tamamlayır.

Nəticələr

Multi-Dendrix alqoritmi

Multi-Dendrix alqoritmi xərçəng xəstələrindən somatik mutasiya məlumatlarını giriş olaraq alır və hər dəstin iki xüsusiyyətini təmin etdiyi çoxlu mutasiyalar dəstini təyin edir: (1) dəstdə bir mutasiya olan bir çox xəstə ilə əhatə dairəsi yüksəkdir ; (2) dəsti, əksər xəstələrin dəstdə tam olaraq bir mutasiyaya sahib olduğu qarşılıqlı eksklüzivlik nümunəsini nümayiş etdirir. Burada Multi-Dendrix alqoritmini qısaca təsvir edirik. Daha ətraflı məlumat aşağıdakı Metodlar bölməsində verilmişdir.

Xərçəng xəstələrində somatik mutasiyaların ölçüldüyünü və bu mutasiyaların fərqli mutasiya siniflərinə bölündüyünü düşünürük . Bir mutasiya sinfi, müəyyən bir genomik lokusda müxtəlif mutasiyaların qruplaşdırılmasıdır. Ən sadə halda, bir mutasiya sinfi, hər bir mutasiyanın (tək nukleotid variantları, nüsxə sayı aberrasiyaları və s.) Bir gendə qruplaşdırılmasına uyğundur. Somatik mutasiya məlumatlarını girişin aşağıdakı kimi təyin olunduğu ikili mutasiya matrisi olaraq təqdim edirik: (1)

Ümumiyyətlə, bir gen deyil, ixtiyari bir genom lokusu üçün bir mutasiya sinfi təyin edilə bilər və fərqli mutasiyalar növlərini ayırd edə bilər. Məsələn, bir mutasiya sinfi, bir protein ardıcıllığında və ya bir zülal sahəsindəki fərdi bir qalıqda tək nukleotid mutasiyalar olaraq təyin edilə bilər. Və ya alternativ olaraq, hər bir gendəki hər bir mutasiya növü üçün ayrı-ayrı mutasiya sinifləri yaradaraq bir gendəki fərqli mutasiyalar növlərini (məsələn, tək nukleotid mutasiyalar, silmələr və ya gücləndirmələr) ayırmaq olar. Aşağıdakı nəticələrdə mutasiya siniflərinin bu sonrakı tərifini istifadə edəcəyik. Ekspozisiyanın asan olması üçün bu hissənin qalan hissəsi üçün hər bir mutasiya sinifinin bir gen olduğunu qəbul edəcəyik.

Vandin və başqaları. [23] Maksimum Çəki Submatrix Problemi olaraq yüksək əhatə dairəsi və yüksək eksklüzivliyi olan bir gen dəsti tapmaq problemini formalaşdırır . Burada bir gen dəstinin çəkisi, əhatə dairəsi, bir gendə bir mutasiya olan xəstələrin sayı və əhatə dairəsinin üst -üstə düşməsi, birdən çox gendə mutasiyaya məruz qalan xəstələrin sayı arasındakı fərqdir. Vandin və başqaları. [23], maksimum çəkiyə malik bir gen dəsti tapan De novo Sürücü Münasibəti (Dendrix) alqoritmini [23] təqdim edir.

Tək sürücü yollarının tapılması vacib olsa da, əksər xərçəng xəstələrinin birdən çox yollarda sürücü mutasiyalarının olması gözlənilir. Dendrix, birdən çox gen dəsti tapmaq üçün tamahkar bir iterativ yanaşma tətbiq etdi (aşağıda təsvir edilmişdir), buna görə də optimal gen dəstləri tapmağa zəmanət verilmir. Birdən çox sürücü yolunun müəyyən edilməsi, ehtimal olunan gen dəstləri kolleksiyalarını qiymətləndirmək üçün bir meyar tələb edir. Yuxarıdakı kimi eyni bioloji motivasiyaya müraciət edərək, hər yolun təxminən bir sürücü mutasiyasından ibarət olduğunu gözləyirik. Üstəlik, hər bir sürücü yolu xərçəng inkişafı üçün əhəmiyyətli olduğu üçün, bir çox şəxsin əksər sürücü yollarında bir sürücü mutasiyasına sahib olmasını da gözləyirik. Beləliklə, hər bir yolun genləri içərisində yüksək bir eksklüzivlik və hər bir yolun tək başına yüksək əhatə dairəsini gözləyirik. Bu meyarlara cavab verən bir tədbir a tapmaqdırağırlıq cəmi maksimuma çatdırılan gen dəstləri toplusu .

Çoxlu Maksimum Çəki Submatrisləri problemini belə bir maksimum çəki toplama problemi olaraq təyin edirik. Çoxsaylı Maksimum Çəki Submatrix problemini tam ədədli xətti proqram (ILP) istifadə edərək həll edirik və nəticədə alqoritmi Multi-Dendrix olaraq görürük (bax Metodlara). Əlavə olaraq, Multi-Dendrix-də istifadə olunan ILP formulası dəyişdirilmiş çəki funksiyasından istifadə edir, burada daha yüksək əhatə dairəsinə malik olan (daha çox mutasiya xəstəsi olan) dəstə ilə daha yüksək örtüşmə üst-üstə düşmə (mutasiyalar arasında daha çox qeyri-müntəzəmlik) arasındakı fərqi tənzimləyən bir parametrdir. . Aşağıdakı döş xərçəngi məlumat bazasında bu parametri istifadə edirik. Bunun əksinə olaraq, Dendrix məhdud idi.

Simulyasiya edilmiş məlumatlar

Simulyasiya edilmiş mutasiya məlumatları üzrə Multi-Dendrix'i Dendrix [23] və RME [22] -nin təkrarlanan versiyaları ilə qarşılıqlı eksklüziv şəkildə yollara yerləşdirilmiş sürücü mutasiyaları və təsadüfi sərnişin mutasiyaları ilə müqayisə edirik. Bu simulyasiyaların məqsədi Multi-Dendrix-i çoxlu məlumatları özündə əks etdirən genləri müəyyən edən digər alqoritmlərlə müqayisə etməkdir.qarşılıqlı eksklüziv dəstlər. Xəstələr və genlər üçün mutasiya məlumatlarını aşağıdakı kimi yaradırıq. Hər biri dörd geni olan dörd yol qrupunu seçirik. Aşağıdakı fasilələrdən əhatə dairəsini bərabər şəkildə seçirik:,,,,. Bu verilənlər bazasının ölçüsü və yolların fərqli örtükləri, real məlumatlarda müşahidə edilənləri (bax § Somatik Mutasiya məlumatlarına) və sürücü mutasiyalarının yollarda toplandığı mutasiya irəliləyiş modellərinə uyğundur [28]. Hər bir yol üçün xəstələri təsadüfi olaraq seçirik və dəstədən tam bir genə sürücü mutasiyasını əlavə edirik. Beləliklə, hər bir yoldakı sürücü mutasiyaları bir -birini istisna edir. Daha sonra hər bir xəstədə təsadüfi olaraq mutasiyaya uğramış genləri ilə sərnişin mutasiyalarını əlavə edirik. TCGA GBM və Ağciyər xərçəngi məlumat dəstləri üçün təxminlərimizə bənzər dəyərlər istifadə etdik (aşağıda § Somatik Mutasiya məlumatlarında) və bunlar müvafiq olaraq idi. Vurğulayırıq ki, bu simulyasiyalar xərçəngdəki somatik mutasiyaların bütün komplekslərini modelləşdirmir, məsələn, genə xas və xəstəyə xas olan mutasiya dərəcələri, çoxlu yollarda mövcud olan genlər və s.

Dendrix və RME alqoritmləri tək yollar tapmaq üçün nəzərdə tutulduğundan, Multi-Dendrix-i birdən çox gen dəsti qaytaran bu metodların təkrarlanan versiyaları ilə müqayisə etdik. Dendrix üçün [23] -də təsvir edilən iterativ yanaşmadan istifadə etdik: ən yüksək bal toplayan bir gen dəsti tapmaq üçün Dendrixi tətbiq edin, həmin genləri verilənlər bazasından çıxarın və Dendrixi istədiyiniz sayda gen dəsti tapılana qədər bu addımları təkrarlayaraq azaldılmış verilənlər bazasına tətbiq edin. . Bu alqoritmi İter-Dendrix adlandıracağıq. Beləliklə, Iter-Dendrix gen dəstləri toplusunu belə qaytarır. RME-nin analoji iterativ versiyasını tətbiq etdik və bu alqoritmi Iter-RME adlandıracağıq. Metodlarda təsvir edildiyi kimi simmetrik fərqi hesablayaraq, hər bir alqoritm tərəfindən tapılan gen dəstlərinin toplanmasını əkilmiş yollarla müqayisə etdik.

Cədvəl 1, Multi-Dendrix, Iter-Dendrix və Iter-RME-nin fərqli dəyərlər üçün simulyasiya edilmiş mutasiya məlumatlarının müqayisəsini göstərir. Biz Iter-RME üçün uzunluğu deyil tam 24 sonra saat kimi üçün Iter-RME müqayisə göstərmək deyil ki, Qeyd , hər hansı bir 1000 süni mutasiya data dəstləri. RME nəşri [22] minlərlə gen və yüzlərlə xəstə olan mutasiya matrislərini təhlil edərkən, bu analiz (və buraxılan RME proqramı) mutasiyaların nümunələrin ən az 10% -də təqdim edilməsini tələb edirdi ki, bu da genlərin/nümunələrin sayını xeyli azaldır. alqoritmə giriş. Əslində, 10% -lik bir hədd cari bütün ekzom tədqiqatlarında demək olar ki, bütün genləri yox edəcək (bax § Multi-Dendrix və RME-nin müqayisəsi).