info@resetheus.org (+420) 222 745 574

KONTAMINACE V GENOMECH – ROZŠÍŘENÝ PROBLÉM

Zdroj | Autor: Mike stone

přeložila Eva Mertlíková

„Většina klinických vzorků a vzorků tkáňových kultur, používaných pro sekvenování virových genomů, JE BĚŽNĚ KONTAMINOVÁNA LIDSKÝMI BUŇKAMI, DALŠÍMI MIKROORGANISMY A OBNAŽENOU DNA A RNA Z POŠKOZENÝCH BUNĚK.“

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2638583/

Když mluvíme o důkazu existence „virů“, je logické vyžadovat, aby částice považované za „virus“ byly purifikovány (neboli očištěny, tj. bez kontaminace, znečišťujících látek, cizího materiálu) a izolovány (odděleny od všeho ostatního). Pouze prostřednictvím procesu purifikace/izolace částic, považovaných za „viry“, lze skutečně prokázat, že tyto konkrétní částice ve skutečnosti existují a jsou jedinou možnou látkou, která by potenciálně mohla být příčinou nemoci. V případě virologie však tyto dva logické požadavky nejsou bohužel nikdy splněny. „Viry“ nejsou nikdy odebrány přímo od lidí a purifikovány k odstranění kontaminace ani nejsou nikdy izolovány od všeho ostatního. Proces kultivace vzorků na buněčných kulturách je přesným opakem purifikace/izolace, jak je vidět ve výše uvedeném citátu. Bez purifikace/izolace neexistuje důkaz, že částice existují, protože na snímcích z elektronového mikroskopu může být mnoho identických struktur a žádný důkaz patogenity není možný, protože jakákoli z toxických LÁTEK PŘIDANÝCH do kultury může sama o sobě onemocnění vyvolat. Chybějící purifikace/izolace částic vede k mnoha problémům, včetně kontaminace domnělého genomu.

Dále uvádím hlavní body z několika studií, které na rozšířený problém s kontaminací genomů poukazují.

Článek z Nature z července 2020:

KONTAMINACE V DATABÁZÍCH SEKVENCÍ

„Biologické sekvence ve veřejných databázích jsou nepostradatelnými zdroji pro výzkum v biologických vědách. I PŘESTO, ŽE SE NA TYTO DATABÁZE KAŽDODENNĚ SPOLÉHÁME, JEJICH DATA OBSAHUJÍ MEZERY, CHYBY A KONTAMINACI. ‚Jedním z našich výzkumných cílů za posledních několik let byla detekce patogenů u lidí pomocí metagenomického sekvenování metodou shotgun,‘ říká Martin Steinegger, který dříve pracoval v laboratoři Stevena L. Salzberga na Johns Hopkins University a nyní pracuje na Seoul National University. ‚V MNOHA PŘÍPADECH JSME BOHUŽEL ZJISTILI, ŽE KONTAMINACE GENOMOVÝCH SEKVENCÍ PRODUKUJE FALEŠNĚ POZITIVNÍ VÝSLEDKY.‘

To Steineggera a Salzberga motivovalo k tomu, aby zahájili projekt hodnocení kontaminace v databázích GenBank, RefSeq a NR. Pomocí nových rychlých algoritmů vyvinuli nástroj s názvem Conterminator, který umožňuje lineární vyhledávání kontaminace napříč taxonomickými říšemi. ‚Verze GenBank, kterou jsme vyhodnotili, měla velikost 3,3 terabytů a obsahovala 400 milionů sekvencí. Vzájemné srovnání všech sekvencí pomocí klasických metod by vyžadovalo stovky let,‘ uvedl Steinegger. ‚Na zpracování celé GenBank na jediném 32jádrovém serveru potřeboval náš algoritmus pouhých 12 dní.‘

OČEKÁVALI, ŽE NAJDOU NĚKOLIK TISÍC KONTAMINOVANÝCH SEKVENCÍ, MÍSTO TOHO JICH VŠAK NAŠLI MILIONY. V GenBank bylo detekováno 2 161 746 kontaminovaných sekvencí, v RefSeq 114 035 a v NR 14 148 kontaminovaných sekvencí. ‚Jedním z nejpřekvapivějších zjištění byla přítomnost části bakterie Acidithiobacillus thiooxidans v alternativním superkontigu AKTUÁLNÍ VERZE LIDSKÉHO REFERENČNÍHO GENOMU (GRCh38),‘ uvedl Steinegger. ‚LIDSKÝ GENOM JE K DISPOZICI JIŽ TAK DLOUHO A MNOHO VÝZKUMNÍKŮ HO POUŽÍVÁ PRAKTICKY KAŽDÝ DEN, ŽE JSME NEČEKALI, ŽE BYCHOM V NĚM NĚJAKOU KONTAMINACI NAŠLI.‘ Steinegger doufá, že Conterminator pomůže vědcům sekvenujícím genomy a správcům databází kontaminaci detekovat. Steinegger upozorňuje uživatele genomových sekvencí na to, že ‚MNOHÉ GENOMY OBSAHUJÍ KONTAMINACI. JEDNÍM Z PROBLÉMŮ, KTERÝ SE OPAKOVANĚ OBJEVUJE, JE TO, ŽE KONTAMINACE VEDE K NESPRÁVNÝM TVRZENÍM O HORIZONTÁLNÍM PŘENOSU GENŮ.‘

https://www.nature.com/articles/s41592-020-0895-8

Shrnutí 1. části:

  • navzdory každodennímu spoléhání se na tyto databáze existují v datech MEZERY, CHYBY A KONTAMINACE
  • „Bohužel jsme v mnoha případech zjistili, že kontaminace v genomových sekvencích MÁ ZA NÁSLEDEK FALEŠNĚ POZITIVNÍ VÝSLEDKY“
  • očekávali, že najdou několik tisíc kontaminovaných sekvencí, ALE MÍSTO TOHO JICH NAŠLI MILIONY
  • jedním z nejpřekvapivějších nálezů byla PŘÍTOMNOST ČÁSTI BAKTERIE Acidithiobacillus thiooxidans v alternativním superkontigu AKTUÁLNÍ VERZE LIDSKÉHO REFERENČNÍHO GENOMU (GRCh38)
  • „Lidský genom je k dispozici již tak dlouho a mnoho výzkumníků ho používá prakticky každý den, že JSME NEČEKALI, ŽE BYCHOM V NĚM NĚJAKOU KONTAMINACI NAŠLI“
  • „MNOHÉ GENOMY OBSAHUJÍ KONTAMINACI. Jedním z problémů, který se opakovaně objevuje, je to, že KONTAMINACE VEDE K NESPRÁVNÝM TVRZENÍM O HORIZONTÁLNÍM PŘENOSU GENŮ.“

Ze studie z března 2020:

KONTAMINUJÍCÍ DNA V SEKVENAČNÍCH EXPERIMENTECH U BAKTERIÍ JE VÝZNAMNÝM ZDROJEM FALEŠNÉ GENETICKÉ VARIABILITY

„KONTAMINUJÍCÍ DNA JE V MOLEKULÁRNÍ BIOLOGII A V DATABÁZÍCH GENOMŮ DOBŘE ZNÁMÝM PROBLÉMEM. Je překvapivé, že analytické pracovní postupy pro data z celogenomového sekvenování (WGS) BĚŽNĚ NEBEROU V ÚVAHU CHYBY POTENCIÁLNĚ ZPŮSOBENÉ KONTAMINACÍ, což může vést k nesprávnému vyhodnocení frekvence alel v základním i klinickém výzkumu.“

„Použili jsme taxonomický filtr k odstranění kontaminantů z více než 4000 bakteriálních vzorků z 20 různých studií a provedli jsme komplexní vyhodnocení rozsahu a dopadu kontaminující DNA při celogenomovém sekvenování. ZJISTILI JSME, ŽE KONTAMINACE JE VELMI ROZŠÍŘENÁ A PŘI ANALÝZE VARIANT MŮŽE ZPŮSOBIT ZKRESLENÍ VÝSLEDKŮ. UKÁZALI JSME, ŽE TOTO ZKRESLENÍ MŮŽE MÍT ZA NÁSLEDEK STOVKY FALEŠNĚ POZITIVNÍCH VÝSLEDKŮ A NEGATIVNÍCH JEDNONUKLEOTIDOVÝCH POLYMORFISMŮ (SNP), DOKONCE I U VZORKŮ S NEPATRNOU KONTAMINACÍ.“

„I když je při vývoji postupů pro vyhledávání jednonukleotidových polymorfismů vzato v úvahu mnoho faktorů, POTENCIÁLNÍ ROLE KONTAMINACE JE PŘEKVAPIVĚ ZVAŽOVÁNA JEN ZŘÍDKA [13]. CHYBNÁ INTERPRETACE KONTAMINOVANÝCH DAT VŠAK MŮŽE VÉST K NESPRÁVNÝM ZÁVĚRŮM OHLEDNĚ BIOLOGICKÝCH JEVŮ [14, 15].

JE ZNÁMO, ŽE GENOMOVÉ DATABÁZE OBSAHUJÍ KONTAMINOVANÉ SEKVENCE A SESTAVENÉ GENOMY, KTERÉ MOHOU OBSAHOVAT VELKÉ ČÁSTI GENOMU Z NECÍLOVÝCH ORGANISMŮ [16, 17]. Nedávná studie překvapivě odhalila, že ULOŽENÉ BAKTERIÁLNÍ A ARCHÁLNÍ SOUBORY JSOU KONTAMINOVÁNY LIDSKÝMI SEKVENCEMI, KTERÉ VYTVOŘILY TISÍCE CHYBNÝCH PROTEINŮ [18]. I když byl potenciální dopad kontaminantů zvažován v oblastech, jako je metagenomika nebo transkriptomika, většina analytických postupů celogenomového sekvenování bakterií postrádá konkrétní kroky zaměřené na nakládání s kontaminovanými daty. TATO SITUACE PRAVDĚPODOBNĚ VZNIKLA Z PŘEDPOKLADŮ, ŽE MIKROBIOLOGICKÉ KULTURY VĚTŠINOU NEOBSAHUJÍ NECÍLOVÉ ORGANISMY A ŽE I KDYŽ JSOU PŘÍTOMNY, TAK KONTAMINUJÍCÍ SEKVENCE SE PRAVDĚPODOBNĚ NEOBJEVUJÍ V REFERENČNÍCH GENOMECH NEBO JSOU ODSTRANĚNY POMOCÍ STANDARDNÍCH METOD ODFILTROVÁNÍ. ROZSAH KONTAMINACE A JEJÍ DOPAD na opětovné sekvenování bakterií NEBYL DOSUD KOMPLEXNĚ POSOUZEN.“

„ZJISTILI JSME, ŽE PŘÍPADY KONTAMINACE JSOU VE STUDIÍCH CELOGENOMOVÉHO SEKVENOVÁNÍ BAKTERIÍ ČASTÉ A PŘI ANALÝZE VARIANT MOHOU ZPŮSOBIT VELKÉ ZKRESLENÍ VÝSLEDKŮ, NAVZDORY POUŽITÍ PŘÍSNÝCH LIMITŮ PŘI MAPOVÁNÍ A VYHLEDÁVÁNÍ VARIANT. DŮLEŽITÉ JE, ŽE TO NEPLATÍ POUZE PRO SEKVENOVÁNÍ BEZ POUŽITÍ KULTUR, ALE TAKÉ PRO SEKVENOVÁNÍ Z ČISTÝCH KULTUR. Ukazujeme, že MÍRA NÁSLEDKŮ NENÍ ZÁVISLÁ NA MNOŽSTVÍ KONTAMINACE, A ŽE DOKONCE I VE VZORCÍCH S NÍZKOU ÚROVNÍ KONTAMINACE SE MOHOU NAHROMADIT DESÍTKY CHYB, zejména u nefixovaných jednonukleotidových polymorfismů.“

„ZJISTILI JSME, ŽE KONTAMINACE JE BĚŽNÁ TAKÉ U STUDIÍ SE SOUBORY DAT MYCOBACTERIUM TUBERCULOSIS (obr. 1b). PŘÍMÉ SEKVENOVÁNÍ Z KLINICKÝCH VZORKŮ a pozitivní zkumavky pro indikaci množství namnožených mykobakterií (MGIT), které jsou naočkovány primárními klinickými vzorky, podle očekávání PŘEDSTAVUJÍ VYŠŠÍ STUPEŇ KONTAMINACE, POKUD JDE O POČET KONTAMINOVANÝCH VZORKŮ A PODÍL ČTENÍ NECÍLOVÝCH ÚSEKŮ V NICH. Tyto vzorky jsou běžně kontaminovány lidskou DNA a bakteriemi, které se obvykle nacházejí v ústní dutině a v dutinách dýchacích cest, jako jsou Pseudomonas, Rothia, Streptococcus nebo Actinomyces a v NĚKTERÝCH VZORCÍCH MOHOU PŘEDSTAVOVAT PRAKTICKY VŠECHNA ČTENÍ. Nicméně, jak bylo pozorováno u souboru dat z bakterií, KONTAMINACE BYLA ZJIŠTĚNA TAKÉ VE STUDIÍCH, VE KTERÝCH SEKVENOVANÁ DNA POCHÁZELA Z IZOLÁTŮ ČISTÝCH KULTUR. Například Bacillus, Negativicoccus a Enterococcus představovaly ve studii KwaZulu až 68%, 58% a 32% různých vzorků. Je překvapivé, že 17 ze 73 vzorků Mycobacterium tuberculosis z nigerijské studie bylo identifikováno jako Staphylococcus aureus (92 až 99% čtení). Datový soubor s vysokou hloubkou čtení byl většinou bez kontaminace, s výjimkou dvou vzorků, u nichž byly v 3,32% případů identifikovány A. baumannii a v 2,83% případů netuberkulózní mykobakterie (NTM) (což představuje 795 887 a 920 379 čtení).“

„Je pozoruhodné, že dokonce i 5% KONTAMINUJÍCÍCH ČTENÍ MŮŽE PŘINÉST VELKÝ POČET FALEŠNĚ POZITIVNÍCH JEDNONUKLEOTIDOVÝCH POLYMORFISMŮ. Jak se dalo očekávat, chybná vyhledávání, způsobená tak malou kontaminací, se objevují hlavně v konzervovaných oblastech. V souladu s výsledky uvedenými na obr. 4a LZE CHYBNÉ JEDNONUKLEOTIDOVÉ POLYMORFISMY NALÉZT V CELÉM GENOMU (další soubor 8: obrázek S2).“

„UKAZUJEME, ŽE PŘÍTOMNOST SEKVENAČNÍCH ČTENÍ Z KONTAMINUJÍCÍCH ORGANISMŮ JE ČASTÁ, I KDYŽ SE SEKVENOVÁNÍ PROVÁDÍ Z IZOLÁTŮ Z ČISTÝCH KULTUR (obr. 1). Kromě NEVHODNÝCH LABORATORNÍCH POSTUPŮ existuje několik potenciálních zdrojů kontaminace, které závisí na různých faktorech, jako je DRUH ZPRACOVANÉHO VZORKU A JEHO PŮVOD nebo PROTOKOLY POUŽÍVANÉ PRO KULTIVACI, EXTRAKCI DNA A SEKVENOVÁNÍ. Např. Salter a kol. prokázali, že KONTAMINACE DNA V LABORATORNÍCH ČINIDLECH MŮŽE KRITICKY OVLIVNIT ANALÝZU MIKROBIOMŮ ZE VZORKŮ S NÍZKOU BIOMASOU [19]. Postupy sekvenování bez použití kultur pro nekultivovatelné nebo pomalu rostoucí patogeny, jako je T. pallidum nebo Mycobacterium tuberculosis, MAJÍ ZA NÁSLEDEK PŘÍTOMNOST VELKÉHO MNOŽSTVÍ KONTAMINUJÍCÍ DNA Z HOSTITELNÉHO ORGANISMU. Možné jsou i jiné zdroje, které nesouvisí se zpracováním vzorků. Například vzorky Mycobacterium tuberculosis, v nigerijské studii chybně označené jako vzorky S. aureus, jsou s největší pravděpodobností CHYBOU PŘI ODESÍLÁNÍ DAT DO GENOMICKÉHO ÚLOŽIŠTĚ. Bez ohledu na zdroj kontaminace je společným důsledkem PŘÍTOMNOST NECÍLOVÝCH ČTENÍ V SEKVENAČNÍCH SOUBORECH, KTERÉ BY MOHLY OVLIVNIT VÝSLEDKY GENOMOVÉ ANALÝZY.“

„KONTAMINACE BYLA UZNÁNA JAKO HLAVNÍ ZDROJ CHYB V GENOMOVÝCH SESTAVÁCH A V DALŠÍCH OBLASTECH, JAKO JE METAGENOMIKA [16, 19]. Role kontaminace při opětovném sekvenování je však OBVYKLE OPOMÍJENA. Zatímco některé skupiny již o tomto problému vědí, většina postupů pro opětovné sekvenování bakterií stále nemá STRATEGIE KONTROLY KONTAMINACE NEBO POKUD JE MAJÍ, TAK JSOU V PUBLIKOVANÝCH PRACÍCH MÁLOKDY PODROBNĚ POPSÁNY.“

https://bmcbiol.biomedcentral.com/articles/10.1186/s12915-020-0748-z

Shrnutí 2. části:

  • kontaminující DNA je v molekulární biologii a v genomových úložištích DOBŘE ZNÁMÝM PROBLÉMEM
  • analytické postupy při celogenomovém sekvenování (WGS) běžně NEBEROU V ÚVAHU CHYBY POTENCIÁLNĚ ZPŮSOBENÉ KONTAMINACÍ, což může vést k chybnému vyhodnocení frekvence alel jak v základním, tak v klinickém výzkumu
  • autoři studie zjistili, že kontaminace je VŠUDYPŘÍTOMNÁ A DO ANALÝZY VARIANT MŮŽE VNÉST VELKÉ ZKRESLENÍ
  • ukázali také, že toto zkreslení může mít za následek STOVKY FALEŠNĚ POZITIVNÍCH VÝSLEDKŮ A NEGATIVNÍCH JEDNONUKLEOTIDOVÝCH POLYMORFISMŮ, a to i u vzorků s NEPATRNOU KONTAMINACÍ
  • připouštějí, že potenciální role kontaminace se zvažuje jen zřídka
  • nesprávná interpretace kontaminovaných dat může vést k vyvození CHYBNÝCH ZÁVĚRŮ o biologických jevech
  • JE ZNÁMO, ŽE GENOMOVÉ DATABÁZE OBSAHUJÍ KONTAMINOVANÉ SEKVENCE a sestavené genomy, které mohou obsahovat velké genomové oblasti z necílových organismů
  • nedávná studie odhalila, že uložené bakteriální a archeální soubory jsou KONTAMINOVÁNY LIDSKÝMI SEKVENCEMI, které vytvořily tisíce chybných proteinů
  • domnívají se, že tato situace pravděpodobně vznikla kvůli PŘEDPOKLADŮM, že mikrobiologické kultury většinou neobsahují necílové organismy a že i když jsou přítomny, tak kontaminující sekvence nejsou do referenčních genomů pravděpodobně mapovány nebo jsou odstraněny pomocí standardních metod odfiltrování
  • ROZSAH KONTAMINACE A JEJÍ DOPAD na postupy pro opětovné sekvenování bakterií NEBYL DOSUD KOMPLEXNĚ POSOUZEN
  • zjistili, že ve studiích celogenomového sekvenování bakterií DOCHÁZÍ KE KONTAMINACI ČASTO a při analýze variant MŮŽE ZPŮSOBIT VELKÉ ZKRESLENÍ, a to navzdory použití přísných limitů při mapování a vyhledávání variant
  • uvádějí, že to platí nejen pro postupy sekvenování bez použití kultur, ale také pro sekvenování z čistých kultur
  • míra následků NENÍ ZÁVISLÁ na množství kontaminace, a dokonce i VE VZORCÍCH S NÍZKOU ÚROVNÍ KONTAMINACE se mohou hromadit desítky chyb, zejména u nefixovaných jednonukleotidových polymorfismů
  • zjistili, že KONTAMINACE JE BĚŽNÁ TAKÉ U STUDIÍ SE SOUBORY DAT MYCOBACTERIUM TUBERCULOSIS
  • PŘÍMÉ SEKVENOVÁNÍ Z KLINICKÝCH VZORKŮ a pozitivní zkumavky pro indikaci množství namnožených mykobakterií (MGIT), které jsou naočkovány primárními klinickými vzorky, PŘEDSTAVUJÍ VYŠŠÍ STUPEŇ KONTAMINACE, pokud jde o počet kontaminovaných vzorků a podíl čtení necílových úseků v nich
  • Běžnými kontaminanty těchto vzorků jsou:
    1. Lidská DNA
    2. Bakterie, které se obvykle nacházejí v ústní dutině a v dutinách dýchacích cest, jako jsou:
      • Pseudomonas
      • Rothia
      • Streptococcus
      • Actinomyces
  • tyto běžné kontaminanty mohou v některých vzorcích představovat PRAKTICKY VŠECHNA ČTENÍ
  • jak bylo pozorováno u souboru dat z bakterií, kontaminace byla zjištěna také ve studiích, ve kterých sekvenovaná DNA POCHÁZELA Z IZOLÁTŮ ČISTÝCH KULTUR
  • dokonce i 5% kontaminujících čtení může přinést velký počet falešně pozitivních jednonukleotidových polymorfismů
  • chybné jednonukleotidové polymorfismy lze nalézt v celém genomu
  • autoři studie dospěli k závěru, že prokázali, že přítomnost sekvenčních čtení z kontaminujících organismů je ČASTÁ, I KDYŽ SE SEKVENOVÁNÍ PROVÁDÍ Z IZOLÁTŮ Z ČISTÝCH KULTUR
  • Důvody kontaminace:
    1. Nevhodné laboratorní postupy
    2. Druh zpracovaného vzorku a jeho původ
    3. Protokoly používané pro kultivaci, extrakci DNA a sekvenování
    4. Chyba při odesílání dat do genomického úložiště
  • KONTAMINACE DNA V LABORATORNÍCH ČINIDLECH může kriticky ovlivnit analýzu mikrobiomů ze vzorků s nízkou biomasou
  • postupy sekvenování bez použití kultur pro nekultivovatelné nebo pomalu rostoucí patogeny, jako je T. pallidum nebo Mycobacterium tuberculosis, mají za následek přítomnost VELKÉHO MNOŽSTVÍ KONTAMINUJÍCÍ DNA Z HOSTITELSKÉHO ORGANISMU
  • důsledkem kontaminace je PŘÍTOMNOST NECÍLOVÝCH ČTENÍ v sekvenačních souborech, které mohou ovlivnit výsledky genomové analýzy
  • kontaminace byla uznána jako HLAVNÍ ZDROJ CHYB v genomových sestavách a dalších oblastech, jako je metagenomika
  • role kontaminace při opětovném sekvenování je obvykle OPOMÍJENA
  • stále chybí STRATEGIE KONTROLY KONTAMINACE nebo pokud existují, jsou v publikovaných pracích málokdy podrobně popsány

Ze studie z února 2020:

PREVALENCE A DŮSLEDKY KONTAMINACE VE VEŘEJNÝCH GENOMICKÝCH ZDROJÍCH: PŘÍPADOVÁ STUDIE 43 REFERENČNÍCH SESTAV ČLENOVCŮ

„CHYBY ZPŮSOBENÉ KONTAMINACÍ JSOU OBZVLÁŠTĚ ZNEPOKOJIVÉ; JSOU ROZŠÍŘENÉ, ŠÍŘÍ SE NAPŘÍČ DATABÁZEMI A MOHOU NEGATIVNĚ OVLIVNIT NÁSLEDNÉ ANALÝZY, ZEJMÉNA DETEKCI HORIZONTÁLNĚ PŘENESENÝCH SEKVENCÍ. STÁLE NÁM VŠAK CHYBÍ KONZISTENTNÍ A KOMPLEXNÍ HODNOCENÍ PREVALENCE KONTAMINACE VE VEŘEJNÝCH GENOMICKÝCH DATECH.“

„VĚDCI OBVYKLE POUŽÍVAJÍ SEKVENAČNÍ DATA GENEROVANÁ OSTATNÍMI, A JSOU PROTO ZÁVISLÍ NA SPOLEHLIVOSTI DOSTUPNÝCH GENOMICKÝCH ZDROJŮ. Z tohoto důvodu je problém kvality veřejných dat v molekulární biologii dlouhodobě považován za zásadní problém (Lamperti a kol. 1992; Mistry a kol. 1993; Binns 1993). PROBLÉM JE JEŠTĚ NALÉHAVĚJŠÍ V DNEŠNÍ DOBĚ S PŘÍCHODEM VYSOCE VÝKONNÝCH SEKVENAČNÍCH TECHNOLOGIÍ, KDY VĚTŠINA DATOVÝCH SOUBORŮ GENEROVANÝCH V GENOMICKÉM VÝZKUMU JEDNODUŠE NENÍ PŘÍSTUPNÁ MANUÁLNÍMU ZPRACOVÁNÍ LIDMI. To přináší novou výzvu pro současné metodologie v genomických vědách, konkrétně vývoj automatizovaných přístupů k detekci a zpracování chyb (např. Andorf a kol. 2007; Schmieder a Edwards 2011; Parks a kol. 2015; Delmont a Eren 2016 ; Drăgan a kol. 2016; Tennessen a kol. 2016; Laetsch a Blaxter 2017; Lee a kol. 2017).

PROBLÉMY S KVALITOU DAT V GENOMOVÝCH SEKVENCÍCH ZAHRNUJÍ MIMO JINÉ CHYBY PŘI SEKVENOVÁNÍ, CHYBY PŘI SESTAVOVÁNÍ A KONTAMINACI. Chyby způsobené kontaminací jsou obzvláště znepokojivé z několika důvodů. Zaprvé MOHOU VÉST K ZÁVÁŽNÝM CHYBNÝM INTERPRETACÍM ÚDAJŮ, jak dokládají nedávné významné příklady. MEZI POTENCIÁLNÍ PROBLÉMY PATŘÍ CHYBNÁ CHARAKTERIZACE OBSAHU GENŮ A SOUVISEJÍCÍCH METABOLICKÝCH FUNKCÍ (např. Koutsovoulos a kol. 2016; Breitwieser a kol. 2019), NESPRÁVNÉ ZÁVĚRY O EVOLUČNÍCH UDÁLOSTECH (např. Laurin-Lemay a kol. 2012; Simion a kol. 2018 ) A ZKRESLENÍ PŘI URČOVÁNÍ GENOTYPU A V POPULAČNÍCH GENOMICKÝCH ANALÝZÁCH (např. Ballenghien a kol. 2017; Wilson a kol. 2018). Zadruhé EXISTUJE PODEZŘENÍ, ŽE KONTAMINACE JE ROZŠÍŘENÁ. VYSKYTUJE SE PŘIROZENĚ VE VĚTŠINĚ SEKVENAČNÍCH PROJEKTŮ DÍKY CIZÍ DNA PŮVODNĚ PŘÍTOMNÉ V SUROVÉM BIOLOGICKÉM MATERIÁLU (např. symbionti, paraziti, požitá potrava; Salzberg a kol. 2005; Starcevic a kol. 2008; Artamonova a Mushegian 2013; Driscoll a kol. 2013 ; Martinson a kol. 2014; Cornet a kol. 2018) nebo se tam dostává v laboratořích a sekvenačních centrech (Longo a kol. 2011; Salter a kol. 2014; Wilson a kol. 2018). Zatřetí CHYBY ZPŮSOBENÉ KONTAMINACÍ SE SNADNO ŠÍŘÍ NAPŘÍČ DATABÁZEMI V PROHLUBUJÍCÍM SE ZAČAROVANÉM KRUHU. Pokud je sekvence DNA z druhu A na začátku přiřazena špatnému druhu B, kvůli kontaminaci druhu B způsobenou druhem A, pravděpodobně si na nějakou dobu své nesprávné zařazení udrží, a může být dokonce identifikována jako že druh A je kontaminován druhem B, když je genom A nakonec sekvenován (Merchant a kol. 2014). Navzdory všem možným problémům vyplývajícím z kontaminace genomových zdrojů se většina studií, zabývajících se tímto problémem, dosud zaměřila na jeden konkrétní genom (např. želvušek) a/nebo jeden konkrétní zdroj kontaminantů (např. člověka). Pouze dvě studie, o kterých víme, důsledně prověřovaly více než jednu sestavu genomu. Merchant a kol. (2014) se zaměřili na genom skotu, ale svůj postup použili také na osm náhodně vybraných konceptů genomů (pěti zvířat, dvou rostlin, jedné houby) s kontrastními výsledky. Cornet a kol. (2018) analyzovali 440 genomů sinic a odhalili podstatnou úroveň kontaminace u více než 5% z nich. JE ZJEVNÉ, ŽE PROBLÉM S KONTAMINACÍ VE VEŘEJNĚ DOSTUPNÝCH GENOMICKÝCH DATECH JE POTŘEBA DÁLE VYHODNOTIT.“

https://academic.oup.com/g3journal/article/10/2/721/6026299

Shrnutí 3. části:

  • CHYBY ZPŮSOBENÉ KONTAMINACÍ jsou obzvláště znepokojivé; jsou ROZŠÍŘENÉ, ŠÍŘÍ SE NAPŘÍČ DATABÁZEMI a mohou NEGATIVNĚ OVLIVNIT NÁSLEDNÉ ANALÝZY, zejména detekci horizontálně přenesených sekvencí
  • stále CHYBÍ KONZISTENTNÍ A KOMPLEXNÍ HODNOCENÍ PREVALENCE KONTAMINACE ve veřejných genomických datech
  • vědci obvykle používají sekvenační data generovaná ostatními, a proto jsou ZÁVISLÍ NA SPOLEHLIVOSTI DOSTUPNÝCH GENOMICKÝCH ZDROJŮ
  • problém je ještě naléhavější v dnešní době s příchodem vysoce výkonných sekvenačních technologií, kdy většina datových souborů generovaných v genomickém výzkumu JEDNODUŠE NENÍ PŘÍSTUPNÁ MANUÁLNÍMU ZPRACOVÁNÍ LIDMI
  • problémy s kvalitou dat v genomových sekvencích zahrnují mimo jiné chyby při sekvenování, chyby při sestavování a kontaminaci
  • kontaminace může vést k závažným chybným interpretacím údajů
  • potenciálními problémy jsou:
    1. Chybná charakterizace obsahu genů a souvisejících metabolických funkcí
    2. Nesprávné závěry o evolučních událostech
    3. Zkreslení při určování genotypu a v populačních genomických analýzách
  • existuje podezření, že kontaminace je ROZŠÍŘENÁ
  • vyskytuje se PŘIROZENĚ ve většině sekvenačních projektů díky CIZÍ DNA
  • chyby způsobené kontaminací SE SNADNO ŠÍŘÍ NAPŘÍČ DATABÁZEMI v prohlubujícím se začarovaném kruhu
  • autoři studie dospěli k závěru, že je zjevné, že problém s kontaminací ve veřejně dostupných genomických datech JE POTŘEBA DÁLE VYHODNOTIT

Každý, kdo tvrdí, že existence genomu je důkazem purifikovaného/izolovaného „viru“, se naprosto mýlí. Kontaminace genomů je nepochybně rozšířeným problémem, který se jen zhoršuje. Problém REPRODUKOVATELNOSTI je v genomice dalším kritickým problémem. Jak kontaminace, tak nedostatek reprodukovatelnosti ovlivňují také počáteční krok kultivace buněk. Pokud by někoho zajímalo, proč existují více než 2 miliony variant (a počet se stále zvyšuje) pro „SARS-CoV-2“, stačí se podívat na vysoce KONTAMINOVANÉ procesy používané ke kultivaci „viru“ a sekvenování genomu.

Problémy se spolehlivostí a přesností týkající se genomů:

https://m.facebook.com/story.php?story_fbid=10158343881003576&id=502548575

Argumenty proti buněčným kulturám:

https://m.facebook.com/story.php?story_fbid=10158078047703576&id=502548575

Napsat komentář

Pin It on Pinterest

Share This