Big Science, kleiner Ertrag: Prof. Graur verreißt ENCODE 11

Zwischen den Genen: Junk oder Funktion?
Grafik: Plociam via Wikimedia cc2

Sarkasmus, offen vorgetragener Ärger und fiese Spitzen gegen Kollegen sind selten in der meist trockenen Fachliteratur der Genomik. Umso mehr horchten die Forscher auf, als kürzlich Prof. Dan Graur von der University of Houston und einige Kollegen mit scharfen Worten die 5-jährige Arbeit des ENCODE Projekts angriffen (On the immortality of television sets: “function” in the human genome according to the evolution-free gospel of ENCODE“). Im ENCODE-Projekt haben sich 442 Genomiker und Bioinformatiker aus aller Welt zusammengeschlossen, um Funktionen der DNA-Elemente des menschlichen Genoms zu beschreiben. Ein staubtrockenes Thema, möchte man meinen. Wieso ärgert sich Dan Graur darüber?

According to Eric Lander, a Human Genome Project luminary, ENCODE is the ‘Google Maps of the human genome’. We beg to differ, ENCODE is considerably worse than even Apple Maps.“ (Graur et al. 2013)

Vordergründig geht es um technische Feinheiten. Wie definiert man „Funktion“? Wie interpretiert man Daten aus Bioinformatik-Projekten? Aber die Schärfe des Artikels, die Frustration, die der Leser durchhört, muss tiefer liegende Gründe haben. Ich versuche deshalb mal, die Geschichte der Reihe nach aufzudröseln.

Bei DNA denken wir sofort an Gene. Gene kodieren Proteine, immer drei Bausteine der DNA stehen für einen Baustein eines Proteins. Da diese Bausteine in der Evolution wenig bis gar nicht verändert werden, können Bioinformatiker beim Vergleich verschiedener Genome relativ leicht erkennen, wo die Protein-kodierenden DNA-Abschnitte liegen. Das menschliche Genom, immerhin drei Milliarden DNA-Buchstaben lang, enthält nur um die 20.000 Protein-kodierende Gene. Zum Vergleich: Der Fadenwurm Caenorhabditis elegans, über den ich neulich schrieb, hat auch etwa 20.000 Gene, aber sein Genom ist nur 100 Millionen Buchstaben lang. Das Genom der Zwiebel wiederum ist fünf mal größer als das des Menschen. Was machen die langen DNA-Abschnitte zwischen den Genen? Haben sie alle eine Funktion? Ist die bescheidene Küchenzwiebel also komplexer als der Mensch?

Um die Gene herum liegen unter anderem „regulatorische DNA-Motive“, die wichtig sind, damit spezialisierte Proteine das Ablesen der Erbinformation regulieren können. Manche Gene sind etwa nur in einer bestimmten Phase der Entwicklung eines Organismus aktiv und werden dann wieder stillgelegt. All dies wird gesteuert durch das Zusammenspiel zwischen DNA-Bindeproteinen und Erkennungsmotiven in der DNA.

Es gibt noch viele andere funktionelle DNA-Abschnitte, die nicht für Proteine kodieren, auf die ich hier aber nicht näher eingehen will. Wichtig ist: DNA hat mehr Aufgaben, als nur den Bauplan für die Gene selbst zu kodieren. Aber auch wenn wir dies berücksichtigen, legt der Vergleich Wurm-Mensch-Zwiebel nahe, dass ein Großteil unseres Genoms, und erst recht das der Zwiebel, „Junk“-DNA ist, die keine Funktion hat (Auf den feinen linguistischen Unterschied zwischen „Junk“ und „Garbage“ werde ich gleich noch zurückkommen).

Das ENCODE-Team hat DNA-Elemente des menschlichen Genoms klassifiziert und ihnen, wenn möglich, eine Funktion zugewiesen. Die Leiter des Projekts behaupten nun, dass 80% der DNA eine Funktion hätte, weit mehr als vermutet – akzeptiertes Wissen war bisher, dass nur etwa 10% der DNA funktionell ist. Von „Junk-DNA“ könne keine Rede sein, Lehrbücher müssten umgeschrieben werden. Haben die Forscher, die sich früher mit dieser Frage beschäftigten, wirklich 70% der DNA fälschlicherweise als „Junk“bezeichnet?

We agree, many textbooks dealing with marketing, mass-media hype, and public relations may well have to be rewritten.” (Graur et al. 2013)

Wenn man Graur folgt, hat das ENCODE-Team gleich ein halbes Dutzend fatale Fehler begangen. Drei davon will ich kurz erläutern:

 1. Eine unsinnige Definition von „Funktion“.

Was meint der Genetiker, wenn er sagt ein Stück DNA habe eine Funktion? Um Dan Graur’s Beispiel aufzugreifen: Das Herz hat die Funktion, Blut zu pumpen. Es ist nicht die Funktion des Herzens, einen leeren Raum im Brustkorb auszufüllen oder das Einfallen des Rippen zu verhindern. Auf die DNA übertragen, wirft Graur den ENCODE-Machern vor, ähnlich unsinnige Funktionszuweisungen aufzulisten. Zum Beispiel weist ENCODE DNA-Abschnitte schon dann als „funktionell“ aus, wenn sie aktiv abgelesen werden. Das alleine reicht aber nicht, eine Funktion (im biologischen Sinn) zu begründen. DNA wird oft abgelesen, ohne dass irgendetwas mit der abgelesenen Information passiert. Auch ist „Protein-Bindung“ eine bei ENCODE häufig aufgelistete „Funktion“ von DNA-Motiven. Aber von einer Funktion zu sprechen ist sinnlos, wenn man nicht weiß, was passiert, wenn ein Protein an ein bestimmtes DNA-Motiv bindet.

2. Vernachlässigung evolutionärer Prinzipien.

Die natürliche Selektion erhält Funktionen in Graur’s Lesart. DNA-Sequenzen, die beliebig und folgenlos mutieren oder gar ganz entfernt werden können, haben biologisch gesehen eben keine Funktion. Professor Graur wirft den ENCODE-Machern vor, diesen Gedankengang, und darauf aufbauende Analysemethoden der evolutionären Genetik, komplett zu ignorieren.

Junk, Garbage oder Rubbish?
Foto: User Nanoworld via wikimedia cc3

Die Kritiker weisen in diesem Zusammenhang auch auf den feinen Unterschied zwischen „Junk“ und „ Garbage“ (oder „Rubbish“ für die Briten) hin. Garbage/Rubbish ist Müll, der in die Tonne getreten und weggebracht wird. Junk ist Gerümpel, das noch in der Wohnung herumliegt, momentan funktionslos, aber früher zu etwas gut war und vielleicht auch später noch einmal nützlich wird. Wenn Genetiker von 90% Junk DNA im Humangenom sprechen, meinen sie genau dies: Momentan ist diese DNA funktionslos, aber sie bildet Material, mit dem die Evolution spielen kann. Es finden sich im „Junk“ auch noch Spuren der evolutionären Geschichte einer DNA-Sequenz, z.B. indem die Information noch abgerufen wird und deshalb auf den ENCODE-Listen als „funktionell“ geführt wird – funktionsloser Junk ist dieses Stück Information aber dennoch.

Vergleichen will ich das mal mutig mit dem Kleinkind-Topfi, das bei vielen Familien noch irgendwo im Badezimmerschrank liegt, auch wenn das Kind schon längst aufs „große Klo“ geht. Die „Funktion“ des Topfis ist es, Urin und Fäkalien aufzunehmen, würde ENCODE definieren, aber Graur möchte genauer hinschauen und sagt: Dieses Topfi ist in diesem Haushalt funktionslos, es hatte früher eine Funktion und wird später vielleicht nochmal gebraucht. Gerade staubt es aber nur vor sich hin.

 3. Zweifelhafte statistische Methoden

Laut den Kritikern um Graur hängt ENCODE’s Aussage, dass 80% der menschlichen DNA eine Funktion habe, sehr davon ab, wie die Bioinformatiker die Parameter der statistischen Analyse setzen. Der Vorwurf: Hier herrscht Beliebigkeit. Mit dem gleichen Datensatz, aber anderen, genauso beliebigen statistischen Grenzwerten, könnte man auch zur Schlussfolgerung kommen, dass 100% des Genoms funktionell seien.

In fact, they could have saved millions of dollars and many thousands of research hours by ignoring selectivity altogether, and proclaiming a priori that 100% of the genome is functional.“ (Graur et al. 2013)

Aber zurück zur Ausgangsfrage: Warum ist Graur so emotional, wenn es vordergründig eher um technische Fragen der Analyse und der Begriffsdefinitionen geht? Die eigentliche Konfrontation, die Professor Graur provoziert, ist die zwischen „Big Science“ und „Small Science“. ENCODE ist Big Science: 442 Wissenschaftler haben 200 Millionen Dollar verbraten, unter Führung eines politisierten und zentralistischen Konsortiums. Dazu eine Herde Bioinformatiker, die jeweils ein eng umrissenes, technisches Teilproblem lösen und Datenbanken aufbauen. BigScience gibt aber keine Antworten auf wissenschaftliche Fragen, sondern produziert Datensätze, die für sich genommen wenig Neuigkeitswert haben – aber dann trotzdem als großer Durchbruch verkündet werden, schließlich will man etwas vorweisen für das viele Geld.

„High-throughput genomics and the centralization of science funding have enabled Big Science to generate ‘high-impact false positives’ by the truckload.“ (Graur et al. 2013)

Graurs These, die ich für richtig halte: Obwohl es in der Öffentlichkeit anders wahrgenommen wird, schreitet die Biologie in erster Linie durch „Small Science“ voran, also durch einzelne Arbeitsgruppen, die in mühsamer Kleinarbeit ganz spezifische Hypothesen testen, die in eine biologisch relevante Theorie eingebettet sind. „Big Science“ hat eine Berechtigung, weil sie Werkzeuge und Daten für „Small Science“ bereitstellt, aber der Blick für die eigentlichen Fragen geht bei der Ballung der Ressourcen auf die prestigeträchtigen Großprojekte verloren. In einem Satz von Robert Royar, den Graur ganz am Anfang seines Papers zitiert:

Daten sind nicht Informationen, Information ist nicht Wissen, Wissen ist nicht Weisheit, Weisheit ist nicht Wahrheit“

11 thoughts on “Big Science, kleiner Ertrag: Prof. Graur verreißt ENCODE

  1. Benjamin Schlager Mar 6, 2013 16:41

    Servus Hans.

    Hab es gerade gelesen. Nahezu verschlungen. Meiner Meinung nach ein Meisterstueck an Skepsis und Kritik. Der Teil ueber die Definition von “function” sollte mandatory reading fuer alle Biologiestudenten sein.

    mfg Ben

  2. Lars Knoch Mar 6, 2013 20:04

    Werde mir den Kommentar auch noch zu Gemüte führen und denke auch das grundsätzlich die Ykritik berechtigt ist.
    Aber eines darf nicht vergessen werden, was das ENCODE paper geschafft: den Massen an Neu- und Alt-Wissenschaftler aus vielen verschiedenen Fachbereichen deutlich klar zu machen,das in der DNA mehr als nur Proteine mit Funktion kodiert sind. Denn viele haben nicht gesehen was noch alles neben den Genen vorhanden ist und Einfluss auf die Entwicklung haben könnte. Ich sehe täglich in meinem Job, wie einseitig manche Wissenschaftler fokussiert sind und nicht links und rechts schauen…

    • Benjamin Schlager Mar 6, 2013 20:22

      Aber eines darf nicht vergessen werden, was das ENCODE paper geschafft: den Massen an Neu- und Alt-Wissenschaftler aus vielen verschiedenen Fachbereichen deutlich klar zu machen,das in der DNA mehr als nur Proteine mit Funktion kodiert sind.

      Dazu habe ich ENCODE nicht gebraucht. Das war in den 80ern schon jedem klar der einigermassen lesen konnte. :)

    • HansZ Mar 6, 2013 20:36

      @Lars @Ben
      Ich finde auch, 200 Millionen $ wären eine stolze Summe für ein didaktisches Projekt. Aber es stimmt ja, der Datensatz mag ganz nützlich sein – aber in der Interpretation haben sich die ENCODE-Leute wohl schon ziemlich vergaloppiert.

      Ein Punkt, wo ich nicht sicher bin ob Graur richtig liegt, ist, wenn er sagt dass Funktion immer mit Spuren der Selektion einhergeht. Wohl richtig in der Theorie, aber ob man wirklich ausserhalb der Gene immer klare Spuren der Selektion sehen kann? – z.B. dann, wenn nur einige ‘key positions” erhalten bleiben müssen um die Funktion zu erhalten.
      Aber da bin ich jetzt wirklich zu lange aus der Praxis raus um das beurteilen zu können.

  3. sparc Mar 7, 2013 06:27

    Ein Argument, das “genetic load” Argument, wird leider in Graurs Artikel nicht deutlich: Bei der beobachteten Mutationsrate kann es nicht sein, dass 80% des Genoms funktionell sind, da die entstehenden Mutationen nicht in demselben Maß durch “purifying selction” aus dem Genpool entfernt werden könnten. Die menschliche Spezies wäre unter solchen Bedingungen nicht überlebensfähig. Auf der Grundlage der “genetic load” konnte bereits in den 70er Jahren die vermutliche Zahl menschlicher Gene (<30.000) ermittelt werden, ein Wissen, dass leider bei den Protagonisten des HGP nicht vorhanden war, so dass sie von der relativ geringen Zahl der Gene überrascht wurden. Der narzistischen Kränkung, nicht wesentlich mehr Gene als ein Nematode zu besitzen, verucht nun derselbe Typ von Wissenschaftler durch die von ENCODE geäußerten Annahmen zu entkommen, Nicht ahnend, dass ihre Behauptungen gleichzeitig bedeuten würden, dass es keien Evolution gegeben haben kann, weshalb Kreationisten jeweder Coleur (YEC, OEC und IDioten) die ENCODE-Veröffentlichungen feiern. Dasselbe geschah übrigens auch schon beim ENCODE Pilotpaper 2007. Die Kritik an ENCODE durch Evolutionsbiologen fand allerdings nur in der Blogosphäre statt und blieb unbeachtet (m.E. beabsichtigt, da ein entsprechend großes Projekt schon zu diesem Zeitpunkt nicht mehr aufzuhalten war). Ewan Birney und ander führende Köpfe von ENCODE ließen die letzten September in denselben Medien erneut geäußerte Kritik nach dem Eiche/Sau-Prinzip an sich abperlen, ohne wirklich auf sie einzugehen. Auch zwei kritische Publikationen, die danach erschienen, blieben weitgehend unbeobachtet, wohl weil sie im Ton moderat blieben. Leider ist zu befürchten, dass Graur et al. dasselbe Schicksal erlebt hätten, wenn sie nicht die verwendete Form gewählt hätten.

    • HansZ Mar 7, 2013 09:12

      Vielen Dank für den Hinweis auf die Rezeption der ENCODE-Papers durch unsere kreationistischen Mitbürger, das ist mir (zum Glück vielleicht für meinen Blutdruck?) bisher entgangen.

      Wobei man fairerweise sagen muss: Kreationisten haben schon eine seltene Begabung, sämtliche Äußerungen von Wissenschaftlern in ihrem Sinne umzudeuten, ich würde das jetzt nicht direkt den ENCODE-Leuten anlasten.
      Allerdings ist es schon frustrierend dass ENCODE die Kritik aus der Evolutionsbiologie ignoriert, und hätte Graur nicht zu den altehrwürdigen Stilmitteln Sarkasmus, Ironie und Bosheit gegriffen, wäre sein paper wohl auch ignoriert worden.
      Es war auf jeden Fall eine mutige Entscheidung des Journals, das Paper in dieser Form anzunehmen – ich nehme an, einige der Gutachter (insgesamt gab es 7 Reviewers!) sind da voll dahintergestanden.

  4. Benjamin Schlager Mar 7, 2013 09:19

    Hoi Sparc.

    Haettest du eine Referenz fuer die Schaetzung <30.000 Gene beim Menschen in den 70ern? Wuerd ich mir gern anschauen…

    -Ben

    • sparc Mar 7, 2013 21:01

      Ich kenne die Zahl aus Ohno´s 1972 paper, in dem er auch den Begriff junk-DNA einführte. Man kann So much “junk” in our genomes als pdf auf T. Ryan Gregorys web-Seiten lesen. Auf seinem blog hat er auch einen post zu den Zahlen, die vor Beendigung des HGP für möglich gehalten wurden

  5. Alexander Mar 10, 2013 08:24

    Sehr schöner Post, danke! Was die Unterscheidung junk/garbage angeht, verweise ich immer gern auf dieses Video von Sydney Brenner, der das mit dem junk auch gut erklärt.

  6. Alexander Mar 12, 2013 08:45

    Und hinterher der kurze Hinweis, dass in PNAS ein Artikel von Ford Doolittle erschienen ist, der auch ENCODE und die falsch verstandene junk DNA Geschichte kritisiert.

Comments are closed.