Wünschelruten-Test in Kassel
Robert König, Jürgen Moll, Amardeo Sama
Robert König, Jürgen Moll, Amardeo Sama
Die Idee eines Wünschelrutentests ist angesichts der Fülle von Berichten und Untersuchungsergebnissen aus der Vergangenheit sicher nicht als neu zu bezeichnen. Was die GWUP dennoch dazu veranlasst hat, einen solchen Test zu planen und durchzuführen, sind im wesentlichen zwei Gründe.
Erstens sind bis heute publizierte Untersuchungen offensichtlich nur einem relativ kleinen Kreis von Wissenschaftlern und interessierten Laien bekannt und führten darüber hinaus zu teilweise gegensätzlichen Resultaten. Dies hat zu dem in der Öffentlichkeit wie in den Fachdisziplinen polarisierten Meinungsbild über das Phänomen Wünschelrute beigetragen und begünstigt so ein Klima, in dem die etwa 10 000 aktiven Wünschelrutengänger der Bundesrepublik einen vorsichtig geschätzten Jahresumsatz von mehr als 100 Millionen DM erzielen können.
Zweitens erfordern außergewöhnliche Behauptungen nach unserer Überzeugung eine besonders sorgfältige Konzeption und Absicherung der Experimente. Die in jüngster Zeit durchgeführten wissenschaftlichen Untersuchungen im deutschsprachigen Raum lassen diese Sorgfalt trotz hoher finanzieller und zeitlicher Aufwendungen in zum Teil eklatanter Weise vermissen, was deren wissenschaftliche Aussagekraft mindestens in Frage stellt.
Es schien daher notwendig, einen Test zu konzipieren, der dem untersuchten Phänomen gerecht wird und als exemplarisch für eine wissenschaftliche Auseinandersetzung mit den Parawissenschaften gelten kann.
Mit diesen selbstgesteckten Ansprüchen ging die GWUP im Sommer ’89 in die Konzeptions- und Vorbereitungsphase für einen Wünschelrutentest. Wesentliche Impulse und Anregungen hat uns in deren Verlauf der bekannte amerikanische Trickkünstler und aktive Skeptiker James Randi gegeben, der seinen seit mehr als 25 Jahren bestehenden 10 000-US-Dollar-Preis für den bzw. die erfolgreichen Wünschelrutengänger zur Verfügung stellte. Darüber hinaus flossen seitens der GWUP eine Fülle von Kenntnissen und Erfahrungen aus den verschiedensten Fachdisziplinen in die Planungsaktivitäten ein. Schließlich fanden wir im Hessischen Rundfunk einen weiteren Partner, der die geeignete Umgebung und Infrastruktur bot, der durch die filmische Aufzeichnung der Tests eine nicht zu unterschätzende neutrale Beobachterposition einnahm und der uns einen wirkungsvollen Kanal zur Öffentlichkeit erschloss.
Den ersten Kontakt zu potentiellen Teilnehmern suchten und fanden wir durch eine Pressemitteilung im Spätsommer ’89, in der wir unseren Test öffentlich ankündigten. Aufgrund der zahlreichen Zeitungsberichte meldeten sich spontan ca. 100 Wünschelrutengänger bei der GWUP. In den folgenden Monaten versuchten wir durch regelmäßige Korrespondenz und eine Fragebogenaktion einen klaren Eindruck von der Art der behaupteten Fähigkeiten zu gewinnen. Dabei stellte sich heraus, dass eine Mehrheit der Interessenten die Fähigkeit vorgab, fließendes Wasser in künstlichen Leitungen zu finden. Wir entschieden uns daher im Frühjahr 1990, den Wünschelrutentest primär auf dieser Testform aufzubauen. Darüber hinaus gaben einige Wünschelrutengänger auch die Fähigkeit an, bestimmte Materialien unterschiedlicher Beschaffenheit (Metalle, Edelmetalle, Kohle, Magnete etc.) erspüren zu können. Dies veranlasste uns, eine zweite Testform zu entwickeln, die wir den Teilnehmern alternativ oder zusätzlich anbieten konnten.
Zur effektiven Koordinierung der Vorbereitungsaktivitäten setzte der GWUP-Vorstand im Februar 1990 eine vierköpfige Kommission ein, die sich der Entwicklung des technischen Aufbaus annahm. Dazu wurde zunächst ein Anforderungskatalog erstellt, der sich aus den oben angesprochenen Bedingungen für eine wissenschaftliche Untersuchung des Phänomens ergab. Danach musste der Test folgende Voraussetzungen erfüllen:
Einschränkend muss gesagt werden, dass Kontrollen (Punkt 3) immer nur relativ sein können. Es ist immer prinzipiell möglich, dass eine bewusste Täuschung mit ausreichend vielen technischen Hilfsmitteln erfolgreich sein kann. Deshalb war für dieses Projekt die Beratung durch James Randi sehr wichtig. Er half, ausreichende Sicherheiten festzulegen.
Auf Grundlage der o.g. Anforderungen erarbeitete die eingesetzte Kommission mehrere Alternativen zur technischen Realisierung des Projekts. Parallel dazu wurden die potentiellen Teilnehmer über den Fortgang der Vorbereitungen und die gestellten Anforderungen informiert.
Nach ausführlichen Vorgesprächen mit dem Hessischen Rundfunk einschließlich mehrerer Ortsbesichtigungen in Kassel sowie einem ständigen und sehr fruchtbaren Kontakt zu James Randi entschieden wir uns für einen einfachen, aber wirkungsvollen technischen Aufbau der Experimente.
Zur effektiven Koordinierung der Vorbereitungsaktivitäten setzte der GWUP-Vorstand im Februar 1990 eine vierköpfige Kommission ein, die sich der Entwicklung des technischen Aufbaus annahm. Dazu wurde zunächst ein Anforderungskatalog erstellt, der sich aus den oben angesprochenen Bedingungen für eine wissenschaftliche Untersuchung des Phänomens ergab. Danach musste der Test folgende Voraussetzungen erfüllen:
Einschränkend muss gesagt werden, dass Kontrollen (Punkt 3) immer nur relativ sein können. Es ist immer prinzipiell möglich, dass eine bewusste Täuschung mit ausreichend vielen technischen Hilfsmitteln erfolgreich sein kann. Deshalb war für dieses Projekt die Beratung durch James Randi sehr wichtig. Er half, ausreichende Sicherheiten festzulegen.
Auf Grundlage der o.g. Anforderungen erarbeitete die eingesetzte Kommission mehrere Alternativen zur technischen Realisierung des Projekts. Parallel dazu wurden die potentiellen Teilnehmer über den Fortgang der Vorbereitungen und die gestellten Anforderungen informiert.
Nach ausführlichen Vorgesprächen mit dem Hessischen Rundfunk einschließlich mehrerer Ortsbesichtigungen in Kassel sowie einem ständigen und sehr fruchtbaren Kontakt zu James Randi entschieden wir uns für einen einfachen, aber wirkungsvollen technischen Aufbau der Experimente.
Die wohl denkbar einfachste Aufgabe für einen Wünschelrutengänger, der fließendes Wasser in künstlichen Leitungen finden soll, ist eine Ja-Nein-Entscheidung. Dieser Prämisse folgend definierten wir die Testaufgaben wie folgt:
Fließt in einem unterirdisch verlegten Rohr, dessen Ort bekannt ist, Wasser oder nicht?
In 30 Einzeltests sollte jeder Teilnehmer eine Antwort auf diese Frage liefen. Zum Erhalt des Preisgeldes von insgesamt 20.000 DM erwarteten wir 25 richtige Antworten, was einer Trefferquote von 83% entspricht. Diese Leistung musste bei Erfolg in einer zweiten Testreihe mit ebenfalls mindestens 83% Trefferquote reproduzierbar nachgewiesen werden.
Nicht weniger präzise gestaltete sich die Aufgabenstellung bei der zweiten Testform:
In welchem von zehn Kunststoff-Behältern befindet sich ein zuvor vom Teilnehmer ausgewählter Gegenstand?
Bei diesem Test begrenzten wir die Zahl der Einzeltests auf zehn und die erforderliche Trefferquote auf 80%. Dies entspricht acht Treffern. Auch hier verlangten wir bei Erfolg die Wiederholung der erbrachten Leistung in einer zweiten Testreihe.
Aus Vorstehendem ergaben sich für uns folgende Hypothesen, die zur Prüfung anstanden:
Aufgrund der Hypothesen sind zwei Ausgänge denkbar:
Natürlich beziehen sich die Ergebnisse auf die getesteten Wünschelrutengänger und die vereinbarten Test-Bedingungen.
Diese ebenso klaren wie eindeutigen Aufgabenstellungen legten den technischen Aufbau der Testanordnungen schon weitgehend fest. Das endgültige Layout der Experimente wurde über die rein technische Machbarkeit hinaus auch von den unter 2. genannten Bedingungen bestimmt und musste zudem den natürlichen Gegebenheiten des Testgeländes Rechnung tragen. Als Ergebnis all dieser Überlegungen entstanden die in Abb. 1 und 4 dargestellten Testaufbauten Anfang November 1990 auf dem Gelände des Hessischen Rundfunks in Kassel.
Abb. 1: Schematische Darstellung der Testform “Fließendes Wasser in künstlichen Leitungen”
Diese ebenso klaren wie eindeutigen Aufgabenstellungen legten den technischen Aufbau der Testanordnungen schon weitgehend fest. Das endgültige Layout der Experimente wurde über die rein technische Machbarkeit hinaus auch von den unter 2. genannten Bedingungen bestimmt und musste zudem den natürlichen Gegebenheiten des Testgeländes Rechnung tragen. Als Ergebnis all dieser Überlegungen entstanden die in Abb. 1 und 4 dargestellten Testaufbauten Anfang November 1990 auf dem Gelände des Hessischen Rundfunks in Kassel.
Der Aufbau für den „Wasser-Test“ bestand aus einem insgesamt ca. 40 m langen Rohrsystem in rechteckiger Konstruktion, das in einer Tiefe von 50 cm auf einem Wiesengelände verlegt wurde. Die verwendeten Kunststoffrohre hatten einen Innendurchmesser von 57 mm. Das Gelände wies ein natürliches Gefälle auf, so dass durch die Schwerkraft ein ausreichender Wasserfluss gewährleistet war. Gespeist wurde das System durch einen Vorratsbehälter mit einem Fassungsvermögen von 1,5 cbm, der oberhalb der Rohrleitungen platziert wurde. Auf der gegenüberliegenden Seite des Rechtecks wurde das Wasser in einem Auffangbehälter gleichen Fassungsvermögens gesammelt und mittels einer Motorpumpe durch eine Ringlei1ung in den Vorratsbehälter zurück gepumpt.
Die Regelung des so geschlossenen Kreislaufs wurde durch 3 Ventile gewährleis1e1, die an dem Verbindungsrohr zwischen Vorratsbehälter und Rechtecksystem angebracht wurden:
1. Hauptabsperrventil (Einschaltventil)
2. Entlüftungsven1il. das die vollständige Entleerung der zuvor wasserdurchflossenen Leitung sicherstellte
3. 2-Wege-Ventil. mit dem die Richtung des Wasserflusses durch zwei mögliche Leitungen bestimmt wurde:
a) in die Teststrecke (Hauptstrecke)
b) in die Umleitung (Nebenstrecke)
Dadurch, daß in jedem Fall Wasser floß, sollten gleiche Bedingungen hinsichtlich Geräuschentwicklung und Vibra1ionen gewährleistet sein.
Damit wären die technischen Komponenten der Anordnung schon vollständig beschrieben, was die angestrebte prinzipielle Einfachheit des Testaufbaus unterstreicht. Ein wesentlicher Vorteil dieser Eigenschaft ist die leichte Kontrollierbarkeit sowohl der technischen Parameter als auch der zu protokollierenden Einstellungen und Rutengängerangaben.
Gerade dieser Aspekt ist nicht zu unterschätzen und auch ein Qualitätsmerkmal solcher Tests.
Dies wird auch beim Aufbau der „Kisten-Experimente“ deutlich.In einer Scheune wurden zehn Kunststoff-Behälter gleicher Machart auf einer Bank platziert und mit Nummern von 1 bis 10 eindeutig gekennzeichnet. Jeder Teilnehmer konnte einen Gegenstand aus Material der folgenden Liste benennen:
– Eisen – Kohle – Gold
– Silber
– Magnet – Kupfer
Das ausgewählte Material musste dann in einem der zehn Behälter gefunden werden.
Mehr als bei anderen wissenschaftlichen Experimenten erfordert die Untersuchung parawissenschaftlicher Behauptungen besondere Sicherheitsvorkehrungen und Kontrollmechanismen. Eine qualitative Aussage über die behaupteten Fähigkeiten ist anhand der Testergebnisse nur dann zulässig, wenn zwei Voraussetzungen unbedingt erfüllt sind:
1. Doppelblind-Versuche
2. Lückenlose Dokumentation
Die folgende Beschreibung des zeitlichen Ablaufs, der Protokollierung und der konsequenten Unterdrückung unerlaubter Informationswege lässt erkennen, wie viel Wert auf die Erfüllung o.g. Voraussetzungen gelegt wurde.
Abb. 2: Rutengänger mit Holzrute beim Wasser-Test im geschlossenen Zelt. Das Markierungsband am Boden kennzeichnet den Verlauf der eingegrabenen Wasserleitung. (Foto: Daniel Fischer)
Die eigentliche Teststrecke der Anordnung beim „Wasser-Test“ und damit der Aufenthaltsort der Teilnehmer sowie des Versuchsleiters befand sich innerhalb eines geschlossenen Zelts von 8 x 6 m. Dieser Testraum wurde, wie in Abb. 1 skizziert, von dem unterirdisch verlegten Rohrsystem auf einer Länge von 6 m gekreuzt. Den Innenraum des Zelts legten wir großflächig mit Kunstrasen aus und markierten zentimetergenau den Verlauf des Rohrs mit Signalband (Abb. 2). Im Bereich der Regelventile errichteten wir ein geschlossenes Holzhäuschen, in dem zwei Mitarbeiter mit der Einstellung für jeden Einzelversuch und deren Dokumentation beschäftigt waren (Abb. 3). Eine zusätzlich installierte Videokamera zeichnete sämtliche Einstellungsvorgänge auf. Der Auffangbehälter (Abflusstank) auf der gegenüberliegenden Seite wurde mit stabilen Holzplatten abgedeckt und ständig durch einen weiteren Protokollanten beobachtet. Das gesamte Testgelände war zudem abgesperrt, so dass außer den Teilnehmern, Protokollanten und Medienvertretern niemand Zutritt hatte.
Vor den eigentlichen Tests überprüften wir die Anordnung ausgiebig auf Dichtheit und Funktion. Darüber hinaus wurden die Zeiten für das Füllen und Entleeren des Rohrsystems gestoppt. Dadurch konnten wir während der Tests die Kommunikation zwischen den Protokollanten auf ein Mindestmaß reduzieren. Vor jedem Einzeltest befand sich das System in einem neutralen Zustand, d.h. das Absperrventil war geschlossen, die Entlüftung geöffnet und das 2-Wege-Ventil in eine Mittelstellung gedreht. Der Versuchsleiter im Zelt leitete jeden Einzeltest durch lautes Ansagen der laufenden Testnummer ein und startete gleichzeitig eine Stoppuhr. Daraufhin ermittelte ein Mitarbeiter im Holzhäuschen die Zufallseinstellung durch Ziehen eines markierten Tischtennisballs aus einer Tasche. Entsprechend der Markierung erfolgte die Einstellung der Ventile. Die zweite Person im Holzhäuschen hatte die Aufgabe, die Einstellung zu protokollieren und mittels einer weiteren Stoppuhr den zeitlichen Ablauf zu überwachen. Nach Ablauf von 30 Sek. gab der Versuchsleiter dem Teilnehmer ein Startsignal und dieser versuchte, die aktuelle Einstellung zu ermitteln.
Abb. 3: Die Kabine aupßerhalb des Testzeltes, in der nach einer physikalischen Zufallsentscheidung die Ventile so gesteuert wurden, dass das Wasser entweder durch die Testleitung oder durch die Umwegleitung floss. (Foto: Daniel Fischer)
Parallel dazu überprüfte und notierte der Protokollant am Auffangbehälter zusätzlich den eingestellten Zustand des Systems. Nachdem der Wünschelrutengänger seine Ja-Nein-Entscheidung getroffen hatte, gab der Versuchsleiter ein akustisches Signal, startete wiederum seine Stoppuhr und trug die Entscheidung ins Protokoll ein, sofern es der Teilnehmer nicht selbst getan hatte. Innerhalb weiterer 30 Sek. wurde das Rohrsystem entlüftet und der oben beschriebene neutrale Zustand des Systems wiederhergestellt.
Die „Kisten-Experimente“ erforderten einen vergleichsweise geringen technischen Aufwand und gestalteten sich auch in der Durchführung einfacher (Abb. 4). Zunächst ermittelte ein Mitarbeiter in einer zum „Wassertest“ analogen Prozedur denjenigen Behälter, in dem der ausgewählte Gegenstand untergebracht werden sollte. Die Nummer des Behälters wurde protokolliert und der Gegenstand hineingelegt. Anschließend verließ der Mitarbeiter den Testraum und signalisierte einem weiteren Protokollanten akustisch, dass die Einstellung erfolgt war. Daraufhin betrat dieser zusammen mit dem Teilnehmer den Testraum und notierte dessen Angaben über den Aufenthaltsort des Gegenstandes. Sowohl die Zufallsauswahl als auch die Einstellung und die Entscheidung des Teilnehmers wurden lückenlos mit einer stationären Videokamera aufgezeichnet. So standen auch hier drei unabhängige Protokolle zur Verfügung.
Abb. 4: Beim Kistenexperiment sollte der Rutengänger diejenige aus den 10 gleichartigen Boxen finden, in die der gesuchte Gegenstand (aus Gold, Silber, Kupfer, Eisen oder Magnet) nach Zufallsauswahl gelegt wurde.
Durch diesen streng formalisierten Ablauf konnten wir einerseits eine vollständige Doppelblindheit sicherstellen und hatten andererseits mehrere unabhängige Protokolle zur Verfügung. Gewollte oder ungewollte Manipulationen während der Tests sowohl seitens des Versuchsteams als auch seitens der Teilnehmer waren so nach allem Ermessen ausgeschlossen.
Besonderes Augenmerk galt während des gesamten Projekts der Information und Beteiligung der Teilnehmer. Sinnvoll und aussagefähig konnte der Test nur dann sein, wenn die Teilnehmer ebenso wie wir der Ansicht waren, dass durch den Test eine eindeutige Aussage über ihre behaupteten Fähigkeiten getroffen werden konnte. Um dabei die Gleichbehandlung aller Teilnehmer sicherzustellen, verteilten wir alle Informationen in schriftlicher Form und formalisierten die weitere Betreuung vor und nach den eigentlichen Tests nach folgendem Schema:
Die vorstehende Aufstellung macht eine weitere Besonderheit solcher Tests deutlich, die aber zugleich eine notwendige Voraussetzung für die Aussagekraft und das wissenschaftliche Gewicht der Resultate darstellt. Auch in dieser Hinsicht kann der Kasseler Wünschelrutentest als beispielhaft gelten und zeigt einmal mehr die besonderen Anforderungen bei der experimentellen Überprüfung parawissenschaftlicher Behauptungen.
Abb. 5: Trefferverteilung der Testform “Fließendes Wasser in künstlichen Leitungen”
Von 21 Wünschelrutengängern, die sich schriftlich angemeldet hatten, kamen 20 nach Kassel, um am Test teilzunehmen. 19 davon absolvierten den Test mit den durchflossenen Wasserrohren. Der 20. meinte, die ganze Gegend sei so „verstrahlt“, dass er die Versuche nicht machen könne. 14 Teilnehmer nahmen an den Kistenexperimenten teil, wovon jedoch nur 13 statistisch ausgewertet wurden. Dies liegt daran, dass eine Person von den vorher festgelegten Bedingungen abwich. Es handelte sich um die gleiche Person, die den Wassertest ablehnte. Ihre Ergebnisse, die die Kernaussage aller Versuchsergebnisse auch bei einer Berücksichtigung nicht verändert hatten, sind gesondert aufgeführt.
Die 19 Versuchspersonen, die den Wassertest absolvierten, erzielten zwischen 11 und 20 Treffer (37% – 67%). Die Verteilung der Ergebnisse ist im Balkendiagramm (Abb. 5) gezeigt. Die durchschnittliche Trefferquote lag bei 52,3% (298 aus 570).
Bei den Einstellungen der Ventile gab es insgesamt vier Fehler (0,7%). In allen vier Fällen wurde das Ventil auf „Aus“ statt auf „Ein“ gestellt. In drei Fällen wurde dies während der Versuche bemerkt und eine Korrektur auf dem Protokoll vorgenommen. Ein weiterer Fall wurde durch einen Vergleich der Protokolle entdeckt. Um den Fehler zu klären, wurden die Videobänder überprüft. Das Video zeigte, dass der Fehler bei der Einstellung geschah. Für die Auswertung der Protokolle wurde die tatsächliche Einstellung berücksichtigt.
Abb. 6: Trefferverteilung der Testform “Gegenstände”
Ein weiterer kleiner „Zwischenfall“ ereignete sich beim Wechsel der Protokollanten. Ein neuer Protokollant am Auffangbehälter deckte den Tank während zweier Testserien nicht vollständig ab. Dadurch ergab sich ein erhöhter Geräuschpegel durch das fließende Wasser. Ein Beobachter meinte, es sei ein kleiner Unterschied zwischen den Geräuschen bei den beiden Einstellungen erkennbar gewesen. Der Fehler wurde durch eine Routinekontrolle der Versuchsbedingungen entdeckt.
Die „Kistenexperimente“ empfanden die meisten Wünschelrutengänger als schwieriger. Dabei hatten sie für diese Testart auch geringere Erwartungen als bei den „Wassertests“. Sie erzielten zwischen 0 und 2 Treffer. Der Erwartungswert lag bei 1 Treffer (10%). Die durchschnittliche Trefferquote lg bei 10,8%. Die Verteilung der Treffer ist im Diagramm in Abbildung 6 gezeigt.
Abb. 7: Angaben der Wünschelrutengänger über “Störzonen” im Zelt beim “Wasser-Test”: Die Angaben einzelner Wüschelrutengänger sind durch verschiedene Symbole gekennzeichnet.
Die Ergebnisse einer Versuchsperson wurde bei den „Kistenexperimenten“ für die Gesamtbewertung nicht berücksichtigt. Dies geschah, weil die Durchführung dem Protokoll in zwei Punkten nicht entsprach. Erstens fand der Versuch im Freien statt, wodurch die Doppelblind-Bedingungen nur eingeschränkt galten. Zweitens absolvierte sie zwei Serien, d.h. 20 statt der vorher festgelegten 10 Einzeltests. Die Versuchsperson erzielte dabei keinen Treffer (aus 20). Damit lag sie sogar unter dem Erwartungswert. Die insgesamt 13 Teilnehmer der „Kistenexperimente“, die je 1 Serie absolvierten, erzielten dabei 14 Treffer. Dies entspricht einer Quote von 10.8%. Nimmt man die beiden Serien der o.g. Versuchsperson hinzu, so reduziert sich die erzielte Quote auf 9,3%.
Neben den eigentlichen Versuchsergebnissen gewannen wir während der Experimente auch andere interessante Erkenntnisse. Abbildung 8 zeigt beispielsweise die „Störzonen“, die von den Wünschelrutengängern vor Beginn der „Wasser-Tests“ angegeben wurden. Die „Störzonen“ wichen nicht nur erheblich voneinander ab; die Wünschelrutengänger führten die Störungen auch auf völlig unterschiedliche Ursachen zurück. Diese reichen von Wasseradern über vergrabene Metalle bis zu „Globalgitter-Netzen“.
Die Wünschelrutengänger erzielten bei keinem der beiden Versuchstypen das für eine Bestätigung ihrer Fähigkeiten notwendige Ergebnis. Damit konnte festgestellt werden, dass keiner der beteiligten Wünschelrutengänger unter den gesetzten Bedingungen mit der erforderlichen Trefferquote Wasser in Rohren oder Gegenstände in Behältern finden konnte.
Das Gesamtergebnis der Wasser-Versuche (52,3%) liegt sehr dicht bei der erwarteten durchschnittlichen Trefferquote von 50%. Die Verteilung der Trefferquoten liegt im Rahmen der unter der Zufallshypothese erwarteten Trefferverteilung. Das Versuchsergebnis bestätigt damit die Zufallshypothese. Nehmen wir nun die besten Ergebnisse bei den Wasser-Versuchen. Zwei Versuchspersonen erzielten 20 Treffer, eine weitere Person 19 Treffer. Im Einzelfall betrachtet, mag dies bemerkenswert erscheinen. Die Wahrscheinlichkeit aber, dass 2 oder mehr Personen bei einem solchen Test 20 und mehr Treffer erzielen, liegt bei ca. 24%. Auch die Wahrscheinlichkeit, dass 3 oder mehr Personen 19 oder mehr Treffer erzielen, liegt mit 30% relativ hoch.
Hierbei sollte aber beachtet werden, dass solche nachträglich festgestellten Wahrscheinlichkeiten von begrenztem Wert sind, auch wenn bemerkenswerte Zahlen herauskommen sollten. Dies hängt mit der großen Zahl verschiedener Auffälligkeiten zusammen, die nachträglich in jedem Zufallsrauschen „entdeckt“ werden können. Sie werden außerdem vom subjektiven Empfinden beeinflusst.
Wir verglichen außerdem die Trefferquoten mit den zufälligen Ziehungen der JA/NEIN-Wasser-Einstellungen. Hier liegen die JA-Werte zwischen 11 und 21. Dies bedeutet, dass die Wünschelrutengänger mit den höchsten Trefferquoten sogar von Zufallszahlen „übertroffen“ wurden. Es zeigt, dass einzelne „Ausreißer“ bei Zufallsergebnissen durchaus erwartet werden können und nicht mit einem Sinngehalt belegt werden müssen. Auch einzelne Ergebnisse bis 23 oder 24 wären noch kein „Beweis“ für „Erdstrahlen“ oder andere „Standorteinflüsse“.
Die Ergebnisse der „Kisten-Experimente“ sehen genauso eindeutig aus. Bei Kisten-Experimenten, wie sie in Kassel durchgeführt wurden, würden 95 % aller Testreihen Ergebnisse zwischen 5% und 15% Treffer zeigen. Das tatsächliche Ergebnis (10,8%) liegt in diesem Fall sehr nahe beim Erwartungswert. Auch die Streuung der Ergebnisse (0 – 2 Treffer aus 10) liefert keine Hinweise auf einen möglichen versteckten Effekt.
Das Gesamtergebnis zeigt, dass die behaupteten Fähigkeiten der Wünschelrutengänger nicht verifiziert werden konnten. Dies ist jedoch nicht gleichbedeutend mit einem allgemeingültigen Beweis der Nichtexistenz der Fähigkeiten. Ein solcher Gegenbeweis ist praktisch unmöglich, da immer eingewandt werden kann, wir hätten die falschen Wünschelrutengänger eingesetzt, die falschen Hypothesen getestet oder einen zu großen Effekt erwartet.
Nehmen wir beispielsweise den letzten Einwand. Wenn wir einen Effekt unter 54% messen wollten, müssten wir mehr als die angesetzten 570 Einzelexperimente bei den Wasser-Versuchen durchführen. Um eine Trefferquote von 53% zu testen, wären mindestens 1000 Einzeltests vonnöten. Wer könnte einem Wünschelrutengänger widersprechen, wenn er unter diesen Umständen Ermüdung als Ausrede benutzen würde? Wichtiger ist es noch, dass eine klare Definition eines „kleinen“, d.h. sehr schwachen, überhaupt nur statistisch nachweisbaren Effektes, von dem gelegentlich die Rede ist, nicht besteht. Dies ist jedoch vor der Planung eines Versuchsaufbaus zwingend, um einen Effekt nachweisen zu können. Dann ist auch ein kleiner Effekt grundsätzlich testbar. Die nachträgliche Entdeckung von Signifikanzen für zuvor nicht definierte Hypothesen kann nicht als Beweis angeführt werden. Bei genügend intensiver Suche können Signifikanzen fast immer gefunden werden. Sie können höchstens als Ausgangspunkt einer neuen Hypothese und somit von neuen Versuchsreihen gesehen werden.
Schlussfolgerung und Ausblick
Die Versuche konnten die zuvor definierten Hypothesen nicht bestätigen. Die getesteten Wünschelrutengänger konnten die behaupteten Leistungen in zwei unterschiedlichen Testformen nicht erbringen. Im Gegenteil zeigen die Ergebnisse eine von der GWUP erwartete Zufallsverteilung. Auch eine genauere Betrachtung der Resultate lieferte keinen Hinweis für einen kleinen Effekt. Allerdings waren die Experimente nicht darauf angelegt, einen sehr kleinen Effekt zu erkennen. Dies würde auch voraussetzen, solch einen kleinen Effekt vor einem Experiment klar zu definieren, was bisher nirgends geschehen ist.
Es haben sich auch Ansätze gezeigt, künftige Versuche zu verbessern. Erstens sollten mehr Personen mit der Überwachung der Versuchsbedingungen beauftragt werden, um bei einem Protokollfehler sofort reagieren zu können. Solche Fehler bedingen eine größere Gefahr als zufällige statistische Ausreißer. Deshalb sollte auf jeden Fall die Forderung nach Wiederholung einer Leistung bleiben, wie es in diesem Test geschah. Zweitens sollten Abweichungen, wie im Falle der bei den Kistenexperimenten nicht berücksichtigten Versuchsperson, grundsätzlich nicht erlaubt sein. Drittens wurde auch als Schwachpunkt genannt, dass das Häuschen mit den Ventilen nicht ganz von der Umwelt abgeschottet war. An Reaktionen der Personen in der Kabine hätte ein Komplize vielleicht etwas erkennen und über technische Hilfsmittel weitergeben können. Zwar ist diese Gefahr als äußerst gering einzustufen; sie sollte aber künftig ausgeschlossen werden.
Diese Vorschläge zeigen nur, wie schwer es ist, perfekte Versuche durchzuführen. Trotzdem muss festgestellt werden, dass in Deutschland bisher keine anderen Versuche zum Erdstrahlen-Wünschelruten-Problem auch nur annähernd die hohen Qualitätsanforderungen erreicht haben, die hier gestellt wurden.
Die GWUP wird bei geeigneten Voraussetzungen weitere Experimente zu Wünschelruten-Behauptungen und anderen paranormalen oder außergewöhnlichen Behauptungen durchführen. Die Voraussetzungen sind allerdings, dass Hypothesen vorher präzise definiert werden, und dass die Versuche streng kontrolliert und doppelblind durchgeführt werden können. Je außergewöhnlicher die Behauptung ist, desto strenger müssen Sicherheitskontrollen sein.
Wir möchten an dieser Stelle nicht versäumen, allen Personen und Institutionen zu danken, die an der Vorbereitung und Durchführung des Wünschelrutentests beteiligt waren und ohne deren Hilfe derartige Aktivitäten undurchführbar gewesen wären.
Wir danken dem Hessischen Rundfunk für seine Gastfreundschaft und eine für alle Beteiligten interessante Zusammenarbeit. Ebenso sei erwähnt, dass uns die Landesfeuerwehrschule Kassel technisch und personell in perfekter Weise zur Seite gestanden hat. Schließlich gilt unser besonderer Dank James Randi, der nicht nur den Wünschelrutentest wesentlich mitbestimmte, sondern darüber hinaus uns allen zu einer wertvollen und sehr angenehmen Erfahrung verholfen hat.
Der Test in Kassel hat gezeigt, dass weit verbreitete Behauptungen von Rutengängern nicht richtig sind. Ihre angebliche Fähigkeit, den Fließzustand von Wasser in Rohrleitungen oder kleine Objekte in Schachteln mit hoher Trefferquote rein rutengängerisch zu erspüren, konnte nicht nachgewiesen werden; die Ergebnisse waren – zumindest bei einer ersten Betrachtung – mit der Zufallshypothese verträglich. Möchte man demonstrieren, dass Rutengänger ihre Treffsicherheit bei derartigen Aufgabenstellungen bei weitem überschätzen, dann war dieser Test nützlich und hat hoffentlich dazu beigetragen, vielen die Augen zu öffnen.
Aus wissenschaftlicher Sicht hat der Test jedoch keine neuen Ergebnisse gebracht. Der Ausgang war vorhersehbar und bestätigt die Erfahrungen früherer Tests – insofern war er überflüssig. Mit so einfachen Methoden kommen wir nicht weiter. Mehr noch: es gab schon bessere Tests dieser Art, weiche nicht nur nach hohen Trefferquoten fragten, sondern nach der grundlegenden Existenz der strittigen Phänomene – und das lässt sich auch bei kleinen Trefferquoten erreichen, wenn man es richtig anpackt. So hat die TU Graz 3300 Wasser-ein/aus-Versuche durchgeführt; die aufsummierten Treffer entsprachen zwar auch dort der Zufallserwartung, eine Betrachtung der einzelnen Serien von je 20 Einzelversuchen ergab aber eine höchst signifikante Abweichung vom Zufall. Allerdings erst, nachdem das Rohr mit feinkörnigem Material gefüllt wurde (1).
Auch die Münchener Experimente haben gezeigt, dass künstliche Objekte in der Regel nicht oder nur mit sehr geringer Trefferquote gefunden werden. Will man also wissen, ob manche Rutengänger vielleicht echte – wenn auch nur marginale Fähigkeiten besitzen, so sind sehr große Testreihen erforderlich.
Der Kasseler Test mit seiner relativ geringen Versuchszahl darf daher nicht so interpretiert werden, dass er das prinzipielle Nichtvorhandensein rutengängerischer Fähigkeiten erwiesen hätte, oder gar mehr Aussagekraft aufweise als die sehr viel aufwendigeren (und teuren) Rohrexperimente in Graz und München (2).
Insofern wurde der Test nicht den Ansprüchen gerecht, welche die GWUP in zahlreichen öffentlichen Verlautbarungen, einschließlich des Briefes an Forschungsminister Riesenhuber, angekündigt hatte; der GWUP-Test war zwar einfacher und billiger als die Münchener Experimente, er erlaubt aber nicht, möglicherweise existierende kleinere und dennoch signifikante Effekte zu erkennen.
Es bleibt dennoch unstrittig, dass alle Experimente mit künstlichen Zielobjekten bisher allenfalls marginale Trefferquoten zeigten – und das ist für viele nicht befriedigend. Wie sollten also künftige Tests aussehen?
Wir schlagen vor, ausgewählte Rutengänger an natürlichen „Reaktionszonen“ zu testen. Es sollte sich dabei um geophysikalisch definierbare Bereiche handeln, wie z.B. Verwerfungen, enge Spalten, oder wasserführende Kluftsysteme. Bei solchen Gegebenheiten konnten nämlich wiederholt erstaunlich hohe Trefferquoten bis zu etwa 90% beobachtet werden, ohne dass eine stichhaltige konventionelle Erklärung vorgebracht werden konnte (3). Wir hoffen, dass sich die GWUP emotionslos und auf einer streng wissenschaftlichen Basis an solchen künftig geplanten Versuchen beteiligen wird.

Reanalyse des Kasseler Wünschelrutentests der GWUP