Arbeitet der BND wirklich so unprofessionell?

Der BND wertet angeblich Millionen an Selektoren (Telefonnummern, E-Mail-Adressen usw) manuell und ohne Internet-/Intranet-Zugang statt automatisiert aus. Ist das Unfähigkeit oder Schlamperei? Oder erzählen die Zeugen im NSA-Untersuchungsausschuss Mist?

BND-Mitarbeiter Dr. T. (mit Amtsbezeichnung Oberregierungsrat, also höherer Dienst) hat ein paar Millionen „Selektoren“ ausgewertet und kategorisiert, die der BND von der NSA bekommt. Also die Daten, nach denen die Geheimdienste nach für sie interessanten Daten in den überwachten Verbindungen suchen. Ich beziehe mich im Folgenden auf das Live-Protokoll seiner Aussage bei Netzpolitik.org und diesen Spiegel-Bericht.

Weil die Datenmenge – einige Millionen Selektoren – zu groß war, musste Dr. T mit einem Leihgerät „außerhalb des Netzes“ arbeiten. Manuelle Auswertung auf einem (im Hause) geliehenen Laptop ohne Internet-/Intranet-Zugang, der in der Zwischenzeit leider ausgemustert wurde. Keine Spuren, vom Ergebnis soll es angeblich nur einen Ausdruck gegeben haben.

Die Dateigröße von ein paar Millionen Selektoren ist bei heutigen normalen Computern Pipifax. Bei 10 Millionen Selektoren mit einer Länge bis 50 zeichen ist das eine Datenmenge von weniger als 500 MB. Damit ist das lokale Netz des BND (Fileserver etc) sowie ein normaler Arbeitsplatz-Rechner überfordert? Wirklich? Sind die derart unfähig?

Das ganze ist so unverschämt dämlich, da frage ich mich:

  • Lügen die Zeugen? Nun, das wäre eindeutig strafbar. Update: Laut Wolfgang Nešković wäre es nicht strafbar, wenn BND-Mitarbeiter das parlamentarische Kontrollgremium anlügen. Gilt das auch für den Untersuchungsausschuss? Wäre eine interessante Frage an den Chefaufseher der Bundesregierung … ;-)
  • Ist die Arbeit beim BND grundsätzlich so unprofessionell?
  • Aber vielleicht sind die so blöd und arbeiten bei soetwas mit einer Word- oder Excel-Datei und das kommt damit nicht klar?
  • Oder haben die Vorgesetzten für die Arbeit (absichtlich oder aus Personalmangel) eine Person ausgewählt, die unfähig ist? Warum wurde Dr. T. ausgewählt?
  • Warum wird so etwas nicht maschinell automatisiert ausgewertet?
  • Haben die solch schwache Arbeitsplatz-Rechner, dass Leih-Notebooks leistungsfähiger sind?
  • Ist das lokale Netzwerk so schlecht ausgestattet, dass es mit solchen Dateien nicht zurecht kommt?
  • Warum gibt es keine Kopie, keine Sicherheitskopie? Bei einem Festplattendefekt wäre wochenlange Arbeit verschwunden.
  • Warum existiert nur ein Ausdruck vom Arbeitsergebnis, keine digitale Kopie?
  • Warum wurde alles vernichtet?
  • Oder ist das alles nur eine Ausrede, weil man explizit einen Rechner nehmen wollte, der keinen Netzzugang hat? Wollte man in der Zeit nach Snowden verhindern, dass irgendwer die Daten oder das Egebnis leakt? Also, war es vielleicht eine bewusste Entscheidung, einen Rechner ohne Netzzugang zu nehmen, keine Kopien anzulegen und nur einen Ausdruck weiterzugeben?
  • Update: Oder hatte der Rechner zwar einen Internetzugang für die Analyse, aber keinen internen Intranetzugang? Allerdings: Nach BSI-Grundschutzkatalog dürfen Rechner mit sehr hohem Schutzbedarf gar nicht direkt mit dem Internet kommunizieren, ohne besonderen Schutz (u.a. externe Hardware-Firewall) wäre das wohl ein Verstoß gegen die Richtlinien. Und der Dr. T. hätte nicht die Wahrheit gesagt.
  • Update: War also wirklich die „Dateigröße“ der Grund für einen Rechner, der „außerhalb des Netzes“ betrieben wurde?
  • Warum werden die im Erfassungssystem zu blockierenden Selektoren auf Papier geliefert und nicht digital? Tippt die jemand manuell ab?
  • Und warum werden verdammt noch mal bei solch sensiblen Vorgängen keine Vorgesetzten informiert? Wollten die vielleicht gar nicht informiert werden?
  • Update: Interessant wäre auch die Antwort auf die Frage, mit welchem Betriebssystem und welcher den der Analyse-Rechner arbeitete, in welchem Fachgebiet der Dr. T. promoviert hat (laut Spiegel Online ist er Mathematiker) und ob und wenn ja welche Programmiersprachen er beherrscht.

Insbesondere frage ich mich, warum die Sachen offensichtlich manuell ausgewertet wurden. E-Mail-Adressen manuell nach Endungen zu sortieren ist Deppen-Arbeit der untersten Stufe – nimmt man dafür einen promovierten Mitarbeiter? Ernsthaft?

Oder wurden die Daten doch automatisiert ausgewertet und alles professionell aufbereitet?

Denn ein kleines (oder größeres) Skript zur Auswertung der Daten erledigt das ganz automatisch: Kategorisierung nach „ist Telefonnummer“, „ist E-Mail-Adresse“, „ist IP-Adresse“, was auch immer. Kategorisierung nach Länderkennung in der E-Mail-Adresse, Telefonnummern und so weiter. Und manches kann man dann noch manuell durchgehen, die Kategorisierung verbessern und spezielles notieren.

Aber nehmen wir mal beispielsweise die E-Mail-Adresse alvar@a-blast.org: welchem Land ist die zuzuordnen? Gehört die einem Deutschen Grundrechtsträger? Ja, gehört sie, es ist meine. Aber kann man das beim manuellen draufschauen erkennen? Nein. Würde ziemlich sicher kein BND-Mitarbeiter erkennen, und dann noch so was mit „blast“, ist bestimmt gefährlich … Und beispielsweise die IP-Adresse 178.254.19.76? Tja, die gehört diesem Server hier. Aber woran will der BND bei manueller Untersuchung ohne Netzzugang erkennen, ob ein Grundrechtsträger betroffen ist? Eine lokale Whois-Datenbank haben sie wohl eher nicht.

Um Grundrechtsträger einigermaßen brauchbar auszufiltern müsste für jede E-Mail-Adresse zumindest erst einmal geprüft werden, ob a) der Domaininhaber deutscher Staatsbürger ist und b) die Mailserver in Deutschland stehen. Hilft bei E-Mail-Adressen wie superbunny5001@hotmail.com zwar nichts, aber kann ansonsten mindestens einen Anhaltspunkt geben. Wie will der Dr. T. das mit einem Rechner ohne Netzzugang getestet haben? Oder waren es nur relativ wenige E-Mail-Adressen und die Mehrheit Telefonnummern? 

Und eigentlich müsste es zu jedem einzelnen Selektor auch die Angaben geben: Wen soll der selektieren? Wer ist diese Person? Warum wird sie ausgewählt? Aber nach allem was man so hört, gab es ja wirklich nur die reinen Suchbegriffe, keine zusätzlichen Infos.

Insgesamt bleiben aber sehr viele Sachen des Vorgehens des BND im Dunkeln. Die Mitglieder des Untersuchungsausschusses leisten gute Arbeit, aber man merkt: an den Stellen, an denen tieferes technisches Verständnis und Wissen nötig wäre, stoßen sie an ihre Grenzen. Ebenso dort, wo Zeugen sich nicht erinnern oder nichts sagen wollen. Andererseits werden die Details ja auch immer erst in den nicht-öffentlichen Sitzungen besprochen. Ich hoffe, das da relevant mehr ans Licht kommt, glaube aber nicht so recht daran.

Update: Und abgesehen wäre auch interessant, ob der BND die Selektoren bzw. die Ergebnisse auch selbst genutzt hat. Oder wurden die Ergebnisse ungesehen weitergegeben? Oder gesichtet und weitergegeben? Wie viel Treffer gab es überhaupt?