Alle thermodynamischen Daten sind mit einer Ungewissheit verbunden. Die Angabe dieser Ungewissheitswerte ist relevant für Fehlerfortpflanzungsrechnungen bei den angewandten Modellierungen selbst, für Sensitivitätsanalysen zur Bestimmung des Einflusses einzelner Spezies oder Parameter sowie für die Transparenz des gesamten Prozesses (für weiterführende Überlegungen zum Thema Ungewissheiten inklusive deren Ermittlung, siehe dazu das Dokument „Aspekte der Modellqualifizierung und des Umgangs mit Ungewissheiten“). Thermodynamische Datenbasen, die regelmäßig im Kontext der nuklearen Entsorgung verwendet werden, wie THEREDA, ThermoChimie, oder die PSI TDB folgen grundsätzlich den allgemeinen Leitlinien der NEA TDB. Im Falle von Pitzer-Koeffizienten werden für gewöhnlich keine Ungewissheiten ermittelt.
Aktuell ist den Autoren kein Code aus den Bereichen geochemische Speziation oder reaktiver Transport (Referenzen siehe oben im Abschnitt „Modelle für thermodynamische Gleichgewichte“) bekannt, welcher in der Lage ist, die Ungewissheiten der thermodynamischen Daten in die Berechnungen direkt einzubeziehen. Typische Ungewissheiten resultieren z.B. aus der Reproduzierbarkeit von Messergebnissen, Probenahme- und Messfehlern, Näherungsverfahren, alternativen Auswerteverfahren, numerischen Artefakten. Lediglich MCPhreeqc (De Vries et al., 2012) stellte zu diesem Zweck die Kopplung von PhreeqC mit einem Monte-Carlo-Ansatz bereit, dieser Code ist jedoch veraltet und wird nicht mehr weiterentwickelt. In jeden Fall sollten die Ungewissheiten vollständig vorgehalten werden, um die zukünftige Entwicklung der Programme oder anderweitige Nutzung der Ungewissheiten in gesonderten Rechnungen zu ermöglichen. Eine interessante aktuelle Entwicklung in diese Richtung stellt das RedModRphree Paket für R von (De Lucia & Kühn, 2021), dar. Ein alternativer und zunehmend verbreiteter Ansatz ist die Einbettung von Codes zur Speziation oder für den reaktiven Transport in Software, welche speziell für Batch-Abarbeitung großer Parametermatrizen und im Idealfall deren statistische Auswertung und Aufbereitung entwickelt wurden. In jedem Fall ist es notwendig, dass bei quantitativen Bezügen auf Parameterungewissheiten klar angegeben ist, auf welches Vertrauensintervall sich bezogen wurde, und ob zusätzlich zur reinen Reproduzierbarkeit von Messungen auch andere, systematische Fehler ebenfalls berücksichtigt wurden.
Quelle von Ungewissheiten ist auch die reine Postulierung von Spezies und Reaktionen ohne unabhängigen Nachweis. Dann sind zwar die experimentellen Befunde formal gut wiedergegeben, aber eine Extrapolation jenseits der Randbedingungen dieser Experimente ist nicht vertretbar. Solche Ungewissheiten manifestieren sich natürlich direkt in den entsprechenden Formulierungen für Reaktionen oder Spezies innerhalb einer TDB.
Planung, Bau und Betrieb eines Endlagers für hochradioaktive Abfälle sind langandauernde Prozesse, die sich über Zeitspannen von Jahrzehnten erstrecken werden. Die Verfügbarkeit der Datenbank muss über einen solchen Zeitraum gewährleistet werden. Dem steht die ständige Weiterentwicklung sowohl der thermodynamischen Daten selbst als auch entsprechender Datenbank-Software entgegen. Es müssen also Maßnahmen ergriffen werden, um die Langzeitverfügbarkeit sicherzustellen. Die Verwendung quelloffener, freier Software ist dabei proprietärer, unfreier Software vorzuziehen. Dies verhindert die Anhängigkeit von einem Hersteller und ermöglicht die Anpassung aller Software-Komponenten an die Bedürfnisse der Daten, der Editoren und der Nutzer (Moog et al., 2015).
Neben dem langzeitgesicherten Betrieb der Datenbank selbst ist auch die Zugänglichkeit der Daten in einer Weise zu gestalten, die den Nutzern transparent auf die verfügbaren Primärdaten zugreifen lässt und ggf. notwendige, interne Umrechnungen deutlich darstellt. Hierzu sollten die im wissenschaftlichen Forschungsdatenmanagement als „best practice“ etablierten FAIR-Prinzipien (Wilkinson et al., 2016) bereits bei der Datenauswahl zur Anwendung kommen: Findable (Auffindbarkeit), Accessible (langfristige Zugänglichkeit), Interoperable (technische Nachnutzbarkeit) und Reusable (analytische und intellektuelle Wiederverwendbarkeit). Die Anwendung dieser Prinzipien bei der Datenauswahl sichert nicht nur die Langzeitverfügbarkeit, sondern trägt auch der Einbeziehung der Öffentlichkeit in den Prozess Rechnung. Gleiches gilt natürlich für die eigene Datenbereitstellung, welche ebenfalls die FAIR Prinzipien befolgen soll.
Zusätzlich zur Langzeitsicherheit ist die Qualität der Dateneingabe ein kritischer Aspekt jeder Datenbankarbeit. Eine qualitätssichernde Maßnahme ist ein technisch unterstütztes Vier-Augen-Prinzip z.B. in Form eines Daten-Audits, bei dem ein Auditor die Dateneingabe nachvollzieht und kritisch prüft. Ebenso zählen hierunter eine stringente Rechtevergabe zu späteren klaren Übertragungen von Daten-Zuständigkeiten, interne Datenumrechnungs- und Prüfungsroutinen (jeweils bereits weiter oben erläutert) oder auch umfassende Dokumentationen.
Eine Datenbasis wird in den seltensten Fällen von einer einzigen Person betreut, oftmals werden Untermengen der Daten je nach chemischen Systemen (z.B. Radionuklide, Zementphasen, Salzsysteme, etc.) von den jeweiligen Experten zusammengestellt bzw. aktualisiert. Um Fehleingaben oder Änderungen an Datensätzen außerhalb des Zuständigkeitsbereiches eines Editors zu verhindern, sollten abgestufte Rechtesysteme etabliert werden, was mit den Grundfunktionalitäten einer modernen relationalen Datenbank leicht zu gewährleisten ist. So kann sichergestellt werden, dass ein Editor nur die Datensätze der chemischen Spezies ändern kann, für die er auch – ausgehend vom chemischen System – die Verantwortung trägt. Eine dergestalt mit Schreibrechtsfunktionalitäten ausgestattete Datenbasis unterstützt auch die Datenübergabe an neue Editoren und stellt eine wirksame Unterstützung bei der Langzeitbetreuung bzw. -verfügbarkeit von Daten dar.
Zurück zum vorherigen Thema Zurück zum Hauptthema