Science Bulletin, Volume 70, Issue 4, 26 February 2025, Pages 452-453, https://doi.org/10.1016/j.scib.2024.10.021
Mitwirkende Mitglieder von MultiTroph: Michael C. Orr, Georg Albert, Arong Luo, Huijie Qiao, Ming-Qiang Wang, Douglas Chesters, Chao-Dong Zhu
Zusammenfassung: Der Artikel behandelt die Herausforderung sogenannter „dunkler Daten“, also wissenschaftlicher Daten, die zwar technisch verfügbar, aber praktisch nicht zugänglich sind – etwa aufgrund fehlender Metadaten, mangelnder Standardisierung oder verschwindender Datenbanken. Die Autorinnen und Autoren argumentieren, dass trotz der zunehmenden Verbreitung von Open-Science-Richtlinien inkonsistente Praktiken beim Datenaustausch großräumige biologische Forschung und die langfristige Nutzbarkeit von Daten behindern. Sie schlagen vor, standardisierte, zukunftssichere Datenformate, verpflichtende Metadaten-Dokumentation, zentrale Indizierung sowie Verbesserungen der Repositorien – einschließlich DOI-Vergabe, dateiebene Zugangsmöglichkeiten und Verknüpfung von Skripten – einzuführen, um sicherzustellen, dass Datensätze vollständig, lesbar, fehlerfrei, zugänglich und nicht redundant (CLEAN) sind.
Schlussfolgerung: Um Datenverluste zu verhindern und die Reproduzierbarkeit zu verbessern, sind strukturelle Veränderungen in Repositorien sowie strengere Richtlinien von Fachzeitschriften dringend erforderlich, ergänzt durch rückwirkende Maßnahmen zur Wiederherstellung historischer „dunkler“ Datensätze. Unterbleiben sofortige Maßnahmen, wird die schnelle Generierung neuer biologischer Daten weiterhin durch ebenso schnelle Verluste ausgeglichen, wodurch bestehende Wissenslücken fortbestehen.