Neues Dateisystem von Microsoft ReFS

Ein neues Dateisystem? Nicht wirklich. ReFS, das Resilient File System, ist ein von Microsoft entwickeltes Dateisystem, das speziell für Umgebungen mit hoher Verfügbarkeit und Leistung konzipiert wurde. Es wurde erstmals mit Windows Server 2012 eingeführt und wird seitdem kontinuierlich weiterentwickelt und in nachfolgenden Windows Server-Versionen implementiert.

Das ReFS-Dateisystem ist seit der Windows 11 Insider Preview Build 25281 verfügbar, die im Januar 2023 veröffentlicht wurde. Derzeit ist ReFS nicht in den stabilen Builds von Windows 11 enthalten, sondern nur in den Insider Previews.

Seit dem 1.10.2024 ist das Windows 11 24H2 Update verfügbar. Dieses Update ist sehr umfangreich und verändert das System tiefgreifend (also das Fundament der Software). Seitens Microsoft sind einige Inkompatibilitäten bekannt, sodass das Update auf bestimmten Computern verweigert wird. Windows 11 richtet eine Schutzsperre (externer Link)ein, bis die Hersteller von inkompatibler Software Updates bereitstellen, um diese Probleme zu lösen. Eine Liste der bekannten Probleme ist hier (externer Link) zu finden.

Das Dateisystem ReFS

  • Integrity Streams: ReFS nutzt Prüfsummen für Metadaten und optional auch für Dateidaten, um Schäden zuverlässig zu identifizieren.
  • Integration in Speicherplätze: Das ReFS (Resilient File System) gewährleistet die Datenintegrität, indem es automatisch erkannte Beschädigungen repariert. Wird ReFS innerhalb eines Spiegelungs- oder Paritätsbereichs eingesetzt, greift es auf alternative Datenkopien zu, die in den Speicherplätzen vorhanden sind. So können beschädigte Daten identifiziert und repariert werden, ohne dass das Volume offline geschaltet werden muss, was eine durchgehende Verfügbarkeit sicherstellt und Ausfallzeiten minimiert.
  • Rettung von Daten: Ein Volume kann online bleiben und wird nur in seltenen Fällen offline genommen, um Reparaturen durchzuführen. Dabei entfernt ReFS beschädigte Daten aus dem Namespace, um das Volume online zu halten. Es erkennt somit beschädigte Daten, auch ohne eine Kopie der Daten zu haben.
  • Proaktive Fehlerkorrektur: Es identifiziert automatisch potenzielle Schäden und initiiert daraufhin eine Datenreparatur.

ReFS unterstützt Volumes bis zu 35 Petabyte (im Vergleich zu 256 Terabyte bei NTFS).
Durch die proaktive Fehlerkorrektur ist das Dateisystem widerstandsfähiger als NTFS.
ReFS implementiert die beschleunigte Parität durch Spiegelung und ermöglicht das Erstellen von Volumes, die sowohl Spiegelungs- als auch Paritätsresilienz nutzen.

Unterschied Spiegelung und Paritätsresilienzschemata

Durch Spiegelungsresilienz lassen sich schnelle Schreibvorgänge realisieren, allerdings ist die Datenreplikation für jede Kopie nicht speichereffizient.

Bei Paritätssystemen wird die Parität für jeden Schreibvorgang neu berechnet, was die Leistung bei wahlfreien Schreibvorgängen beeinträchtigen kann. Jedoch ermöglicht die Parität eine Speicherung der Daten mit höherer Speicherplatzeffizienz.

Namespace

Der Begriff Namespace bezeichnet bei ReFS die Art und Weise, wie Dateien und Verzeichnisse im Dateisystem strukturiert und organisiert sind.

  1. Datei- und Verzeichnisstruktur: Es bestimmt die hierarchische Organisation der Dateien und Verzeichnisse.
  2. Zugriff und Verwaltung: Der Namespace erlaubt es Anwendern und Programmen, auf Dateien zuzugreifen und diese zu verwalten.
  3. Integrität und Konsistenz: Um die Integrität des Dateisystems zu sichern, werden defekte oder beschädigte Dateien aus dem Namespace entfernt.
  4. Metadaten: Ein Namespace beinhaltet Metadaten, also Informationen über Dateien und Verzeichnisse, wie zum Beispiel Dateigröße, Erstellungsdatum und Berechtigungen.

Block-Clone Vorgänge

Block-Clone-Vorgänge stellen vermutlich die bedeutendste Innovation des Dateisystems dar. ReFS erlaubt es mehreren Dateien, denselben logischen Cluster zu nutzen. Zum Beispiel: Wenn drei Dateien bis auf jeweils vier gleiche und einen unterschiedlichen Cluster identisch sind, benötigt ReFS nur sieben Cluster statt der 15 Cluster, die bei NTFS nötig wären. Dies führt zu einer erheblichen Geschwindigkeitssteigerung für den Benutzer, insbesondere beim Kopieren von Dateien.

  • Gemeinsame Nutzung logischer Cluster:
    • Es erlaubt, dass mehrere Dateien dieselben logischen Cluster gemeinsam nutzen.
    • Dadurch werden bei Kopiervorgängen nur eine Region der Datei auf einen physischen Speicherort umgeleitet, was den Prozess beschleunigt und die E/A-Belastung verringert.
  • Referenzzähler:
    • In den Metadaten für kopierte Regionen werden Referenzzähler geführt. Diese zählen die Anzahl der einzigartigen Dateiregionen, die dieselben physischen Regionen verwenden.
    • Dies ermöglicht es, dass mehrere Dateien dieselben physischen Daten teilen können, ohne die Isolation zwischen den Dateien zu beeinträchtigen.
  • Effizienz und Speicherplatz:
    • Da logische Cluster gemeinsam genutzt werden und somit identische Daten nicht mehrfach gespeichert werden müssen, verbessert sich die Speicherkapazität.
    • Schreiboperationen auf freigegebene Bereiche aktivieren einen Mechanismus, bei dem ReFS eine neue Region für den anstehenden Schreibvorgang zuweist, um die Integrität der gemeinsam genutzten logischen Cluster sicherzustellen.

Ich habe die wichtigsten Aspekte von ReFS hervorgehoben. Solange im privaten Sektor keine SSDs oder HDDs eingesetzt werden, die 256GiB überschreiten, wird Microsoft Windows vermutlich weiterhin standardmäßig NTFS nutzen. Allerdings könnten die Effizienz, Speicherplatzoptimierung und proaktive Fehlerbehebung auch für Privatanwender attraktiv sein.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen