• Onlineshop
    Onlineshop
    • Shop
    • Thomas-Krenn-Wiki
    • Über Thomas-Krenn
    • Kontakt
    Thomas-Krenn-Magazin durchsuchen
    mag - Home mag
    • Shop
    • Thomas-Krenn-Wiki
    • Über Thomas-Krenn
    • Kontakt

      Warum Deduplizierung keinen Sinn macht

      3
      • von Florian Hettenbach
      • in Backup & Storage · Expertentipps
      • — 18.06.2013 um 09:09

      Bei der Speicherung von Daten kommt es allzu häufig vor, dass gleiche Blöcke mehrfach abgespeichert werden. Ein gängiges Beispiel ist hierfür eine Powerpoint Präsentation, die an einen Kollegen weitergegeben wird. Dieser ändert lediglich den Namen auf der Titel-Folie, ansonsten bleibt der Inhalt gleich. Der Kollege speichert die Datei in seinem eigenen Benutzerverzeichnis ab. Somit liegen auf dem Speicher-System zwei Dateien, die aus Inhalts-Sicht zu 99% gleich sind. Auf Blöcke bezogen sind also alle Blöcke, bis auf den „Titel-Block“ 99% doppelt abgelegt. Je größer eine Firma ist, desto höher ist die Wahrscheinlichkeit von Dateien und Blöcken, die doppelt vorhanden sind. Auch bei jeder weiteren Vollsicherung im Backup-Bereich ergeben sich sehr viele Duplikate.

      E

      in System, das Deduplizierung beherrscht, untersucht nun die Daten auf Duplikate und speichert diese nur einmal ab. Das Duplikat wird nicht gelöscht, sondern beinhaltet einen Zeiger auf das Unikat. Somit ist gewährleistet, dass es aus Anwender- bzw. Applikationssicht zu keiner Veränderung gekommen ist. Das Verfahren kann entweder auf Datei- oder Blockebene angewendet werden und im laufenden Betrieb (Inline) oder im Nachgang (Post-Processing) durchgeführt werden.

      Warum Deduplizierung keinen Sinn macht



      Deduplizierung wurde zuerst im Backup populärDeduplizierung wurde zuerst im Backup populär, da die Infrastruktur oft nicht mehr mit der explodierenden Datenmenge zurechtkam, die es zu sichern galt. Durch Deduplizierung können die Vollsicherungen „eingedampft“ werden, ohne dass man auf inkrementelle Sicherung bei der Wiederherstellung angewiesen ist. Viele Storage-Hersteller haben sich Deduplizierung auf die Fahne geschrieben und argumentieren damit, dass sich damit sehr viel Speicherplatz einsparen lässt. Ich würde es lieber so formulieren: … sich sehr viel Platz einsparen lassen könnte. Nur weil man viele Office-User oder virtuelle Maschinen (mit dem gleichen Betriebssystem) hat, heißt dies noch lange nicht, dass man große Dedup-Einsparungen erzielt. Die namhaften Hersteller bieten zur Analyse der Daten Tools bzw. Beratungsleistungen an.

      Was jedoch oft nicht beachtet wird:

      • Deduplizierung ist NIE kostenlos (Performance-technisch): Entweder beim Speichern oder im Nachgang muss eine Tabelle gepflegt werden, die die Prüfsumme der einzigartigen Blöcke enthält
      • Deduplizierung resultiert in einer extrem starken Bindung an einen Hersteller – Wie will man von Hersteller A zu B wechseln, wenn das logische Speichervolumen dreimal höher ist als das physikalische?
      • Wenn Speicherplatz (€/GB) günstig ist dann kann man getrost auf Deduplizierung verzichten

      Daneben löst Deduplizierung nur ein hausgemachtes Problem. Konzipiert man eine Speicher-Strategie, die versucht möglichst Duplikate zu vermeiden, dann kann man mit den heutigen Speichermedien (4TB HDDs) die meisten Anforderungen abdecken. Setzt man bspw. bei den Dokumenten ein entsprechendes Content Management System mit Versionierung ein, so lässt sich allein dadurch eine Vielzahl von doppelten Dokumenten vermeiden.

      Deduplizierung ist nur in Ausnahmefällen sinnvoll

      Deduplizierung kann in Ausnahmefällen bei bestimmten Szenarien sinnvoll sein, man sollte sich jedoch sehr genau mit der Analyse vorhandener Daten als auch der Methode des jeweiligen Anbieters auseinander setzen. Ergeben sich daraus signifikante Einsparungsmöglichkeiten (1 zu 10: Eine physikalisch gespeicherte Datei steht für 10 Referenzen) ist die Technologie in Erwägung zu ziehen. Trotzdem gilt es abzuwägen, ob die Vorteile der Einsparung des Speicherplatzes die Nachteile des stärkeren Lock-In als auch der höheren Performance-Kosten aufwiegen.

      Logo_Shop_TKmag_klein
       
      Im kostenlosen E-Book “Der Weg zum schnellen Server“ zeigen wir Ihnen, worauf man bei der Zusammenstellung eines möglichst performanten Server-Systems besonders achten sollte. Gleich downloaden!

       

      Tags: BackupContent: Know-how

      Florian Hettenbach

      — Florian Hettenbach

      Florian Hettenbach (B.Sc. Wirtschaftsinformatik) war bis Januar 2016 Experte der Thomas-Krenn.AG für Virtualisierung, Cloud Computing und Storage.

       Autor auf LinkedIn   Autor auf Facebook   Autor auf Google Plus   Autor auf Xing

      Das könnte Sie auch interessieren

      • VMware Virtual SAN (vSAN) VMware Virtual SAN (vSAN) Appliance von Thomas-Krenn
      • Arbeitsspeicher erweitern – 5 wichtige Tipps beachten
      • Case Study: IMP Bautest AG
      • Webinar_AzureStackHCI23H2_VM-Workloads_Aufzeichnung Webinarreihe Azure Stack HCI 23H2: #3 VM-Workloads verwalten

      Schreibe einen Kommentar Antwort abbrechen

      Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

      3 Comments

      1. Was ist Datendeduplizierung / Data #Deduplication | Tellem.org sagt:
        2. Februar 2016 um 17:13 Uhr

        […] Und genau darin liegt auch die Schwachstelle dieser Technik. Solche Szenarien sind tatsächlich denkbar und sehen in der Theorie gut aus. Dennoch sollte man diese Funktion in der Praxis mit Vorsicht betrachten und in Zeiten des günstigen Festplattenspeichers auch an bewährte – wenn auch altmodische – alternativen Denken. Das meint auch Florian Kettenbach in seinem Beitrag. […]

        Antworten
      2. Huhu sagt:
        30. November 2018 um 08:37 Uhr

        Ich verstehe den Sinn des Artikels nicht.
        Die Deduplizierung wird im Windows 2016 doch schon „kostenlos“ mitgeliefert und funktioniert einwandfrei.

        Sie reduzierte in unserem System den sinnfrei belegten Speicherplatz um mehrere hundert Gigabyte.
        Wer das Prinzip der Deduplizierung verstanden hat, weiß das es geht.

        Antworten
        • Avatar-Foto Quirin Anetseder sagt:
          7. Dezember 2018 um 12:48 Uhr

          Hallo,

          wie Sie am Datum des Artikels erkennen können wurde dieser bereits 2013 verfasst und Windows Server 2016 wurde erst wesentlich später veröffentlicht. Gerade im IT-Bereich verläuft der technische Fortschritt rasant und Technologien werden stetig weiter verbessert und immer effizienter. Wir freuen uns, dass Sie mit der Deduplizierung in Windows 2016 zufrieden sind. Übrigens gibt es mit Windows Server 2019 bereits eine neue Version des Server-Betriebssystems.

          Wir sehen es aber nicht als sinnvoll an, alte Artikel aus unserem Unternehmensblog zu löschen oder umfassend zu überarbeiten, zumal der Autor des Artikels mittlerweile nicht mehr bei Thomas-Krenn arbeitet.

          Viele Grüße
          Ihr Team der Thomas-Krenn.AG

          Antworten
        • Home
        • Expertentipps
        • Backup & Storage
        • Warum Deduplizierung keinen Sinn macht
        • Thomas-Krenn-Produkte

          • » Rack-Server
          • » Tower-Systeme
          • » Workstations
          • » Industrie-PCs
          • » Storage-Systeme
          • » Low Energy Systeme
          • » PCs & Thin Clients
          • » Einsatzzweck
          • » Software
          • » Infrastruktur
        • Über die Thomas-Krenn.AG

          Die Thomas-Krenn.AG ist einer der größten Hersteller individueller Server- und Storage-Systeme in Deutschland. Seit 2002 beliefert das Unternehmen Endanwender, Wiederverkäufer und Betreiber von Rechenzentren mit hochwertiger Hardware nach dem Build-to-Order-Prinzip. Auch als Lösungsanbieter für individuelle Kundenprojekte steht die Thomas-Krenn.AG für höchste Servicequalität bei hardwarenaher Entwicklung, Auftragsfertigung, Produktveredlung und Logistik.

          Sie ist damit ein anerkannt zuverlässiger Partner für Industrie, Systemhäuser, Dienstleister sowie mittelständische Endkunden aus jeder Branche. Die Thomas-Krenn.AG produziert mit derzeit rund 200 Mitarbeitern alle Server in Deutschland am Standort Freyung.

        • Unsere Autoren

          Redaktion
          Redaktion
          Thomas Niedermeier
          Thomas
          Niedermeier
          Florian Fritsch
          Florian
          Fritsch
          Werner Fischer
          Werner
          Fischer
          Ulrich Wolf
          Ulrich
          Wolf
          Andreas Ljubisic
          Andreas
          Ljubisic
          Christoph Mitasch
          Christoph
          Mitasch
          Bernhard Seibold
          Bernhard
          Seibold
          Benjamin Bayer
          Benjamin
          Bayer
          Stefan Bohn
          Stefan
          Bohn
          Armin Oberneder
          Armin
          Oberneder

        alle Rechte vorbehalten c/o Thomas-Krenn.AG