Hadoop
Aus Thomas Krenn Wiki
Hadoop ist ein Open Source Framework für zuverlässiges, skalierbares und verteiltes Rechnen (reliable, scalable, distributed computing). Die umfangreichste Hadoop Installation betreibt Facebook, mit insgesamt 2.000 Rechnern und 21 PB Daten (Stand Mai 2010).[1]
Inhaltsverzeichnis |
Projektinformationen
- Projektname: Hadoop
- URL: http://hadoop.apache.org/
Projektbeschreibung
Einer der Kernbereiche von Hadoop ist das Hadoop Distributed File System (HDFS). HDFS ist der primäre Datenspeicher für Hadoop Applikationen. Es erstellte mehrere Replikas von Datenblöcken und verteilt diese auf auf Compute Nodes im Cluster um zuverlässige und schnelle Berechnungen zu ermöglichen.[2]
Hadoop wird in Debian ab Debian 6 Squeeze direkt im Debian Repository enthalten sein.[3]
Einzelnachweise
- ↑ http://hadoopblog.blogspot.com/2010/05/facebook-has-worlds-largest-hadoop.html
- ↑ http://hadoop.apache.org/hdfs/
- ↑ http://packages.debian.org/search?keywords=hadoop&searchon=names&suite=all§ion=all
Weitere Informationen
- http://de.wikipedia.org/wiki/Hadoop
- http://www.heise.de/newsticker/meldung/Verarbeiten-grosser-verteilter-Datenmengen-mit-Hadoop-968753.html
Autor: Werner Fischer
