Big-Data-Workloads in der Cloud
Lassen Sie Ihre Big-Data-Workloads sprichwörtlich fliegen
Mehr als alle anderen Datenverarbeitungs-Workloads brauchen Big Data und dazugehörige Workloads die richtige Infrastruktur-Plattform. Engpässe können andernfalls gut durchdachte Systeme lahmlegen und in diesem Maßstab können bereitgestellte, gut konfigurierte Systeme immense Auswirkungen auf die Gesamtleistung des Systems haben. Aus diesem Grund wird CloudSigma von einer steigenden Anzahl an Kunden bevorzugt, die Workloads mit großen Datenmassen betreiben.
Hochleistungs-Infrastruktur
Große Datenmengen und ähnliche Hochleistungs-Datenverarbeitungs-Workloads sind nur so schnell wie ihr langsamster Bestandteil. Es sind diese Engpässe, die ein effizientes und gut funktionierendes Systems in etwas verwandeln, dass sich fernab von optimal bewegt. Eine Cloud-Plattform zu besitzen, die eine große Bandbreite an Leistungsanforderungen aufrechterhalten kann, einschließlich einer sehr hohen Leistung über viele Aspekte seiner Infrastruktur hinweg, ist daher sehr wichtig.
Fragen, die zu stellen sind
- Welche internen VM-zu-VM-Netzwerkgeschwindigkeiten unterstützt Ihr System?
Dinge, auf die man achten sollte
- Netzwerkgeschwindigkeiten, besonders um Kopfknoten herum, können riesige Engpässe erzeugen. Ein internes Netzwerk, das mehrere Gigabit-Geschwindigkeitsbereiche unterstützt, steigert die erreichbaren Skalierbarkeits- und Gesamtleistungsgrade.
Unsere Cloud-Lösung
- Unsere Cloud ist zu jedem Rechnerknoten mit einem dualen 10 GigE-Netzwerk ausgestattet. Sie können von einem einzelnen Standard-Cloud-Server von CloudSigma ganz einfach mit 4-5 Gbps oder mehr streamen. Wir haben keine HPC-Instanzen, weil alle unsere Server in allen Größen HPC-Leistungsfähigkeit erreichen können.
- Welche Speicherleistungs-Profile sind verfügbar?
- Big-Data-Workloads, wie der Name schon sagt, kombinieren große Datenmengen mit einer intensiven Rechenleistung. Demzufolge benötigen Big Data Anwendungen neben einem sehr schnellen, aktiven Workload-Speicher auch kosteneffiziente Speichermöglichkeiten im Petabyte-Maßstab. Suchen Sie nach einer Cloud Lösung, in der Sie diese abweichende Speicherbedürfnisse einfach und flüssig miteinander kombinieren können.
- Wir bieten sowohl SSD als auch vergrößerbare Magnetspeicheroptionen. Kunden können sich ihre Laufwerke erstellen und deren Größe bestimmen und diese dann nach Bedarf in ihre Cloud-Server integrieren und miteinander kombinieren. Unsere komplette SSD-Option liefert bis zu 1000 IOPS pro Schreibvorgang für nur 0,13 USD pro GB für 30 Tage, mit einer maximalen Laufwerksgröße von 5 TB. Unsere vergrößerbare magnetische Option kostet nur 0,08 USD pro GB für 30 Tage, mit einer maximalen Laufwerksgröße von bis zu 100 TB. Es ist absolut einfach, in unserer Cloud Hochleistungs-Anforderungen neben großen Datenspeichern zu verwalten.
- Geben Sie bei Ihren Cloud-Servern CPU-Befehlssätze aus?
- Moderne CPU-Leistung ist sehr auf die Befehlssätze der CPU angewiesen, um die Verarbeitung vieler Operationen zu optimieren. Die Ausgabe dieser Befehlssätze durch die Cloud-Server ist nicht immer verfügbar. Sie suchen nach einer Cloud Lösung, die in der Lage ist, Befehlssätze auszugeben, sodass Sie von 2015er CPUs statt von 1985ern profitieren können!
- Bei CloudSigma können unsere Kunden zwischen der gewöhnlich emulierten CPU (zugunsten der Kompatibilität) oder dem nativen CPU-Modell wählen. Das Letztere erlaubt vollständige CPU-Befehlssatzausgabe an die Cloud-Server für eine optimale Leistung.
„Durch unsere Wahl einer guten Leistung, kosteneffizientem Speicher sowie einem Hochleistungs-SSD-Speicher – alles flexibel und bei Bedarf verfügbar – sind wir in der Lage, schnell und kosteneffizient unsere Plattform aufzuziehen, deren Ziel es ist, Erdbeobachtungsdaten zu verwenden, um sowohl Menschenleben als auch Eigentum vor Erdbeben und vulkanischen Gefahren zu schützen.“Julio Carreira, Capacity Manager, European Space Agency
Skalierung & Automatisierung
Wenn Sie vermutlich auch Batch-Datenverarbeitung betreiben werden, werden Ihre Ressourcenanforderungen mit der Zeit ziemlich stark variieren. Zudem ist der Betrieb in diesem Umfang gleichbedeutend mit einem automatisierten System für einfache Verwaltung. Eine Cloud zu wählen, die schnell auf Infrastruktur-Bedürfnisse reagiert, vollständige Automatisierung erlaubt und all dies gleichzeitig durch ein sensibles Berechnungssystem unterstützt, das Ihre Nutzung über die Zeit hinweg aufzeichnet, ist sehr wichtig.
Fragen, die zu stellen sind
- Wie lange dauert es, um Hauptressourcen, wie Server, Laufwerke und Netzwerkressourcen bereitzustellen?
Dinge, auf die man achten sollte
- Eine große Infrastruktur bei Bedarf bereitzustellen ist nur in einer Umgebung machbar, die schnelle Bereitstellung unterstützen kann. Sie suchen nach kurzen Ressourcen-Lieferzeiten?
Unsere Cloud-Lösung
- Alle Ressourcen werden unmittelbar nach der Bestellung bereitgestellt. Für die Netzwerk- und Laufwerkserstellung bedeutet dies 2-5 Sekunden, für neue Server braucht es weniger als 30 Sekunden, um unmittelbar einen nutzbaren Zugang zu erhalten.
- Unterstützt Ihre API Bulk-Vorgänge & volle Funktionsabdeckung?
- Es ist wichtig, was Sie bei Ihrer Cloud-Plattform automatisieren können und was nicht, es ist daher wichtig, die API-Abdeckung zu verstehen. Beim Skalieren von hunderten oder tausenden Servern ist die Möglichkeit der Unterstützung von Bulk-Vorgängen ein großer Vorteil.
- Wir sind stolz auf unsere kampferprobte Cloud-API. Sie bietet nicht nur 100-prozentige Funktionsabdeckung, um Ihnen vollständige Automatisierung zu gewährleisten, sondern auch eine Vielzahl an Bulk-Vorgängen für schnelles Scale-Up. Sie brauchen 200 neue Arbeitsknoten? Geben Sie uns einfach nur das goldene Server-Image und wir klonieren und starten alle 200 mit einem einzigen API-Call. Wir halten Sie sogar auf dem Laufenden, solange Ihr Auftrag in Arbeit ist. Schauen Sie sich unsere Treiber- und API-Bibliothek-Implementierungen an.
- Wie geht Ihr Berechnungssystem mit variierenden Infrastrukturbedürfnissen durch Batch-Verarbeitung im Laufe der Zeit um?
- Kunden mit Big Data und HPC neigen dazu, ihren Ressourcenverbrauch stark variieren zu lassen, als Ergebnis der verschiedenen Batch-Verarbeitungsaktivitäten. Es ist somit am besten, nach einer Cloud zu suchen, die es Ihnen erlaubt – sofern möglich – zu erwerben, was Sie benötigen.
- Wir haben unsere Cloud mit einem Utility-Ansatz hinsichtlich der Berechnung aufgebaut. Das bedeutet, dass wir pro Ressource nur Ihren Gesamt-Ressourcenverbrauch zu einem Zeitpunkt betrachten. Das Beste daran ist, dass Sie Ressourcen als Abonnement oder „Burst“ erwerben können. Sie können sich somit für eine Kernressourcen-Nutzung anmelden, aber bei Bedarf vergrößern, wann immer Sie mögen. Nie wieder reservierte Instanzen versus on-demand. Es ist viel einfacher.
„Der Flexibilitätsgrad von CloudSigma geht über die Effizienz der Möglichkeit, Ressourcen zu erwerben, hinaus. Als wir uns entschieden haben, von Rackspace zu CloudSigma umzuziehen, nahmen wir an, dass es eine Lernkurve geben würde, davon ausgehend, dass die Herangehensweise von CloudSigma sich von anderen Anbietern unterscheidet. CloudSigma hat es für uns jedoch einfach gemacht. Dazu gab es die Möglichkeit, das von uns bevorzugte Betriebssystem und die von uns bevorzugte Software-Anwendung in der Cloud einzusetzen, was ebenfalls von großer Hilfe war.“Amit Chaudhary, Mitbegründer, Gresp
Plattform-Flexibilität
Unsere Big Data- und HPC-Nutzer besitzen ein deutliches Verständnis für ihre EDV-Anforderungen. Eine Plattform zu haben, die es den Kunden erlaubt, ihre Bedürfnisse genau mitteilen zu können, ist wichtig für eine optimierte und erfolgreiche Bereitstellung, besonders, wenn man an Maßstäben arbeitet.
Fragen, die zu stellen sind
- Welche Auswahl an Betriebssystemen und Anwendungen habe ich, wenn ich Ihre Cloud nutze?
Dinge, auf die man achten sollte
- Einige Clouds erheben Einschränkungen bei der Wahl der Software. Dies überlässt dem Cloud-Vendor die strategische Kontrolle über technologische Entscheidungen und kann zu Problemen führen – wenn nicht heute, dann in der Zukunft.
Unsere Cloud-Lösung
- Wir bieten eine offene Plattform. Während wir zugunsten des Komforts eine Anzahl an vorinstallierten Systemen anbieten, können die Kunden jedes x86/x64-basierte Betriebssystem ohne die Notwendigkeit von Modifizierungen installieren oder hochladen. Dies schließt BSD, Linux und Windowsbasierte Systeme mit ein. Was auch immer auf Ihren Wunsch hin laufen soll, unsere Cloud kann es unterstützen.
- Kann ich CPU und Hypervisor-Einstellungen tweaken, um Sie für meinen Workload zu optimieren?
- Es ist möglich, sehr viele Einstellungen in einer virtuellen Umgebung anzupassen, um einem spezifischen Workload besser zu entsprechen. Dies kann, verglichen mit Standardeinstellungen, zu bis zu 50-prozentigen Leistungsgewinnen führen. Je mehr Individualisierung, desto besser.
- Wir bieten alles: Von NUMA-Topologie (großartig für VM) über virtuelle Kerngrößen (erstellen Sie viele Threads für Parallelverarbeitung) bis hin zu Hypervisor-Zeiteinstellungen (dies kann in Windows-Umgebungen einen großen Unterschied machen). Mit CloudSigma sitzen Sie am längeren Hebel und können bei einer Vergrößerung das beste Preis-/Leistungsverhältnis auf dem Markt erreichen.
- Wie viel Flexibilität bei der Größenauswahl der Server ist möglich?
- Big Data- und HPC-Workloads erfordern oftmals Cloud-Server-Größen, die außerhalb des Normalbereichs liegen. Es könnte ein Server mit viel RAM sein, einer mit einer Menge Speicherplatz oder nur mit einem sehr großen Knoten.
- Wir bieten vollständig entbündelte Ressourcen ohne feste Servergrößen. Sie können die Server mit genau der CPU und RAM bestücken, die Sie benötigen und diesen je nach Bedarf mit verschiedenen Speichern kombinieren. Wir nennen das „perfekte Bereitstellung“. Wir bieten ebenfalls eine große Auswahl an Größen für jede Ressource an, sodass Sie sich sicher sein können, über genügend Ressourcen zu verfügen.
„Wir sind zu CloudSigma gewechselt, da wir eine kosteneffiziente und flexible Hochleistungs-Cloud-Infrastruktur benötigten, um unsere anspruchsvollen Lösungen für semantische Suchen abzulegen. Die Möglichkeit, die Infrastruktur schnell auf die individuellen Bedürfnisse anzupassen, damit diese perfekt zu den unterschiedlichen Anforderungen passt, ist ideal für jedes Big-Data-Unternehmen.“
Mario Juric, CTO, Unsilo
Hohe Verfügbarkeit & Lastausgleich
Bei CloudSigma sind Sie in der Lage, Hauptkomponenten einer Infrastruktur angemessen voneinander abzutrennen, um einzelne Fehlerpunkte zu vermeiden. Das ist wichtig für die Dienstverfügbarkeit sowie für die Lastverteilung über die Infrastruktur hinweg. Somit vermeidet man Hotspots, die sich zu Engpässen entwickeln können. Eine Cloud, die Nutzern die Tools an die Hand geben kann, um hohe Verfügbarkeit ihrer eigenen Dienstleistungen sowie Lastausgleich zu gewährleisten, ist ein wichtiger Aspekt für jeden, der im Prozess der Wahl eines Cloud-Dienstleisters involviert ist.
Fragen, die zu stellen sind
- Welche Funktionen bieten Sie an, um die Trennung von Infrastruktur-Komponenten Ihrer Großkunden sicherzustellen?
Dinge, auf die man achten sollte
- Infrastruktur in die Cloud auszulagern hat viele Vorteile, aber es besteht die Gefahr, dass der Verlust der Sichtbarkeit zu einzelnen Fehlerpunkten führen kann. Funktionen, die die Trennung der Infrastruktur ermöglichen, können sehr hilfreich sein, um wirklich stabile Cloud-Infrastrukturen zu erstellen.
Unsere Cloud-Lösung
- Wir bieten die Möglichkeit, Infrastrukturen explizit auf separaten Systemen voneinander zu trennen. Wenn Sie ein Laufwerk oder einen Server erstellen oder klonieren, können Sie bestimmen, welche andere Infrastruktur vermieden werden soll. Wir zeigen außerdem deutlich jede Infrastruktur an, die auf geteilten System angelegt ist. Das ermutigt unsere Kunden dazu, mehr stabile Dienste zu erstellen.
- Wie redundant sind die zur Bereitstellung Ihres Cloud-Dienstes genutzten Systeme?
- Die Qualität und Redundanz der Systeme, die von verschiedenen Cloud-Dienstleistern genutzt werden, können sich erheblich unterscheiden. Wenn man einen Provider gegenüber einem anderen bewertet, sollte dies Teil Ihrer Preis-/Leistungsberechnung sein.
- Wir wählen nur Datenzentren für die Beherbergung unserer Cloud-Locations aus, die Tier III oder höher entsprechen. Zusätzlich vermischen wir mehrere Anbieter mit Tier I- Konnektivität, um Netzwerkverfügbarkeit sicherzustellen. Innerhalb unserer Cloud verfügen wir durchgehend über redundante Schaltung. Als Ergebnis dessen bieten wir eine Dienstleistungsvereinbarung mit 100-prozentigem Verfügbarkeitsgrad einschließlich einer Netzwerk-Latenzgarantie von unter einer Millisekunde innerhalb unserer Cloud.
- Bieten Sie Lastausgleich und automatische Skalierung an?
- Lastausgleich als Dienstleistung anzubieten, zusammen mit verifizierten Produkten, kann großartige Zeitersparnis bieten. Das Hinzufügen von automatischer Skalierung macht es leicht, die Zahl der Cluster auf Basis der Anforderungen in Echtzeit zu erhöhen.
- Wir bieten einen mehrstufigen Lastausgleichs-Dienst, der Kunden zum richtigen Preis eine angemessene Wahl ermöglicht. Diese Optionen beinhalten fortschrittliche Lastausgleichsfunktionen und vollständige, automatische Skalierbarkeit. Das Grundangebot beginnt bei nur 50 USD pro Monat.