Vraag Wat is een Storage Area Network en welke voordelen heeft het ten opzichte van verschillende opslagoplossingen?


Ik stel dit voor om een ​​te zijn canonieke vraag over Storage Area Networks op bedrijfsniveau.

Wat is een Storage Area Network (SAN) en hoe werkt het?
Hoe is het anders dan een Network Attached Storage (NAS)?
Wat zijn de use-cases in vergelijking met direct-attached storage (DAS)?
Op welke manier is het beter of slechter?
Waarom is het zo duur?
Moet ik (of mijn bedrijf) er een gebruiken?


34
2017-09-07 15:12


oorsprong


@Basil: denk je dat de vraag ook betrekking heeft op NAS? Ze zijn fundamenteel anders dan SAN (en er is al een vraag om ze te vergelijken: serverfault.com/questions/81723/...). Ik was van plan deze te zijn specifiek over SAN's. Ik verwijder uw bewerking niet, maar ik zou graag een feedback van de community hierover op prijs stellen. - Massimo
I do-file serving is meestal een functie van de meeste opslagapparaten op de markt nu de meeste mensen een "SAN" zouden noemen. - Basil
Ik denk dat de vraag die ik heb gekoppeld hier redelijk goed over gaat, en ook dat NASes conceptueel veel eenvoudiger zijn (ze zijn in feite bestandsservers). Een SAN is veel complexer, modulair en duurder. Het verbreden van de reikwijdte van deze vraag naar alle vormen van opslag zou het gewoon te breed maken. Dit is natuurlijk mijn mening. - Massimo
Mijn punt is dat elke opslagoplossing die je nu kunt krijgen een geïntegreerde bestandsservice heeft. EMC, HDS, IBM, HP, Netapp (uiteraard), Dell. Je kunt niet over een "SAN" praten (alweer een verkeerde benaming, want dat is eigenlijk wat je omschrijft als de verbindingslaag) zonder te praten over bestandsservices. Kun je de spreekkamer binnenstappen? - Basil
Ik hou van de manier waarop dit is gebleken. Ik denk dat het beter is om deze vraag te laten focussen op wat een SAN is en alleen NAS terloops te noemen. Die oudere vraag over "wat is het verschil tussen SAN, NAS, DAS?" kan een beetje worden bijgewerkt en op zichzelf worden omgezet in een canonieke vraag en antwoord. - Ward♦


antwoorden:


Allereerst voor een (brede) vergelijking van DAS-, NAS- en SAN-opslag hier.


Er zijn enkele veel voorkomende misvattingen over de term "SAN", wat betekent "Storage Area Networken als zodanig strikt gesproken, verwijst alleen naar de communicatie-infrastructuur die opslagapparaten (schijfarrays, bandbibliotheken, enz.) en opslaggebruikers (servers) met elkaar verbindt. In de dagelijkse praktijk wordt de term 'SAN' echter gebruikt om naar twee dingen te verwijzen:

  1. Een complete opslaginfrastructuur, inclusief alle hardware en software voor gedeelde toegang tot centrale opslagapparaten van meerdere servers. Dit gebruik, hoewel niet strikt correct, wordt algemeen aanvaard en waar de meeste mensen naar verwijzen als ze het hebben over een "SAN". De rest van dit antwoord zal hierop zijn gericht en dus alle componenten van een opslaginfrastructuur op bedrijfsniveau beschrijven.
  2. Een enkele opslagarray (zie later); als in, "we hebben een merk X SAN met 20 TB opslag". Dit gebruik is fundamenteel incorrect, omdat het zelfs geen rekening houdt met de echt betekenis van "SAN" en gaat er gewoon van uit dat het een of andere vorm van opslagapparaat is.

Een SAN kan bestaan ​​uit heel verschillende hardware, maar kan meestal worden opgesplitst in verschillende componenten:

  • Opslagarrays: dit is waar de gegevens daadwerkelijk worden opgeslagen (en wat ten onrechte vaak een "SAN" wordt genoemd). Ze zijn samengesteld uit:
    • Fysieke schijven: ze bewaren de gegevens natuurlijk. Schijven op bedrijfsniveau worden gebruikt, wat betekent dat ze meestal een lagere capaciteit per schijf hebben, maar veel hogere prestaties en betrouwbaarheid; ook, ze zijn een stuk duurder dan schijven van consumentenklasse. De schijven kunnen een breed scala aan verbindingen en protocollen gebruiken (SATA, SAS, FC, enz.) en verschillende opslagmedia (Solid-state schijven komen steeds vaker voor), afhankelijk van de specifieke SAN-implementatie.
    • Schijfbehuizingen: dit is waar de schijven worden geplaatst. Ze leveren elektriciteit en gegevensverbindingen met hen.
    • Storage Controllers / Processors: deze beheren schijf I / O, INVAL en caching (de term "controller" of "processor" varieert tussen SAN-leveranciers). Nogmaals, er worden controllers op bedrijfsniveau gebruikt, dus ze hebben veel betere prestaties en betrouwbaarheid dan hardware van consumentenklasse. Ze kunnen en worden meestal per paar geconfigureerd voor redundantie.
    • Opslag zwembaden: een opslagpool is een berg opslagruimte, bestaande uit enkele (vaak veel) schijven in een RAID-configuratie. Het wordt een "pool" genoemd omdat delen ervan op aanvraag kunnen worden toegewezen, verkleind en gede-alloceerd, waardoor LUN's worden gecreëerd.
    • Logical Unit Numbers (LUN's): een LUN is brok ruimte getrokken uit een opslagpool, die vervolgens beschikbaar wordt gesteld ("gepresenteerd") aan een of meer servers. Dit wordt door de servers gezien als een opslagvolume en kan door hen worden geformatteerd met elk bestandssysteem dat zij verkiezen.
  • Tape Bibliotheken: ze kunnen worden verbonden met een SAN en dezelfde communicatietechnologie gebruiken voor zowel het verbinden met servers als voor directe back-up van opslag naar tape.
  • Communicatienetwerk (het "SAN" correct): dit is wat de opslaggebruikers (servers) toegang geeft tot de opslagapparaten (opslagarray (s), bandbibliotheken, enz.); het is strikt genomen het echt betekenis van de term "Storage Area Network", en het enige deel van een opslaginfrastructuur dat moeten als zodanig zijn gedefinieerd. Er zijn echt veel oplossingen om servers te verbinden met gedeelde opslagapparaten, maar de meest voorkomende zijn:
    • Fibre Channel: een technologie die glasvezel gebruikt voor hogesnelheidsverbindingen naar gedeelde opslag. Het bevat hostbusadapters, glasvezelkabels en FC-switches, en kunnen overdrachtssnelheden bereiken van 1 Gbit tot 20 Gbit. Ook, multipath-I / O kan worden gebruikt om verschillende fysieke koppelingen te groeperen, waardoor hogere bandbreedte en fouttolerantie mogelijk zijn.
    • iSCSI: een implementatie van de SCSI protocol over IP-transport. Het loopt over standaard Ethernet hardware, wat betekent dat het overdrachtssnelheden kan behalen van 100 Mbit (meestal niet gebruikt voor SAN's) tot 100 Gbit. Multipath I / O kan ook worden gebruikt (hoewel de onderliggende netwerklaag wat extra complexiteiten introduceert).
    • Fibre Channel over Ethernet (FCoE): een technologie tussen volledige FC en iSCSI, die Ethernet als de fysieke laag gebruikt, maar FC als het transportprotocol, waardoor de noodzaak van een IP-laag in het midden wordt vermeden.
    • InfiniBand: een zeer krachtige connectiviteitstechnologie, minder gebruikt en vrij duur, maar die wat kan bereiken indrukwekkend bandbreedte.
  • Hostbusadapters (HBA's): de adapterkaarten die door de servers worden gebruikt om toegang te krijgen tot de verbindingslaag; het kunnen dedicated adapters zijn (zoals in FC SAN's) of standaard Ethernet-kaarten. Er zijn ook iSCSI HBA's, die een standaard Ethernet-verbinding hebben, maar die het iSCSI-protocol in hardware aankunnen, waardoor de server wordt ontlast van wat extra belasting.

Een SAN biedt vele extra mogelijkheden ten opzichte van direct gekoppelde (of fysiek gedeelde) opslag:

  • Fouttolerantie: hoge beschikbaarheid is ingebouwd in elk SAN op ondernemingsniveau en wordt op alle niveaus behandeld, van voedingen in opslagarrays tot serververbindingen. Schijven zijn betrouwbaarder, RAID wordt gebruikt om defecten met één schijf (of meerdere schijven) te weerstaan, er worden redundante controllers gebruikt en multipath I / O zorgt voor ononderbroken opslagtoegang, zelfs in het geval van een koppelingsfout.
  • Grotere opslagcapaciteit: SAN's kunnen veel grote opslagapparaten bevatten, waardoor veel grotere opslagruimten mogelijk zijn dan wat een enkele server zou kunnen bereiken.
  • Dynamisch opslagbeheer: opslagvolumes (LUN's) kunnen op verzoek worden gemaakt, verkleind en vernietigd; ze kunnen van de ene server naar de andere worden verplaatst; het toewijzen van extra opslag aan een server vereist slechts enkele configuraties, in tegenstelling tot het kopen van schijven en het installeren ervan.
  • Prestatie: een correct geconfigureerd SAN, dat recente (hoewel dure) technologieën gebruikt, kan werkelijk indrukwekkende prestaties leveren en is vanaf de grond af ontworpen om zware gelijktijdige belasting van meerdere servers aan te kunnen.
  • Replicatie op opslagniveau: twee (of meer) opslagarrays kunnen worden geconfigureerd voor synchrone replicatie, zodat de server-I / O volledig kan worden omgeleid van de ene naar de andere in fout- of rampscenario's.
  • Snapshots op opslagniveau: de meeste opslagarrays maken het mogelijk snapshots van enkele volumes en / of hele opslagpools te maken. Die snapshots kunnen vervolgens indien nodig worden hersteld.
  • Back-ups op opslagniveau: de meeste SAN's maken het ook mogelijk om rechtstreeks back-ups te maken van opslagarrays naar SAN-verbonden bandbibliotheken, waarbij de servers die de gegevens daadwerkelijk gebruiken volledig worden omzeild; verschillende technieken worden gebruikt om de integriteit en consistentie van gegevens te waarborgen.

Op basis van alles hierboven zijn de voordelen van het gebruik van SAN's overduidelijk; maar hoe zit het met de kosten om er een te kopen, en de complexiteit van het beheer ervan?

SAN's zijn van enterprise-grade hardware (hoewel er een businesscase voor kleine SAN's kan zijn, zelfs in kleine / middelgrote bedrijven); ze zijn natuurlijk in hoge mate aanpasbaar, dus kunnen variëren van "een paar TB's met 1 Gbit iSCSI en enigszins hoge betrouwbaarheid" tot "enkele honderden TB's met verbluffende snelheid, prestaties en betrouwbaarheid en volledige synchrone replicatie naar een DR-gegevenscentrum"; de kosten variëren dienovereenkomstig, maar zijn over het algemeen hoger (zoals in "totale kosten", evenals in "kosten per gigabyte aan ruimte") dan andere oplossingen. Er is geen prijsnorm, maar het is niet ongebruikelijk dat zelfs kleine SAN's prijskaartjes hebben in het bereik van tienduizenden (en zelfs honderdduizenden) dollars.

Het ontwerpen en implementeren van een SAN (nog meer voor een high-end) vereist specifieke vaardigheden, en dit soort werk wordt meestal gedaan door zeer gespecialiseerde mensen. Dagelijkse bewerkingen, zoals het beheren van LUN's, zijn aanzienlijk eenvoudiger, maar in veel bedrijven wordt opslagbeheer sowieso afgehandeld door een speciale persoon of een bepaald team.

Ongeacht de bovenstaande overwegingen zijn SAN's de opslagoplossing bij uitstek waar hoge capaciteit, betrouwbaarheid en prestaties vereist zijn.


44
2017-09-07 15:12



Stem ++ voor een dergelijk diepgaand antwoord. - Simon Catlin


Heb je er een nodig? Ligt eraan. £ of $ per TB is aanzienlijk hoger dan DAS. Plus, de prestaties van DAS zijn, naar ik vrees, beter dan FC / AL en iSCSI SAN (goed, tenminste in mijn testen met Oracle en SQL Server DB's). Maar met DAS krijgt u niet de voordelen van het kunnen delen van opslag (goed voor clustering en VMWare).

Een aantal opslagleveranciers migreert weg van fiber-channel voor de host-to-storage controller-verbindingen, in het voordeel van iSCSI, dat bovenop Ethernet draait. Het is helemaal opnieuw de oude Token-Ring vs Ethernet-saga; met zoveel industrie-breed onderzoek en investeringen in Ethernet, FC kan het gewoon niet bijbenen. Een 10 Gbps Ethernet-switch is veel goedkoper dan een 8 Gbps FC-one, plus het kan vLANd zijn of anderszins gesegmenteerd om opslag- en niet-opslagdata te bieden.

Er zijn echter enkele grote voordelen van SAN's:

  • SAN snapshots (point in time herstelpunt voor een server of een verzameling servers)
  • On-site en off-site blokniveau-replicatie (zonder tussenkomst van de hostserver, dus geen noodzaak voor replicatie op basis van software)
  • Directe SAN-back-ups - als uw back-upsysteem kan aansluiten op en werken met uw SAN

Als je overweegt om je teen in het water van gedeelde opslag te dompelen, kijk dan naar producten zoals HP's P4000-set.


3
2017-09-07 15:59