Vraag Waarom is Enterprise Storage zo duur?


Dit is een Canonical Question over de kosten van Enterprise-opslag.
  Zie ook de volgende vraag:

Met betrekking tot algemene vragen zoals:

  • Waarom moet ik 50 dollar per maand extra gigabyte aan opslag betalen?
  • Onze fileserver heeft altijd te weinig ruimte, waarom gooit onze systeembeheerder niet gewoon een extra 1TB schijf erin?
  • Waarom is SAN-apparatuur zo duur?

De Antwoorden hier zullen proberen een beter begrip te krijgen van hoe opslag op bedrijfsniveau werkt en wat de prijs beïnvloedt. Als je de vraag kunt uitdiepen of inzichten kunt geven over het antwoord, post dan alsjeblieft.


106


oorsprong


Sluit alle vragen over 'Waarom is opslag zo duur' en zet ze hier in de gaten. - Mark Henderson♦
Dit is niet bedoeld als een advertentieforum voor iedereen die goedkope providers heeft gevonden, dit gaat over het schetsen van de "verborgen" kosten in storage op bedrijfsniveau. - Mark Henderson♦
Verplichte BOFH-referentie ("Ik heb meer ruimte nodig!"): bofh.ntk.net/BOFH/0000/bastard01.php - Massimo
Jim Salter heeft een uitsplitsing hiervan gepost en biedt de blogpost aan Deprimerende opslagcalculator. Kort gezegd: u moet zorgen ergens tussen 10 en 25 keer de hoeveelheid zichtbare opslag van de eindgebruiker gewenst, afhankelijk van aannames en vereisten. - α CVn


antwoorden:


  1. De capaciteit van de harde schijf van de server is minuscuul in vergelijking met de capaciteiten van de vaste schijf van de pc. 450 en 600 GB zijn niet ongebruikelijke formaten om te zien in gloednieuwe servers, en je zou veel 4TB SATA-desktopdrives kunnen kopen voor de prijs van een 600GB SAS (server) harde schijf.

  2. Uw SATA-harde schijf op uw pc thuis is als een muscle-car van Ford, of GM of Mercedes of een andere fabrikant van auto's voor alledaagse mensen (grote capaciteit V8 of V12, 5 of 6 liter). Omdat ze moeten worden bestuurd door mensen die geen racelicentie hebben, of begrijpen hoe een interne combi-engine werkt, hebben ze zeer grote toleranties. Ze hebben rev-limiters, ze zijn ontworpen om te draaien op elke olie van een bepaalde rating, ze hebben onderhoudsintervallen die 10.000 kilometer uit elkaar liggen, maar als je een service-interval met een paar weken mist, zal het niet ontploffen in je gezicht. Ze vatten geen vlam wanneer u lange afstanden rijdt.

    De SAS-schijf in een server lijkt meer op een Formule 1-engine. Ze zijn erg klein (2,4 liter) maar hebben immense vermogens vanwege hun kleine toleranties. Ze stijgen hoger en hebben vaak geen toerenbegrenzer (wat betekent dat ze ernstige schade lijden als ze onjuist worden aangedreven), en als je een service-interval mist (dat is om de paar uur) ze ontploffen.

    Je vergelijkt eigenlijk krijt en kaas. Nummers en een volledige uitsplitsing worden besproken in de Intel Whitepaper Enterprise-klasse versus desktopklasse harde schijven

  3. Laten we een paar harde cijfers hier bespreken. Stel dat u 1 MB extra gegevens aanvraagt ​​(een mooi rond getal). Hoeveel data is dat werkelijk? Welnu, uw 1 MB aan gegevens gaat naar een RAID-array. Laten we zeggen dat ze veilig zijn en dat maken in RAID1. Uw 1 MB aan gegevens wordt gespiegeld, dus het is eigenlijk 2 MB aan gegevens.

    Laten we zeggen dat uw gegevens zich binnen een SAN bevinden. In het geval van een SAN-knooppuntdefect worden uw gegevens op byte-niveau gesynchroniseerd met een 2e SAN-knooppunt. Het is dus gedupliceerd en uw 2 MB aan gegevens is nu 4 MB.

    U verwacht van uw provider dat deze on-site back-ups maakt, zodat uw gegevens kunnen worden hersteld in het geval van een noodgeval zonder rampen? Elke fatsoenlijke provider zal je minstens 1 on-site back-up bieden, misschien meer. Laten we zeggen dat ze één keer per week een momentopname maken voor drie weken on-site. Dat is een extra 3 MB aan gegevens, dus je bent nu tot 7 MB.

    Als er zich een kritieke ramp voordoet, kan uw provider beter een kopie ergens anders laten bewaren. Zelfs als het een maand oud is, zou het moeten bestaan. Dus nu ben je maximaal 8 MB.

    Als het echt een provider van hoog niveau is, hebben ze mogelijk zelfs een rampherstel-site die live is gesynchroniseerd. Deze schijven zullen ook worden RAIDed, dus dat is een extra 2MB, en dus ben je tot 10 MB aan data.

    Je zult die gegevens uiteindelijk moeten overzetten. Wat? Overzetten? Ja, gegevensoverdracht kost geld. Het kost geld wanneer je het downloadt, het via internet benadert, het kost zelfs geld om het te ondersteunen (iemand moet die banden uit zijn kantoor halen en het kan zijn dat je 1 MB aan gegevens betekent dat ze een extra schijf moeten kopen) set banden en verplaats ze ergens).

  4. Wanneer je SATA-huisstation faalt, mag je de technische ondersteuning bellen en ze overtuigen dat je schijf dood is. Stuur dan uw drive naar de fabrikant (op uw eigen dubbeltje meestal). Wacht een week. Ontvang een vervangende schijf terug en moet deze opnieuw installeren (het is vrijwel zeker niet hot swappable of in een drive slee al).

    Wanneer die SAS-schijf faalt, bel je de technische ondersteuning. Ze twijfelen bijna nooit aan uw mening dat de schijf onmiddellijk moet worden vervangen en een nieuw station moet laten vallen; meestal wordt de nieuwe schijf later diezelfde dag geleverd, anders is de volgende dag ook heel gewoon. Meestal zal de fabrikant een vertegenwoordiger sturen om de schijf daadwerkelijk te installeren als je niet weet hoe (erg handig als je van plan bent om ooit op vakantie te gaan en dingen moet blijven doen terwijl je weg bent).

  5. Enterprise-drives hebben nauwe toleranties, zie # 2 hierboven, en hebben de neiging om ongeveer 10 keer langer mee te gaan dan schijven met een consumentengeschiktheid (MTBF). Enterprise-drives ondersteunen bijna altijd geavanceerde fout- en storingsdetectie, die volgens een Google-rapport ongeveer 40% van de tijd werkt, maar dat is iets dat iemand zou verkiezen als een computer plotseling zou sterven.

    Wanneer u een enkele schijf in uw thuiscomputer gebruikt, zijn de statistische faalkansen eenvoudig die van de schijf. Schijven werden vroeger beoordeeld in MTBF (waar SAS-schijven nog steeds genieten van ~ 50% hogere beoordelingen of meer), nu is het gebruikelijker om foutenpercentages te zien. Een standaard SAS-schijf heeft 10 tot 1000 keer minder kans op een onherstelbare fout (met 100x de meest gebruikelijke die ik recent heb gevonden). (foutenpercentages volgens de documentatie van de fabrikant geleverd door Seagate, Western Digital en Hitachi, zonder vooringenomenheid, uitdrukkelijk afwijzing van schadevergoeding).

    Foutmeldingen zijn met name belangrijk, niet wanneer u een onherstelbare fout op een station tegenkomt, maar wanneer een ander station in dezelfde array faalt en u niet vertrouwt dat alle stations in een array leesbaar zijn om de defecte schijf te herstellen.

  6. SAS is een afgeleide van SCSI, een opslagprotocol. SATA is gebaseerd op ATA, die zelf is gebaseerd op de ISA-bus (die 8/16-bits bus in computers uit het dinosaurustijdperk). Het SCSI-opslagprotocol heeft uitgebreidere opdrachten voor het optimaliseren van de manier waarop gegevens worden overgedragen van stations naar controllers en terug. Deze opleving in efficiëntie zou een anders gelijke SAS-schijf inherent sneller maken, vooral onder extreme werkbelastingen, dan een SATA-schijf; het verhoogt ook de kosten.

  7. Er zijn minder SAS-schijven geproduceerd, schaalvoordelen bepalen dat ze duurder zullen zijn omdat al het andere gelijk is.

  8. SAS-schijven worden meestal geleverd met rotatiesnelheden van 10k of 15k; terwijl SATA meestal wordt geleverd in 5.4k of 7.2k. SAS-schijven, met name de 2.5 "-formaat die steeds populairder worden, hebben snellere zoektijden. De twee combineren dramatisch de IOps die een schijf kan uitvoeren, meestal is een SAS-schijfeenheid ~ 3x sneller.Wanneer meerdere gebruikers ongelijksoortige gegevens eisen, stelt de IOps de capaciteit van de schijf / array wordt een kritieke prestatie-indicator.

  9. De schijven in een datacenter worden meestal altijd ingeschakeld. Uit onderzoek is gebleken dat het falen van een schijf wordt beïnvloed door het aantal verwarmings- / koelingscycli die het doormaakt (van hardlopen versus uitgeschakeld). Door ze de hele tijd in bedrijf te houden, neemt de levensduur van de schijf doorgaans toe. Het gevolg hiervan is dat de schijven elektriciteit verbruiken. Deze elektriciteit moet van iets worden voorzien (in het geval van een grote DC kunnen de schijven alleen meer stroom verbruiken dan een kleine huizenbuurt). Ze moeten die warmte ook ergens afvoeren, waardoor koelsystemen nodig zijn (die zelf meer kracht nodig hebben om te werken).

  10. Infrastructuur en personeelskosten. Die drives bevinden zich in high-end NAS- of SAN-eenheden. Die eenheden zijn duur, zelfs zonder de dure schijven erin. Ze hebben dure medewerkers nodig om ze in te zetten en te onderhouden. De gebouwen waarin deze NAS- en SAN-units zich bevinden, zijn duur in gebruik (zie het punt over koeling hierboven, maar er is veel meer aan de hand). De back-upsoftware is meestal niet gratis (noch zijn de licenties voor dingen zoals spiegelen) en het personeel om back-ups te maken en te onderhouden is meestal ook duur. De kosten voor het huren en het opslaan van off-site tapes zijn slechts een van de vele dingen die zich opstapelen wanneer u meer opslagruimte nodig heeft.

Als je in gedachten houdt dat de capaciteit van hun schijven misschien wel 1/10 van de grootte van een desktopdrive is, en vijf keer de prijs, is je 1 MB aan gegevens eigenlijk 10, en alle andere verschillen, je kunt op geen enkele manier zinvol tekenen conclusies tussen de prijs van uw desktopopslag en de prijs van opslag op bedrijfsniveau.


115



Tegenwoordig worden 2-4TB SAS / SATA 7,2K-stations gebruikt voor massaopslag, dus sommige hiervan zijn niet langer universeel toepasbaar. - Mircea Chirea
@MirceaChirea 2-4TB-schijven die worden gebruikt in enterprise-opslag, zijn NL of ML SAS en verschillen van 2-4 TB SATA-schijven. De prijs per GB is nog steeds erg verschillend tussen de twee platforms. - MDMarra
@MDMarra, de meeste zijn niet veel anders dan hun desktopvarianten: afgezien van SAS hebben ze een betere garantie en zijn ze weggegooid voor betrouwbaarheid. - Mircea Chirea
Ze zijn gespecificeerd voor 24x7 gebruik waar meest SATA-schijven zijn dat niet. Ze falen ook gracieus en zullen het niet doen hang je hele RAID-array op. Alleen SATA-schijven die ondersteuning bieden voor TLER mislukken gracieus en voorkomen dit. Er zijn ook geen dual-poort SATA-schijven, terwijl SAS met twee poorten gebruikelijk is en een transparante failover van controllers mogelijk maakt. Nogmaals, als u een beperkt budget heeft, is SATA misschien uw enige keuze, maar er zijn aanzienlijke verschillen waar het bedrijfsleven om geeft tussen NL-SAS en SATA. - MDMarra
Backblaze zei op hun blog dat enterprise drives niet minder kans hadden te falen dan consumer drives - Bert


Ik voeg dit niet toe aan het top CW antwoord, vooral omdat het een meningsverschil is. Voel je vrij om dit samen te voegen / te bewerken als je dat wilt.

Vaak is de reden dat opslag op bedrijfsniveau zo duur kan zijn dat de vrager de vereiste niet begrijpt, maar soms begrijpt de systeembeheerder de vereiste niet, kan hij de vereiste niet communiceren met iemand met koopautoriteit, of krijgt hij gewoon genegeerd door genoemde autoriteit.

Hoogwaardige, hoog beschikbare, weinig onderhoudbare standaard opslagarrays zijn duur. Een deel van de taak van een systeemontwerper is om te weten waar deze geschikt zijn en waar een ander ontwerp geschikt is.

Ik denk niet dat de relatieve kosten van verschillende soorten schijfstations relevant zijn voor beide voorbeeldvragen.

Waarom moet ik 50 dollar per maand betalen?   per extra gigabyte aan opslagruimte?

Dit is duidelijk gericht aan een serviceprovider van een bepaalde soort. De twee mogelijke antwoorden op mijn gedachten zijn:

  1. Je hebt 5 nines uptime, 24/7 support, in Manhattan / Londen / Hong Kong. De draaiende schotels vormen slechts een klein deel van de stapel waarvoor u betaalt.

  2. Je betaalt te veel. Onderhandelen, van aanbieder veranderen of binnenshuis brengen.

Onze fileserver heeft altijd te weinig ruimte, waarom gooit onze systeembeheerder niet gewoon een extra 1TB schijf erin?

Dit is vrijwel zeker een slecht ontwerp (en waarschijnlijk om politieke redenen). De gegevens op die fileserver vallen ergens in dit spectrum:

  • Gegevens zijn de moeite van het opslaan waardevol als het gaat om hoge prestaties, hoge beschikbaarheid en hoge kosten. Uitvaltijd veroorzaakt door onvoldoende ruimte beïnvloedt uw hoge beschikbaarheid en is een ontwerp- of planningsfout.

  • Gegevens zijn ofwel onbelangrijke of trage prestaties of langere uitvaltijd is acceptabel. Goedkope schijven en goedkope back-upoplossingen zijn acceptabel. Regelmatige downtime als gevolg van gebrek aan schijfruimte lijkt nog steeds een vreemde afweging, omdat het grootste deel van uw kosten in dit geval waarschijnlijk uw systeemtijd zal zijn, en op de lange termijn zullen ze meer tijd besteden aan het oplossen van problemen met een lage schijf ruimte.

Merk op dat ik zei dat dit een spectrum is, en de meeste eisen komen ergens tussen de twee.


31



Het is de moeite waard erop te wijzen dat wat vanuit het oogpunt van de gebruiker "bijna geen ruimte meer heeft" misschien wel "het vullen van uw quotum" is vanuit het oogpunt van de systeembeheerder. - Richard Gadsden


De kosten van het produceren van een item zijn rechtstreeks verbonden met het volume van de eenheden die het in een feedbacklus zal verkopen.

In het geval van een conventionele harde schijf, met ronddraaiend roestig glas en elektronica, is er potentieel een enorme variatie in de kosten van de mechanische en elektronische componenten - maar er zijn 2 duidelijke prijs / kwaliteit-banden ontstaan ​​- Enterprise en Commodity.

Het lagere verkoopvolume van een enterprise drive eist echter een zware tol van wat u krijgt voor uw geld - iets dat zeven keer zo veel kost, zal niet zeven keer beter zijn.

De enterprise-eenheden (voor een bepaalde capaciteit) zijn iets sneller dan de basiseenheden, bijvoorbeeld Seagate Barracuda SATA (commodity) en Cheetah SAS (enterprise) drives vergelijken:

model            Barracuda            Cheetah
capacity(Gb)     500                  450
sustained data   125                  168
   rate (Mb/s)
cache(Mb)        16                   64
annual failure   <1%                  0.44%
   rate
Price GBP        42                   275
Price USD        67                   440

Maar in een bedrijfscontext zou geen gezonde systeembeheerder ooit belangrijke gegevens opslaan op een enkele schijf - het gebruik van meerdere schijven biedt een grotere betrouwbaarheid en bandbreedte en vermindert effectief de latentie; vier van de Barracuda-drives die zijn geconfigureerd als RAID10, zullen een stuk sneller zijn dan de enkele Cheetah-drive, met veel minder risico op gegevensverlies van ongeveer 60% van de prijs.

Zeker krijgt u een betere garantie met de Enterprise-schijf, en de leverancier zal meestal dezelfde dag nog een exemplaar bij u kunnen krijgen - maar u zult waarschijnlijk sneller een grondstoffenaandrijving bij een lokale leverancier kunnen kopen dan uw leverancier kan koerier de vervangende schijf uit. Aan de andere kant is de ondernemingsschijf eerder een exacte vervanging voor de defecte schijf.

Dus misschien krijg je veel meer betrouwbaarheid van de enterprise drives? Terwijl de mensen die de schijven maken en verkopen vaak zeggen dat dit het geval is (Seagate is hier nogal terughoudend op hun website - maar zelfs de versluierde cijfers die ze publiceren laten zien dat het minder dan een factor 2 is). Onafhankelijke studies suggereren dat er is geen significant verschil.

De SCSI-commandoset heeft enkele technische voordelen ten opzichte van de ATA-opdrachtset, met name wat betreft het toestaan ​​dat het besturingssysteem precies weet wat er met de schijf is gemoeid, maar nogmaals, dit maakt alleen een effectief verschil met betrekking tot de prestaties en betrouwbaarheid van een bestandssysteem geïmplementeerd op een enkele schijf.

Als uw serviceprovider een Fibre Channel-SAN beheert, zijn de kosten per Gigabyte aan opslag minstens acht keer hoger dan wanneer u een schijf bij de dichtstbijzijnde hardwarewinkel koopt. Maar daar zijn andere benaderingen wat de kosten aanzienlijk omlaag kan brengen.

Merk op dat dit nog nooit goedkoper zal zijn dan het kopen van een standaardschijf, aangezien u ook betaalt voor redundantie, stroom, airconditioning en ondersteuning, maar deze kosten moeten klein zijn in verhouding tot de kosten van de opslagvoorziening.


6





Ik ben het eens met de andere berichten over de kwaliteit van wat een hostingbedrijf aanbiedt. Maar we hebben onlangs ons hostingcontract opnieuw uitgevoerd en hebben rondgeklopt en niemand was concurrerend op het gebied van opslagruimte, noch waren de prijzen lager dan ons vorige contract van drie jaar oud. SAS-schijven zijn in prijs gedaald, disk shelf / arrays / SAN's / FC / switches zijn weggevallen, alles is in prijs gedaald. Maar geen schijfopslag?

Een collega met veel meer ervaring wees op de tactieken. De prijs van CPU, geheugen en bandbreedte was verbluffend! Registreer hier! Meld u nu aan en negeer dat probleem met schijfruimte! Je hebt niet zoveel schijfruimte nodig. Kijk naar de CPU en het geheugen!

Als je je eenmaal aan hun contract hebt verbonden, hebben ze je echt en verdienen ze hun inkomsten op de schijfruimte. Ja, het is RAID-5 en hoge prestaties enz. Maar back-ups kosten extra, replicatie op afstand kost meer.

Voor hostingbedrijven is het een bedrijfsmodel. De meeste bedrijven doen iets soortgelijks met hun prijzen - verlaag deze prijs hier maar verhoog die daar om elders hun inkomsten te verdienen. Ze moeten ook hun huur en salarissen betalen.

Voor interne servers heb je verschillende problemen. Je kunt niet zomaar een serverruimte binnenlopen met de Fedex-box met je nieuwe 3Tb-harde schijf. Als u van plan bent om uit te breiden, is het gemakkelijker, maar servers / racks / arrays zijn mogelijk al in hun capaciteit qua slots, I / O, controllerkaarten, voeding.

Het is alsof je onder een steen kijkt, je zult verrast zijn wat je zou kunnen vinden.


5



De kosten van schijven lopen mogelijk terug, maar de arbeid gaat omhoog. CapEx is niet het grootste deel van de TCO. - Chris S


Het is ook belangrijk om op te merken dat 'lokale' opslag misschien wel meer kost dan je denkt.

Als onderdeel van een oefening om enkele van onze 'gearchiveerde' gegevens naar de cloud te verplaatsen, heb ik recentelijk een prijsoefening voltooid waarin de kosten van beschikbare (bijvoorbeeld geformatteerde in plaats van onbewerkte) schijfruimte op onze nieuwste SAN werden vergeleken met de opslagkosten in de Amazon cloud-dataservice.

Rekening houdend met de betaalde prijs voor het SAN zelf, inclusief schijven, uitgaande van een levensduur van vijf jaar voor de SAN-hardware, en niet de 'overhead' kosten van het runnen van onze serverruimte, onze prijs voor 150 Gb aan lokale opslag is $ 31,88 per maand versus $ 28,41 van Amazon (uitgaande van een verkeerssnelheid per maand van 20% op en neer).

Nu ben ik niet van plan om snel naar buiten te gaan en al onze opslag naar de cloud te verplaatsen, omdat er andere voordelen zijn bij lokale opslag, maar ik denk dat dit soort prijsoefeningen nuttig zijn: Als u denkt dat cloudopslag duur is, hoeveel bent u dan werkelijk betalen voor uw lokale opslag?


5





Mijn kijk op deze vraag is simpel IO ... een bestand dat op een enkele commodity-harde schijf zit zonder raid en waarschijnlijk geen hot swapping, en normaal gesproken wordt gebruikt door één persoon en waarschijnlijk nooit een back-up heeft gemaakt. Dit is een goedkope en eenvoudige methode van IO ...

In onze business heb ik een van de duurste manieren van overvallen gebruikt (raid 10) waarvoor minimaal 4 schijven nodig zijn, we gebruiken 6 ... dit geeft ons hoge IO-snelheden en fouttolerantie.

Deze configuratie heeft mijn a $$ op een grote manier opgeslagen, en dit resultaat heeft hogere prestaties en minder downtime tot eindgebruikers betekend .. voor eenvoudige IO is er maar één persoon die moet teleurstellen en waarschijnlijk is er weinig financiële waarde verbonden aan de downtime.

We hebben ook een speciale iSCSI-server die wordt gebruikt voor Xen-virtualisatie en die ook is geconfigureerd voor raid 10 ...

Hoe meer IO nodig is om te worden gebruikt en geback-upt, des te duurder het is om te implementeren ... als uw bedrijfsvereiste verlies van gegevens, zeer lage snelheden en geen redundantie zal accepteren, dan kan opslag in bedrijfsklasse worden gedaan op de goedkoop!!! Wees gewoon voorbereid om ontslagen te worden ...


4