Inici > general > RAID Atomicidad

RAID Atomicidad

Mentre ho fa, jo estava llegint sobre els nivells de RAID, mentre que en el bany. El tema de la atomicidad es va acostar, i és una cosa que volia compartir.

No sol ser la font més fiable de les dades tècniques, però citaré a Wikipedia per ajudar a explicar la atomicidad per preparar l'escenari. Pres de http://en.wikipedia.org/wiki/RAID a la secció de "Problemes amb RAID" ...

Aquest és una manera de falla molt poc entès i poques vegades s'esmenta als sistemes d'emmagatzematge redundants que no utilitzen les característiques transaccionals. Base de dades l'investigador Jim Gray va escriure "Actualització en el lloc és una verins d'Apple" [28] durant els primers dies de la comercialització de base de dades relacional. No obstant això, aquesta advertència en gran mesura va passar desapercebuda i va caure en l'oblit amb l'adveniment de RAID, que va confondre a molts enginyers de programari, com la resolució de la integritat de totes les dades emmagatzemades i els problemes de fiabilitat. Molts programes de programari actualitzar un objecte d'emmagatzematge "in situ", és a dir, d'escriure una nova versió de l'objecte a les direccions mateix que la versió anterior de l'objecte. Mentre que el programari també pot registrar certa informació a altres parts del delta, que espera que l'emmagatzematge de presentar la semàntica d'escriptura atòmiques ", el que significa que l'escriptura de les dades, ja sigui produït en la seva totalitat o no passar en absolut.

Això ha tornat a la llum recentment, però sota una aparença diferent amb problemes SSD error d'escriptura. Molts fabricants de SSD i els venedors d'emmagatzematge empresarial estan abordant aquest amb el nou firmware que escriu totes les dades de forma seqüencial, mai sobre-escriptura d'un bloc de dades fins que tot el disc ha estat escrit a continuació, tornar a començar-escriptura blocs des del principi (que òbviament han estat alliberats primer).

No obstant això, aquest és un tema passat per alt amb els mitjans tradicionals de filat i és sovint menyspreat i desestimat sense una explicació clara o comprensió. La idea és que molts sistemes sobre-escriure les dades en el lloc, l'escriptura es va confirmar que estava escrit amb èxit, però no necessàriament que les dades coincidia amb el que l'amfitrió ha enviat. La sobrecàrrega d'aquest control es posa una càrrega addicional considerable, com cada escriptura es necessita una lectura addicional i de suma de comprovació abans de l'escriptura es confirma i la memòria cau d'escriptura es pot rentar.

Això es pot veure agreujat per l'anomenada "copiar en escriure" les tecnologies d'instantànies. En lloc de conservar les dades que ja s'han escrit en un sector en particular en el disc, les dades originals es copien en una àrea d'instantànies en una part diferent del sistema d'emmagatzematge abans que el sector de dades original es sobreescriu. Així que una aplicació de transaccions d'alt que sobreescriu les dades de forma periòdica (per exemple una base de dades dels registres de temperatura o de repetició que es va posar vermell amb regularitat, com els registres d'Oracle abans d'arxiu) poden ser molt susceptibles a aquest tipus d'error. El principal problema aquí és que una vegada que les dades s'escriuen i es confirma, no hi ha manera de corregir com el sistema d'emmagatzematge es confirmen com intacta. Això pot tenir un cop massiu en la validesa de la deduplicació de dades. Si el primer bloc s'escriu en un sector corrupte sense ser identificats, això podria estar relacionat amb centenars d'altres blocs de dades com a part del procés de de-duplicació, fent que la corrupció massiva de dades.

Això no sempre pot ser fixat per la paritat de RAID com RAID es calcula després d'una franja que està escrit. No sempre es pot calcular en la memòria, ja sigui com una banda completa no sempre s'escriu, podria ser una banda parcial en què la paritat ha de ser calculat a partir de dades que tingueu al disc, així com dades encara no escrits en el disc. Si les dades s'escriuen en el disc i després llegir la finalitat de calcular la paritat, que no necessàriament està confirmat davant la font. Hi ha diverses maneres de fer això, i sobre tot això ha d'ocórrer en la memòria, en general una suma de comprovació es considera l'enfocament acceptable. Lectura de les dades més tard després d'una escriptura va confirmar que no es pot garantir que no tens res amb què comparar-lo contra la integritat necessita ser comprovada, mentre que les dades es manté actiu en la memòria per a comparar.

Hi ha diverses maneres de que els proveïdors d'emmagatzematge de fer front a això, i com era d'esperar m'ocuparé del que NetApp fer. El sistema d'arxius WAFL escriu a cada bloc de dades lliure i activa que mai sobreescriu un bloc de dades. Per crear blocs de dades lliures hi ha un procés d'esborrat que s'executa en segon pla, aquest s'executa el bloc d'emmagatzematge de tot el sistema pel bloc i si s'interroga a una instantània o sistema de fitxers actiu s'assenyalen en aquest bloc de dades en particular. Si no és així, llavors s'esborra les dades en el bloc i la marca com a lliure (o desmarca com en ús probablement seria més correcte). Això permet que el sistema de fitxers per confirmar que no només és el bloc de dades no està en ús, però en realitat com un efecte secundari que s'estén dades s'escriu a través de tota la superfície d'un disc i nega o minimitza els efectes de atomicidad. A més, el procés d'esborrat de WAFL posa a prova els blocs de dades per comprovar la integritat del disc, així és com els discs poden ser pre-no sobre la base de la integritat del disc en lloc de la superfície de falla física, després d'un llindar definit dels sectors de disc que ha fallat el disc no està i un la recuperació i s'intenta activar un recanvi. Així que en un sistema NetApp, els mateixos blocs de dades rares vegades s'escriuen en diverses ocasions, fins i tot (o especialment) en un sistema de repetició de transaccions d'alt.

Prengui tot l'anterior, i també comencen a adonar-se que un sistema d'arxius complet és dolent per a l'emmagatzematge de diferents maneres. Si vostè té un sistema d'emmagatzematge complet, llavors hi ha menys blocs lliures per escriure, de manera que una porció més petita de blocs de dades s'escriuen en forma contínua. Això agreuja les possibilitats de atomicidad i en general augmentarà el desgast del disc. Així que una bona raó per veure el arxivat de dades, deduplicació i, en general de manteniment dels sistemes d'arxius nets i no abusar dels sistemes d'emmagatzematge!

Així que si us plau pregunti al seu proveïdor d'emmagatzematge com protegir les seves dades contra aquests problemes.

Millorat per Zemanta
VN: F [1.9.11_1134]
Vota aquest post:
Qualificació: 9,3 / 10 (3 vots)
based on 3 ratings RAID Atomicidad, 9,3 de cada 10 basat en 3 valoracions

General de , , , , , ,

  1. 16 abril 2011 a les 00:08 | # 1

    Molt fresc.

  1. Encara no hi ha trackbacks.



Aquest lloc no està afiliat o patrocinat en qualsevol cas per NetApp o qualsevol altra empresa esmentada en el seu interior.

Mala conducta ha bloquejat els intents d'accés 3028 en els últims 7 dies.

© 2009-2012 Chris Kranz Tots els drets reservats
Aquest lloc no està afiliat o patrocinat en qualsevol cas per NetApp o qualsevol altra empresa esmentada en el seu interior.