Ang. driftproblem d. 21 oktober

UnoEuro blev fredag d. 21. oktober berørt af en række uheld, hvilket desværre betød, at en stor del af vores kunder ikke kunne modtage e-mails før sidst på dagen. Vi har løbende udmeldt driftsinformation og opdateringer på hjemmesiden. Inden vi afslutter sagen, vil vi dog gerne give en opsummering på hændelsen, og prøve at forklare hvad der skete, hvordan vi nåede frem til en løsning og hvad vi vil gøre, for at sikre det ikke sker igen.

Tidligt fredag nat gik en af vores diske ned, på det disksystem (SAN) som håndterer flere af vores mail løsninger – en hændelse som absolut ikke er faretruende, da vores SAN er konfigureret til at kunne håndtere op til 4 samtidige diskfejl. I løbet af morgenen og indtil kl. 08.37 mistede vi dog yderligere 3 diske, hvilket stadig ikke var et direkte problem.

Da tabet af flere diske ville være absolut katastrofalt, stod vi på daværende tidspunkt derfor med 2 muligheder. Vi kunne lade disksystemet køre videre, og håbe på at vi ikke ville miste flere diske imens de 4 ødelagte diske blev genopbygget, hvilket ville ske over en periode på ca. 40 timer, da genopbygning i et kørende system kun vil køre med ca. 30% hastighed. Alternativt kunne vi erkende, at der var en fejl på det enkelte netværk (SAN) og derfor slukke hele systemet, hvorved en genopbygning blot vil tage 10-13 timer, da den således kan køre med 100% hastighed.

Vi tog derfor en strategisk beslutning, om at slukke for disksystemet, for at være sikre på at vores løsninger ville komme op og køre igen allerede den samme dag.

Kl. 20.30 fredag aften – ca. 11,5 timer efter at vi tog systemet ned, var det færdig med at gendanne/reparere de første diske og vi følte os derfor trygge ved at starte systemet op igen. Hele episoden har været meget beklagelig, til dels fordi at denne form for tekniske problemer normalt kun berører os internt, men specielt fordi at det denne gang ligeledes har været en meget langsommelig affære og har berørt mange af vores kunder.

Med hensyn til hvorfor problemet opstod, så var de fejlede lagerenheder/diske, blot blevet registreret som at have fejlet. Desværre viser det sig, at være et problem med operativsystemet på disksystemet, som fejlagtigt har troet at der var opstået fejl på nogle diske, mens de i realiteten intet fejlede. Vi har i samarbejde med leverandøren løst problemet og forventer derfor bestemt ikke flere problemer. Dertil har vi bestilt et nyt, større og mere avanceret SAN, som vi vil sætte i drift, når vi modtager det inden året er omme.

Til sidst vil vi gerne understrege, at vi er dybt beklagelige over hele situationen og de problemer som det har givet vores kunder. Vi agerede som vi gjorde, for at sikre vores kunders data. Vi har dog fuld forståelse for, at hele situationen har været problematisk for mange af de berørte, og undskylder naturligvis for dette.

11 meninger om “Ang. driftproblem d. 21 oktober”

  1. Jeg ved ikke om der er en sammenhæng, men jeg kunne, som i jo fint beskriver, ikke modtage mails, men godt sende mails.
    Men flere af de tilbud jeg sendte ud den pågældende dag, nåede aldrig frem til modtageren. Og ja spam-mappen er undersøgt :)
    er der nogen sammenhæng?

    1. Det burde det ikke, hvis du har sendt igennem asmtp.unoeuro.com kan du åbne en support ticket med flere informationer, så kan vi se hvad der er sket med mailen fra vores side.

  2. Vi blev naturligvis også berørt af det hjemme hos os. Vi fandt dog forholdsvis ud af at se på jeres hjemmeside og fandt så ud af, at I var klar over at den var gal.
    Vi mangler stadig nogle mails, som blev sendt til os ved nitiden fredag. Det drejer sig om nogle bekræftelses-mails ifb med nethandel.
    Bortset fra det har I håndteret hele miseren fint, synes jeg. Det eneste jeg kunne ønske mig, var en besked på bloggen, som jeg rss-abonnerer på.
    Men tak for denne udmelding, som viser at I ikke er ligeglade med jeres kunder. :-)

  3. Tak for svaret

    Kunne dog også være fedt med en mail ved driftsforstyrrelser – eller muligheden for at modtage mails vedr. driftsforstyrrelser.

  4. Driftsforstyrrelser er altid ærgelige. Jeg synes dog at det var positivt at se jer (Unoeuro) holde os opdateret under hele forløbet.

  5. Jeg er ikke kunde, men kigger jævnligt af interesse…

    Det er fandme professionelt håndteret af en udbyder.
    Ja 12 timers drift udfald er super ærgeligt, men chancen for at gå fuldstændig ned og starte rebuild ville være en chance at tage… forstår godt at det blev håndteret på denne måde.

  6. Man kan aldrig helgardere sig imod software fejl, men man kan helgardere sig imod dårlige udbydere. Derfor er jeg her hos UnoEuro.

    helt iorden service, og hellere lidt nedetid på emailen, end at miste alle data.

Lukket for kommentarer.