Backup med rsync til egeneid remote backupmaskin
rsync (remote synchronization) er et terminalbasert program som i sin enkleste form kopierer filer fra en lokal maskin til en remote maskin. Hvis filene først er kopiert over, og så endres på den lokale maskinen, kan rsync kjøres på nytt og kopiere over kun endringene. Man kan bruke dette til å lage et script (enkelt program) som tar backup av filserveren på kontoret til en maskin som står hjemme hos en ansatt. rsync må være installert på både kildemaskinen og målmaskinen for at dette skal fungere.
psdigital har et egenutviklet backupscript psbup.sh
for å sette opp denne type backup.
Fordi originalen og backupen er plassert på to forskjellige geografiske lokasjoner er man beskyttet mot det meste - diskkrasj, tyveri, brann, oversvømmelse etc. Og selvsagt sletting av fil ved feiltakelse. rsync gjør inkrementelle backuper - dvs bare forskjellene i dataene siden forrige backup kopieres over. Dermed kopierer hver backupjobb så lite data som mulig - det tar kortere tid å kopiere over nettverket og krever mindre lagringsplass.
rsync følger med Linux maskiner og Linux-baserte maskiner som Synology, samt Apple Macintosh (som er basert på UNIX - opphavet til Linux). rsync kan også installeres på Windows-maskiner. For en introduksjon til rsync og Synology, se Synology rsync daemon og Synology rsync over SSH.
Det må alltid gjøres en initiell backup - den første backupen som kopiere alle dataene fra filserveren over til backupmaskinen. Slik at man har et startpunkt for inkrementelle backups. Denne første kjøringen gjøres gjerne med filserver og backupmaskin på samme nettverk, typisk kontornettverket. Og man bruker rsync daemon istedenfor rsync over SSH. Når inkrementell backup er ferdig, fraktes backupmaskinen dit den skal stå permanent, for eksempel hjemme hos en ansatt. Inkrementelle backups kjører med rsync over SSH - fordi dataene transporteres over internett, og da bør de være kryptert.
Med store mengder data kan man spare mange timer på å kjøre den initielle jobben med rsync daemon istedenfor SSH. Eksempel: en jobb som tar et døgn med rsync over SSH reduseres til rundt 6 timer med rsync daemon. Og hadde man kjørt den initielle jobben over internett istedenfor å ha begge maskiner på samme nettverk, kunne det tatt en måned!
En annen måte å gjøre den initielle backupen er å bruke en ekstern harddisk (for eksempel med USB tilkopling). Hovedfordelen er at den er enkel å flytte. Og det er også enklere å konfigurere den inkrementelle backupen fordi alt foregår på samme maskin - og ikke på ett nettverk. Man begynner med å kople den eksterne harddisken til kildemaskinen. Alle dataene kopieres over til ekstern harddisk med et eget rsync-script. Deretter fraktes den eksterne harddisken til bygningen der målmaskinen står og koples til målmaskinen. Enten kan man bruke et nytt, eget script til å kopiere dataene fra den eksterne harddisken til intern harddisk på målmaskinen, og kjøre inkrementelle backups mot denne interne harddisken. Eller man lar den eksterne harddisken være koplet på målmaskinen permanent, og kjører inkremetelle backups mot denne.
Fordeler med denne måten å ta backup på:
- Man har hele tiden full kontroll på egne data. Alt lagres på egne maskiner, istedenfor i en skyløsning - der det er uoversiktlig hvor dataene lagres geografisk, hvem som har tilgang, osv.
- Restore av store mengder data kan gjøres raskere. Restore av store mengder data tar lang tid dersom dataene skal lastes ned over internett. Med denne måten å ta backup på kan man dra hjem til den som har backupen stående hos seg, hente maskinen eller den eksterne harddisken, dra tilbake til kontoret og gjøre restore på det lokale nettverket (eller over en USB-tilkopling). Ved restore av store mengder data er dette en betydelig fordel - og noen ganger eneste mulighet, fordi ellers kan det ta ukevis. Alternativt må sky-leverandøren preparere en ekstern harddisk med dataene og sende denne med et budfirma.
- Ved lagring av sensitive data kan det være juridiske restriksjoner på hvor dataene kan lagres geografisk, krypteringsnivå etc. Slike hensyn kan det være enklere å ivareta når man selv eier maskinene og vet hvordan alt er satt opp.
- Ingen kostnad for leie av skyløsning.
Bakdeler med denne måten å ta backup på:
- Mer komplisert og tidkrevende å sette opp.
- Restore av data over internett er mer komplisert. Eksempelvis restore av en fil som ble slettet ved en feiltakelse. Dette kan endres i nye versjoner av backup-scriptet, dvs når vi får et GUI.
- Man må skaffe egen backupmaskin - men dette kan være en billig Linuxmaskin. Og en ansatt eller annen person du stoler på med internettabonnement.
- Lisenskostnad
Referanser
- Wikipedia rsync
https://en.wikipedia.org/wiki/Rsync