Change background image

TUTORIALS Auto Backup Server & Uploading to Google Drive,Amazon Drive,OneDrive,...

Discussion in 'Website & Server Administration' started by DannyTuan, Nov 15, 2017.

  1. DannyTuan

    DannyTuan Ban Quản Trị Staff Member Administrator

    Joined:
    Jun 10, 2000
    Messages:
    174
    Likes Received:
    0
    Trophy Points:
    16
    Gender:
    Male
    Location:
    Cần Thơ
    Rclone – Backup toàn bộ VPS lên Google Drive

    Trước đây mình vẫn dùng VPS để chứa các bản backup sử dụng công cụ Duplicity hoặc Rsync. Tuy nhiên, hiện giờ đã có một phương pháp mới hiệu quả hơn, tiết kiệm hơn (Free), đó là sao lưu lên Cloud với Rclone.

    [​IMG]

    Rclone là một công cụ đồng bộ hóa dữ liệu tương tự Rsync nhưng lại được tập trung phát triển chức năng kết nối với các dịch vụ lưu trữ đám mây.

    Ưu điểm của việc sử dụng dịch vụ lưu trữ đám mây đó là tốc độ cao (do có server được đặt trên khắp thế giới), an toàn dữ liệu (không lo ngại các vấn đề phần cứng, network) và nhất là hầu hết đều Free. Mình đặc biệt thích những thứ Free!

    Rclone hỗ trợ rất nhiều dịch vụ Cloud thông dụng như:
    • Google Drive
    • Amazon S3
    • Openstack Swift / Rackspace cloud files / Memset Memstore
    • Dropbox
    • Google Cloud Storage
    • Amazon Drive
    • Microsoft OneDrive
    • Hubic
    • Backblaze B2
    • Yandex Disk
    • SFTP
    • The local filesystem

    Giờ thay vì backup đưa lên VPS khác để lưu trữ, mình chuyển sang sử dụng Google Drive, dung lượng miễn phí 15GB, mua thêm cũng khá rẻ, chỉ 45k/tháng là được 100GB rồi. Bạn nào có tài khoản Google Apps miễn phí nữa thì càng tuyệt vời.

    Trong bài viết này sẽ có 2 phần chính, 1 là cài đặt Rclone trên VPS, 2 là sử dụng Rclone để upload backup lên Google Drive. Với những cloud service khác các bạn làm tương tự.

    Việc tạo file backup toàn bộ dữ liệu VPS mình đã hướng dẫn chi tiết trong bài viết Hướng dẫn tự động sao lưu toàn bộ VPS, bài viết này sẽ chỉ tập trung vào việc cài đặt tự động upload file nén lên Google Drive. Xem thêm hướng dẫn sử dụng Rclone với Google Drive và các dịch vụ cloud khác tại Rclone Docs.

    Kịch bản tự động backup như sau:
    • Sao lưu toàn bộ database MySQL, mỗi database một file .gz
    • Sao lưu toàn bộ code trong thư mục /home/domain.com/public_html/
    • Sao lưu toàn bộ cấu hình Nginx trong thư mục /etc/nginx/conf.d/
    • Tổng hợp tất cả dữ liệu vào 1 folder
    • Upload file backup lên Google Drive vào lúc 2h00 sáng
    • Tự động xóa file backup trên VPS sau khi upload xong, xóa file backup trên Cloud nếu quá 2 tuần
    I. Hướng dẫn cài đặt Rclone
    1. Cài đặt Rclone
    Rclone là một chương trình dòng lệnh nên mình sẽ down xuống rồi di chuyển file chạy đến thư mục /usr/sbin/ của VPS để sử dụng sau này.
    – Cài đặt với phiên bản hệ điều hành Linux 64bit
    Code:
    cd /root/
    wget http://downloads.rclone.org/rclone-v1.36-linux-amd64.zip
    unzip rclone-v1.36-linux-amd64.zip
    \cp rclone-v*-linux-amd64/rclone /usr/sbin/
    rm -rf rclone-*
    – Cài đặt với phiên bản hệ điều hành Linux 32bit
    Code:
    cd /root/
    wget http://downloads.rclone.org/rclone-v1.36-linux-386.zip
    unzip rclone-v1.36-linux-386.zip
    \cp rclone-v*-linux-386/rclone /usr/sbin/
    rm -rf rclone-*
    2. Một số câu lệnh thông dụng
    Các câu lệnh sử dụng Rclone thường có dạng như sau:
    Code:
    rclone command <parameters> <parameters...>
    Trong đó command là câu lệnh, parameters là các tham số.

    Một số lệnh thông dụng khi dùng Rclone:
    • rclone config – Cấu hình kết nối đến dịch vụ cloud.
    • rclone copy – Copy files từ server đến cloud, skip nếu đã tồn tại dữ liệu.
    • rclone sync – Synchronize giữa server và cloud, chỉ update dữ liệu trên cloud mà thôi.
    • rclone move – Move files từ server lên cloud.
    • rclone delete – Xóa dữ liệu của folder.
    • rclone purge – Xóa dữ liệu của folder và toàn bộ nội dung bên trong.
    • rclone mkdir – Tạo folder.
    • rclone rmdir – Xóa folder trống tại đường dẫn.
    • rclone rmdirs – Xóa toàn bộ folder trống tại đường dẫn.
    • rclone check – Kiểm tra dữ liệu server và cloud có đồng bộ hay không.
    • rclone ls – Liệt kê toàn bộ dữ liệu gồm size và path.
    • rclone lsd – Liệt kê toàn bộ thư mục.
    • rclone lsl – Liệt kê toàn bộ dữ liệu gồm modification time, size và path.
    • rclone size – Trả về kích thước thư mục.
    II. Backup VPS lên Cloud với Rclone
    1. Tạo kết nối với Google Drive
    Đầu tiên chúng ta sẽ cấu hình kết nối Rclone với Google Drive, việc này chỉ phải làm 1 lần duy nhất. Kết nối được tạo tên remote

    Kết nối SSH với VPS rồi chạy lệnh:
    Code:
    rclone config
    Bạn sẽ nhận được thông báo: No remotes found - make a new one, nhập n rồi nhấn Enter để tạo kết nối mới.

    Ở dòng name bạn nhập remote để đặt tên cho kết nối, bạn có thể chọn tên nào cũng được.

    Một danh sách các dịch vụ cloud xuất hiện, hãy chọn số 7, Google Drive rồi nhấn Enter.

    Ở 2 dòng tiếp theo client_id và client_secret, bạn hãy để trống nhấn Enter.

    Khi được hỏi Use auto config? hãy nhập n rồi nhấn Enter. Ngay lập tức, Rclone sẽ đưa ra một đường link, bạn có thể click thẳng vào đó hoặc copy rồi paste vào trình duyệt.

    [​IMG]

    Giao diện sẽ xuất hiện như sau:

    [​IMG]

    Nhấn nút Allow để đồng ý, sau đó bạn sẽ nhận được đoạn mã verification code như hình dưới:

    [​IMG]

    Quay trở lại cửa sổ SSH, copy rồi paste code này vào dòng Enter verification code> rồi nhấn Enter.

    Rclone cần xác nhận thông tin một lần nữa, bạn nhấn y để đồng ý rồi nhấn q để thoát khỏi giao diện cấu hình kết nối.

    Toàn bộ quá trình cài đặt sẽ tương tự như sau:
    Code:
    No remotes found - make a new one
    n) New remote
    r) Rename remote
    c) Copy remote
    s) Set configuration password
    q) Quit config
    n/r/c/s/q> n
    name> remote
    Type of storage to configure.
    Choose a number from below, or type in your own value
     1 / Amazon Drive
       \ "amazon cloud drive"
     2 / Amazon S3 (also Dreamhost, Ceph, Minio)
       \ "s3"
     3 / Backblaze B2
       \ "b2"
     4 / Dropbox
       \ "dropbox"
     5 / Encrypt/Decrypt a remote
       \ "crypt"
     6 / Google Cloud Storage (this is not Google Drive)
       \ "google cloud storage"
     7 / Google Drive
       \ "drive"
     8 / Hubic
       \ "hubic"
     9 / Local Disk
       \ "local"
    10 / Microsoft OneDrive
       \ "onedrive"
    11 / Openstack Swift (Rackspace Cloud Files, Memset Memstore, OVH)
       \ "swift"
    12 / SSH/SFTP Connection
       \ "sftp"
    13 / Yandex Disk
       \ "yandex"
    Storage> 7
    Google Application Client Id - leave blank normally.
    client_id>
    Google Application Client Secret - leave blank normally.
    client_secret>
    Remote config
    Use auto config?
     * Say Y if not sure
     * Say N if you are working on a remote or headless machine or Y didn't work
    y) Yes
    n) No
    y/n> n
    If your browser doesn't open automatically go to the following link: https://accounts.google.com/o/oauth2/auth
    Log in and authorize rclone for access
    Enter verification code> x/xxxxxxxxx-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
    --------------------
    [remote]
    client_id =
    client_secret =
    token = {"access_token":"xxxx.xxxxx-xxxxxxxxxxxxxxx_xxxxxxxxxx-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx","token_type":"Bearer","refresh_token":"1/xxxxxxxxxxxxxxxx_xxxxxxxxxxxxxxxxxxxxxxxxxx","expiry":"2016-09-12T00:12:53.66619724-04:00"}
    --------------------
    y) Yes this is OK
    e) Edit this remote
    d) Delete this remote
    y/e/d> y
    Current remotes:
    
    Name Type
    ==== ====
    remote drive
    
    e) Edit existing remote
    n) New remote
    d) Delete remote
    r) Rename remote
    c) Copy remote
    s) Set configuration password
    q) Quit config
    e/n/d/r/c/s/q> q
    Đoạn nào bôi đỏ là cần nhập input
    Vậy là xong, giờ bạn có thể test thử kết nối với lệnh: rclone lsd remote:

    Nếu không có vấn đề gì sẽ có output tương tự như bên dưới:
    [​IMG]

    Tài khoản Google Drive này của mình mới tạo, chưa upload gì lên, chỉ có file mặc định Getting started.

    2. Tạo kết nối với AmazonDrive/OneDrive/Yandex
    Hiện nay, bên cạnh GG Drive, các Cloud khác cũng dần trở nên phổ biến và có nhiều ưu đãi cho người dùng. Việc tạo kết nối tới Amazon Drive/OneDrive/Yandex tương tự GG Drive, chỉ khác biệt bước lấy access_token.

    Việc xác thực được thực hiện qua remote machine có trình duyệt (ví dụ máy tính của bạn) với lệnh rclone authorize "tên_cloud".

    Mình chỉ ví dụ cụ thể OneDrive, đến bước xác thực:
    Code:
    Remote config
    Use auto config?
     * Say Y if not sure
     * Say N if you are working on a remote or headless machine
    y) Yes
    n) No
    y/n> n
    For this to work, you will need rclone available on a machine that has a web browser available.
    Execute the following on your machine:
           rclone authorize "onedrive"
    Then paste the result below:
    result>
    Rclone yêu cầu chạy lệnh rclone authorize "onedrive" tại máy đang sử dụng để lấy access_token.

    1. Tải Rclone về máy cá nhân (bản cho Windows/OSX) tại Rclone Downloads. Cụ thể, Windows AMD64 – 64 Bit được file rclone-v1.36-windows-amd64.zip. Bên trong có file rclone.exe để chạy trên cửa sổ lệnh. Ví dụ đường dẫn file D:\Rclone/rclone.exe
    2. Mở ứng dụng CMD của Windows (Run -> cmd) rồi chạy rclone authorize "onedrive" với đường dẫn file. Khi đó, lệnh sẽ tương tự D:\Rclone\rclone.exe authorize "onedrive"
    3. Browser bật ra yêu cầu bạn đăng nhập để xác thực. Thành công sẽ hiện thông báo Success. Go back to rclone to continue trên trình duyệt. Quay lại ứng dụng CMD bạn copy access_token để xác thực bên VPS.
    [​IMG]
    Chú ý, khi copy access_token từ CMD bạn paste qua trình edit text (EmEditor/Notepad++) để loại bỏ hoàn toàn các kí tự thừa gây cách dòng. Khi đó, access_token chỉ là 1 chuỗi kí tự liền mạch duy nhất(dạng {"access_token":"..."expiry":"..."}).​

    3. Script backup toàn bộ VPS và upload lên Cloud
    – Tạo file backup.sh ở thư mục /root/
    Code:
    nano /root/backup.sh
    – Copy toàn bộ nội dung script bên dưới rồi paste vào (áp dụng với HocVPS Script 2.0 trở lên)
    Code:
    #!/bin/bash
    
    SERVER_NAME=DannyServerBackup
    
    TIMESTAMP=$(date +"%F")
    BACKUP_DIR="/root/backup/$TIMESTAMP"
    MYSQL_USER="root"
    MYSQL=/usr/bin/mysql
    MYSQL_PASSWORD="password"
    MYSQLDUMP=/usr/bin/mysqldump
    SECONDS=0
    
    mkdir -p "$BACKUP_DIR/mysql"
    
    echo "Starting Backup Database";
    databases=`$MYSQL -e "SHOW DATABASES;" | grep -Ev "(Database|information_schema|performance_schema|mysql)"`
    
    for db in $databases; do
       $MYSQLDUMP --force --opt --databases $db | gzip > "$BACKUP_DIR/mysql/$db.gz"
    done
    echo "Finished";
    echo '';
    
    echo "Starting Backup Website";
    # Loop through /home directory
    for D in /home/*; do
       if [ -d "${D}" ]; then #If a directory
           domain=${D##*/} # Domain name
           echo "- "$domain;
           zip -r $BACKUP_DIR/$domain.zip /home/$domain/public_html/ -q -x /home/$domain/public_html/wp-content/cache/**\* #Exclude cache
       fi
    done
    echo "Finished";
    echo '';
    
    echo "Starting Backup Nginx Configuration";
    cp -r /etc/nginx/conf.d/ $BACKUP_DIR/nginx/
    echo "Finished";
    echo '';
    
    size=$(du -sh $BACKUP_DIR | awk '{ print $1}')
    
    echo "Starting Uploading Backup";
    /usr/sbin/rclone move $BACKUP_DIR "remote:$SERVER_NAME/$TIMESTAMP" >> /var/log/rclone.log 2>&1
    # Clean up
    rm -rf $BACKUP_DIR
    /usr/sbin/rclone -q --min-age 2w delete "remote:$SERVER_NAME" #Remove all backups older than 2 week
    /usr/sbin/rclone -q --min-age 2w rmdirs "remote:$SERVER_NAME" #Remove all empty folders older than 2 week
    echo "Finished";
    echo '';
    
    duration=$SECONDS
    echo "Total $size, $(($duration / 60)) minutes and $(($duration % 60)) seconds elapsed."
    Lưu ý:
    • Script trên sẽ back up toàn bộ database, mỗi database nén thành một file .gz, lưu trong thư mục mysql
    • Mỗi thư mục chứa website được nén lại thành 1 file .zip
    • Toàn bộ cấu hình Nginx của các website được lưu trong thư mục nginx
    • SERVER_NAME mặc định là DannyServerBackup, nếu muốn thay đổi folder trên Cloud bạn hãy thay đổi tham số này.
    • Muốn điều chỉnh thời gian xóa file backup, bạn sửa thông số ở dòng delete và rmdirs. Cụ thể, chuyển 2w thành xd (ngày) hoặc xw (tuần) tùy theo nhu cầu.
    – Nhấn Ctrl+O, Enter để lưu và Ctrl+X để thoát.

    – Phân quyền cho script
    Code:
    chmod +x /root/backup.sh
    – Vậy là xong rồi đó, giờ bạn có thể test lại bằng cách chạy lệnh:
    Code:
    /root/backup.sh
    Thử kiểm tra trên Cloud xem có thư mục mới với dữ liệu backup chưa nhé, hoặc test với lệnh rclone lsd remote:

    4. Tạo cronjob tự động backup hàng ngày
    Giờ mình sẽ cho script tự động chạy lúc 2h00 sáng.
    Code:
    EDITOR=nano crontab -e
    Dán nội dung sau vào cửa sổ Terminal
    Code:
    0 2 * * * /root/backup.sh > /dev/null 2>&1
    Nhấn Ctrl+O, Enter để lưu và Ctrl+X để thoát

    Vậy là xong, cứ 2h sáng hàng ngày script sẽ tự động chạy, backup toàn bộ dữ liệu của VPS rồi upload lên Cloud. Đồng thời, dữ liệu backup trên VPS sẽ được xóa luôn sau khi upload xong.
    III. Tải file backup từ Cloud xuống VPS
    Cách đơn giản nhất để bạn khôi phục lại dữ liệu đó là tải file backup từ Cloud xuống máy tính, rồi tùy theo nhu cầu mà up trở lại lên VPS.

    Tuy nhiên, nếu muốn tải trực tiếp file backup về VPS, bạn có thể sử dụng luôn Rclone với câu lệnh copy.

    Ví dụ tham khảo:
    Code:
    rclone copy "remote:/DannyServerBackup/2017-10-03" /root/
    Lệnh trên sẽ copy folder 2017-11-01 trong thư mục DannyServerBackup trên Cloud về thư mục /root/ của VPS. Tốc độ upload và download từ Cloud đều rất nhanh.
    Sau khi copy dữ liệu backup về VPS, bạn tiến hành giải nén file zip, copy thư mục web và nginx về đúng vị trí đồng thời tiến hành import database.

    IV. Tổng kết
    Công việc backup VPS/Server là việc vô cùng quan trọng, mình đã từng mất toàn bộ dữ liệu không khôi phục được do ấn nhầm Rebuild và chủ quan không backup. Hi vọng với bài hướng dẫn chi tiết này, các bạn sẽ có thêm phương pháp mới tiết kiệm và hiệu quả hơn.
     

Share This Page