Làm thế nào để lưu một bản sao của trang web và đâu là nơi tốt nhất để làm điều đó?

Mục lục:

Làm thế nào để lưu một bản sao của trang web và đâu là nơi tốt nhất để làm điều đó?
Làm thế nào để lưu một bản sao của trang web và đâu là nơi tốt nhất để làm điều đó?
Anonim

Hãy tưởng tượng tình huống: bạn đang tạo một trang web. Thuê quản trị viên web hoặc tự mình làm việc đó, tiêu tốn nhiều tiền bạc và thời gian cá nhân cho việc đó. Bạn lưu trữ đứa con tinh thần của mình và điền đầy đủ thông tin vào nó mà không cần nghĩ đến việc phải lưu một bản sao của trang web để không bị mất dữ liệu.

Một ngày, không quá tuyệt vời đối với bạn, bạn truy cập trang web của mình, nhưng nó không hoạt động. Bạn bắt đầu tìm hiểu xem có chuyện gì, và, thật kinh hoàng, trung tâm dữ liệu bị cháy hoặc máy chủ lưu trữ đã ngừng hoạt động. Hoặc có thể một vi-rút đã xâm nhập và phá hủy dữ liệu của bạn. Việc mất thông tin trên một trang web có thể so sánh với việc mất thông tin trên máy tính. Vậy làm cách nào để bạn giữ một bản sao của trang web?

cách lưu bản sao của một trang web vào máy tính
cách lưu bản sao của một trang web vào máy tính

Hãy giải quyết định nghĩa trước. Quá trình lưu trữ trang web là việc lưu giữ phiên bản hiện tại của một trang hoặc trang web trong kho lưu trữ để làm việc với nó sau này. Đối với những mục đích này, phần mềm chuyên dụng được sử dụng. Công ty lớn nhất trên thế giới là Internet Archive, chúng ta sẽ thảo luận bên dưới.

Đối với một kho lưu trữ riêng tư, bạn có thể sử dụng các trình duyệt ngoại tuyến được thiết kế đặc biệt để hoạt động ngoại tuyến. Họ sẽ giúp tạo rabản sao cục bộ của các trang web riêng lẻ hoặc toàn bộ các trang web. Chúng bao gồm, ví dụ:

  • Trình duyệt HTTrack đa nền tảng hỗ trợ 29 ngôn ngữ thế giới và có thể tiếp tục tải xuống bị gián đoạn, cập nhật trang nhân bản.
  • Chia sẻ ngoại tuyến miễn phí Explorer, cho phép bạn tải xuống không chỉ các tệp hoặc trang mà còn toàn bộ trang web từ Internet qua FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
  • Trình quản lý tải xuống Trình quản lý tải xuống miễn phí. Nó tích hợp với tất cả các trình duyệt, có FTP tích hợp, hỗ trợ giao thức BitTorrent, có thể tạo tệp torrent, chặn liên kết từ clipboard.
  • Teleport Pro mã nguồn đóng cho Windows. Chương trình cho phép bạn tải xuống toàn bộ trang web.
  • Một chương trình không tương tác dựa trên bảng điều khiển miễn phí để tải xuống các tệp và trang web từ Internet Wget. Chương trình hỗ trợ các giao thức HTTPS, HTTP, FTP và cũng có thể hoạt động thông qua một máy chủ proxy HTTP. Thích hợp cho Linux.
bản sao lưu của trang web google
bản sao lưu của trang web google

Tạo bản sao lưu trên hosting

Bạn có thể thiết lập sao lưu trang web trên nhà cung cấp dịch vụ lưu trữ của mình. Để thực hiện việc này, bạn cần vào bảng quản trị, đến phần tạo bản sao lưu. Mỗi nơi lưu trữ đều có bảng quản trị riêng và thật khó để nói chính xác nơi lưu trữ phần này của bạn. Nếu bạn không thể tìm ra, hãy viết thư cho bộ phận hỗ trợ kỹ thuật.

cách mở một bản sao đã lưu của một trang web
cách mở một bản sao đã lưu của một trang web

Tạo bản sao lưu với các plugin

Nếu trang web của bạn được lưu trữ trên nền tảng CMS, chẳng hạn như,WordPress, bạn có thể lưu bản sao trang web của mình bằng cách cài đặt plugin wp-db-backup (www.wordpress.org/plugins/wp-db-backup/) hoặc tương tự. Bằng cách định cấu hình đúng plugin, bạn sẽ nhận được một bản sao lưu trang web hàng ngày hoặc hàng tuần, như bạn muốn.

Cách lưu bản sao của trang web vào máy tính của bạn

Bạn có thể lưu trang web vào máy tính của mình bằng ứng dụng FTP. Nếu bạn sử dụng chương trình FileZilla, hãy tạo thư mục "Sao lưu" trên máy tính của bạn (tên thư mục có thể là bất kỳ thứ gì). Kết nối với máy chủ thông qua ứng dụng FTP và chỉ cần kéo và thả để tạo bản sao lưu đầy đủ của trang web vào thư mục "Backup".

Bên cạnh đó, bạn có thể sử dụng dịch vụ Site2ZIP (lưu trữ trang web), một chương trình để tải xuống WinHTTrack WebSite Copier. Làm thế nào để xem bản sao đã lưu của trang web? Để thực hiện việc này, hãy mở thư mục nơi lưu trang web và nhấp vào tệp index.html.

cách xem bản sao đã lưu của trang web
cách xem bản sao đã lưu của trang web

Lưu trữ Internet

Tại San Farncisco, năm 1996, Brewster Cale thành lập Tổ chức lưu trữ Internet phi lợi nhuận. Nó thu thập các bản sao của tất cả các trang web, bản ghi âm thanh và video, các tệp đồ họa và chương trình. Kho lưu trữ của tài liệu thu thập được được lưu trữ ở đây trong một thời gian rất dài và mọi người đều có quyền truy cập miễn phí vào cơ sở dữ liệu của nó.

Nếu bạn đang băn khoăn về cách mở bản sao đã lưu của một trang web, hãy truy cập archive.org/web/ và nhập địa chỉ của trang web hoặc trang đó vào trường thích hợp. Vào cuối năm 2012, Kho lưu trữ trên Internet là 10 petabyte - tức là 10.000 terabyte! Và đến giữa năm 2016, nó đã tích lũy được 502 tỷ bản.các trang web.

Lưu vào bộ nhớ cache của trang web bởi các công cụ tìm kiếm

Bản sao đã lưu của trang web Google chỉ là bộ nhớ cache của các trang của trang web được tạo bởi công cụ tìm kiếm. Bất kỳ người dùng nào cũng có thể sử dụng một bản sao của trang cho nhu cầu của họ bất kỳ lúc nào. Lưu trữ chúng trên các máy chủ của công cụ tìm kiếm tốn rất nhiều tài nguyên và rất nhiều tiền được phân bổ cho việc này, nhưng sự trợ giúp như vậy sẽ tự trả giá, vì chúng ta vẫn sử dụng các công cụ tìm kiếm. Đúng, phương pháp này chỉ phù hợp với các trang hiện có hoặc những trang đã bị xóa gần đây. Nếu điều này xảy ra đã lâu, thì công cụ tìm kiếm sẽ xóa dữ liệu.

Công cụ tìm kiếm chuyên biệt

Ngoài việc bạn có thể tìm kiếm các trang được lưu trong bộ nhớ cache theo cách thủ công trong Google hoặc Yandex, bạn có thể sử dụng công cụ tìm kiếm chuyên biệt là cachedview.com. Nó có một tương tự: cachedpages.com.

Nếu bạn muốn lưu một bản sao của trang web hoặc trang cá nhân của nó, bạn có thể tự làm và miễn phí tại archive.is. Ngoài ra, cũng có một tìm kiếm toàn cầu cho các phiên bản đã từng được người dùng lưu.

lưu một bản sao của trang web
lưu một bản sao của trang web

Tạo kho lưu trữ web trong các thư viện quốc gia

Ngày nay, các thư viện quốc gia đang phải đối mặt với nhiệm vụ tạo ra các kho lưu trữ tài liệu Internet, một phần của di sản khoa học, văn hóa và lịch sử của nhân loại. Nhưng điều này rất có vấn đề.

Các nghiên cứu đã chỉ ra rằng số lượng tài liệu web trên Web đang tăng lên theo cấp số nhân và trung bình một tài liệu tồn tạitừ một đến bốn tháng. Thuận tiện nhất là sử dụng trang web như một đơn vị tài khoản cho kho lưu trữ tài liệu web. Quá trình tạo quỹ là tạo một bản sao hoặc "bản sao" của trang web. Vì thông tin trên đó thay đổi theo thời gian, nên thư viện cần tạo các bản sao của cùng một trang web theo định kỳ.

Như vậy, có 60.000 trang web ở Thụy Điển, gấp 20 lần số lượng ấn phẩm báo in truyền thống. Các bản sao của các tài liệu in trong thư viện Thụy Điển chiếm 1,7 km giá sách mỗi năm. Một kho lưu trữ web sẽ lấp đầy 25 km giá sách! Hiện kho lưu trữ của họ chứa 138 triệu tệp với tổng trọng lượng là 4,5 gigabyte.

Internet đang phát triển mỗi ngày. Có nhiều công ty và trang web lưu ý giữ bản sao của các trang web trong kho lưu trữ của họ. Nhưng đừng dựa vào chúng một mình. Thực hiện sao lưu kịp thời và bạn sẽ không bao giờ mất trang web của mình.

Đề xuất: