Thứ Ba, 4 tháng 9, 2012

Hướng Dẫn của EFF (Electronic Frontier Foundation) Để Giữ Trang Web Sống Còn

Nguồn nofirewall

Electronic Frontier Foundation 
2012/09/03

BBT No Firewall: Nhiều trang dân báo thường xuyên bị tin tặc đánh sập và một số trường hợp cho thấy các cuộc tấn công đến từ chính quyền Hà Nội.  Đây là một cách kiểm duyệt Internet và ngăn chặn các tiếng nói và thông tin độc lập. Thông thường các trang dân báo thuộc về cá nhân hoặc những tổ chức nhỏ, nên ít khi có khả năng kỹ thuật để đối phó. Để giúp giới blogger và dân báo Việt Nam, Blog No Firewall đã hợp tác với tổ chức chuyên bảo vệ tự do Internet, Electronic Frontier Foundation , để dịch hướng dẫn hữu ích này. Mời các bạn cùng phổ biến rộng để nhiều người cùng áp dụng. 

Popout


Ngày càng nhiều nhóm khác nhau dùng dịch vụ từ chối (DoS) và dịch vụ từ chối phân tán (DDoS) để tấn công máy chủ -- từ giới hoạt động cho đến chính quyền -- nhằm tê liệt một trang web tạm thời hoặc vĩnh viễn. Thường thì tấn công bằng cách gởi tràn ngập yêu cầu làm cho máy chủ bị nghẽn đường băng thông, khiến cho máy chủ không thể đáp ứng được các yêu cầu chính thống khác.

Các trang web lớn thường có đủ nguồn lực và kiến thức để chống đở hoặc ngăn ngừa các cuộc tấn công, nhưng các trang web nhỏ - chẳng hạn như các trang của giới truyền thông độc lập nhỏ hoặc tổ chức nhân quyền - đôi khi bị tê liệt thường trực vì họ không đủ nguồn lực hoặc kiến thức chống đỡ.
Hướng dẫn này nhằm trợ giúp các trang web chọn dịch vụ lưu trữ web, cũng như hướng dẫn cách lập trang sao (mirroring) và sao lưu trang web để nội dung vẫn còn, ngay cả khi trang web bị đánh sập bởi các cuộc tấn công DoS hay DDoS.

1. Chọn dịch vụ lưu trữ web

Có ba loại dịch vụ căn bản lưu trữ web bạn có thể chọn:

Dịch vụ Lưu trữ Web (hosted service) là các dịch vụ cho bạn mở tài khoản và bắt đầu soạn nội dung. Những dịch vụ này bao gồm Blogger  và WordPress .

Dịch vụ Lưu trữ Web Chung (shared hosting) là các công ty cung cấp máy chủ cho phép lưu trữ trang web của khách hàng và thường thì họ cho bạn phần mềm quản trị tài khoản, thí dụ như cPanel. Khi dùng dịch vụ lưu trữ web chung, bạn cần tự mình cài đặt và cấu hình trang web, nhưng công ty đó sẽ lo quản trị máy chủ cho bạn. Những công ty loại này bao gồm Dreamhost  và Bluehost .

Sau cùng, Máy chủ Tự quản lý (self-hosted server) là những máy chủ bạn tự quản trị lấy. Loại này bao gồm máy chủ riêng ảo (Virtual Private Servers (VPS)) và máy chủ thật trong các trung tâm dữ kiện. Máy chủ tự quản lý thường là giải pháp tốt nhất cho các tổ chức có nhu cầu đặc thù cho trang web, tuy nhiên nó đòi hỏi phải có người quản trị hệ thống và thiết lập web. Bảo vệ máy chủ tự quản lý để chống tấn công DDoS là một đề tài ra khỏi phạm vi của hướng dẫn này.

Mỗi loại dịch vụ lưu trữ web có những lợi thế và trở ngại của chúng.

Dịch vụ Lưu trữ Web

Lợi thế:

  • Dễ dàng -- không cần có khả năng kỹ thuật chuyên môn.
  • Miễn phí!
  • Công ty lớn cung cấp dịch vụ này có các máy chủ ổn định, an toàn và có khả năng chống đỡ tấn công DDoS.
  • Cập nhật, an ninh, chống đỡ DDoS là trách nhiệm của nơi cung cấp dịch vụ (mặc dầu bạn vẫn có trách nhiệm bảo vệ trang của mình bằng một mật khẩu chắc chắn).

Trở ngại:

  • Các dịch vụ này thường có chính sách về nội dung, có thể không phù hợp với trang web của bạn.
  • Bạn không chủ động được các định dạng nền (theme) và phần bổ trợ (plugins) nào có thể sử dụng với trang web.
  • Nếu trang web bạn cần những hình thức nội dung phức tạp hơn là chỉ đăng bài/trang blog, dịch vụ này có thể không phù hợp.
Trình độ kỹ thuật đòi hỏi để thiết lập: Thấp. Nếu bạn dùng được Facebook, thì bạn có thể dùng dịch vụ lưu trữ web.

Đối phó với DDOS: Bạn không chủ động việc này, nhưng công ty cung cấp dịch vụ sẽ giúp bạn.

Thí dụ: Blogger, Wordpress.com, Maktoob, LiveJournal, Tumblr, Posterous.

Công Ty Cung Cấp Dịch Vụ Lưu Trữ Web Chung

Lợi thế:

  • Sau khi cài đặt CMS, bạn có thể cài bất cứ định dạng nền và plugins nào bạn muốn, luôn cả plugin an ninh và sao lưu tự động, hay plugin tự chế riêng cho trang bạn.
  • Công ty cung cấp dịch vụ chịu trách nhiệm cập nhật máy chủ.

Trở ngại:

  • Tốn tiền (khoảng $10/tháng).
  • Bạn chịu trách nhiệm cập nhật CMS và plugin. Nếu không cập nhật kịp lúc thì trang web có thể bị xâm nhập.
  • Vì cùng chung một máy chủ với các trang web khác, nếu các trang kia có vấn đề an ninh thì có thể bạn bị vạ lây.

Trình độ kỹ thuật đòi hỏi để thiết lập: Trung bình. Bạn cần biết sử dụng phần mềm quản lý tài khoản, biết dùng FTP/SFTP/SSH, và cài đặt và cấu hình một CMS.

Đối phó với DDOS:  

  • Bạn cần đảm bảo CMS của bạn dùng caching. Nếu bạn dùng Wordpress, EFF đề nghị dùng WP Super Cache plugin. Drupal thì đã có sẵn caching. Dùng caching để xử lý lưu lượng thông tin lớn.
  • Nếu bị tấn công DDoS, hy vọng là công ty cung cấp dịch vụ sẽ giúp bạn chống đỡ

Thí dụ: Dreamhost, Go Daddy, Yahoo, Host Gator, Bluehost, Just Host, iPage, FatCow.

Máy Chủ Tự Quản Lý

Lợi thế:

  • Bạn có thể cài đặt trang web theo đúng ý muốn của bạn.
  • Nếu bạn có đủ khả năng kỹ thuật, có thể dùng caching proxy chuyên biệt như Varnish  hay Spuid .
  • Nếu có khả năng kỹ thuật, bạn có thể thiết kế cân bằng tải (load balancer) để phân tán lưu lượng thông tin web ra nhiều máy chủ khác nhau. Đây là cách các trang web lớn như Facebook, Google, và Amazon làm để đứng vững ngay cả khi họ bị tràn ngập với một lưu lượng thông tin khổng lồ.

Trở ngại:

  • Đòi hỏi có người quản lý hệ thống và thiết kế chuyên nghiệp để bảo quản. 
  • Tốn kém hơn dịch vụ lưu trữ web chung.
  • Trình độ kỹ thuật đòi hỏi để thiết lập: Cao. Bạn cần có một người quản lý hệ thống chuyên nghiệp và cần người biết cách cài đặt và cấu hình CMS.

Thí dụ: Amazon EC2, Slicehost, trung tâm dữ kiện.

Chọn dịch vụ lưu trữ web
 
 

2. Sao Lưu
Popout


Một cách chuẩn bị phòng chống DDoS hoặc những tấn công khác là thường xuyên sao lưu nội dung trang web để bạn có thể phục hồi hoặc đem qua máy khác trong trường hợp dịch vụ lưu trữ web không bảo vệ được. Thường thì phục hồi một bản sao lưu tốn nhiều công nhưng vẫn đỡ hơn là thất thoát tất cả nội dung.
Để sao lưu trang web trên dịch vụ lưu trữ web, bạn hãy xuất ra toàn bộ các trang, bài vở, ý kiến vào một tập tin XML. Lưu ý là cách này chỉ sao lưu nội dung văn bản chữ của trang web mà thôi. Những nội dung khác, như là hình ảnh đã tải lên, sẽ không có trong bản sao lưu. Cách dễ nhất để có bản sao lưu của tất cả hình ảnh là làm một trang sao của trang web.
Để sao lưu trang web trên dịch vụ lưu trữ web chung (shared hosting) hoặc bạn có máy chủ riêng, hãy sao chép toàn bộ tập tin của trang web và giữ lại một phó bản của cơ sở dữ liệu.
Nếu bạn quản trị máy chủ của riêng bạn thì nên thiết lập sao lưu tự động qua một máy chủ khác từ xa. Các công cụ hữu dụng bao gồm ssh, scp, mysqldump và crontab. Hướng dẫn chi tiết để làm sao lưu tự động không nằm trong phạm vi của tài liệu này

Sao Lưu - Dịch Vụ Lưu trữ Web

Bạn có thể phòng bị việc tấn công trang web và ngăn ngừa thiệt hại phần nội dung bằng cách thường xuyên sao lưu và từ đó có thể phục hồi hoặc đem qua một hệ thống khác trong trường hợp dịch vụ lưu trữ web không bảo vệ được. Tuy tốn nhiều công sức để phục hồi bản sao lưu, nhưng việc này vẫn đỡ hơn là bị mất tất cả nội dung.

Để sao lưu trang web trên dịch vụ lưu trữ web, hãy xuất ra toàn bộ các trang, bài vở, ý kiến vào một tập tin XML. Lưu ý là cách này chỉ sao lưu nội dung văn bản chữ của trang web mà thôi. Những nội dung khác, như là hình ảnh đã tải lên, sẽ không có trong bản sao lưu. Cách dễ nhất để có bản sao lưu của tất cả hình ảnh là làm một trang sao của trang web (hướng dẫn chi tiết bên dưới).

Để sao lưu trang web trên dịch vụ lưu trữ web chung (shared hosting) hoặc bạn có máy chủ riêng, hãy sao chép toàn bộ tập tin của trang web và giữ lại một phó bản của cơ sở dữ liệu.

Xem hướng dẫn sau đây để sao lưu các bài đăng và ý kiến của trang web lưu trữ với dịch vụ Blogger, WordPress.com, Maktoob, LiveJournal, Tumblr hoặc Posterous. Không phải dịch vụ nào cũng dễ dàng thế này, và bản sao lưu bạn có cũng không phải trong dạng hữu dụng nhất. Tuy thế, trong trường hợp tệ hại xảy ra, tốt hơn hết là giữ các bản sao lưu để có thể phục hồi sau đó.

Blogger

Blogger  là dịch vụ blogging của Google. Để làm sao lưu, trước tiên đăng nhập vào tài khoản, rồi vào dashboard. Bấm chọn Settings trong menu thả xuống:

 

Bấm chọn Other trong Settings.

 



Bấm chọn "Export Blog" để xuất ra trang blog. Blogger cho phép bạn đem ra dưới dạng Blogger Atom mà dạng này có thể đem vào lại trong các dịch vụ blogging khác.

 

Bấm nút Download Blog để tải xuống bản sao lưu XML của trang blog.

WordPress.com

WordPress.com  là dịch vụ blog chạy trên hệ nguồn mở WordPress . Để làm bản sao lưu, đăng nhập vào tài khoản rồi vào dashboard.

 

Ở cột trái, gần dưới chót, bấm chọn Tools, rồi chọn Export trong menu pop-up

 

Chọn "All content" để xuất ra tất cả, rồi bấm nút Download Export File. Sau đó tất cả các bài vở, trang, ý kiến và các dữ kiện khác trong trang web WordPress sẽ được sao lưu. Nếu bạn muốn dời trang web từ WordPress.com qua một trang web WordPress mà bạn tự lưu trữ và quản trị thì đây là cách dễ nhất để chuyển nội dung qua.

Maktoob

Maktoob  của Yahoo là một trong những hệ thống blog dẫn đầu trong thế giới Á-rập. Để làm sao lưu trang web, hãy đăng nhập vào tài khoản và vào dashboard. Bấm chọn إدارة المحتويات để quản trị nội
dung web.

 

Rồi bấm تصدير để đến trang xuất (export).

 

Di chuyển xuống dưới chót và bấm تحميل ملف التصدير để giữ lại một bản sao lưu của trang web.

 

Bản sao lưu sẽ là dạng WordPress XML mà bạn có thể nhập vào lại Maktoob, WordPress.com hay một trang WordPress bạn tự lưu trữ riêng.

LiveJournal

LiveJournal  là một hệ thống blog lâu đời nhất. Tiếc là công cụ sao lưu của họ chỉ cho phép xuất ra mỗi lần có một tháng bài viết mà thôi. Để sao lưu, đăng nhập vào tài khoản LiveJournal và vào tranghttp://www.livejournal.com/export.bml  để xuất ra các bài viết theo từng tháng một.

 

Bạn cần điền vào năm trong ô "yyyy" và tháng trong ô "mm". Nếu muốn sao lưu tất cả bài viết đã từng đăng tải thì bạn phải làm từng tháng một. LiveJournal lưu giữ bản sao lưu trong dạng CSV mà bạn có thể mở ra xem bằng ứng dụng Microsoft Excel, LibreOffice Calc, hoặc lưu giữ dưới dạng XML.


Tumblr

Tumblr  là một dịch vụ blog phổ thông. Rất tiếc là không có cách nào để xuất trang blog ra qua giao diện web của họ vào thời điểm này. Tumblr có cung cấp một công cụ sao lưu trên trang Goodies  nhưng chỉ chạy trên hệ điều hành Mac OS X mà thôi.

Tumblr có cho phép truy cập API , do đó các lập trình viên có thể viết các đoạn mã để làm sao lưu trang web, tuy nhiên việc này vượt quá khả năng kỹ thuật của đa số người dùng. Tuy nhiên, có dịch vụ giúp bạn dời chuyển trang blog Tumblr qua WordPress, như dịch vụ tumblr2wp.com .

 

Điền vào tên miền của blog Tumblr của bạn, chọn cấu hình, bấm Export, và nó sẽ lưu giữ lại một tập tin XML mà có thể nhập vào WordPress. Dầu bạn không dự tính đổi qua dùng WordPress, cách này cũng là một cách hữu hiệu để làm bản sao lưu trang blog Tumblr.

 

Posterous

Cũng như Tumblr, Posterou s là một hệ thống blog phổ thông nhưng không cung cấp cách nào để làm sao lưu dữ kiện. Posterous có cho phép truy cập API , do đó các lập trình viên có thể viết các đoạn mã để làm sao lưu trang web, tuy nhiên việc này vượt quá khả năng kỹ thuật của đa số người dùng. Không có cách nào để sao lưu dữ kiện dễ dàng cho trang web Posterious ngoài việc lập ra các trang sao định kỳ.

Sao Lưu - Dịch Vụ Lưu trữ Web chung

Để sao lưu trang web trong dịch vụ lưu trữ web chung, bạn cần sao lưu các tập tin và cơ sở dữ liệu. Bạn cần một ứng dụng chuyển tập tin (file transfer) chạy trên máy vi tính để sao lưu tập tin, và bạn cần vào được trang quản lý tài khoản (control panel) để sao lưu cơ sở dữ liệu. Các dịch vụ lưu trữ web chung sử dụng các giao diện quản lý tài khoản khác nhau. Nhiều dịch vụ dùng công cụ gọi là cPanel, tuy giao diện có khác nhau đi nữa, các bước để làm sao lưu căn bản giống nhau.

Sao lưu các tập tin trong trang web

Để sao lưu các tập tin trong trang web bạn cần tên trang chủ để nối vào (thường Bạn cũng cần một ứng dụng chuyển tập tin. FileZilla  là một ứng dụng nguồn mở chạy trên các hệ điều hành lớn. Nếu bạn dùng Windows hay Mac OS X, có thể tải xuống ấn bản mới nhất của FileZilla từ trang nhà của FileZilla . Nếu bạn dùng GNU/Linux bạn có thể dùng package manager để cài đặt.

Để sao lưu trang web, khởi động FileZilla và bấm vào Site

Manager (icon đầu tiên trong thanh trên cùng).
  • Bấm New Site và đặt một tên mới. Điền vào tên máy chủ trong ô Host (thường là tên miền của trang web, không cần phải ghi "http://" ). Bạn có thể để trống ô Port.
  • Bấm vào menu thả xuống Protocol và chọn SFTP. Nếu bạn không kết nối vào máy chủ bằng SFTP được thì chọn FTP. Dữ liệu chuyển tải dùng giao thức SFTP được mã hóa an toàn, còn chuyển tải dùng FTP thì không. Chuyển tải dữ liệu sao lưu qua đường FTP có nguy cơ và có thể khiến cho trang web của bạn bị xâm nhập.
  • Bấm vào menu thả xuống Logon Type và chọn "Normal" nếu bạn muốn FileZilla nhớ mật khẩu; chọn "Ask for password" nếu bạn muốn đánh vào mật khẩu mỗi khi vào. 
 
  • Khi bạn sẵn sàng để nối kết, bấm Connect.
  • LƯUÝ: Nếu bạn dùng giao thức SFTP, có thể sẽ thấy thông báo "Unknown host key" (chìa khóa chủ lạ) khi vào lần đầu.
 

Bạn có thể đánh dấu vào ô "Always trust this host, add this key to the cache" (Tin tưởng máy chủ này và thêm chìa khóa vào bộ đệm) rồi bấm OK. Từ nay trở đi sẽ không thấy thông báo này nữa. Nhiều phần khi lần đầu nối kết vào máy chủ SFTP bạn chưa là đích nhắm của kiểu tấn công bởi kẻ trung gian (Man in the Middle Attack) cho nên chọn tin tưởng chìa khóa máy chủ lần đầu. Nếu bạn bị tấn công trong khi nối kết vào máy chủ, bạn sẽ thấy một hộp thoại báo động mới cho biết chìa khóa đang dùng nối để vào khác với chìa khóa đã lưu trữ. Khái niệm này gọi là Tin Tưởng Lần Đầu Sử Dụng (Trust On First Use or TOFU)
Bây giờ thì bạn đã nối vào máy chủ từ xa. Nếu bạn gặp vấn đề nối kết, mở Site Manager ra và xem lại các cấu hình.
  • Khi nối vào xong, bạn sẽ thấy màn ảnh chia đôi trong FileZilla. Bên trái là máy tính của bạn còn bên phải là máy chủ từ xa. Bạn có thể di chuyển tới lui bên phần máy tính để chọn thư mục giữ bản sao lưu.
  • Kế tiếp, trên máy chủ từ xa, hãy tìm thư mục chính của trang web của bạn. Tên thư mục này có thể là "htdocs", "docs", "public_html", hay cũng có thể là tên của máy chủ. Bấm chuột nút phải và chọn Download.
 

Bản sao của tất cả tập tin trên trang web sẽ được tải xuống máy tính bạn.

Sao lưu cơ sở dữ liệu MySQL

Sau đây là hướng dẫn để sao lưu cơ sở dữ liệu MySQL của dịch vụ Dreamhost và Bluehost. Nếu bạn không dùng các dịch vụ lưu trữ web này, bạn vẫn có thể dựa vào đây để có khái niệm sao lưu cơ sở dữ liệu MySQL. Đa số các dịch vụ lưu trữ web chung có phần mềm gọi là phpMyAdmin để bạn quản trị cơ sở dữ liệu. Nếu bạn truy cập được phpMyAdmin trong web thì có thể theo hướng dẫn sau đây.

Bạn cần biết tên đăng nhập và mật khẩu của MySQL để sao lưu trang web của bạn. Nếu bạn dùng Wordpress bạn có thể tìm thấy chúng trong tập tin wp-config.php. Nếu bạn dùng Drupal, chúng nằm trong tập tin sites/default/settings.php. Nếu bạn dùng một loại hệ thống quản trị nội dụng (CMS) khác thì xem trong tập tin config để tìm tên đăng nhập và mật khẩu.

Sao lưu cơ sở dữ liệu Dreamhost

Đăng nhập vào tài khoản Dreamhost  của bạn. Sau khi vào, mở menu Goodies và chọn MySQL Databases.

 

Bạn sẽ thấy một danh sách MySQL mà bạn đã thiết kế khi cấu hình trang web. Bấm vào đường dẫn phpMyAdmin kế bên tên máy chủ bạn muốn sao lưu.

 

phpMyAdmin sẽ mở ra một bảng mới và bạn phải đăng nhập vào với tên & mật khẩu của tài khoản MySQL. Nếu bạn sao lưu nhiều trang web trong Dreamhost, bạn phải lập lại bước này cho mỗi trang mạng cần sao lưu.

 

Bấm vào tên của cơ sở dữ liệu trong khung bên trái. Rồi bấm vào thẻ Export bên trên.

 

Bạn có thể để nguyên các tùy chọn mặc định. Trước khi bấm Go ở bên dưới, chọn nút "zipped" và kiểm lại là ô "Save as file" được đánh dấu. Khi bấm Go, phpMyAdmin sẽ để bạn tải xuống một tập tin sao lưu nén lại (dạng zip) của cơ sở dữ liệu.

 

Khi bản sao lưu đã được giữ lại, bạn có thể đổi tên tập tin để thêm vào ngày tháng sao lưu.

Sao lưu cơ sở dữ liệu BlueHost
Hãy đăng nhập vào tài khoản BlueHost ở trang https://my.bluehost.com/cgi/account/cpanel . Bấm vào bảng cPanel ở góc trái bên trên màn ảnh. cPanel là một phần mềm nguồn mở phổ thông dùng để quản lý tài khoản web. Nhiều dịch vụ lưu trữ web dùng cùng phần mềm này do đó hướng dẫn này áp dụng được luôn.

 

Di chuyển xuống dưới đến phần Databases. Bấm vào phpMyAdmin.

 

Đăng nhập vào với tên và mật khẩu của MySQL.

 

Bấm vào tên cơ sở dữ liệu ở khung bên trái. Rồi bấm vào thẻ Export bên trên.

 

Để mặc định Export Method là "Quick" và Format là dạng SQL. Bấm Go để tải xuống bản sao lưu cơ sở dữ liệu.

 

Sau khi có bản sao lưu rồi bạn có thể đổi tên để thêm ngày tháng sao lưu vào.

3. Trang Sao 



Popout



Lập ra một trang sao (phó bản) của trang web không phải là sao lưu (backup) lại trang web đó. Khi bạn làm bản sao của trang web, bạn tải xuống tất cả các tập tin của trang web đó (bao gồm hình, CSS và tập tin JavaScript), cũng như các ấn bản HTML tĩnh. Sau đó bạn có thể nhờ người khác mở trang nhà với bản sao này. Khác với bản sao lưu, trang sao nhìn giống như trang nhà của bạn, tuy nhiên cần phải hiểu là bản sao của trang web này không phải y hệt như vậy. Nó chỉ là một ấn bản tĩnh, có nghĩa là bạn không làm được những thao tác như đăng nhập, điều chỉnh bài viết, hay đăng tải ý kiến.



Bạn có thể mở trang sao trên bất cứ dịch vụ thiết kế web nào, tuy nhiên cách nhanh và lẹ nhất là dùng những dịch vụ miễn phí như Blogger hoặc Wordpress.


Khi làm bản sao của một trang web, bạn tải xuống từng trang một của trang web. Đối với một trang web lớn, bạn có thể phải làm hàng trăm hay hàng ngàn truy cập và có thể chiếm nhiều thời gian và băng thông. Đối với một trang web nhỏ thì lẹ hơn nhiều.

GNU wget  là một công cụ rất tốt để làm bản sao của các trang web. Tuy là một lập trình dòng lệnh nhưng nó dễ dùng. Công cụ này có trong tất cả các hệ điều hành lớn. Mệnh lệnh bạn dùng sẽ giống như sau:
wget -mkxKE -e robots=off http://www.example.org/
Bạn thay thế http://www.example.org/ với địa chỉ trang web của bạn. Tất cả các tùy chọn của wget ("-mkxKE -e robots=off") cần thiết cho một bản sao. Để xem tất cả các tùy chọn dùng với wget, bạn xem trang http://man.cx/wget .

Wget sẽ lưu trữ bản sao ngay trong ngăn mà bạn cho chạy mệnh lệnh này. Thí dụ như, nếu bạn chạy wget từ mặt bàn và làm bản sao của trang www.gnu.org, nó sẽ lập ra một ngăn mới trên mặt bàn có tên là www.gnu.org và chứa tất cả tập tin của bản sao. Bạn có thể mở các tập tin HTML với trình duyệt. Trang nhà sẽ là tập tin index.html.

Dưới đây là hướng dẫn chi tiết cách dùng wget trong một số hệ điều hành.

Microsoft Windows
Bạn có thể lấy wget ấn bản Windows từhttp://gnuwin32.sourceforge.net/packages/wget.htm . Tải xuống phần "Complete package, except sources" (trọn gói, không kể nguồn) và cài đặt vào máy.

 


Bạn phải mở một khung dòng lệnh để từ đó chạy wget trong Windows. Cách mở khung dòng lệnh có khác biệt chút đỉnh tùy theo ấn bản Windows, nhưng một cách tổng quát bạn có thể bấm vào Start > Programs > Accessories > Command Prompt. Sau đây là hình minh hoạ trong Windows 7.

 

Khởi sự từ ngăn nhà của bạn. Trong Windows 7 là "C:\Users\username." Trong Windows XP là "C:\Documents and Settings\username". Đánh "cd Desktop" và nhấn nút Enter để vào ngăn Desktop. Làm vậy để khi làm bản sao của trang web, nó sẽ được lưu giữ ngay trên mặt bàn.

Đánh hàng sau đây:

"C:\Program Files\GnuWin32\bin\wget.exe" -mkxKE -e robots=off http://www.example.com

Trong thí dụ này, "C:\Program Files\GnuWin32\bin\wget.exe" là chỗ bạn cài đặt wget. Nếu nó không chạy thì có thể bạn cài đặt wget ở nơi khác. Bạn dùng tên thư mục đã cài đặt wget thay vì "C:\Program Files\GnuWin32\bin\wget.exe."

Nếu bạn muốn dùng ấn bản GUI thay vì dòng lệnh thì có thể dùng HTTrack

Mac OS X

Nếu bạn dùng Mac OS X Snow Leopard hay Lion bạn có thể lấy wget từ kho Rudix  bạn có thể tải gói cài đặt (tập tin.pkg) của wget thẳng từ tranghttps://code.google.com/p/rudix/wiki/wget .

Mở một khung terminal. Bạn tìm thấy ứng dụng Terminal trong Applications > Utilities > Terminal, hoặc dùng Spotlight tìm "terminal". Khi mở một khung terminal trong Mac OS X bạn bắt đầu từ ngăn nhà, "/Users/username". Đánh "cd Desktop" và nhấn nút Enter để vào ngăn Desktop. Làm thế để khi lập bản sao của trang web nó sẽ được lưu giữ trên mặt bàn. Sau đây là hình minh họa của mệnh lệnh để làm bản sao cho http://www.example.org :

 

GNU/Linux

Mọi bản phân phối của GNU/Linux đều có sẵn wget vì wget là một phần của đề án GNU. Nếu bản phân phối Linux không có sẵn wget thì bạn có thể thể cài đặt dùng package manager. Sau đây là hình minh họa mệnh lệnh để làm bản sao của trang http://www.example.org 
:

 

Không có nhận xét nào:

Đăng nhận xét