Отдельные Web-страницы сайта (полностью или частично) можно сохранять с помощью обычного браузера. В MS Internet Explorer это можно выполнить четырьмя способами (рис. 1.5).

Рис. 1.5. Выбор способа сохранения Web-страницы «Официальный сайт ТГУ» (http://www.tsu.ru)

В первом случае в выбранном каталоге помещаются htm-файл и папка, имеющие одинаковые названия. В папке находятся файлы с элементами графического оформления web-страницы (графические файлы, css-таблицы и др.). Удаление папки вызывает удаление и htm-файла.

Во втором случае сохраняется один файл с расширением .mht (Microsoft Hypertext Archive – гипертекстовый архив Microsoft), в котором сохраняется выбранная Web-страница со всеми деталями оформления.

В третьем случае сохраняется один файл с расширением .htm, в котором сохраняется выбранная Web-страница без деталей графического оформления. На месте картинок появляются квадратики с красными крестиками.

В четвертом случае сохраняется один файл с расширением .txt, в котором сохраняется только текстовая информация с выбранной Web-страницы.

Все эти способы находят применение в зависимости от того, с какой степенью детализации надо получить информацию с выбранной Web-страницы.

Для сохранения многих страниц одного сайта существуют оффлайн-браузеры (offline browser), или «Web-качалки». Такие программы скачивают страницу, определенную директорию, целый сайт и даже группу сайтов, связанных ссылками, делая их доступными в отключенном от Интернета состоянии. Таким образом, на своем жестком диске можно создать копию («зеркало») сайта со всей его структурой.

Теоретически оффлайн-браузер может скачать весь Интернет. Идя по ссылкам, без которых не обходится ни один сайт, программа будет копировать все новые и новые страницы. Для того чтобы этого не произошло, существуют специальные настройки. Так, можно загрузить все файлы, находящиеся в пределах одного домена или же определенной директории. Можно разрешить оффлайн-браузеру путешествовать не только по внутренним ссылкам, ведущим на страницы внутри сайта, но и по внешним, которые идут на страницы, расположенные на другом сервере. Для того чтобы не иметь всего содержимого Интернета на жестком диске своего компьютера, необходимо ограничить глубину загрузки по ссылкам. Так, например, страница А, связанная ссылкой со страницей B, расположена от нее на глубине, равной одной ссылке. Если же на странице B расположена ссылка на страницу С, то глубина между А и С становится равной двум ссылкам.

Затянуться процесс загрузки может и в связи с тем, что на сайте расположен какой-либо крупный архив файлов. Для того чтобы не перекачивать не нужные вам файлы, в оффлайн-браузере предусмотрены фильтры. С помощью них можно ограничивать загрузку определенных типов файлов. Так, можно отключить загрузку графических файлов или архивных. Или, напротив, можно настроить фильтр так, чтобы он скачивал только их. Так, например, нередко удобнее скачать только документы в формате .pdf, содержащие какие-либо инструкции, чем загружать полностью весь сайт.