Файловые архивы - это что такое и для чего они нужны? Реферат: Файловые архивы Internet

В настоящее время, когда популярность World Wide Web достаточно велика, объем трафика передаваемого по сети Internet по протоколу FTP занимает тем не менее первое место, несколько опережая объем трафика по протоколу HTTP. В этом свете организация файловых архивов в рамках технологии TCP/IP является крайне актуальной задачей.

Архивы используют для решения разных задач, однако наиболее популярными в сети являются свободно доступные архивы или такие архивы, доступ к которым разрешен по анонимному идентификатору пользователя. Таким образом эти архивы можно использовать в качестве:

  • коллекции свободно распространяемого программного обеспечения;
  • коллекции программ для бета-тестирования;
  • коллекции нормативных и регламентных документов;
  • и т.п.

FTP-архив можно использовать и в качестве архива коммерческого программного обеспечения, которое используется в компании, только в этом случае такой архив не должен разрешать анонимного доступа к хранящимся в нем ресурсам.

Часто возможность авторизированного FTP-доступа используют и для обмена сообщениями, т.е. в качестве средства коммуникации. Это происходит обычно в том случае, когда система электронной почты по тем или иным причинам не работает.

В настоящее время всю систему взаимодействия компонентов FTP-обмена можно представить в виде схемы представленной на рисунке 4.1.

На этой схеме показано два важных технологических момента: во-первых, доступ к архиву можно осуществлять не только из специализированной программы-клиента, но и из универсального броузера, например Netscape Communicator или Microsoft Internet Explorer, а во-вторых, для поиска информации в FTP-архивах можно воспользоваться программой Archie.

Рис. 4.1. Схема взаимодействия компонентов FTP-обмена

При этом следует четко понимать, что Archie и FTP - это совершенно разные технологии. В большинстве случаев доступ к Archie-серверу пользователи осуществляют из Archie-клиента, который находится на той же машине, что и сервер, т.е. сначала пользователь по Telnet заходит как пользователь Archie, а потом использует программу-клиент (обычно она запускается в качестве оболочки) для доступа к Archie серверу.

Протокол FTP (File Transfer Protocol)

FTP (File Transfer Protocol или «Протокол Передачи Файлов») - один из старейших протоколов в Internet и входит в его стандарты. Обмен данными в FTP проходит по TCP-каналу. Построен обмен по технологии «клиент-сервер». На рисунке 4.2 изображена модель протокола.

Рис. 4.2. Модель протокола

В FTP соединение инициируется интерпретатором протокола пользователя. Управление обменом осуществляется по каналу управления в стандарте протокола TELNET. Команды FTP генерируются интерпретатором протокола пользователя и передаются на сервер. Ответы сервера отправляются пользователю также по каналу управления. В общем случае пользователь имеет возможность установить контакт с интерпретатором протокола сервера и отличными от интерпретатора пользователя средствами.

Команды FTP определяют параметры канала передачи данных и самого процесса передачи. Они также определяют и характер работы с удаленной и локальной файловыми системами.

Сессия управления инициализирует канал передачи данных. При организации канала передачи данных последовательность действий другая, отличная от организации канала управления. В этом случае сервер инициирует обмен данными в соответствии с параметрами, согласованными в сессии управления.

Канал данных устанавливается для того же host"а, что и канал управления, через который ведется настройка канала данных. Канал данных может быть использован как для приема, так и для передачи данных.

Возможна ситуация, когда данные могут передаваться на третью машину. В этом случае пользователь организует канал управления с двумя серверами и организует прямой канал данных между ними. Команды управления идут через пользователя, а данные напрямую между серверами (рисунок 4.3).

Канал управления должен быть открыт при передаче данных между машинами. В случае его закрытия передача данных прекращается.

Рис. 4.3. Соединение с двумя разными серверами и передача данных между ними

. Режимы обмена данными

В протоколе большое внимание уделяется различным способам обмена данными между машинами различных архитектур. Действительно, чего только нет в Internet, от персоналок и Mac"ов до суперкомпьютеров. Все они имеют различную длину слова и многие различный порядок битов в слове. Кроме этого, различные файловые системы работают с разной организацией данных, которая выражается в понятии метода доступа.

В общем случае, с точки зрения FTP, обмен может быть поточный или блоковый, с кодировкой в промежуточные форматы или без нее, текстовый или двоичный. При текстовом обмене все данные преобразуются в ASCII и в этом виде передаются по сети. Исключение составляют только данные IBM mainframe, которые по умолчанию передаются в EBCDIC, если обе взаимодействующие машины IBM. Двоичные данные передаются последовательностью битов или подвергаются определенным преобразованиям в процессе сеанса управления. Обычно, при поточной передаче данных за одну сессию передается один файл данных, а при блоковом способе за одну сессию можно передать несколько файлов.

Описав в общих чертах протокол обмена, можно перейти к описанию средств обмена по протоколу FTP. Практически для любой платформы и операционной среды существуют как серверы, так и клиенты. Ниже описываются стандартные сервер и клиент Unix-подобных систем.

Программное обеспечение доступа к FTP-архивам

Для работы с Ftp-архивами необходимо следующее программное обеспечение: сервер, клиент и поисковая программа. Сервер обеспечивает доступ к ресурсам архива из любой точки сети, клиент обеспечивает доступ пользователя к любому архиву в сети, а поисковая система обеспечивает навигацию во всем множестве архивов сети.

В разных операционных системах эти компоненты Ftp-обмена изменяются как по форме, так и по возможностям, но некоторые общие принципы остаются, кроме этого, программы, ориентированные на интерфейс командной строки, по большей части остаются неизменными в разных операционных средах.

Сервер протокола - программа ftpd

Команда ftpd предназначена для обслуживания запросов на обмен информацией по протоколу FTP. Сервер обычно стартует в момент загрузки компьютера. Синтаксис запуска сервера следующий:

Ftpd [-d] [-1] [-t timeout]

  • d - опция отладки;
  • 1 - опция автоматической идентификации пользователя;
  • t - время пассивного ожидания команд пользователя.

Каждый сервер имеет свое описание команд, которое можно получить по команде help. Автоматическая идентификация пользователей осуществляется при помощи файла /etc/passwd. Пароль пользователя не должен быть пустым.

Существует специальный файл, в котором содержатся запрещенные пользователи, т.е. те, кому обслуживание по протоколу FTP запрещено. Возможен вход в архив по идентификатору пользователя anonimous или ftp. В этом случае сервер принимает меры по ограничению доступа к ресурсам компьютера для данного пользователя. Обычно для таких пользователей создается специальная директория ftp, в которой размещают каталоги bin, etc и pub. В каталоге bin размещаются команды, разрешенные для использования, а в каталоге pub собственно сами файлы. Каталог etc закрыт для просмотра пользователем и в нем размещены файлы идентификации пользователей.

Программа обмена файлами - ftp

FTP - это интерфейс пользователя при обмене файлами по одноименному протоколу. Программа устанавливает канал управления с удаленным сервером и ожидает команд пользователя. Идентификатор удаленного сервера указывается либо аргументом программы, либо в команде интерфейса open.

Если команда ftp работает с пользователем и ожидает его команд, то на экране отображается приглашение «ftp>».

Синтаксис команды:

Ftp [-v][-d][-i][-n]

  • v - подавляет ответы сервера и статистику передачи данных;
  • n - управляет режимом идентификации пользователя. Если указан этот ключ, то сначала проверяется файл.netrc;
  • i - выключает подтверждения передачи файла при массовом копировании файлов;
  • d - включает режим отладки;
  • g - отключает прозрачность передачи имен.

В рамках данного курса нет возможности перечислить все команды ftp, поэтому остановимся только на самых необходимых.

Первой такой командой является команда open . По этой команде открывается сеанс работы с удаленным сервером:

Ftp>open polyn.net.kiae.su

После выдачи такой команды последуют запросы идентификации пользователя. Зарегистрировать пользователя можно и по команде user :

Ftp> user anonymous

В данном примере пользователь не имеет особых прав доступа на удаленном сервере и поэтому регистрируется как аноним. В ответ на запрос идентификации следует в этом случае ввести свой почтовый адрес. Обычно достаточно ввести что-то похожее на почтовый адрес для допуска к ресурсам архива, но бывают и дотошные серверы, которые проверяют наличие такого адреса, поэтому лучше никого не обманывать и честно регистрироваться.

Следующими по важности командами являются команды cd и ls (dir). Назначение этих команд достаточно прозрачно и понятно всем пользователям - навигация по дереву файловой системы и просмотр содержания каталогов. Здесь следует посоветовать пользоваться при просмотре каталогов командой ls с дополнительными параметрами:

Ftp>ls -FC

В этом случае пользователь может получить многоколоночный отчет с указанием типов файлов. Однако не все серверы отрабатывают эту комбинацию.

Так как в процессе приема-передачи участвуют две машины, то кроме навигации в удаленной файловой системе нужна еще навигация в локальной файловой системе. Для этой цели служит команда lcd (локальная cd). Кроме этого пользователь может выдать и любую команду локальной оболочки, если предварит ее символом "!":

По этой команде будет выдано имя текущей директории на локальной машине.

И, наконец, самыми важными являются команды приема/передачи данных get , put , mget , mput и bin . По командам get и put можно принять или передать один файл:

Ftp> get README.TXT

Команды mget, mput предназначены для приема/передачи набора файлов:

Ftp> mget *.gz

Из примера видно, что в последнем случае применяется маска "*". Обычно при передаче групп файлов для каждого файла запрашивается подтверждение. Для того, чтобы избежать этого перед приемом/передачей, следует выдать команду prompt . Последняя переключает режим запроса подтверждения и при повторном использовании этой команды состояние запроса подтверждения восстанавливается. Другой полезной командой является команда hash :

Ftp> hash #

Символ "#" можно заменить на любой другой. При работе по медленным линиям или при передаче больших файлов после включения режима hash пользователь имеет возможность видеть процесс передачи данных (знак "#" выдается после передачи каждого блока). И последнее, на чем следует остановить внимание - это команда bin. После выдачи этой команды по умолчанию данные будут передаваться в режиме передачи двоичных данных. Последнее чрезвычайно важно, т.к. при передачи в ASCII нельзя передать программы и архивированные данные. Часто бывает полезно включить режим bin и для символьных данных с произвольной длиной строки, например файлов postscript (*.ps), т.к. в ASCII режиме есть ограничение на длину строки (обычно 254 символа).

Для выхода из ftp следует выполнить команду quit .

Поиск в FTP-архивах - программа Archie

В настоящее время доступ по FTP-протоколу осуществляется из множества мультипротокольных интерфейсов (например, Mosaic или Netscape) или графических ftp-оболочек типа ftptool для X-Window. Все они гораздо удобнее и проще в использовании, но и потребляют гораздо больше ресурсов.

Любопытно, что FTP-сервер есть даже для MS-DOS (пакет NCSA Telbin), не говоря о многозадачных средах. Однако поиск нужного FTP-сервера в Internet - задача сложная и трудоемкая. Для ее облегчения существует специальное средство - Archie. Archie был разработан в Университете McGill в Канаде. Задача Archie - сканировать FTP-архивы на предмет наличия в них требуемых файлов. Работать с Archie можно через telnet-сессию, через локального клиента или по электронной почте. Для работы по telnet следует открыть telnet-сессию, в ответ на login ввести слово «archie»:

Telnet archie.mcgill.ca login: archie… archie>

После появления приглашения «archie>» следует поинтересоваться возможностями сервера, введя команду «help».

При работе через локального клиента вводят просто:

Archie gnuplot.tar.gz

и в ответ получают список архивов, где имеется файл «gnuplot.tar.gz». Следует принять во внимание, что различные модификации клиентов (особенно графические) могут значительно отличаться по синтаксису друг от друга.

В настоящее время, когда популярность World Wide Web достаточно велика, объем трафика передаваемого по сети Internet по протоколу FTP занимает тем не менее первое место, несколько опережая объем трафика по протоколу HTTP. В этом свете организация файловых архивов в рамках технологии TCP/IP является крайне актуальной задачей.

Архивы используют для решения разных задач, однако наиболее популярными в сети являются свободно доступные архивы или такие архивы, доступ к которым разрешен по анонимному идентификатору пользователя. Таким образом эти архивы можно использовать в качестве:

  • коллекции свободно распространяемого программного обеспечения;
  • коллекции программ для бета-тестирования;
  • коллекции нормативных и регламентных документов;
  • и т.п.

FTP-архив можно использовать и в качестве архива коммерческого программного обеспечения, которое используется в компании, только в этом случае такой архив не должен разрешать анонимного доступа к хранящимся в нем ресурсам.

Часто возможность авторизированного FTP-доступа используют и для обмена сообщениями, т.е. в качестве средства коммуникации. Это происходит обычно в том случае, когда система электронной почты по тем или иным причинам не работает.

В настоящее время всю систему взаимодействия компонентов FTP-обмена можно представить в виде схемы представленной на рисунке 4.1.

На этой схеме показано два важных технологических момента: во-первых, доступ к архиву можно осуществлять не только из специализированной программы-клиента, но и из универсального броузера, например Netscape Communicator или Microsoft Internet Explorer, а во-вторых, для поиска информации в FTP-архивах можно воспользоваться программой Archie.

Рис. 4.1. Схема взаимодействия компонентов FTP-обмена

При этом следует четко понимать, что Archie и FTP - это совершенно разные технологии. В большинстве случаев доступ к Archie-серверу пользователи осуществляют из Archie-клиента, который находится на той же машине, что и сервер, т.е. сначала пользователь по Telnet заходит как пользователь Archie, а потом использует программу-клиент (обычно она запускается в качестве оболочки) для доступа к Archie серверу.

Протокол FTP (File Transfer Protocol)

FTP (File Transfer Protocol или "Протокол Передачи Файлов") - один из старейших протоколов в Internet и входит в его стандарты. Обмен данными в FTP проходит по TCP-каналу. Построен обмен по технологии "клиент-сервер". На рисунке 4.2 изображена модель протокола.


Рис. 4.2. Модель протокола

В FTP соединение инициируется интерпретатором протокола пользователя. Управление обменом осуществляется по каналу управления в стандарте протокола TELNET. Команды FTP генерируются интерпретатором протокола пользователя и передаются на сервер. Ответы сервера отправляются пользователю также по каналу управления. В общем случае пользователь имеет возможность установить контакт с интерпретатором протокола сервера и отличными от интерпретатора пользователя средствами.

Команды FTP определяют параметры канала передачи данных и самого процесса передачи. Они также определяют и характер работы с удаленной и локальной файловыми системами.

Сессия управления инициализирует канал передачи данных. При организации канала передачи данных последовательность действий другая, отличная от организации канала управления. В этом случае сервер инициирует обмен данными в соответствии с параметрами, согласованными в сессии управления.

Канал данных устанавливается для того же host"а, что и канал управления, через который ведется настройка канала данных. Канал данных может быть использован как для приема, так и для передачи данных.

Возможна ситуация, когда данные могут передаваться на третью машину. В этом случае пользователь организует канал управления с двумя серверами и организует прямой канал данных между ними. Команды управления идут через пользователя, а данные напрямую между серверами (рисунок 4.3).

Канал управления должен быть открыт при передаче данных между машинами. В случае его закрытия передача данных прекращается.


Рис. 4.3. Соединение с двумя разными серверами и передача данных между ними

. Режимы обмена данными

В протоколе большое внимание уделяется различным способам обмена данными между машинами различных архитектур. Действительно, чего только нет в Internet, от персоналок и Mac"ов до суперкомпьютеров. Все они имеют различную длину слова и многие различный порядок битов в слове. Кроме этого, различные файловые системы работают с разной организацией данных, которая выражается в понятии метода доступа.

В общем случае, с точки зрения FTP, обмен может быть поточный или блоковый, с кодировкой в промежуточные форматы или без нее, текстовый или двоичный. При текстовом обмене все данные преобразуются в ASCII и в этом виде передаются по сети. Исключение составляют только данные IBM mainframe, которые по умолчанию передаются в EBCDIC, если обе взаимодействующие машины IBM. Двоичные данные передаются последовательностью битов или подвергаются определенным преобразованиям в процессе сеанса управления. Обычно, при поточной передаче данных за одну сессию передается один файл данных, а при блоковом способе за одну сессию можно передать несколько файлов.

Описав в общих чертах протокол обмена, можно перейти к описанию средств обмена по протоколу FTP. Практически для любой платформы и операционной среды существуют как серверы, так и клиенты. Ниже описываются стандартные сервер и клиент Unix-подобных систем.

Программное обеспечение доступа к FTP-архивам

Для работы с Ftp-архивами необходимо следующее программное обеспечение: сервер, клиент и поисковая программа. Сервер обеспечивает доступ к ресурсам архива из любой точки сети, клиент обеспечивает доступ пользователя к любому архиву в сети, а поисковая система обеспечивает навигацию во всем множестве архивов сети.

В разных операционных системах эти компоненты Ftp-обмена изменяются как по форме, так и по возможностям, но некоторые общие принципы остаются, кроме этого, программы, ориентированные на интерфейс командной строки, по большей части остаются неизменными в разных операционных средах.

Сервер протокола - программа ftpd

Команда ftpd предназначена для обслуживания запросов на обмен информацией по протоколу FTP. Сервер обычно стартует в момент загрузки компьютера. Синтаксис запуска сервера следующий:

Ftpd [-d] [-1] [-t timeout]

  • d - опция отладки;
  • 1 - опция автоматической идентификации пользователя;
  • t - время пассивного ожидания команд пользователя.

Каждый сервер имеет свое описание команд, которое можно получить по команде help. Автоматическая идентификация пользователей осуществляется при помощи файла /etc/passwd. Пароль пользователя не должен быть пустым.

Существует специальный файл, в котором содержатся запрещенные пользователи, т.е. те, кому обслуживание по протоколу FTP запрещено. Возможен вход в архив по идентификатору пользователя anonimous или ftp. В этом случае сервер принимает меры по ограничению доступа к ресурсам компьютера для данного пользователя. Обычно для таких пользователей создается специальная директория ftp, в которой размещают каталоги bin, etc и pub. В каталоге bin размещаются команды, разрешенные для использования, а в каталоге pub собственно сами файлы. Каталог etc закрыт для просмотра пользователем и в нем размещены файлы идентификации пользователей.

Программа обмена файлами - ftp

FTP - это интерфейс пользователя при обмене файлами по одноименному протоколу. Программа устанавливает канал управления с удаленным сервером и ожидает команд пользователя. Идентификатор удаленного сервера указывается либо аргументом программы, либо в команде интерфейса open.

Если команда ftp работает с пользователем и ожидает его команд, то на экране отображается приглашение "ftp>".

Синтаксис команды:

Ftp [-v][-d][-i][-n]

  • v - подавляет ответы сервера и статистику передачи данных;
  • n - управляет режимом идентификации пользователя. Если указан этот ключ, то сначала проверяется файл.netrc;
  • i - выключает подтверждения передачи файла при массовом копировании файлов;
  • d - включает режим отладки;
  • g - отключает прозрачность передачи имен.

В рамках данного курса нет возможности перечислить все команды ftp, поэтому остановимся только на самых необходимых.

Первой такой командой является команда open . По этой команде открывается сеанс работы с удаленным сервером:

Ftp>open polyn.net.kiae.su

После выдачи такой команды последуют запросы идентификации пользователя. Зарегистрировать пользователя можно и по команде user :

Ftp> user anonymous

В данном примере пользователь не имеет особых прав доступа на удаленном сервере и поэтому регистрируется как аноним. В ответ на запрос идентификации следует в этом случае ввести свой почтовый адрес. Обычно достаточно ввести что-то похожее на почтовый адрес для допуска к ресурсам архива, но бывают и дотошные серверы, которые проверяют наличие такого адреса, поэтому лучше никого не обманывать и честно регистрироваться.

Следующими по важности командами являются команды cd и ls (dir). Назначение этих команд достаточно прозрачно и понятно всем пользователям - навигация по дереву файловой системы и просмотр содержания каталогов. Здесь следует посоветовать пользоваться при просмотре каталогов командой ls с дополнительными параметрами:

Ftp>ls -FC

В этом случае пользователь может получить многоколоночный отчет с указанием типов файлов. Однако не все серверы отрабатывают эту комбинацию.

Архив - это файл, содержащий в себе один или несколько других файлов, а также метаданные . Архивы используются для объединения множества любых файлов в единый файл-контейнер с целью удобства хранения и переноса информации или просто чтобы сжать данные . Для создания архивов и работы с ними используются программы -архиваторы .

В архивах может сохраняться структура каталогов, присутствовать служебная информация для обнаружения и исправления ошибок, комментарии и другая информация. В зависимости от формата архива, данные в нём могут шифроваться с помощью пароля.

Применение

Архивы особенно полезны как способ упаковки данных файловой системы и метаданных в единый файл для его хранения в компьютере или для пересылки по каналам, которые поддерживают только пофайловую передачу, например для пересылки структуры каталогов по электронной почте.

Помимо целей архивирования, архивы часто используются для распространения пакетов программного обеспечения; в этом случае архив нередко называют дистрибутивным пакетом и к нему могут применяться дополнительные условия касательно содержимого (скажем, должен присутствовать файл манифеста). Примеры архивов-дистрибутивов: deb для Debian, JAR для Java, APK для Android.

Функциональные особенности

В зависимости от типа, архивы поддерживают объединение файлов в один, сжатие данных , шифрование , многотомность (архив из нескольких частей), контрольные суммы для проверки целостности содержимого архива, самораспаковку, самоустановку, информацию об исходном томе и носителе, информацию о структуре каталогов, примечания и комментарии, а также другие метаданные. Формат файла-архива определяется по расширению файла и/или по файловому заголовку. Для создания архивов используются программы -архиваторы , ПО для авторинга оптических дисков и программы для работы с образами дисков.

Форматы архивов

Формат архива - это файловый формат архивного файла. Существует множество форматов архивов, но лишь некоторые из них получили широкое признание и поддержку со стороны поставщиков ПО и пользовательских сообществ. Так, к числу наиболее популярных в среде Windows относятся ZIP, RAR, 7z, а в Mac OS - формат SIT.

Типы архивов

  • Только архивирующие форматы выполняют лишь слияние файлов в один (пример: tar).
  • Только сжимающие форматы выполняют лишь сжатие файлов (примеры: gzip , bzip2).
  • Многофункциональные форматы позволяют сливать файлы в один, сжимать их, зашифровывать, создавать информацию для обнаружения и исправления ошибок, оформлять архивы как самораспаковывающиеся для извлечения содержимого без участия дополнительного ПО (примеры: RAR , ZIP , ).
  • Дистрибутивные форматы используются для создания пакетов установки ПО , которые также могут быть самоинсталлируемыми файлами (примеры: JAR , APK , IPA).
  • Форматы дисковых образов используются для создания образов дисков , применяемых как тома хранения информации (примеры: ISO, NRG).

Подвиды архивов

Самораспаковывающиеся архивы

Самораспаковывающиеся архивы часто также называют SFX-архивами (от англ. SelF-eXtracting - самоизвлечение). В отличие от обычного архива, самораспаковывающийся архив имеет формат исполняемого файла (в Windows это файл с расширением.EXE), для извлечения данных из которого (а также нередко для тестирования и показа списка содержимого) не требуется отдельная программа - всё выполняется средствами самого SFX-архива. Иными словами, вы просто запаковываете информацию в SFX-архив, а получателю, которому она предназначена, нужно лишь запустить этот SFX-архив (в аналогичной ОС), чтобы получить разархивированную информацию. Примечание. В действительности SFX-архивы - это обычные архивы, к которым прикреплён небольшой исполняемый модуль-разархиватор, поэтому при необходимости (например, из-за опасения, что этот исполняемый модуль может быть заражен вирусом) для работы с SFX-архивом можно использовать соответствующий внешний архиватор, не запуская сам SFX-файл.

Многотомные архивы

Многотомные архивы - это архивы, состоящие из нескольких частей. Поддерживаются в ряде популярных форматов архивов - в RAR, ZIP, 7z и др. Чтобы создать многотомный архив, нужно при упаковке файлов просто выбирать размер частей, на которые будет разделён результирующий архив. Данная функция особенно удобна при работе с файлами большого размера (например, образами видеодисков), так как позволяет сохранять даже огромные и плохо сжимаемые файлы на носителях меньшего объёма. Некоторые архиваторы (например, RAR) имеют функцию автоматического определения размера каждого тома в зависимости от свободного объема на текущем носителе, используемом для архивирования, что позволяет максимально эффективно использовать многотомные архивы, скажем, для переноса с компьютера на компьютер на нескольких флэш-накопителях разного объёма.

Непрерывные архивы

Непрерывное (англ. - solid) архивирование - это разновидность архивирования, при котором все добавляемые в архив файлы рассматриваются архиватором как один непрерывный поток данных. Благодаря такому подходу удаётся добиться существенного увеличения степени сжатия, особенно при упаковке множества однотипных файлов сравнительно (с величиной «скользящего словаря» архиватора) небольшого размера. Помимо очевидного преимущества (более сильное сжатие) непрерывные архивы имеют и свои недостатки. Так как данные в непрерывном архиве - это один сплошной поток, то чтобы извлечь какой-либо файл, сначала нужно распаковать все файлы, которые находятся в архиве перед этим файлом, поэтому извлечение файлов, расположенных в конце архива, происходит медленнее. Также медленнее, чем в обычном (не solid) архиве, выполняются операции по изменению содержимого архива (добавление и удаление файлов). Кроме того, если архив по какой-то причине окажется повреждённым, то из него удастся извлечь только файлы, идущие до места повреждения, а вся информация после этого места окажется утерянной. Иными словами, непрерывные архивы хороши для упаковки и хранения данных, изменять которые требуется редко.

Метаданные

Архив почти всегда содержит метаданные. К ним относятся:

  • Имена файлов (кроме некоторых программ сжатия одиночных файлов - например, gzip, где имя файла - это имя архива без расширения)
  • Идентификаторы владельцев, групп, и т. п. файлов и их прав
  • Размеры файлов
  • Даты изменения, создания и последнего обращения к файлам
  • Контрольные суммы файлов для проверки правильности распаковки
  • Размер и контрольные суммы архива
  • Избыточные данные для восстановления данных при повреждении
  • Цифровая подпись создателя архива

Файловые архивы FTP

Сервис FTP (File Transfer Protocol – Протокол передачи файлов) используется для доступа к файловым архивам Internet.

Точнее говоря, он позволяет установить соединение с одним из компьютеров в Internet (по протоколу FTP, используя программу ftp на вашей локальной машине), просмотреть файлы, доступные на нем, и скопировать к себе необходимые.

File Transfer Protocol (FTP) – это протокол, позволяющий легко пересылать файлы и документы. Его обычно рассматривают как один из методов работы с удаленными сетями.

File Transfer Protocol (FTP) – самый распространенный протокол передачи файлов между компьютерами. Он позволяет работать с любыми типами файлов.

Как и многие другие виды сервиса, FTP работает по принципу системы с архитектурой клиент-сервер. Поэтому для работы с FTP обычно требуются специальные программы – FTP-клиенты. В качестве серверов при этом выступают FTP-серверы, расположенные где-то в сети и предоставляющие доступ к обслуживаемым ими файловым архивам.

Одним из самых распространенных видов FTP-серверов является анонимный FTP-сервер. Работая с ними, вам для соединения с сервером и получения файлов не нужно знать имя пользователя и его пароль. На анонимном FTP-сервере в качестве имени пользователя обычно используется "anonymous" или "ftp", а в качестве пароля – адрес вашей электронной почты.

В архивах FTP на своих серверах почти все крупные производители аппаратного обеспечения размещают драйверы для своих устройств, которые могут "скачать" себе владельцы этих устройств.

Несмотря на то, что FTP прекрасно справляется с передачей файлов, хороших средств для работы файлами, разбросанными по многим компьютерам, в нем нет. В связи с этим и была разработана усовершенствованная система пересылки файлов . Она называется Gopher .

Используя систему меню, Gopher позволяет Вам не только просмотреть списки ресурсов, но и перешлет нужный материал, причем знать, где он расположен, вовсе не обязательно. Gopher – это одна из наиболее всеобъемлющих систем просмотра, интегрированная с другими программами, такими, как FTP или Telnet. В Internet она широко распространена.

Компьютеры Gopher связаны в единую поисковую систему, называемую Gopherspace (Gopher-пространство). Доступ в Gopher-пространства осуществляется через предлагаемые ими меню, а поиск – с помощью нескольких разновидностей поисковых систем. Наиболее известны среди них система Veronica, и индексная поисковая система глобального информационного сервера (wAIS – wide Area Information Server).

Телеконференции

Система телеконференций появилась как средство общения групп людей со сходными интересами. Со времени своего появления она широко распространилась, став одним из самых популярных сервисов Internet.

Этот вид сервиса напоминает списки рассылки Internet, за тем исключением, что сообщения не отправляются всем подписчикам данной телеконференции, а помещаются на специальные компьютеры, называемые серверами телеконференций или news-серверами . После этого подписчики телеконференции могут прочитать поступившее сообщение и, при желании, ответить на него.

Телеконференция похожа на доску объявлений, куда каждый может повесить свое объявление и прочитать объявления, повешенные другими. Для упрощения работы с этой системой, все телеконференции делятся по темам, названия которых отражены в их именах. На данный момент насчитывается около 10000 различных телеконференций, в которых обсуждается все, что только можно себе вообразить.

Для работы с системой телеконференций необходимо специальное программное обеспечение, с помощью которого вы сможете установить соединение с news-сервером и получить доступ к хранящимся на нем статьям телеконференций. Так как на news-сервере хранятся статьи очень большого числа телеконференций, пользователи обычно выделяют те, которые представляют для них интерес (или, другими словами, подписываются на них), и в дальнейшем работают только с ними.

После подписки на выбранные телеконференции придется устанавливать соединение с news-сервером, чтобы просмотреть поступившие сообщения. Отличие заключается в том, что можно настроить программу чтения телеконференций таким образом, чтобы она отслеживала состояние только тех из них, на которые вы подписались, и не вынуждала вас просматривать весь список.

По существу, Telnet – это протокол, позволяющий использовать вычислительные ресурсы удаленного компьютера. Кроме того, так обычно называется программа, позволяющая получить доступ к ресурсам удаленного компьютера по этому протоколу. Зачастую эти понятия объединяются в одно и, когда идет речь о Telnet, имеется в виду программа telnet, работающая по протоколу TELNET.

Telnet позволяет работать с удаленными компьютерами в режиме текстового терминала. Таким образом, вы набираете команды и видите на своем экране результаты их выполнения, но фактически все команды выполняются на том компьютере, с которым вы установили соединение. По сети передается лишь та информация, которую вы вводите с клавиатуры и, которая отображается у вас на экране. При этом создается впечатление, что вы работаете только с собственным компьютером.

Для того чтобы воспользоваться Telnet, необходимы права доступа на компьютер, с которым вы хотите работать. В большинстве случаев это означает, что вы должны знать соответствующее имя пользователя и его пароль. Другим вариантом может быть то, что вы лично зарегистрированы на этом компьютере в качестве пользователя.

Telnet является одним из фундаментальных видов сервиса Internet. Он предоставляет пользователю возможность связаться со своим компьютером, даже находясь за сотни километров от него, просмотреть свою почту, проверить процесс выполнения запущенных задач и, при необходимости, запустить новые, пообщаться с друзьями, работающими в этот момент на компьютере, и еще многое, многое другое.

Главным условием является подключение компьютера к Internet и возможность терминального доступа. (Примером этого могут послужить компьютеры, Работающие под управлением операционной системы UNIX.)

Серверы файловых архивов
Сотни тысяч серверов Интернета являются серверами файловых архивов, и на них хранятся сотни миллионов файлов.
Файловые серверы поддерживают многие компании- разработчики программного обеспечения и производители аппаратных компонентов компьютера и периферийных устройств. Размещаемое на таких серверах програмное обеспечение является свободно распространяемым или условно бесплатным, и поэтому, скачивая тот или иной файл, пользователь не нарушает закон об авторских правах на программное обеспечение.
Протоколы передачи файлов
Доступ к файлам на серверах файловых архивов возможен как по протоколу HTTP, так и по специальному протоколу передачи файлов FTP. Протокол FTP позволяет не только загружать файлы с удаленных серверов файловых архивов на локальный компьютер, но и наоборот, производить передачу файлов с локального компьютера на удаленный Web-сервер, например, в процессе публикации Web-сайта.
Для загрузки с сервера файлового архива ftp.server.com файла file.exe, хранящегося в папке pub, необходимо указать URL-адрес этого файла. Протокол записывается следующим образом: ftp://ftp.server.com/pub/file.exe.
Для удобства пользователей многие серверы файловых архивов имеют Web-интернет, что позволяет работать с использованием браузеров.
Браузеры являются интегрированными системами для работы с ресурсами включают в себя менеджеры загрузки файлов
После активизации ссылки на файл требуется указать папку на локальном компьютере. После чего начнется загрузка файла с отображением на информационной панели.
Специализированные менеджеры загрузки файлов
Более удобнее для работы с файловыми архивами использовать, например программу FlashGet. Данные менеджеры позволяют увеличить скорость загрузки. Так же они позволяют продолжить загрузку после разрыва соединения с сервером, содержат средство поиска по другим серверам, позволяют архивировать файлы в процессе загрузки.
Специализированные менеджеры загрузки файлов интегрируются в браузеры и начинают процесс загрузки с использованием менеджера загрузки.
FTP – клиенты
FTP-серверы – это серверы, с которыми может производиться обмен файлами по протоколу FTP. FTP-серверы могут являться как серверами файловых активов так и Web-серверами, на которых размещаются Web-сайты. Обмен файлами с серверами файловых архивов и Web-серверами производиться с помощью специализированных программ – FTP-клиентов.
FTP-клиент включает в себя менеджер сайтов, позволяющий создать список серверов. Обеспечивается продолжение загрузки файла после обрыва соединения. В процессе передачи файла отображается вся необходимая информация.
Off-line браузеры
Для быстрой загрузки Web-сайтов с целью дальнейшего просмотра используется специальная программа – off-line.
Off-line браузеры позволяют загружать на компьютер Web-сайты целиком или отдельные части сайта. Пользователь может устанавливать необходимую «глубину» загрузки Web-сайта. Имеется возможность продолжения загрузки после разрыва соединения и обновления ранее загруженных сайтов.