gzip(1) gzip(1)
NAZWA
gzip, gunzip, zcat - skompresuj i zdekompresuj pliki
SKŁADNIA
gzip [ -acdfhlLnNrtvV19 ] [-S rozszerzenie] [ nazwa ... ]
gunzip [ -acfhlLnNrtvV ] [-S rozszerzenie] [ nazwa ... ]
zcat [ -fhLV ] [ nazwa ... ]
OPIS
gzip redukuje rozmiar podanych plików używając algorytmu
Lempel-Ziv (LZ77). Zawsze, jeżeli jest to możliwe, do
nazwy pliku dodawane jest rozszerzenie .gz, przy zachowa
niu informacji o właścicielu pliku, trybie dostępu, oraz
czasie dostępu i modyfikacji. (Domyślnym rozszerzeniem
nazwy pliku jest -gz dla systemu VMS, .z dla MSDOS, OS/2
FAT, Windows NT FAT i Atari.) Jeżeli nie podano nazwy
żadnego pliku, lub podano nazwę "-", dane do kompresji
pobierane są ze standardowego wejścia, a po skompresowaniu
zapisywane na standardowe wyjście. gzip kopresuje jedynie
zwykłe pliki. W szczególności, ignoruje dowiązania symbol
iczne.
Jeżeli nazwa skompresowanego pliku jest za długa dla sys
temu plików, gzip obcina ją. gzip usiłuje obcinać jedynie
części nazw plików dłuższe niż 3 znaki. (Część nazwy pliku
znajduje się pomiędzy kropkami). Jeżeli nazwa składa się
tyko z krótkich części, obcinane są najdłuższe z nich. Na
przykład, jeżeli długość nazwy plików jest ograniczona do
14 znaków, gzip.msdos.exe jest kompresowane do
gzi.msd.exe.gz. Jeżeli w systemie plików nie ma
ograniczenia długości nazwy pliku, nazwa nie jest obci
nana.
Domyślnie gzip zachowuje oryginalną nazwę pliku oraz czas
modyfikacji i dostępu wewnątrz skompresowanego pliku. Jest
ona uzywana podczas dekompresji z opcją -N. Jest to
użytecznie, gdy nazwa skompresowanego pliku została
obcięta lub czas modyfikacji nie został zachowany po
transferze pliku.
Skompresowane pliki moga być odtworzone do pierwotnej
postaci przy użyciu poleceń gzip -d, gunzip lub zcat.
Jeżeli oryginalna nazwa pliku zachowana wewnątrz pliku
skompresowanego nie może być odtworzona w danym systemie
plików, na podstawie oryginalnej nazwy tworzona jest nowa.
gunzip uruchamiany jest z listą plików w linii poleceń.
Następnie każdy plik, którego nazwa kończy się rozszerze
niem .gz, -gz, .z, -z, _z lub .Z i w nagłówku pliku znaj
duje się prawidłowa liczba (magic number) jest dekompre
sowany i zastępowany oryginalnym plikiem bez jednego z
powyższych rozszerzeń. gunzip rozpoznaje też specjalne
rozszerzenia nazw plików .tgz i .taz jako skróty dla,
odpowiednio, .tar.gz i .tar.Z. Podczas kompresji pliku z
local 1
gzip(1) gzip(1)
rozszerzeniem .tar, jeżeli jest to konieczne, gzip używa
rozszerzenia .tgz zamiast obcinania nazwy pliku.
gunzip może dokonać dekompresji plików stworzonych przez
programy gzip, zip, compress, compress -H lub pack.
Rodzaj pliku wejściowego jest rozpoznawany automatycznie.
Podczas dekompresji plików w pierwszych dwóch formatach,
gunzip kontroluje 32-bitową sumę kontrolną CRC. W wypadku
plików stworzonych przez programy pack i gunzip sprawdzana
jest długość zdekompresowanego pliku. Standardowy format
programu compress nie umożliwiał kontroli poprawności.
Jednak niekiedy gunzip jest w stanie wykryć uszkodzony
plik .Z. Jeżeli w trakcie dekompresji takiego pliku
pojawią się błędy, nie sądź, że plik jest w porządku
jeżeli program uncompress nie zgłaszał problemów. Oznacza
to tylko, że uncompress nie kontroluje poprawności plików
wejściowych. Format plików compress -H systemu SCO (kom
presja metodą lzh) również nie obsługuje kontroli
poprawności, lecz także możliwe jest podstawowe sprawdze
nie spójności pliku.
Pliki stworzone przez program zip mogą być zdekompresowane
tylko, jeżeli w archiwum .zip znajduje się jeden plik i
jest on skompresowny metodą 'deflation'. Jest to opcja
przeznaczona do konwersji plików .tar.zip do formatu
.tar.gz. Do dekompresji archiwów .zip zawierających więcej
niż jeden plik użyj programu unzip unzip zamiast gunzip.
zcat działa tak samo, jak gunzip -c. (W niektórych sys
temach zcat może być zainstalowany jako gzcat, aby
zachować oryginalne dowiązanie do programu compress).
zcat dekompresuje pliki z listy podanej w linii poleceń
lub pobiera dane ze standardowego wejścia, a nastepnie
zapisuje zdekompresowane dane na standardowym wyjściu.
zcat dokonuje dekompresji plików po sprawdzeniu, że w
nagłówku pliku znajduje się właściwa liczba (magic num
ber); nie jest wymagane, aby nazwa pliku miała rozszerze
nie .gz.
Gzip korzysta z algorytmu Lempel-Ziv użytego w programach
zip i PKZIP. Wydajność kompresji zależy od wielkości
danych wejściowych, ilości bitów używanych w kodach oraz
rozmieszczenia w danych jednakowych podciągów. Dane takie,
jak kod źródłowy lub tekst w języku angielskim są
redukowane o 60-70 procent. Osiągany stopień kompresji
jest przeważnie dużo większy niż przy użyciu kodowania LZW
(używanym przez program compress), Huffmana (pack), lub
adaptywnym kodowaniu Huffmana (compact).
Kompresja jest przeprowadzana zawsze, nawet jeżeli plik
wyjściowy jest większy niż oryginalny. W najgorszym przy
padku narzut może wynosić kilka bajtów dla nagłówka i 5
bajtów dla każdego bloku o długości 32K. Ewentualnie
współczynnik powiększenia pliku może wynosić 0.015% dla
local 2
gzip(1) gzip(1)
bardzo dużych plików. Zauważ, że prawie nigdy nie zwiększa
się ilość bloków używanych przez plik na dysku. gzip
zachowuje tryb dostępu, właściciela pliku oraz czas
dostępu i modyfikacji pliku podczas kompresji i dekom
presji.
OPCJE
-a --ascii
Tryb tekstowy. Przekształć znaki końca linii
używając lokalnych konwencji. Ta opcja jest
dostępna jedynie na kilku systemach nie-Unixowych.
W systemie MS-DOS podczas kompresji znaki CR LF są
przekształcane na LF; a podczas dekompresji z
powrotem.
-c --stdout --to-stdout
Wypisz skompresowane dane na standardowe wyjście;
oryginalne pliki pozostają nienaruszone. Jeżeli
podanych zostało kilka plików wejściowych, każdy z
nich kompresowany jest oddzielnie. Dla osiągnięcia
lepszej kompresji połącz pliki ze sobą przed pod
daniem ich kompresji.
-d --decompress --uncompress
Zdekompresuj plik.
-f --force
Kompresuj plik nawet, jeżeli istnieją do niego
twarde dowiązania lub plik wyjściowy już istnieje,
lub też, jeżeli dane są uprzednio skompresowane.
Jeżeli format danych wejściowych nie jest rozpoz
nany, a podana została opcja --stdout, dane zostają
bez zmian przekopiowane na standardowe wyjście.
zcat zachowuje się w takim wypadku jak cat. Jeżeli
opcja -f nie została podana i program został uru
chomiony w pierwszym planie, gzip pyta użytkownika
przed nadpisaniem istniejącego pliku.
-h --help
Wyświetl ekran pomocy i zakończ działanie.
-l --list
Dla każdego skompresowanego pliku wypisz
następujące informacje:
compressed size: rozmiar skompresowanego pliku
uncompressed size: rozmiar zdekompresowanego
pliku
ratio: współczynnik kompresji (0.0% jeżeli niez
nany)
uncompressed_name: nazwa zdekompresowanego pliku
Rozmiar zdekompresowanego pliku jest wypisywany
jako -1 dla plików nie będących w formacie gzip,
local 3
gzip(1) gzip(1)
jak na przykład pliki .Z. Aby poznać rozmiar
takiego pliku po dekompresji, możesz użyć polece
nia:
zcat file.Z | wc -c
Po podaniu również opcji --verbose, dodatkowo są
wyświetlane następujące informacje:
method: metoda kompresji
crc: 32-bitowa suma kontrolna CRC zdekompre
sowanych danych
date & time: pole daty/czasu oryginalnego pliku
Aktualnie dostepne metody kompresji, to deflate,
compress, lzh (SCO compress -H) oraz pack. Suma
CRC dla plików w formacie innym niż gzip jest
podawana jako ffffffff.
Po podaniu opcji --name, podawane są dane oryginal
nego pliku zawarte w pliku skompresowanym (nazwa,
data/czas), jeżeli zostaną tam znalezione.
Po podaniu opcji --verbose wyświetlany jest wspólny
rozmiar i współczynnik kompresji wszystkich plików,
chyba że nie dla wszystkich plików te dane są
dostępne. Po podaniu opcji --quiet, linie nagłówka
i podsumowania nie są wyświetlane.
-L --license
Wyświetl informację o licencji i zakończ działanie
programu.
-n --no-name
Podczas kompresji nie zachowuj w skompresowanym
pliku oryginalnej nazwy, trybu dostępu oraz czasu
modyfikacji i dostępu. (Oryginalna nazwa jest
zapisywana, jeżeli nazwa pliku będzie musiała być
obcięta). Podczas dekompresji nie odtwarzaj orygi
nalnej nazwy pliku (usuń tylko rozszerzenie .gz z
nazwy pliku), nie odtwarzaj również oryginalnego
pola daty/czasu - zamiast tego zachowane zostanie
to pole z pliku .gz. Jest to domyślna opcja podczas
dekompresji.
-N --name
Podczas kompresji zawsze zachowuj oryginalne pole
daty/czasu; jest to zachowanie domyślne. Podczas
dekompresji odtwórz oryginalne pole daty/czasu oraz
nazwę pliku. Ta opcja jest użyteczna na sytemach z
limitem długości nazwy pliku lub po utracie orygi
nalnego pola daty/czasu po transferze pliku.
local 4
gzip(1) gzip(1)
-q --quiet
Nie wyświetlaj żadnych ostrzeżeń.
-r --recursive
Kompresuj rekurencyjnie zawartość katalogów
podanych w linii poleceń. W wypadku programu gun
zip dokonaj rekurencyjnej dekompresji.
-S .suf --suffix .suf
Użyj rozszerzenia .suf zamiast .gz. Można użyć
dowolnego rozszerzenia, chociaż należy unikać
innych niż .z lub .gz, aby uniknąć zamieszania po
transferze plików do innego systemu. Rozszerzenie o
zerowej długości powoduje, że gunzip usiłuje
zdekompresować wswzystkie napotkane pliki
niezależnie od rozszerzenia, np:
gunzip -S "" * (*.* for MSDOS)
Poprzednie wersje programu gzip używały rozsz
erzenia .z, aby uniknąć konfliktu z programem
pack(1).
-t --test
Sprawdź spójność skompresowanego pliku.
-v --verbose
Wyświetl nazwę i stopień kompresji każdego pliku.
-V --version
Wyświetl numer wersji oraz opcje kompilacji i
zakończ działanie.
-# --fast --best
Określ prędkość kompresji za pomocą cyfry #, gdzie
-1 lub --fast oznacza najszybszą (lecz najmniej
wydajną) kompresję, zaś -9 lub --best oznacza naj
wolniejszą (lecz najbardziej wydajną) metodę kom
presji. Domyślną wartością jest -6 (tzn. zorien
towaną na lepszą kompresję kosztem prędkości).
ZAAWANSOWANE SPOSOBY UŻYCIA
Skompresowane pliki mogą być ze sobą łączone; w takim
wypadku gunzip zdekompresuje wszystkie pliki jednocześnie.
Na przykład:
gzip -c plik1 > foo.gz
gzip -c plik2 >> foo.gz
Następnie
gunzip -c foo
jest równoznaczne z
local 5
gzip(1) gzip(1)
cat plik1 plik2
W wypadku, gdy jeden z połączonych plików zostanie uszkod
zony, pozostałe wciąż mogą być odzyskane (po usunięciu
uszkodzonego pliku). Jednak znacznie lepsze efekty daje
jednoczesne kompresowanie wszystkich plików:
cat plik1 plik2 | gzip > foo.gz
daje lepsze wyniki kompresji niż
gzip -c plik1 plik2 > foo.gz
Jeżeli chcesz od nowa skompresować połączone ze sobą skom
presowane pliki wykonaj polecenie:
gzip -cd stary.gz | gzip > nowy.gz
Jeżeli skompresowny plik został utworzony z kilku skompre
sowanych plików, informacje uzyskane opcją --list dotyczą
tylko ostatniego pliku. Jeżeli interesuje cię rozmiar
wszystkich plików po dekompresji, wykonaj:
gzip -cd plik.gz | wc -c
Jeżeli chcesz umieścić w archiwum kilka plików, a
następnie mieć możliwość oddzielnego ich odzyskania użyj
programów takich, jak tar lub zip. tar w wersji GNU
obsługuje opcję -z, która powoduje wywołanie programu gzip
w sposób niewidzialny dla użytkownika. gzip został zapro
jektowany jako uzupełnienie programu tar; nie może go
zastąpić.
ŚRODOWISKO
W zmiennej środowiskowej GZIP mogą się znajdować domyślne
opcje dla programu gzip. Są one odczytywane na początku;
w ten sposób opcje w linii poleceń mają przed nimi pier
wszeństwo, na przykład:
dla sh: GZIP="-8v --name"; export GZIP
dla csh: setenv GZIP "-8v --name"
dla MSDOS: set GZIP=-8v --name
Na komputerach Vax/VMS zmienna nosi nazwę GZIP_OPT, by
uniknąć konfliktu z zestawem symboli dla wywoływania pro
gramu.
ZOBACZ TAKŻE
znew(1), zcmp(1), zmore(1), zforce(1), gzexe(1), zip(1),
unzip(1), compress(1), pack(1), compact(1)
DIAGNOSTYKA
Kod wyjścia jest normalnie równy 0; jeżeli wystapi błąd,
kod wyjścia jest równy 1. Jeżeli wystąpi ostrzeżenie, kod
wyjścia jest równy 2.
local 6
gzip(1) gzip(1)
Usage: gzip [-cdfhlLnNrtvV19] [-S suffix] [file ...]
W linii poleceń znalazły się nieprawidłowe opcje.
file: not in gzip format
Podany plik nie jest skompresowany (komunikat pro
gramu gunzip).
file: Corrupt input. Use zcat to recover some data.
Skompresowany plik uległ uszkodzeniu. Do miejsca
uszkodzenia dane mogą być odzyskane poleceniem
zcat file > recover
file: compressed with xx bits, can only handle yy bits
Plik został skompresowany (z użyciem algorytmu
LZW) przez program obsługujący kody o większej
ilości bitów niż program do dekompresji na tym
komputerze. Skompresuj plik od nowa programem
gzip, który osiąga lepszy współczynnik kompresji i
używa mniej pamięci.
file: already has .gz suffix -- no change
Plik z rozszerzeniem nazwy .gz nie może być
ponownie kompresowany. Zmień nazwę pliku i spróbuj
ponownie.
file already exists; do you wish to overwrite (y or n)?
Odpowiedz "y", jeżeli chcesz nadpisać istniejący
już plik wyjściowy lub "n", jeżeli nie chcesz
gunzip: corrupt input
Program otrzymał sygnał SIGSEGV co zazwyczaj
oznacza, że plik wejściowy jest uszkodzony.
xx.x%
Osiągnięty stopień kompresji (tylko po podaniu
opcji -v i -l.)
-- not a regular file or directory: ignored
Gdy plik wejściowy nie jest zwykłym plikiem lub
katalogiem (tzn. jest np. dowiązaniem symbol
icznym, gniazdem, kolejką FIFO, plikiem
urządzenia) jest pozostawiany bez zmian.
-- has xx other links: unchanged
Plik wejściowy ma twarde dowiązania i nie może
zostać zmieniony. Więcej informacji znajdziesz w
opisie polecenia ln(1). Użyj opcji -f, aby
wymusić kompresję plików mających twarde
dowiązania.
OSTRZEŻENIA
Podczas zapisywania danych na taśmie, zazwyczaj trzeba
dodać na końcu odpowiednią ilość zer, by ostatnia część
danych zajmowała pełny blok. Gdy dane są odczytywane
przez program gunzip, wykrywa on, że na końcu właściwych
danych znajdują się przypadkowe dane i wypisuje
ostrzeżenie. Aby tego uniknąć, powinieneś używać opcji
--quiet. Ta opcja może być ustawiona w zmiennej
środowiskowej GZIP w następujący sposób:
dla sh: GZIP="-q"; tar -xfz --block-compress /dev/rst0
dla csh: setenv GZIP -q; tar -xfz --block-compr
/dev/rst0
local 7
gzip(1) gzip(1)
W powyższym przykładzie gzip jest niejawnie wywoływany
przez program tar dzięki opcji -z programu GNU tar. Musisz
byc pewien, że do zapisu i odczytu z taśmy użyto tej samej
długości bloku (opcja -b programu tar). W tym przykładzie
zakłada się, że uzywasz programu tar w wersji GNU.
PROBLEMY
Opcja --list wypisuje niewłaściwy rozmiar pliku, jeżeli
jest on większy niż 2 gigabajty. Opcja --list wypisuje
rozmiar jako -1 i CRC jako ffffffff jeżeli plik znajduje
się na nośniku o dostępie sekwencyjnym.
Niekiedy (rzadko) zdarza się, że kompresja z opcją --best
daje gorsze rezultaty niż z opcją domyślną (-6). Niektóre
pliki, w których powtarza się bardzo dużo sekwencji są
lepiej kompresowane programem compress niż gzip.
local 8