Для работы с gzip-архивами есть класс GZipStream
из пространства имен System.IO.Compression
, доступный в .NET Framework 2.0, однако в MSDN почему-то получилось, как в анекдоте про Вовочку, класс есть, а слова такого нету примера под второй фреймворк нет. В том, который есть, используется отсутствующий метод CopyTo()
Пришлось действовать без него:
1. Заводим три потока, собственно GZipStream
два FileStream
для чтения сжатого и записи распакованного файла.
GZipStream gzip = null;
FileStream readStream = null;
FileStream writeStream = null;
Все дальнейшее лучше делать в try/catch
, чтобы отловить возможные ошибки
2. Открываем оригинальный файл на чтение, распакованный на запись:
readStream = new FileStream(originalFile, FileMode.Open);
writeStream = new FileStream(unpackedFile, FileMode.Create);
3. Создаем поток GZipStream
, подсовываем ему поток, откуда читать данные, и устанавливаем CompressionMode
в Decompress
gzip = new GZipStream(readStream,CompressionMode.Decompress);
А теперь делаем CopyTo
, только без самой CopyTo
:
1. Заводим переменную с размером буфера, сам буфер, и переменную для хранения фактического количества прочитанных из потока GZipStream
байт:
int size = 1024; //размер буфера для обмена между потоками
byte[] unpackbuf = new byte[size]; //буфер
int count = 0; //для хранения фактически прочитанных байт
Чем больше размер буфера, тем быстрее пойдет процесс.
2. Читаем данные кусками размером size
из GZipStream
и пишем их в поток выходного файла:
//пишем распакованные данные по кускам do { count = gzip.Read(unpackbuf, 0, size); //читаем кусками размером size if (count > 0) //если данные есть { writeStream.Write(unpackbuf, 0, count); //пишем //фактически прочитанное кол-во байт } } while (count > 0);
3. Закрываем потоки:
gzip.Close();
readStream.Close();
writeStream.Close();
И ТЕЛЕМАРКЕТ!
Функция целиком под катом
На самом деле, архив формата gzip не хранит исходное имя сжатого файла, и вообще хранит один единственный файл. Однако принято, что распакованный файл носит то же имя, что и имя архива, но без расширения .gz
, если оно присутствует. Вот функция, которая «отрезает» расширение:
public string GetUnpackedFilename(string fileName) { FileInfo fi = new FileInfo(fileName); string unpackedFile = fileName.Substring(0, fileName.Length - fi.Extension.Length); return unpackedFile; }