C# распаковка gzip-архива (в .NET Framework 2.0)

Для работы с gzip-архивами есть класс GZipStream из пространства имен System.IO.Compression, доступный в .NET Framework 2.0, однако в MSDN почему-то получилось, как в анекдоте про Вовочку, класс есть, а слова такого нету примера под второй фреймворк нет. В том, который есть, используется отсутствующий метод CopyTo() Пришлось действовать без него:

1. Заводим три потока, собственно GZipStream два FileStream для чтения сжатого и записи распакованного файла.

GZipStream gzip = null;
FileStream readStream = null;
FileStream writeStream = null;

Все дальнейшее лучше делать в try/catch, чтобы отловить возможные ошибки

2. Открываем оригинальный файл на чтение, распакованный на запись:

readStream = new FileStream(originalFile, FileMode.Open);
writeStream = new FileStream(unpackedFile, FileMode.Create);

3. Создаем поток GZipStream, подсовываем ему поток, откуда читать данные, и устанавливаем CompressionMode в Decompress

gzip = new GZipStream(readStream,CompressionMode.Decompress);

А теперь делаем CopyTo, только без самой CopyTo:

1. Заводим переменную с размером буфера, сам буфер, и переменную для хранения фактического количества прочитанных из потока GZipStream байт:

int size = 1024; //размер буфера для обмена между потоками
byte[] unpackbuf = new byte[size]; //буфер
int count = 0; //для хранения фактически прочитанных байт

Чем больше размер буфера, тем быстрее пойдет процесс.

2. Читаем данные кусками размером size из GZipStream и пишем их в поток выходного файла:

//пишем распакованные данные по кускам
do
{
 	count = gzip.Read(unpackbuf, 0, size); //читаем кусками размером size
 	if (count > 0) //если данные есть
 	{                        
 		writeStream.Write(unpackbuf, 0, count); //пишем 
 		//фактически прочитанное кол-во байт
  	}
} while (count > 0);

3. Закрываем потоки:
gzip.Close();
readStream.Close();
writeStream.Close();

И ТЕЛЕМАРКЕТ!

Функция целиком

public bool Unpack(string originalFile, string unpackedFile)
{            
    GZipStream gzip = null;
    FileStream readStream = null;
    FileStream writeStream = null;

    try
    {
        readStream = new FileStream(originalFile, FileMode.Open);               
        writeStream = new FileStream(unpackedFile, FileMode.Create);         
        gzip = new GZipStream(readStream,CompressionMode.Decompress);

        int size = 1024; //размер буфера для обмена между потоками
        byte[] unpackbuf = new byte[size]; //буфер                
        int count = 0; //для хранения фактически прочитанных байт
        
        //пишем распакованные данные по кускам
        do
        {
            count = gzip.Read(unpackbuf, 0, size); //читаем кусками размером size
            if (count > 0) //если данные есть
            {                        
                writeStream.Write(unpackbuf, 0, count); //пишем фактически 
                //прочитанное кол-во байт
            }
        } while (count > 0);                
    }
    catch (Exception ex)
    {
        if (readStream != null) readStream.Close();
        if (writeStream != null) writeStream.Close();
        if (gzip != null) gzip.Close();
        ErrorMessage = ex.Message;

        return false;
    }
    
    gzip.Close();
    readStream.Close();
    writeStream.Close();
    return true;
}

Получение имени распакованного файла, как в других программах, работающих с gzip

На самом деле, архив формата gzip не хранит исходное имя сжатого файла, и вообще хранит один единственный файл. Однако принято, что распакованный файл носит то же имя, что и имя архива, но без расширения .gz, если оно присутствует. Вот функция, которая «отрезает» расширение:

public string GetUnpackedFilename(string fileName)
{
    FileInfo fi = new FileInfo(fileName);
    string unpackedFile = fileName.Substring(0, fileName.Length -
        fi.Extension.Length);
    return unpackedFile;
}

Код на PasteBin
На Github

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *