ARJ
Что-то меня потянуло на разную околокомпьютерную древность.
Пока экспериментировал с арифметическим кодированием, как-то сами собой вспомнились различные архиваторы времён ДОСа, но больше всего почему-то ARJ, который в «Иркеннефти», где я иногда в летние каникулы работал в детстве, называли «а-эр-йот».
Захотелось его сравнить с чем-нибудь современным.
Скачал виртуальную машину с MS-DOS 6.22, установил туда ARJ 2.21 (это версия сентября 1991 года) и попробовал посмотреть насколько уменьшится один из рассказов Анджея Земянского — первый попавшийся текстовый файл, который был у меня на компьютере.
В итоге файл размером 214962 байт ужался до 67634, это 31,5% исходного объёма. Современный архиватор xz 5.4.2 на максималках (использует алгоритмы LZMA и LZMA2) ужал тот же файл до 54648 байт, это 25,4% исходного объёма. Вроде неплохой прогресс.
Но потом я вспомнил, что где-то в сети существует таблица сравнения архиваторов за 2002-й год. Победителя нагуглить не удалось, зато архиватор «Compressia», который находится строчкой ниже, нашёлся на «ВебАрхиве». Он смог сжать тот же файл до 44361 байт, что составляет 20,6% исходного файла. А это архиватор 2003-го года (я скачал последнюю версию — 1.0b)!
Всё как обычно — есть популярные продукты, а есть почти неизвестные программы, которые в тёмном углу пилят какие-то одиночки. Любопытно — как обстоят дела в этом пыльном углу в этом году, каких успехов добились такие малоизвестные архиваторы?
plain text лучше всего жал архиватор HA. Но он был очень медленным. :)
HA же для текстов! %)
Но вот чем их распаковать сейчас, непонятно.
HA, точно :) Тем более я знаю где взять более быстрый его вариант. Правда не исключено, что это сейчас совсем неважно. Надо попробовать :)
Попробовал. Сжимает почти махом (ещё бы, на текущих-то мощах), сжал в 51088 байт (23,7%).
Да уже не один десяток лет определяющим фактором является не степень сжатия, а отношение времени упаковки/распаковки относительно скорости передачи по сети. Ну и совместимость. Тот же HA, если найдется в архивах, распаковать можно только с бубном. Хотя во времена «запихнем побольше на дискету» нормально спасал.
Никто же всерьёз не предлагает HA/ARJ использовать :)
Похоже, всё позабыто и позаброшено ¯\_(ツ)_/¯
http://compression.ru/arctest/act/act-text.htm
Ну да, эта ссылка есть в моей заметке :)