Каникулы торрент |
Длина - 3 бита Это число из третьей группы, в которую входят числа 4. Длина четыре бита Это число из четвертой группы, в которую входят числа 8. Порядковый номер в группе - Торрент. Это число из шестой группы, в которую входят числа 32. Порядковый номер в группе - 001100. В итоге мы имеем следующее представленаНа запись ушло 12 битов, это и есть расплата за то, что самый часто встречающийся символ заменили одним битом.
Теперь можно написать алгоритм перекодировки из обычной системы двоичного кодирования в рассмотренную выше, выше. Теперь посмотрим, как работает декомпрессирующая программа. Пусть на нее поступила произвольная последовательность битов,например-всего 30 битовКоличество ведущих единиц указывает на длину двоичного кода. Режем текст по ведущим единицамА теперь вместо двоичных значений поставим торрент номера символов-всего 10 символовКак можно заметить декодирование происходит вполне однозначно и несложно.
Можно оценить эффективность компрессии 10 символов у нас торрент в 30 битах примерно в четырех байтах. Во-первых, можно сразу отметить, отметить что для записи 255-го символа нам потребуется вместо каникулы восьми битов нам потребуется 16, и остается уповать на то, что такой символ в файле будет редок. Во-вторых, можно отметить еще одну интересную деталь. Мы теперь можем иметь дело каникулы с 256-ым и с 500-ым символом Коды не ограничены стандартной длиной одного байта и поэтому мы можем иметь в нашем символьном наборе хоть миллион символов.
| Комментировать | « Пред. запись — К дневнику — След. запись » | Страницы: [1] [Новые] |