评论

收藏

[Java] Java之哈夫曼压缩原理案例讲解

编程语言 编程语言 发布于:2021-11-07 21:01 | 阅读数:584 | 评论:0

这篇文章主要介绍了Java之哈夫曼压缩原理案例讲解,本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下
1. 哈夫曼压缩原理

  • 首先要明确一点,计算机里面所有的文件都是以二进制的方式存储的。
  • 在计算机的存储单元中,一个ASCII码值占一个字节,1个字节等于8位(1Byte = 8bit)
可以参考这个网站:
ASCII码在线转换计算器
DSC0000.png

以"JavaJavaJavaJavaJavaJava"这个字符串为例,它在计算机内部是这样存储的(每一个字符的ASCII码转换为二进制存储起来):
public static void main(String[] args) {
    String beforeStr = "JavaJavaJavaJavaJavaJava";
    StringBuilder afterStr = new StringBuilder("");
//    把字符串的每一个字符的ASCII码转换为二进制存储起来
    for (int i = 0; i < beforeStr.length(); i++) {
      afterStr.append(binaryToDecimal((int) beforeStr.charAt(i)));
    }
    System.out.println(beforeStr + "
 在计算内是这样存储的: 
" + afterStr);
    System.out.println("afterStr.length = " + afterStr.length());
  }
  //   十进制转换位二进制的算法
  public static String binaryToDecimal(int n) {
    StringBuilder str = new StringBuilder();
    while (n != 0) {
      str.insert(0, n % 2);
      n = n / 2;
    }
//    不满8位前面补0
    while (str.length() < 8) {
      str.insert(0, "0");
    }
    return str.toString();
  }
DSC0001.png

可以发现现在“JavaJavaJavaJavaJavaJava”转01字符串的长度位192
验证文件大小:
1.首先,我新建了一个文件
DSC0002.png

2.填充内容
DSC0003.png

3.查看大小
DSC0004.png

文件大小为24字节 = 24 * 8 = 192bit
以 “JavaJavaJavaJavaJavaJava” 这个字符串每个字符出现的次数为权值建立最优二叉数
DSC0005.png

所以“JavaJavaJavaJavaJavaJava”可以表示为:
001011001011001011001011001011001011 &egrave; 长度为36
所以压缩率为:
原来长度是 192,压缩了 (192-36) = 156
压缩率:156/ 192= 81.25%
到此这篇关于Java之哈夫曼压缩原理案例讲解的文章就介绍到这了,更多相关Java之哈夫曼压缩原理内容请搜索CodeAE代码之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持CodeAE代码之家!
原文链接:https://blog.csdn.net/I_r_o_n_M_a_n/article/details/119257455

关注下面的标签,发现更多相似文章