直到今天,我才知道一位是一个变量,或者是内存中的一个空间,它可以保存一个值(高)或零(低)。这是我从学习计算机编程、微处理器或数据总线等中学到的概念。
但是在开始了信息论课程之后,我发现比特是表示为消息中符号的信息内容。这是采用符号出现概率的倒数的对数(以 2 为底)计算得出的。
这两个概念是一样的吗?一方面,一位是可以存储零或一的变量。另一方面,一个比特是与发生概率为 0.5 的两个符号之一相关联的不确定性。那么,计算机编程或 ASCII 码中的 1 位是否意味着源或信息论的信息内容中的 1 位?
一点点编辑:这是我在理解这个主题时遇到困难的一件事。看,在英文字母的数据传输中,如果我们使用 ASCII 码,我们基本上用 8 位来表示每个符号。假设 a 为 00000000,b 为 00000001,等等。所以我们基本上为每个符号分配了 8 个量化级别。
但是当信息论发挥作用时,我们会考虑每个符号的概率。“E”的频率最高,“Z”的频率最低。所以平均信息内容可以归结为 3 或 4 位,对吧?
我的书说,“熵或平均信息内容是表示每个样本不失真所需的最小平均位数”。那么,在这种情况下,为了有效的数据传输,我们是否为每个符号创建最多四个量化级别?因为,平均而言,它们携带价值 4 位的信息。如果是这样,信息论中的比特与计算机编程、数据传输或 ASCII 码等中的比特不一样吗?
你可能知道我在这里显然是个菜鸟:p