编码的基础知识 编码的定义 编码是根据一定的协议或格式把模拟信息转换成比特流的过程。 在计算机硬件中,编码coding是在一个主题或单元上为数据存储,管理和分析的目的而转换信息为编码值典型地如数字的过程。在软件中,编码意味着逻辑地使用一个特定的语言如C或C++来执行一个程序。在密码学中,编码是指在编码或密码中写的行为。 将数据转换为代码或编码字符,并能译为原数据形式。是计算机书写指令的过程,程序设计中的一部分。在地图自动制图中,按一定规则用数字与字母表示地图内容的过程,通过编码,使计算机能识别地图的各地理要素。 n位二进制数可以组合成2的n次方个不同的信息,给每个信息规定一个具体码组,这种过程也叫编码。 编码的简介 GB编码标准中,比较常用的是GB2312和GBK两种,GB2312是GBK的一个子集,GB2312编码范围是 0xA1A1 - 0xFEFE ,如果纯粹的 GB2312编码,处理起来是十分简单的,但处理GBK字符集时有些小的提示,先说说GBK编码的标准吧: GBK 采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字包括部首和构件21003 个,图形符号 883 个。 编码的分类 1. 汉字区。包括: a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。 b. GB 13000.1 扩充汉字区。包括: 1 GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。 2 GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。 CJK 汉字在前,按 UCS 代码大小排列;增补的汉字包括部首和构件在后,按《康熙字典》的页码/字位排列。 2.图形符号区。包括: a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外, 还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。 b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。 3. 用户自定义区:分为123三个小区。 1 AAA1-AFFE,码位 564 个。 2 F8A1-FEFE,码位 658 个。 3 A140-A7A0,码位 672 个。 第3区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。 这里有几个小技巧: 一、在php中,字符编码是按所发送的编码为准的,因此使用的就是用户输入的编码,不会自动改变,但在asp中,默认的编码是unicode,这样我们很容易就能得到gbk->unicode的编码对照表,这样即使在毫无基础库的情况下也能很容易的实现gbk到utf-8的转换了; 二、由于GBK是高位最低数值是0x40,即是64,因此,有时候组织一些涉及中文的字串时,分割字符最好用64之前的ascii码,这样在任意情况下替换或分割都不会出现乱码,比较常用的是 ","、";"、":"、" "、" "、" ",这些字符永远都不会给gb编码添乱。 编码的种类 编码Encoding在认知上是解释传入的刺激的一种基本知觉的过程。技术上来说,这是一个复杂的、多阶段的转换过程,从较为客观的感觉输入例如光、声到主观上有意义的体验。 字符编码Character encoding是一套法则,使用该法则能够对自然语言的字符的一个集合如字母表或音节表,与其他东西的一个集合如号码或电脉冲进行配对。 文字编码 文字编码Text encoding使用一种标记语言来标记一篇文字的结构和其他特征,以方便计算机进行处理。 语义编码 语义编码Semantics encoding,以正式语言乙对正式语言甲进行语义编码,即是使用语言乙表达语言甲所有的词汇如程序或说明的一种方法。 电子编码 电子编码Electronic encoding是将一个信号转换成为一个代码,这种代码是被优化过的以利于传输或存储。转换工作通常由一个编解码器完成。 神经编码 神经编码Neural encoding是指信息在神经元中被如何描绘的方法。 记忆编码 记忆编码Memory encoding是把感觉转换成记忆的过程。 加密 加密Encryption是为了保密而对信息进行转换的过程。 译码 译码Transcoding是将编码从一种格式转换到另一种格式的过程。 “的人还: 感谢您的阅读,祝您生活愉快。 本文来源:https://www.wddqw.com/doc/e601379129160b4e767f5acfa1c7aa00b42a9d6a.html