首页 > 编程知识 正文

数据库中的外码是什么,mysql左外连接查询

时间:2023-05-04 00:08:41 阅读:152829 作者:723

满意的回答

贺明文

2017.10.03

合格率: 57%等级: 10

帮助: 1369人

我们经常说汉字的“内码”和“外码”。

内码是汉字存储在计算机内部,用于处理和传输的信息符号。 它必须与ASCII代码兼容,但不能冲突。

因此,将国标代码的2字节的最高位置'1'与西班牙语区分开来是内码。 汉字的输入代码称为“外码”。 输入代码是输入汉字时使用的代码。 一般的外部符号被分为数字符号(例如,区号)、拼音符号、字形符号) (例如,五笔)。

而且区号,“啊”的区号是1601,用十六进制写的话是0 x 10,0 x 01。 这与计算机中广泛使用的ASCII代码相矛盾。 为了与00-7f的ASCII代码兼容,在区号的高位、低位字节中分别添加了A0。 这样,“啊”的代码就变成了B0A1。 添加了两个A0的代码也称为GB2312代码。 虽然GB2312的原文没有提到这一点。

内码是指操作系统内部的字符编码。 早期操作系统的内部代码与语言相关。 当前的Windows在内部统一使用Unicode,并在代码页上支持多种语言。 “内部代码”的概念很模糊。 在缺省代码页中指定的代码称为内部代码。 内码这个词没有官方的定义。 代码页也只是微软的习惯叫法。 作为程序员,我们只要知道它们是什么,就不需要太多考证这些名词。

代码页(code page )是一种语言中字符的字符编码。 例如,GBK的码页是CP936,BIG5的码页是CP950,GB2312的码页是CP20936。

Windows有默认代码页的概念。 也就是说,默认情况下用什么编码解释字符? 例如,Windows记事本打开一个文本文件,其内容是字节流。 是BA、BA、D7、D6。 Windows该怎么解释? 是用Unicode代码说明、用GBK说明、用BIG5说明、还是用ISO8859-1说明? 用GBK说明的话,会得到“汉字”这个文字。 其他编码解释可能找不到对应的字符,或者可能会找到错误的字符。 所谓“错误”,是指不符合文本制作者的意图,会发生乱码。

答案是Windows根据当前默认的代码页解释文本文件中的字节流。 您可以在“控制”面板的“区域”选项中设置默认代码页。 将记事本另存为时存在ANSI,但实际上它是以默认代码页编码方式保存的。

Windows的内部代码是Unicode,在技术上可以同时支持多个代码页。 如果可以说明文件使用的编码,并且用户安装了相应的代码页,则Windows将正确显示,例如,可以在HTML文件中指定charset。

一个HTML文档的作者,特别是英语作者,认为世界上所有的人都使用英语,并且不会在文档中指定charset。 如果他使用了0x80-0xff之间的字符,中文Windows还会按照默认的GBK进行说明,出现乱码。 在这种情况下,只需在此html文件中添加指定charset的语句即可。 例如,以下内容:

如果原作者使用的代码页与ISO8859-1兼容,就不会出现乱码。 ? ? ?

进一步的参考资料

' shortoverviewofiso-iec 10646 and unicode ' (http://www.nada.kth.se/i18n/UCS/unicode-iso 10646-oview.html ) )

12共享通报

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。