汉字机内代码
中汉字的代码也是二进制代码,根据应用目的,汉字代码可分为外码、交换码、机器码和外形码。
1 .外码(输入码)外码又称输入码,是用于将汉字输入计算机的一组键盘符号。 常用的输入码有拼音、笔形码、自然码、表形码、认证码、区域码和保真等,一个好码码码规则简单、易记、操作方便、重码率低、输入速度快2 .交换码(国标代码)计算机内部处理的信息全部用二进制码表示,汉字也不例外。 二进制码不好用,需要采用信息交换码。 中国标准总局于1981年制定了中华人民共和国国家标准GB2312--80 《信息交换用汉字编码字符集--基本集》,即国家标准代码。 区号是国标编号的另一种表现形式,将国标GB2312--80的汉字、图形符号组成9494的方阵,分为94个“区”,各区含有94个“位”。 其中,“区”的号码是01到94,“位”的号码也是01到94。 94个区中位置总数=9494=8836个,其中7445个汉字和图形文字分别占一个位置后,还剩1391个空位,这1391个空位留有备用。 3 .机器码根据国标代码的规定,有为每个汉字确定的二进制码,微机内部的汉字代码使用机器码,磁盘上记录汉字代码也使用机器码。 4 .汉字字形码字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写成同样大小的方形。 通常用1616点显示汉字。 5 .汉字地址码汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。 与汉字内码具有简单的对应关系,使内码到地址码的转换变得简单。 标题:汉字统计time limit :2000/1000 ms (Java/others ) memory limit 336065536/32768 k (Java/others ) ) )。
总订阅(s ) : 30976加速订阅(s ) : 16990
Problem Description计算给定文本文件中的汉字数。 Input输入文件首先包含表示测试实例数量的整数n,然后包含n段文本。 Output对于各段落的文本,输出其中的汉字数,各测试实例的输出占一行。
[Hint:]从汉字机内代码的特征来看~
Sample Input 2WaHaHa! WaHaHa! 今年的庆典不说话只说普通话! WaHaHa! 马上就要期末考试了,Are you ready? Sample Output 149 //代码如下。 #include fstream
#includeiostream
#includecmath
#include cstdlib
#include cstring
#include algorithm
using namespace std;
int main () )
{
char a[1000];
int n; cinn; getchar (;
wile(n----) )。
{gets(a );
intlen=Strlen(a );
int res=0;
for(intI=0; ilen; I )
{
if(a ) I )0) res;
}
res/=2;
coutresendl;
}
返回0;
}
//汉字的ascii码值小于零。 因为汉字使用了2字节,所以结果会除以2。