,单击此处编辑母版标题样式,单击此处编辑母版文本样式,内容提要,一、汉字信息处理技术的基本概念,国标码,内码,汉字输入码,汉字字形码,二、,Windows,中文输入法概述,常用输入法的使用,第三章 汉字处理与输入法,第一节 汉字处理,汉字信息处理的定义,对汉字进行,输入、识别、存储、传输和输出,等操作的统称。,一、汉字编码国标标准,GB2312-80,1,、,国标码,1980,年,我国颁布了第一个汉字编码 的国家标准,:,信息交换用汉字编码字符集,基本集,,即,GB2312,。,一个汉字用,2,个字节(,Byte,),表示。,第三章 汉字处理与输入法,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准,因此又称为“,国标码,”。亦称为“,汉字交换码,”。,国标码字符集收录了,6763,个常用汉字和各种符号,682,个,合计7445个。,其中一级汉字,3755,个,是,最常用,的,在编码表中,按,汉语拼音,字母顺序排列,;二级汉字,3008个,,按,偏旁部首,的笔画顺序排列,。,第三章 汉字处理与输入法,2、区位码,GB2312给出了一个二维,双字节,编码表,该表有94行、94列。行又称为“区”(Section),由第一字节表示;列又称为“位”(Position),用第二字节。用该表来存放7445个汉字或字符。,该表中的每个汉字或字符也可以用它在表中所在位置的区号和位号来标识,即,区位码,。,区位码是一个,四位,的,十进制数,,,每个区位码,都对应着,一个,唯一,的汉字或符号,。,第三章 汉字处理与输入法,在区位码表中,,一级汉字,存放在1655区,按照拼音顺序排列,同音字按起笔横、竖、撇、捺、折的顺序;,二级汉字,存放在5687区,按照偏旁部首顺序排列。各种汉字符号存放在19区,二、汉字编码:(略),1、汉字输入码,为了将汉字输入计算机而编制的代码,又称为,外码,。,第三章 汉字处理与输入法,该码直接与,汉字输入法,相关,即每种汉字输入法对应一种外码,因此,一个汉字的外码不唯一,外码应该简明、易记、重码少。,目前,常用的键盘汉字输入法分为,音码,、,形码,和,音形码,三类(详见“中文输入法”)。,非键盘输入方式:笔、语音、扫描输入。,2、汉字机内码:,简称为内码,是,计算机内部存储、处理和传输汉字时所用的代码,。,第三章 汉字处理与输入法,一个汉字内码占2个字节存储空间,且每个字节的最高位都是1,即把,国标码每个字节的最高位由,0,置为,1,,避免与ASCII码混淆。,【注意】,Unicode编码系统将统一ASCII与汉字的表示。,区位码,和,国标码,的关系,国标码是区位码的行号、列号各增加,32D(20H),后得到的双,7,位二进制,编码,最高位为,0,。,第三章 汉字处理与输入法,【总结】,1、,国标码,的高位、低位,=区位码,的高位、低位各,加,32D(即20H)。,2、,机内码,的高位、低位=,国标码,的高位、低位各,加,128D(即80H)。,【例】设汉字“东”的区位码为2211D,求国标码和机内码。,国标码的高位:,22+32=54,国标码的低位:,11+32=43,机内码的高位:,22+32+128,机内码的低位:,11+32+128,第三章 汉字处理与输入法,3、汉字字形码,(1)定义,汉字在屏幕上显示或在打印机上输出时,为了能被人们理解和接受,必须以,汉字字形,输出,这种采用二进制数对汉字的字形进行编码的方法称为,汉字字形码,。,第三章 汉字处理与输入法,汉字字形是一般以,点阵方式,表示汉字的。用点阵方式表示汉字,即每个汉字分解成若干,点,,,一个点对应一位(bit),。点阵中的每个点可以有明、暗两种状态,如果该处有,笔划,,则为亮,否则为暗。,用点阵方法描述汉字,点数越多,字形越精确、美观,但存储量越大。如一个1616点阵表示的汉字的存储容量为32Byte,甚至可以用128 128点阵表示一个汉字。,下页图为16 16点阵表示的汉字。,第三章 汉字处理与输入法,1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1616点阵字型,第三章 汉字处理与输入法,(2)汉字字形码的存储,存储汉字字形点阵信息的介质称为,(汉)字库,,字库又分为,软字库,和,硬字库,。,软字库是将汉字字库文件存储在,磁盘,上,使用时必须将其读入内存。,硬字库是将汉字字库存储在,汉卡,中(亦称中文卡),汉卡是由特殊的,集成电路,制成的,安装在机器的扩展槽中。通过,汉卡,,可以节省存储空间,减少CPU占用率,提高处理速度。,第三章 汉字处理与输入法,【,问题,】,存储一个16 16点阵字型码需要多大的存储空间?,【,补充,】字形还可以用,矢量,和曲线,轮廓,表示,4、汉字地址码,是,汉字字模库,中存储汉字字形代码的逻辑地址码,即汉字字形码在存储介质的顺序码。,而且通过某种对应关系,可以从,内码,推算出,汉字地址码,。通过,汉字地址码,,便于从字库中提取,汉字字形码,,从而完成汉字的显示。,32Byte,第三章 汉字处理与输入法,5、汉字信息交换码,是用于,汉字信息处理系统,之间或者,通信系统之间,进行汉字信息交换用的汉字代码,即,国标码,。,6、汉字控制功能码(,不要求,),不表示具体的汉字信息,而是,控制汉字输入、处理、存储、传输和输出的信息,,直接影响到汉字系统的效率和性能。,第三章 汉字处理与输入法,7、汉字扩充码:(,了解,),是按照国家标准GB2311进行扩充的编码,如汉字交换码(GB2312)和汉字控制码。,基于中西文兼容,及扩大汉字使用范围。,补充,:,GBK,汉字集,GBK,,,即,汉字扩充内码规范,,又,称大字符集,,一共收录了,20902,个汉字。它包容了,GB2312-80,的,6763,个常用汉字,台湾,BIG5,码,13000,多个汉字,是目前见到的收录汉字最多的汉字系统。,第三章 汉字处理与输入法,计算机汉字处理总结,(,1,)通过某种汉字输入法,由输入设备输入,汉字,的,外码(汉字输入码,);,(,2,)汉字输入系统将汉字,外码,转换为,内码,并存储;,(,3,)如果要进行汉字通信,将内码转换为,汉字交换码,实现网络传输;,(,4,)将汉字内码转换为,汉字地址码,,再从汉字库中提取出相应,汉字字形码,;,(,5,)通过输出设备把汉字字形码输出为,汉字,。,第三章 汉字处理与输入法,第二节 汉字输入,一、中文输入法安装,1、中文Windows 缺省的输入法,Windows安装完成后,系统提供了多种汉字输入法:,微软拼音、全拼、双拼、郑码和智能ABC等输入法。,第三章 汉字处理与输入法,2、其他输入法的安装,【方法一】(安装内置的输入法),(1)打开“,控制面板,”窗口,,双击“区域选项”图标,,打开,“区域选项”,对话框。,(2)单击,“输入法区域设置”,选项卡,再单击“添加”按钮,打开“,添加输入法区域设置,”对话框。,(3)选取相应的区域设置和键盘布局,并确定。,第三章 汉字处理与输入法,【方法二】(安装系统外汉字输入法),运行相应汉字输入法的,安装程序,。如智能陈桥的“,智能陈桥.exe,”或王码五笔字型的“,setup.exe,”,3、输入法的删除,第三章 汉字处理与输入法,二、输入法的切换,1、使用鼠标,【步骤】1、单击,“任务栏”,上的,“输入法指示器”,。,2、屏幕弹出当前系统已安装的各种输入法菜单,单击要选用的输入法。,2、使用键盘,Ctrl+Shift,键在英文及中文输入法之间进行,切换,。,3、定义默认的输入法,在,“键盘属性”,对话框,的,“输入法设置区域”,选项卡下,选取某个输入法,单击“,设置为默认值,”按鈕,并确定。,第三章 汉字处理与输入法,三、输入法状态窗口,选择某种输入法,出现相应输入法状态窗口(该窗口可由,输入法状态图符菜单,控制):,第三章 汉字处理与输入法,1、中英文切换,(1)鼠标操作,单击输入法状态窗口的中,英文切换按钮,。,(2)键盘操作,Caps Lock,和,Ctrl+Space,键切换(Shift)。,2、输入方式切换,针对同一种输入法而言,单击输入法状态窗口的,“输入方式切换按钮”,进行切换。,不同输入法,其方式不同,如“智能陈桥”是“五笔/拼音”,智能ABC是“标准/双拼”。,第三章 汉字处理与输入法,3、全角/半角切换,(1)鼠标操作,单击输入法状态窗口中的,全角/半角切换按钮,。,(2)键盘操作,键盘,Shift+Space 键,切换。,第三章 汉字处理与输入法,4、中英文标点的输入,(1)中英文标点的切换,鼠标操作:单击输入法状态窗口中的,中英文标点切换按钮,。,键盘操作:键盘,Ctrl+.(句号)键,切换。,第三章 汉字处理与输入法,(2)中英文标点的输入,在英文标点状态下,所有标点与键盘一一对应。,在中文标点状态下,中文标点符号与键盘的对照关系如下:,(见下页),(3)通过软键盘输入中文标点,(详见5、软键盘操作),第三章 汉字处理与输入法,第三章 汉字处理与输入法,5、软键盘操作,Windows 内置的中文输入法共提供,13 种软键盘,。,(1)打开/关闭,单击输入法状态窗口中的,软键盘切换按钮,。,(2)选择软键盘,右击,输入法状态窗口中的软键盘按钮,可选择不同的软键盘。,第三章 汉字处理与输入法,四、外码窗口和候选窗口,(略),选定一种输入法,并打入第一个外码,,外码窗口,和,候选窗口,弹出如下:,第三章 汉字处理与输入法,1、外码窗口,显示输入的外码,同时可以进行编辑,几个通用的编辑键为:,Backspace,:删除一个外码,Esc,:取消所有外码,2、候选窗口,显示重码的字、词,可用鼠标、键盘进行选择(,建议用键盘选择,)。,第三章 汉字处理与输入法,五、输入法状态图符,(略),1、输入法已打开,2、输入法已关闭,二者可以通过,输入法状态,图符菜单,(见右)来控制。,3、图符菜单的其他操作,第三章 汉字处理与输入法,六、目前常用的输入法,(略),1、,智能ABC输入法,包括全拼、简拼、混拼及双打输入方式,并且具有自动记忆、自动分词和构词等智能功能。,(1)全拼输入规则,按规范的汉语拼音输入,输入过程和书写汉语拼音的过程完全一致。,(2)简拼规则,取各个音节的第一个字母(声母)组成,对于包含 zh、ch、sh(知、吃、诗)的音节,也可以取前两个字母组成。,第三章 汉字处理与输入法,例如:,计算机:jsj,长城:cc,cch,chc,chch,(3)混拼输入规则,对于输入词语,使用全拼可以降低重码率,也可以使用混拼,降低输入强度。,例如:金沙江,jinsj jshaj,第三章 汉字处理与输入法,(4)双打(双拼)输入规则,一个汉字由其声母及韵母两部分(两键)输入。【如】拥护:y s h u,(5)音节分割符:,用来切分音节的符号,如:方案直接输入为fangan(反感),所以应该输入fangan,长安直接输入为changan(产干),所以应该输入changan,2、中文(简体)全拼输入法,同智能ABC全拼输入法,但支持GBK,,字、词最全,,但重码多。,3、五笔字型输入法,通过把汉字拆分成字根来输入,基本可实现,盲打,。但学习曲线比较陡。(字根图见下页),第三章 汉字处理与输入法,第三章 汉字处理与输入法,第三章 汉字处理与输入法,七、提高汉字输入速度小结,(略),(1),正确坐姿与指法,(2),熟悉一种汉字输入法,熟悉外码规则,(3)尽量用,词组、高频字或简略方式输入,【,如,】我们wm,(4)掌握一些输入技巧,(5)在实践中不断总结、提高,