单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第4章,文字处理与编辑排版,-Word 2003的应用,4.1 文字信息处理过程,文字处理的全过程大致包含三个环节,即信息输入、文字信息处理加工、文字信息输出。首先要解决用0、1代码串表示文字符号的问题,也就是编码问题。,以英文信息的计算机处理为例,英文字符的编码标准是ASCII码,是七位的二进制代码。中文字符用GB1988国标码标准进行编码,其中除了货币符号置换为人民币符号外,其他都相同。,1.文字信息的输入,对于英文字符来说,通常通过键盘把组成英文词汇的各个英文字母逐个地输入。,2.文字信息的处理,文字信息处理包括多种不同的处理要求。例如,在文稿的编辑操作中,有对文字的增、删、改操作;有对假设干个字、整个句子、整段文字的增、删、改操作。在对文字串的处理中,有分类、合并、比较、排序、检索以及对齐等操作。,3.文字信息的输出,文字信息处理完毕后,要把处理结果的代码信息轮换成文字形式输出,输出的方式包括显示和打印。计算机中的字形是以点阵字形的形式表示的。,4.2 中文文字信息处理,中文是联合国六种工作语言之一。早期的计算机是不能处理汉字信息的,自20世纪60年代以来,日本、中国及其他一些国家相继开展了以汉字信息处理研究。20世纪70年代末到80年代,我国在汉字根本属性、编码和存储、输入输出设备和汉字应用系统等方面的研究取得了迅速突破性进展。,1.汉字的特点,4.2 中文文字信息处理,汉字的主要特点是它属于象形文,字量大,字形复杂。,2.汉字输入技术,目前,把汉字输入计算机的主要方法仍是靠键盘,通过汉字方法输入。,汉字编码输入方法有两大类,一类是整字编码法,另一类是按汉字的字形或发音特征,或利用汉字的形、音特征相结合的编码方法。,目前国内外提出的汉字输入编码方案有500多个,不同的编码方法对应于不同的输入方法。,按汉字字形编码的方案俗称“形码。形码编码规那么往往比较复杂,与阅读文稿时大脑的思维不甚符合。比较成功的的形码有郑码、五笔字形等。,以语音特征来编码的方案俗称“音码。比较成功的音码有微软拼音、智能ABC、清华紫光、全拼输入法等。,3.汉字字模库,汉字输出主要是指汉字字形的输出。输出方式有两种:打印和显示。,描述一个汉字点阵信息的二进制代码串称为汉字的“字模。,