欢迎访问广东易畅教育投资控股有限公司官方网站—专注日语教育15年!
南城校区:东莞市南城区鸿福路口鸿富楼六楼 0769 - 8997 1118
东莞日语培训机构
当前位置:首页 > 学习资料 > 正文内容

中日汉字文化的异同点

编辑:蒲公英日韩语培训学校 热度: 时间:2018-03-23

 一、前 言   鸦片战争中,英国军舰的炮击不仅震撼了中国的封建王朝,也震撼了整个东亚。从此,不论是中国还是日本都接受着

 一、前 言
  鸦片战争中,英国军舰的炮击不仅震撼了中国的封建王朝,也震撼了整个东亚。从此,不论是中国还是日本都接受着西方近代资本主义文明的全面攻势。希望尽早摆脱被动局面、实现近代化的知识分子们,将东亚文明停滞的原因之一归结为科学知识的落后,提出为了扫除文盲、普及近代教育就要废除汉字,采用和欧美同样的表音文字的主张。这种将汉字看作实现近代化的障碍的思潮,在一个相当长的时期里,支配着人们的思想。当计算机登上历史舞台之际,汉字仍然被给予否定性的评价,甚至预言汉字不会生存到计算机的时代。即使当因特网出现之际,今后英语会成为全世界共同语的主张仍然十分流行。
  然而非常幸运的是,人们充分地发挥了各种各样的聪明才智,突破难关,用事实证明了汉字不仅计算机可以处理、因特网可以对应,甚至还有可能为创造新的文明充当重要角色。
  但从十九世纪中叶以来的历史中,东亚走向分裂乃至对立,没有能够产生共同进行汉字近代化的机遇。由于日本军国主义的失败,那种险恶和不幸的局面虽告一段落,出现了二十世纪中叶以来的新环境,但也没有产生共同进行汉字改革的动向。在朝鲜半岛,不仅结束了强制推行日语的境况,恢复了自己民族的语言,而且向着摆脱汉字束缚、全面使用本民族文字(谚文)的方向迈进。在日本,制定?quot;当用汉字"(后又称作"常用汉字")方案,对文字的字数进行了限制,同时还对这些常用汉字进行了简化。在中国,汉字文化直接受到了政治对立的影响,分裂为二:中国共产党在大陆取得革命胜利以后,为达到扫除文盲的目的,积极地进行文字改革,淘汰异体字,进行汉字的统一整理,同时还大胆地推进大幅度减少笔画的汉字改革(即制定了简化汉字方案)。另一方面,逃到台湾的国民党政权,站在坚持自己正统性的立场,显示了死守旧汉字系统的态势。因此,中国产生了简体字和繁体字两种书写体系。连说汉语的地区都形成这样的对立,何况说不同语言的日语、朝鲜语等东亚的不同地区呢?所以在相当长的一段时期内,东亚汉字文化圈的汉字统一问题曾被认为不过是一种梦想。
  曾经被许多人推测终究会消亡的汉字,实际上没有消亡,而且今后也不会向那个方向发展。现在,东亚地区沿着各自独立的道路发展而来的汉字文化,出现了新的动向。冷战时期激烈的政治对立阴影的消失,超越国境和政治体制界限的全球规模的经济、文化交流和联系活跃起来。尤其是中国全面推行改革开放政策以来,在即将到来的二十一世纪,东亚将成为充满活力的地区,并以其比以前更加重要的地位而引起世界的瞩目。经济活动的急剧发展,必然加速人员和信息情报的往来,这自然会反映到文字的领域。以前汉字问题被认为是各语言内部的问题,现在却明显地看出,这绝不是各语言本身可以独立解决的问题。计算机能够处理汉字了,各个语言都创立了自己的操作系统并得到普及。尤其是覆盖整个地球的因特网的爆发性发展,以各种语言显示的信息情报,使人们意识不到时空差异,谁都能够在瞬间收发信息。在这样的时代,超越语言和国境界限的汉字和计算机的关系如何解决呢?这是一个新出现的课题。
  任何研究都应从正确把握实际情况出发。在讨论汉字问题上,也首先应当从正确把握汉字在日语、汉语等语言中的实际使用情况着手。在此基础上再考虑计算机时代汉字文化应有的状态。站在这样的角度,搞清楚以下所论及的日语、汉语在各种领域中的汉字使用状况,才可以知道问题所在。具体来说,首先就是要从政治、教育、新闻、人名、地名等领域来调查用电脑处理日语和汉语时所使用的汉字的情况,搞清楚各自的特点。
  二、日本和中国的信息交换用汉字编码体系
  (一)日本的汉字编码
  用计算机处理日语的汉字时所需要的编码体系最初是在1978年日本规格协会作为JIS C 6226∶1978规定下来的。现在应用的是其第四次修改版JIS X 0208∶1997,下面简称为JIS汉字或者JIS。但这里所说的JIS以外的字也是日本规格协会制定的汉字符号集,如《JIS补助汉字》,即JIS X 0212-1990;UNICODE的日本语版,JIS X 0221-1995 (包括了日本的JIS、中国的GB、台湾的CNS、韩国的KS汉字的编码系统);2000年又作为X 0208的扩充,增加了第三水准汉字符号1,249字、第四水准汉字符号2,436字,成为JIS X 0213:2000。但是本论文的研究对象主要是JIS X 0208:1997。JIS汉字分为第一水准汉字(一级)和第二水准汉字(二级)。第一水准的排列是按各个代表字的音序,第二水准汉字的排列是按部首的顺序。JIS由第一水准汉字2,965个和第二水准汉字3,390字构成,合计6,355字。第一水准汉字中有的规定到常用汉字、教育用汉字、人名用汉字中,有的没有规定。
所谓教育用汉字,是指日本文部省《小学学习指导要领》指定的汉字符号,指在小学要教的汉字群。它可以看作是日语中最常用的汉字符号。教育用汉字有《学年别汉字分配表》,其中具体说明了小学各学年应当学习的汉字。在1958年第一次发表的时候,只有881字,此后追加、修改过多次,现在第一学年80字、第二学年160字、第三学年200字、第四学年200字、第五学年185字、第六学年181字,总共1,006字。
  《常用汉字表》的前身,是1946年指定的《当用汉字表》1,850字。再向前推,可以追溯到1923年临时国语调查会提案的《常用汉字表》1,962字。这就是今天《常用汉字表》的基础。《常用汉字表》1981年以《当用汉字表》的修改形式制定下来,共1,945字。其中包含着被指定为教育用汉字的部分。所以,本文的统计表中标有"常"字的是指教育用汉字中没有的常用汉字,共939字。也就是说,包括教育用汉字在内的常用汉字共有1,945字。
  在制定"当用汉字"的时候,限制汉字使用的意图很强,所以人名所使用的字是在其后另外增加定的,亦即现在以法务省令户籍施行规则的附则形式制定的《人名用汉字别表》285字,其中含JIS第一水准汉字符号245字、第二水准汉字符号40字。也就是说,第一水准汉字中不属于教育用字、常用汉字、人名用汉字的有775字。第二水准汉字中不属于人名用汉字的有3,350字。这些数据如表01所示。
  (二)中国的汉字编码系统
  中国大陆的计算机汉字编码体系《国家标准信息交换用汉字编码字符集o基本集》(GB 2312―80),是1980年制定的。(下文简称其为GB)由第一级汉字(3,755字) 和第二级汉字(3,008字)构成,共6,763字。第一级汉字根据读音排列,第二级汉字根据部首排列。这种排列顺序的基本构思是仿照日本的情报交换用汉字符号系统的。在中国,没有像日本的常用汉字、教育用字等那样的应当使用的汉字的国家规定。而是从计算机处理用汉字的需要来统计调查使用频率,并根据其频率由高到低的顺序,取其最高的2,500字为常用字,接下来的1,000字为次常用字,构成《现代汉语常用字表》,于1988年以国家语言文字工作委员会和国家教育委员会的名义公布。但并没有明文规定将这些常用字、次常用字作为学校教育用字来推行。
  笔者综合了中国相当大规模的汉字使用频率统计报告的两种报告资料,进行了分类分析。使用的报告资料如下∶
  1)《汉字频度统计-速成识读优先表》贝贵琴、张学涛汇编 电子工业出版社1988年4月
  2)《现代汉语字频统计表》国家语言文字工作委员会 国家标准局编 语文出版社1992年1月
  前一种资料是对21,657,039字所做的统计结果,使用了新闻、政治、文学、科技等方面的素材,共有字种5,991字,GB中所没有的字共224个。后一种资料也使用了社会科学、自然科学的各个领域的11,872,762字(报告书为11,873,029字,但笔者计算的结果是前面的数字)的文字资料,共有字种7,386个,GB以外的汉字为1,090字。将这二项的结果综合起来的工作十分费力,因为这些印刷品资料有许多不准确的地方。笔者将这二项统计结果进行综合,试分类如下∶从其由高到低的顺序排列,1-500为一级,即最常用字;501-1000为二级,即常用字;1001-1500为三级,即次常用字;1501-3000为四级,即稀用字;由此以下的字至少使用过一次的字为五级,共有3,760字。这五级中,GB第一级汉字符号有806字,第二级汉字有2,654字。再就是在二项中都一次也没有出现的字有302字,将此作为六级。笔者在此所做的分类当然是一种暂时性的,但是整体说来,对于了解汉语用字的情况提供了具有深刻意义的事实。GB汉字符号系统依照上述分为六类的情况如表02所示。
  由这个表可以看出∶GB的第一级汉字和第二级汉字的划分,由于是基于使用频率的,所以第一级汉字所起的作用很大,第一级汉字的字种数占GB总字数的比例不过55.5%,而这些字在使用中却十分活跃,可以覆盖到99.7%。最常用、常用、次常用的字仅1,500字,就可以覆盖到95.4%。可以说证明了基于使用频率的第一级汉字和第二级汉字的区分是相当有效的。这里要说明一下,第二级汉字中,唯一属于我划分的三级的字,是"胞"的异体字"孢"。
  以下依照上述设定的JIS和GB的分类基准,来考查汉字使用的情况。
  三、日本和中国的汉字使用状况
  (一)政治领域的比较
  日本国会首相施政方针演说和中国共产党建国以来的党代表大会的政治报告的用字情况分别用表03和04来表示。
  前者资料是从东京大学东洋文化研究所田中明彦教授的主页上公开的《战后日本形成的基础性研究》资料中下载的(渡边昭夫、山影进、田中明彦制作),其内容是从1951年10月12日的吉田茂的施政方针演说以来,到1997年9月29日的桥本龙太郎的就任演说,还有历代内阁总理大臣的施政演说。总汉字数达307,404字(不含假名字数),这些只用了1,730个字种,并且其99.4%是第一水准汉字。这个实际资料的情况是耐人寻味的。第二水准汉字只使用了57字,总出现次数只有177次。
  中国建国以来党代表大会的政治报告,使用的汉字总数为207,317字,这些只用了2,054个字种。日语中?quot;平假名"、"片假名"这样的假名文字,而汉语中基本上只用汉字,从这一实情考虑,可知汉语出现的汉字更加集中。从中国建国以来的政治风波来看,各个政治报告的内容并不是千篇一律的。尽管如此,第一级汉字2,028字,覆盖率99.98%,再看"最常用汉字"的500字以内可以覆盖85.98%。这是值得注意的,日本国会演说和中国政治报告性质相同,都具有政界的"话题集中化"的特征,所以使用的汉字字种也比较有限。
  (二)新闻报道的比较
  日本朝日新闻社公开发行的《朝日新闻》(今日朝刊)电子版(1998年4月2日到2000年1月31日)的汉字使用状况如表05所示。
  《朝日新闻》(今日朝刊),内容包括"综合"、"社会"、"经济"、"体育"、"社论"、"小说"诸方面。汉字总数达7,547,623字,字种仅有3,660个。而且第一水准汉字2,815字覆盖率达99.87%,仅1,006个教育汉字覆盖率就达89.14%。
  但是需要注意的是,日本的新闻用字、用语是受尽量不越出"常用汉字"这样一个前提来约束的,因此例如"払しょく"(拂拭)一词,虽是汉字词语,却有一部分是用假名书写的。这是由于「払」是常用汉字,而"拭"不是常用汉字。但是另一方面,人名地名等固有名词的书写,近年来采取了按照户籍上的字来书写的原则,所以有时可以不使用标准汉字而使用异体字。因此,现在《朝日新闻》的用字、用语不一定是首尾一致的。使用汉字词语时将不属于常用汉字的部分用平假名来书写,未必是日语的正常的书写方法。但是简易地表达这一本来的目的却是很重要的。绝对地看其是否是常用汉字的分法是没有必要的,应当努力寻求一种易懂的日语书写方式。
  新闻不仅反映日本国内的事情,也报道世界各国的各种各样的事情。当然有JIS汉字范围内处理不了的字。电子版的新闻,对于没有的字用〓来表示,然后再在其后说明其字的写法,如"唐家〓· 中国外相"(〓字是左王右旋)。
  本项目以中国权威性报刊《人民日报》为调查材料。这里采用的是1993年1月到12月和1995年2月到8月的《人民日报》全部新闻语料,对此进行了用字调查。其详细情况如表06所示。一年零七个月之久的语料和《朝日新闻》没有很大差别。但是《人民日报》用的是全文资料,而朝日新闻的今日朝刊基本上只有主要报道,没有牵涉到版权的文章。人民日报全都使用汉字,所以汉字信息量达30,791,482字,是《朝日新闻》的4倍。字种使用了5,945个,其中最常用汉字500字覆盖全部资料的74.91%,第一级汉字3,752字,覆盖全部资料的99.75%,显示出其使用效率状况是相当好的。
  (三)中学语文教科书的比较
  日本小学语文教科书对各年级所学汉字有严格的限定,到了中学就没有这种限定了。我调查了中学一年级到三年级所使用的语文教科书的汉字使用状況,并将教科书的补助教材也作为分析对象。其结果如表07所示。
  三年间的语文教科书及补助教材所使用的汉字总数为65,086字,字种2,089个。其中第一水准汉字1988字,覆盖率95.17%,教育汉字中一次也没有被使用的字在教科书中有22个,补助教材中有11个。常用汉字一次也没有被使用的字在教科书中有285字,补助教材中有74字。各个学年的教科书中所使用字种1,400个左右,这主要是适当考虑到对学生来说不要形成过度负担。
  我们将中国人民教育出版社中学语文室编的九年义务教育三年制初级中学教科书《语文》(全六册)的课文通过电子扫描识别制作成了电子资料。其汉字使用情况如表08所示。
  中国的语文教科书每半年一册,各年级课文平均为36,709字,平均字种2,426个。收入教科书的文章非常广泛,介绍科学知识,翻译外国文学作品、古典文学作品相当多,因而字种总数达3,911个,比GB第一级汉字的数目还多。而且有些在此表中没有出现、用GB码也不能够输入的字,比预想的多,和日语教科书的汉字使用情况有相当大的差别。最常用、常用、次常用的汉字1,500字中,1,485字被使用,覆盖率达到91.70%。
  (四)人名、地名用字的比较
  关于日本的地名信息可以从邮政省(邮电部)的主页(http://www.postal.mpt.go.jp)上关于邮政编号的资料中得到。其中的村镇所使用汉字的分析结果如表09所示。
  人名资料的搜集不像地名那么容易。不是没有姓名资料,而是姓名汉字的书写标准并没有统一规定。比如大藏省(财政部)印刷局发行的《平成12年度职员录》光盘,登载着中央官厅、特殊法人、都道府县、市町村(乡、镇)的科长(或干事)级以上的姓名资料,使用了相当多的JIS编码以外的汉字,而且对编码外汉字的处理方法也有多种,所以要做出正确的统计是很难的。表10所介绍的不包括那些用编码外汉字表示的姓名。
  地名和人名用字综合情况,如表11所示。
  姓名用汉字有许多是JIS汉字编码中没有的,因此很容易做出人名地名用汉字中非常多的推测,其实并非如此。字种的总数为3,276个,相当于第一水准字符集的数字。对第一水准汉字资料字数的覆盖率为98.69%,仅教育用字覆盖率达77.47%。由于也有人名和地名不使用的汉字,所以比起一般的用法来人名和地名的字种反而少了。当然要注意这个统计是省去JIS以外的汉字的。不过,人名地名用的JIS外汉字多数都是异体字,真正意义上的JIS汉字所没有的字并不是太多。
  中国的地名信息也和日本一样,使用的是邮政编码资料。从国家邮政局的主页(http://www.chinapost.gov.cn/)上获得了各地地名资料。此外,还将中国省市简称(如湖南称湘,上海称沪)等在邮编中没有的地名补充进去,其分析结果如表12所示。
  中国人(汉族)的姓并不是太多。相当于中国人姓氏一览表的《百家姓》,其"百"是"很多"的意思。但其不用"万家姓"、"千家姓"来称道,是由于其数也就是几百的规模。而且中国人的姓像王、刘那样的单姓占多数,司马、欧阳这样的复姓很少。名字也一般以二字为多。但近些年来一字的名字增多,姓和名各一字的情况很多,而且用于名字的字是有限的,所以同姓同名的情况非常多。名字的作用本来是用以和他人区别的,但这种区别的作用大幅度下降了。表13所示的是中国人姓名所使用的汉字,其资料来源除了《百家姓》之外,还有中国政府和中国共产党的领导人的姓名、中国大学入学考试合格者的姓名(因特网公布的部分地区合格者姓名)等。
  姓和名加在一起字种多达2,113字,其中姓仅有640字。
  (五)综合结果
  以上就政治演说、新闻、教科书、人名、地名等资料,对日本和中国的信息交换用汉字字符集的使用情况进行了实际调查。此外,对文学作品的调查没有进行。另外,自然科学方面的调查也尚未进行。"没有调查就没有发言权",没有充分的调查就不能正确地发言。在深知现在仅处于不够充分的阶段的前提下,本论文综合各领域使用的汉字信息,明确了现阶段日语和汉语中汉字的使用状况。
  日语的综合情况如表14所示。首先应当明确的是,这个资料对JIS汉字字符集所包含汉字的统计,是不包括JIS之外的汉字的。
日语多达8,777,630字的汉字信息资料,实际上由具有6,355字的JIS汉字中的4,710字(74.11%)的汉字构成。其中从字种数来看,第一水准2,951字、第二水准1,759字。实际上从出现次数来看,仅第一水准汉字就可以覆盖99.79%,而第二水准汉字仅可覆盖0.21%。尤其值得注意的是,教育用字1,006字都被使用,其出现总数占全体的88.26%。再看包括了教育用字以外的常用字的《常用汉字表》的1,945字,有1,943字被使用,只有2个字一次也没有被使用。这两个汉字即"璽"和"朕"。在"主权在民"的日本宪法下,不用这二字是当然的结果。第一水准汉字中,也包含着未必与现代日语使用状况一致的汉字。常用汉字虽然还存在着这样的问题,但是用1,943字能够覆盖日语汉字的97.97%这一事实,应当给予很好的评价。这个成果对于学习日语的外国人的汉字教育应当说具有重要的意义。
  还有一点应当注意,即在JIS汉字的6,355字中,有相当于25.89%的1,645个汉字一次也没有使用过。当然,如果调查对象资料的领域更多些,资料的量再增大些,一次也没有使用过的汉字的数就会减少一些,但是达到全部都使用也是不可能的。
那么,基本上只使用汉字的汉语的情况如何呢?笔者为本项研究所收集的资料的统计、再加上中国已经进行的统计(参照本论文的2.2部分)结果,综合处理后如表15《汉语综合分析结果》所示。不过,这个资料中含有一些为把GB编码以外的字显示在因特网上而使用了汉字结构部件(即部首汉字,在印刷文字中基本不出现) 的资料,所以其数据有些是需要修正的。
  此表中的"既统计"是指在中国进行的汉字调查结果,"新统计"是指笔者本项目的调查结果。"既统计"和"新统计"的资料总字数大体相同。字种数前者比后者多390字。这是由于"既统计"的统计对象资料范围更宽的原因。有趣的结果是"新统计"一次也没有使用过的第一级汉字只有1字。按照"既统计"出现频率的顺序,试分类为最常用(一) 、常用(二) 、次常用(三) 、稀用(四)。将其分类用于"新统计"时,仅有2字在"新统计"未出现,到常用(二)的范围也完全相同,资料字总数也没有多大差别。也就是说,基于出现频率的分类是极为合理有效的。
  从"既统计"和"新统计"综合起来的结果来看,第一级汉字3,755字中一次也没有使用的字是不存在的,占到第一级汉字总字数比例的99.67%。再是第一级汉字并且进入一至三类的次常用以上的汉字仅有1,499字,占到95.40%。第二级汉字字种2,838字,虽然多些,但是只占到总字数的0.33%。
  中国的《信息交换用汉字编码字符集》(GB)的第一级、第二级这一划分,是参考了日本的JIS系统的,但由于汉字的选取是基于使用频率统计结果的,所以是一个远比日语JIS汉字符号集利用效率更高的汉字编码体系。
  四、日语和汉语的汉字信息的互换性
  (一)不能翻译的汉字--固有名词
  人名、地名这些固有名词不能翻译。人员的往来和信息的传达要越过国境和语言的界限来进行。确立站在国际性观点的汉字文化,是一个极为重要的课题。对于不能翻译的地名和人名等固有名词所使用的汉字,要找出各自在信息交换汉字字符集中所没有的字。有这样的字的话,即使该种语言本身不可能用,也应当从国际性信息交换的观念出发,遵循各自语言表现形式(字体)并编入其信息交换用汉字符号集之中。
  据本次调查结果,我们搞清楚了下面的数据∶日语人名、地名所使用的3,276个汉字中,有259个中国的GB编码中没有,在此按照使用频率由高到低的顺序列举如下∶
  畑 辻 笹 萩 樋 畠 梶 榎 樫 槻 栃 薗 込 堺 楢 埜 峠 俵 桝 紘 槇 鉾 礒 榊 喰 宍 塙 簗 椚 麿 槙 椙 柊 杁 籏 蛯   鍜 枡 杣 鴫 椛 榑 匂 糀 枦 粂 莇 杢 鑓 鞆 薙 栂 硲 橿 惇 埣 椥 葎 袰 釼 萢 梛 圷 圀 蕗 鯏 杤 塀 鉋 柾 樒 籔   鳰 筬 垪 垰 畷 枌 纐 騨 釆 梠 蔀 筥 笘 狢 夘 靱 箙 岻 垈 瀞 雫 峅 鵤 鰯 姶 筈 鰺 洸 莚 鋺 呰 栫 狛 鰕 颪 乕   酘 稙 綛 楜 朏 旻 凪 岨 泙 慥 鞁 寉 楪 錺 榲 苙 苳 揃 碆 暘 塰 陦 蘓 枅 桾 昜 娚 檮 圦 蟷 湶 箟 絅 烝 鯲 罧   罍 鯵 緤 縢 廸 戝 閇 嵎 釖 釛 岼 岶 屶 釿 峇 乢 鎹 幵 鏥 錣 鐇 嶬 鳫 鰄 俶 鵄 鴾 鯆 凩 鮓 鮖 鮠 鮴 鰔 鮨 扱   枠 鵺 鷆 亶 矼 乂 磑 碵 閖 壗 墹 埖 垳 坏 闍 哘 硴 鬘 弖 咢 叺 厖 靫 吽 檍 橦 橲 樌 凧 艀 甃 櫁 槫 樛 樮 槝   篶 澪 珸 筰 笂 粭 猯 栴 椣 滉 糘 糒 擶 秡 誂 畉 跿 轌 憙 愃 葹 梺 梹 蒄 桙 蕣 畭 莟 椨 棯 秬 椌 棡 杙 蚫 薑   梼 晄 柧 柆 柤 枩 椡
  在这些汉字中存在着属于异体字性质的字,所以是否有必要全都编入GB码中应当再做考查。
  中国人名、地名用汉字的3,710字中,有515个字日语JIS编码中没有。不过,这个资料中含有GB本身也不能显示而靠汉字偏旁来显示的中国地名汉字的资料,所以如果除去这些偏旁字,数量就会有若干减少。另外,少数民族的人名、地名用字的书写本来以排除为好,如果除去的话,数量也会减少一些。尽管如此,也有500字左右,而且属于GB第一级汉字、而JIS汉字不能够显示的中国人名、地名用字只有129字。列举如下∶
  啊 盎 扒 吧 靶 坝 爸 梆 泵 膘 脖 糙 碴 搽 铲 扯 澈 郴 撑 滁 挡 蹬 凳 邓 翟 滇 靛 垫 碉 刁 碟 懂 侗 陡 墩 囤   掇 垛 洱 份 涪 噶 嘎 赶 赣 篙 搞 埂 龚 菇 焊 夯 郝 阂 烘 磺 靳 卡 炕 棵 垮 筷 盔 啦 拦 涝 厉 傈 晾 另 咙 潞   铝 滦 抡 箩 蚂 玫 镁 锰 瞄 闽 蘑 哪 奶 淖 妮 帕 盼 庞 跑 砰 坯 莆 柒 歧 俏 擎 醛 煞 拴 僳 塌 碳 躺 趟 惕 屉   彤 拖 挖 桅 潍 锌 邢 汛 丫 氧 荧 郧 匀 咱 眨 詹 漳 桩 桌 淄 鬃
  日语的JIS汉字编码体系只要补充这129字,在汉字信息交换这一点上就会变得非常方便了。
  不论在日本还是中国,以前在选定各自的信息交换用汉字编码体系时,缺乏国际性信息交换的观念。当时基本都是急于制定各国的语言文字编码体系,所以造成这种现状也是不得已的。另外只是根据字形相同或相似这些表面现象来设计各国的编码体系,这也是无视各自语言的特殊性的表面处理。在这一点上,像UNICODE编码体系那样的处理也不能解决本质问题。
  但是,如前所述,用于固有名词的、不能翻译的汉字,不仅要考虑本国语言,而且有必要考虑汉字文化圈全体都能够通用。另外,正如前面的分析结果所表明的那样,即使将其他语言所使用的人名、地名用汉字编入本语言的汉字编码体系中,也不会给其汉字编码体系带来混乱。从国际性信息交换的观念来看,确保固有名词所使用的汉字信息的互换性,是应当早日解决的问题。
  (二)覆盖率为99.9%时所需要的汉字
  汉字存在着简体字和繁体字,这只是汉字的具体表现形态(字体)不同而已,并非用法不同。书写为"国"还是"國",发音、意义、语法功能都没有不同。日语和汉语的情况,由于语言不同,用法(比如发音、意义、语法功能)也不同。字形也有因简化方法不同而有差异的情况,但即使存在因不同语言而有不同的用法,而作为文字的汉字基本是相通的。这和拉丁字母可以跨越语言的界限在世界许多语言中被使用是同样的道理。
  如前面的统计结果所显示的那样,当汉字成为一定范围内的文字体系时,可以说是效率良好的文字系统,而越过其范围时其非效率性的另一侧面就会表现出来。在日语和汉语中都能够达到99.9%的汉字群,应当说是日常使用最频繁的汉字群。以本项目调查的综合资料而言,日语中最频繁的汉字群,即出现频率顺序在1到2770位之间的汉字群。这个数值大体接近于JIS第一水准汉字的2,965字。汉语中则是1到4262位之间的汉字群。这个数值比GB第一级汉字的3,755字多出十分之一以上。因此,日语覆盖率达到99.9%所需的汉字和汉语覆盖率达到99.9%所需的汉字加在一起,日语和汉语都应当是可以覆盖到99.9%的。以本调查结果所显示,其数为7,032字。
  如果不把字形这个表现形式的差异作为问题,而将有相互对应字体的情况看作同一汉字,那么就会比单纯相加的7,032这个字数要少得多。
  下面将无论在日语中还是在汉语中覆盖率都可以达到99.9%时所需要的汉字列表显示。即先以GB字符集为基础,将JIS字符集重合;再以JIS字符集为基础,将GB字符集重合;看实际上需要多少个字种。这时,看是否能够重合的标准,不采纳只看字形相似不相似的观点,而是考虑到字义、字音的关联性等文字的共同性来作综合判断。将GB作为基础的统计结果如表16"GB汉语、日语覆盖99.9%"所示;将JIS作为基础的统计结果如表17"JIS日语、汉语覆盖99.9%"所示。
  以GB为基础不能够显示的JIS汉字只有下列70字∶
  鯵 扱 噂 榎 薗 樫 橿 梶 椛 喰 粂 紘 込 冴 堺 榊 笹 鴫 宍 雫 椙 揃 凧 栂 槻 辻 嬬 峠 栃 惇 薙 楢 匂 埜 覗 萩   筈 畑 畠 塙 樋 柊 俵 塀 鉾 槙 桝 麿 杢 匁 鑓 枠 呟 囃 暘 杁 杣 枦 枡 椚 榑 礒 箟 簗 籏 糀 蛯 郤 鍜 槇
  加上这70字,GB字符集便可以覆盖日语汉字的99.9%。
  与此相对,以JIS为基础不能显示的GB汉字数是其七倍以上,多达511字(字例从略)。
  将二者进行比较可以看出∶GB汉字字符集所缺少的JIS汉字的高频字2,770位以内的字几乎都是日本造的汉字,又称为"和字"或"国字"。与此相对,JIS汉字字符集所缺少的GB汉字的高频字4,626位以内的字是多种多样的。只将汉字作为基本文字,还是将汉字和假名并用作为基本文字?二者的不同在此显示出来了。
  JIS汉字字符集到底是日语的汉字编码体系,能否覆盖汉语的99.9%未必是很重要的。如在本节第一部分中所论述的那样,汉语的汉字有必要加进JIS中的字,不过是那些不能翻译的固有名词所使用的汉字。只在GB中加上70字就能够显示日语的99.9%,或者在JIS中加上511字就可以显示汉语的99.9%。这个事实,为我们考虑真正意义上汉字文化圈的统一编码体系提供了一个重要的提示。
  (三)不受字形束缚的汉字世界--汉点字
  不同的语言之间,真正意义上的统一编码,是不囿于字形的理念型汉字编码体系。其极限的形体即"点字"(盲文)的领域。关于这一点,笔者知道在日本有用来表示日语汉字的八点式"汉点字"编码体系,并曾经撰写了论文提议将其发展成为国际汉点字,对其可能性与必要性进行过论述。(见日本中国语学会编的《中国语学》240号、1993年所收的村田忠禧《点字的汉字书写的必要性和可能性-面向国际汉点字的创造》)这次关于日本和中国汉字使用状况的调查,更加证实了这个提议的有效性。
  一般的点字在日语或汉语中都是以左右各三点的凸凹块构成一个点字,从理论上说,共六十三个组合,用以表现汉字是绝对不够的,所以只有表音文字的功能。但是这六个点构成的凸凹组合的上部左侧再加一个凸点,用以表示汉字的开始符号,在右侧上部再加上一个凸点用以表示汉字终了的符号,就构成了"八点式"点字。据此设想,第一个块有汉字开始符号、第二个块有汉字终了符号的话,就构成一个单位,表示一个汉字。这样就可能有63×63=3,969 个组合。再看最基本的汉字的情形,由63个块上附加上开始符号和终了符号就使得点字表示汉字成为可能。因此,用这样的一个块或两个块能够表示约4,000个汉字。对于使用频率低的汉字可以用三个块来表示,那么能够表现的汉字的数量就会格外地增加。所以,从理论上来说,点字表示汉字是有充分可能性的。今后应当考虑的是怎样的汉字有必要制成点字这一汉字的选定问题。再就是探究如何发挥汉字本来的特征,使其实现最易于识别、易  于记忆的合理组合排列方式的问题。为此,东亚汉字文化圈需要去共同研究开发。
  对盲人来说,现行的只能表现发音的点字还是不方便。这就和一般明眼人读那种不使用汉字、只使用表音文字写的文章时会感到很不方便是一样的。笔者以前在香港听到过这样的担心:香港回归之后,对香港的盲人来说,如果和大陆统一,以前学会的广东话的点字就不能再用了,要学习北京话的点字吧,汉语的点字也和日本的一般假名点字一样,只能表示发音。广东话的点字和北京话(普通话)的点字是完全不同的点字体系,所以才产生这样的担心。不仅如此,台湾的点字(这里是国语的点字,基本上和普通话发音相同)和大陆普通话的点字也是完全不同的体系。也就是说,北京、台北、香港的盲人使用表音方式的点字,是不能够直接进行文字交流的。如果有了直接表示汉字的点字,这样的问题就不存在了。再把日语汉字也考虑进去的话,和日语之间也就可以通过汉点字进行通信了。所以务必首先在点字这一极端的文字编码体系领域内实现汉字文化的统一。如果能够在不囿于字形的点字领域实现汉字文化统一,并以此为契机,站在新角度,才可能在有形的领域,探求汉字文化统一的科学基础。

1.本站部分内容来源于互联网权威网站,内容具合法性;

2.文章内容并不代表观点或立场,如有关于文章内容、版权或其它问题请联系蒲公英日韩语培训学校删除;

[field:keywords/]相关推荐
  • 教你七夕告白日语小句子,撩妹必备的土味情话

    教你七夕告白日语小句子,撩妹必备的土味情话

  • 这个暑假蒲公英让你零基础学好日语 N1/N2不是问题

    这个暑假蒲公英让你零基础学好日语 N1/N2不是问

  • 东莞道滘日语培训暑假班-上班族轻松学日语お疲れ様とご苦労様

    东莞道滘日语培训暑假班-上班族轻松学日语お疲

  • 平常简单的日语元音练习题有助于提高日语口语

    平常简单的日语元音练习题有助于提高日语口语

  • 学好日语不是一朝一夕就可以学会的,需要持之以恒

    学好日语不是一朝一夕就可以学会的,需要持之以恒

  • 韩语单词如何记忆最好 初学韩语的注意要点

    韩语单词如何记忆最好 初学韩语的注意要点

  • 喜报!蒲公英日语2020高考日语高分榜揭晓!

    喜报!蒲公英日语2020高考日语高分榜揭晓!

  • 高考日语助你上理想大学-东莞蒲公英日语培训学校

    高考日语助你上理想大学-东莞蒲公英日语培训学

  • 自己平时多复习对高考日语有帮助

    自己平时多复习对高考日语有帮助

  • 轻轻松松学韩语 适合学韩语的韩剧

    轻轻松松学韩语 适合学韩语的韩剧

  • 初学者怎么学韩语 怎么自学好

    初学者怎么学韩语 怎么自学好

  • 怎么快速学韩语 学韩语好还是学日语好

    怎么快速学韩语 学韩语好还是学日语好

联系我们

南城校址
:东莞市南城区鸿福路口鸿富楼6楼(时尚电器对面)
南城校区:0769 - 8997 1118

官方公众号 
Copyright © 2012-2023 版权所有 广东易畅教育投资控股有限公司 粤ICP备11013012号-7