共1个回答0条评论
分享
为什么 Unicode 中会存在「凉」和「凉」这样两个极其相像的字符?
在贴吧里看到两个一模一样的 ID,仔细看才发现这两个字不一样。第一个「凉」是 U+F979,第二个「凉」是 U+51C9。
尹良灿
排序方式:被封时间
时间排序由新到旧
- 493 个点赞 👍
我来补充一下为什么韩语里“凉”会是多音字,以及怎样用“正常”的方法打出这两个“凉”字。
韩语中“凉”字本来的读音是량(liang)。
这里我姑且用英文字母l来表示韩文字母ㄹ的发音,内行人不要挑漏儿。
韩语有一定阿尔泰语系的特征,其中有一条就是单词不能以l开头。
韩语的固有词的确没有以l开头的,但是对于外来语,处理方式就不同了。
来自西方的外来语单词,开头的l会保留,比如라이터(la-i-teo,打火机);
来自汉语的单词,在朝鲜会保留的开头的l,但在韩国,需要按照如下的“头音法则”把l换掉:
- 如果l后面接的是元音i或者以i开头的双元音,则l要去掉,比如“梨花”:리화(li-hwa)-> 이화(i-hwa)。韩国人的姓“李”拼作이(i)也是这个道理。
- 如果l后面接的是其它元音,则l要换成n,比如“骆驼”:락타(lag-ta)-> 낙타(nag-ta)。
另外,以n开头的汉字词,如果n后面接的是元音i或者以i开头的双元音,也要把n去掉,比如“女子”:녀자(nyeo-ja)-> 여자(yeo-ja)。
根据头音法则可以发现,所有声母为l的汉字,在韩语中都是多音字。
韩国的KS X 1001字符集比较奇葩,给多音字的每个读音都分配了一个编码。
而Unicode为了与所有已有字符集兼容,必须也给韩语中多音字的每个读音分配一个编码。
每个字的多个编码中,有一个是放在正常的汉字区(4E00 ~ 9FA5)的,其它的都放到了“中日韩兼容字符”区(F900 ~ FAFF)。
于是在这个兼容区可以看到大量声母为l(或n)的汉字:
Windows自带的韩语输入法,在输入一个韩文字符后按右Ctrl键,可以将这个字符换成对应的汉字,如下图:
如果输入량(liang),那么打出的就是“凉”字(U+51C9);
如果输入经过头音法则变换后的양(yang),那么打出的就是“凉”字(U+F979)。
已经发现了Unicode中有四个“樂”,这同样也是韩语多音字搞的鬼。
韩语中“樂”字的四种读音以及对应的Unicode编码、意义如下:
- 악(ag),U+6A02(樂),对应普通话读音yuè,名词,音乐意;
- 락(lag),U+F95C(樂),对应普通话读音lè,形容词,快乐意;
- 낙(nag),U+F914(樂),为lag经头音法则变换后的结果;
- 요(yo),U+F9BF(樂),对应普通话读音yào,动词,喜爱意。
查看全文>>
王赟 Maigo