姽婳、愔嫕、頔暐韡……這些繁復(fù)的漢字現(xiàn)在都可以直接在電腦上輸入。近日,國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)、工業(yè)和信息化部、國(guó)家語(yǔ)言文字工作委員會(huì)聯(lián)合發(fā)布新版《信息技術(shù)中文編碼字符集》強(qiáng)制性國(guó)家標(biāo)準(zhǔn)(GB 18030-2022),新國(guó)標(biāo)將于2023年8月1日正式實(shí)施。
標(biāo)準(zhǔn)首次發(fā)布于2000年,2005年第一次修訂,支撐了我國(guó)中文信息處理和交換需要。與上一版標(biāo)準(zhǔn)相比,新國(guó)標(biāo)增加錄入1.7萬(wàn)多個(gè)生僻漢字,為傳承中華文化、增強(qiáng)中文信息處理能力、滿(mǎn)足姓名生僻字人群用字需求提供標(biāo)準(zhǔn)保障。
中文進(jìn)入信息處理系統(tǒng)經(jīng)過(guò)了漫長(zhǎng)的過(guò)程,中文編碼字符集時(shí)隔17年迎來(lái)新版,此次版本迭代有何意義?如何解讀1.7萬(wàn)余個(gè)生僻漢字的增錄?為此,羊城晚報(bào)記者專(zhuān)訪(fǎng)中山大學(xué)中文系古代漢語(yǔ)教研室副教授吳吉煌——
生僻字的概念是相對(duì)的
羊城晚報(bào):此次新國(guó)標(biāo)增加了1.7萬(wàn)余個(gè)生僻漢字,引起了廣泛的關(guān)注。對(duì)此,您是如何看的?
吳吉煌:這是在滿(mǎn)足人們?nèi)粘h語(yǔ)使用需求的基礎(chǔ)上,利用現(xiàn)代技術(shù)促進(jìn)中文國(guó)際化、信息化的重要舉措?,F(xiàn)實(shí)生活中,人們難以直接接觸歷代古籍材料,生僻字的信息化為語(yǔ)言文字研究者整理、印刷和出版文獻(xiàn)典籍帶來(lái)便利,有助于降低讀者閱讀古籍的門(mén)檻,傳播漢字文化。
羊城晚報(bào):生僻字有準(zhǔn)確的界定標(biāo)準(zhǔn)嗎?我查字表“璽”也算生僻字,但是感覺(jué)這個(gè)字比較常見(jiàn)。
吳吉煌:生僻字指的是人們不常用的、不熟悉的漢字,與其相對(duì)的概念是“常用字”?!冬F(xiàn)代漢語(yǔ)常用字表》中收錄了3500個(gè)常用漢字,分為2500個(gè)常用字和1000個(gè)次常用字兩個(gè)部分。經(jīng)計(jì)算機(jī)抽樣檢測(cè),常用字在語(yǔ)料中的覆蓋率達(dá)到99.48%,掌握了常用字便能達(dá)到利用漢語(yǔ)的基本要求。
科學(xué)地界定生僻字,通常是先劃定一個(gè)范圍,然后在這批文字語(yǔ)料庫(kù)中進(jìn)行統(tǒng)計(jì),如果一個(gè)字使用頻率很低,甚至不出現(xiàn)于日常生活中,那就可以算作生僻字?!碍t”是一個(gè)歷史概念,在今天并不常用,所以也算生僻字。
有的字對(duì)于普通大眾而言比較生僻,但是對(duì)于從事語(yǔ)言文字研究的人來(lái)說(shuō)非常熟悉。所以生僻字的概念是相對(duì)的,它不是一個(gè)絕對(duì)性的概念。
羊城晚報(bào):3500個(gè)常用字就覆蓋了現(xiàn)代出版物用字的99.48%。既然如此,為何還要對(duì)生僻字進(jìn)行大范圍的增補(bǔ)?
吳吉煌:常用的3500個(gè)字的調(diào)查樣本當(dāng)時(shí)沒(méi)有照顧到大量的古代文獻(xiàn),主要是從現(xiàn)代漢語(yǔ)或者白話(huà)文寫(xiě)作的漢語(yǔ)文獻(xiàn),尤其是一些時(shí)效性比較強(qiáng)的報(bào)刊文章中統(tǒng)計(jì)出來(lái)的。從語(yǔ)言學(xué)的角度出發(fā),每個(gè)時(shí)代都有其常用字和生僻字。對(duì)生僻字的編碼有助于對(duì)其進(jìn)行信息處理和后續(xù)的排版印刷,從實(shí)用的角度而言,能夠有效推動(dòng)古籍的整理出版或者數(shù)字化,也方便了姓名中帶有生僻字的人們?cè)谛畔⑾到y(tǒng)中實(shí)名認(rèn)證。
生僻字越多傳統(tǒng)文化越濃厚?
羊城晚報(bào):從文字識(shí)別到文字對(duì)應(yīng)輸出,您認(rèn)為將漢字的形體構(gòu)造應(yīng)用于信息技術(shù)層面,有什么樣的意義?
吳吉煌:漢字從象形文字發(fā)展演變而來(lái),部分固定的筆畫(huà)結(jié)構(gòu)具有穩(wěn)定字形,故用字符中的筆畫(huà)結(jié)構(gòu)對(duì)漢字進(jìn)行編碼,能夠?qū)崿F(xiàn)編碼的唯一性。
漢字進(jìn)入計(jì)算機(jī)、信息處理系統(tǒng)經(jīng)歷了一個(gè)漫長(zhǎng)的過(guò)程,漢字編碼的基礎(chǔ)性工作是實(shí)現(xiàn)漢字編碼的唯一性。就像我們每個(gè)人都有專(zhuān)屬的身份證號(hào)碼,漢字編碼規(guī)定了每個(gè)漢字所對(duì)應(yīng)的統(tǒng)一符碼,以便計(jì)算機(jī)處理、輸出和顯示用戶(hù)所需的準(zhǔn)確漢字。漢字編碼的發(fā)展伴隨著計(jì)算機(jī)軟硬件設(shè)備的升級(jí),也離不開(kāi)語(yǔ)言文字工作者的努力。從最早的英文系統(tǒng),到如今中文成為計(jì)算機(jī)內(nèi)置的語(yǔ)言選項(xiàng),漢字編碼都是現(xiàn)代信息處理技術(shù)的基礎(chǔ)工作,其意義不言而喻。
2006年,中華字庫(kù)工程被列入《國(guó)家“十一五”時(shí)期文化發(fā)展規(guī)劃綱要》的重大建設(shè)項(xiàng)目,該工程以對(duì)文字學(xué)深入研究為基礎(chǔ),語(yǔ)言文字工作者研究歷代文獻(xiàn)典籍,輔以新技術(shù)的開(kāi)發(fā)利用,對(duì)文字進(jìn)行收集整理、篩選、比對(duì)和認(rèn)同工作。隨著中華字庫(kù)工程的進(jìn)一步發(fā)展,中文字符集將進(jìn)一步擴(kuò)充完善。
羊城晚報(bào):今天的語(yǔ)言環(huán)境越來(lái)越簡(jiǎn)化,在網(wǎng)絡(luò)世界生僻字很難扎根,長(zhǎng)期不使用的生僻字還是會(huì)消失?
吳吉煌:生僻字的增補(bǔ)意義不在于推廣,而在于人們有需要的時(shí)候可以便捷地使用。很多字都有其使用的環(huán)境和場(chǎng)景,網(wǎng)絡(luò)平臺(tái)也有其特定的語(yǔ)言環(huán)境,不是說(shuō)增補(bǔ)以后一定要大范圍去推廣使用。這個(gè)方向的理解是不對(duì)的。
有的生僻字可能逐漸淡出人們的視野,但是不會(huì)消失,它會(huì)一直存在于文獻(xiàn)之中。近年來(lái),隨著國(guó)家對(duì)語(yǔ)言文字研究和古籍整理的重視,越來(lái)越多的專(zhuān)家學(xué)者在從事這方面的研究,被發(fā)現(xiàn)的生僻字也越來(lái)越多,這些字都會(huì)被匯集整理到字典里。
羊城晚報(bào):生僻字的不斷發(fā)現(xiàn)、收錄和信息編碼的增補(bǔ),和弘揚(yáng)傳統(tǒng)文化有何關(guān)系?
吳吉煌:一方面,兩者是互相依存的關(guān)系。對(duì)于生僻字的研究和發(fā)現(xiàn),有助于認(rèn)識(shí)和弘揚(yáng)我們的傳統(tǒng)文化;同時(shí)對(duì)于傳統(tǒng)文化的學(xué)習(xí)越深入,我們閱讀的古代文獻(xiàn)越多,認(rèn)識(shí)的生僻字也會(huì)越多。但真正承載文化的是典籍,而非漢字本身;也不要把生僻字和常見(jiàn)字對(duì)立,二者是一個(gè)整體。當(dāng)然,并非生僻字越多,傳統(tǒng)文化就越濃厚,含義就越深。比如儒家傳統(tǒng)文化的“仁、義、禮、智、信”,都是非常常見(jiàn)的字,但蘊(yùn)含著深厚的文化價(jià)值和思想價(jià)值。
取名需慎用生僻字
羊城晚報(bào):據(jù)悉,第一本“生僻字”被用于元素周期表。目前生僻字主要應(yīng)用于哪些范圍?
吳吉煌:這些生僻字主要用于一些專(zhuān)門(mén)的領(lǐng)域,比如化學(xué)領(lǐng)域中的元素周期表,這些字是在西方科學(xué)引進(jìn)之后,為了記錄新的科學(xué)概念而新造的漢字,原來(lái)漢字系統(tǒng)中并沒(méi)有。
再就是古籍文獻(xiàn)中會(huì)有大量生僻字,這個(gè)生僻也是相對(duì)于今天常用的3500個(gè)漢字而言。地名中也會(huì)存在生僻字,這種生僻往往具有地域性,受當(dāng)?shù)匚幕头窖缘挠绊?,?duì)于本地人比較常見(jiàn),但是外地人則不太熟悉。比如廣州的“新滘西路”中的“滘”字,對(duì)于土生土長(zhǎng)的廣州人來(lái)說(shuō)不算陌生。
化學(xué)、古籍、地名都可歸入專(zhuān)業(yè)性領(lǐng)域,這些生僻字都具有專(zhuān)業(yè)性和專(zhuān)門(mén)性,除了常用地名,一般不為大眾所熟知。
還有一種是人名,家長(zhǎng)給孩子取名,出于求新或文化炫耀心理,采用生僻字。一種是影視劇作品中,以古代作為背景的穿越架空劇,編劇為了拉開(kāi)跟現(xiàn)代的距離,盡量貼近它所架空的時(shí)代背景,會(huì)采用生僻字給劇中的人物取名。
羊城晚報(bào):時(shí)下,不少父母偏愛(ài)挑選美好寓意的生僻字給孩子取名。您如何看待這種現(xiàn)象?
吳吉煌:如今有一些父母為了所謂的回歸傳統(tǒng)文化,或是給孩子取一個(gè)能突顯文化意義的名字,可能會(huì)刻意地使用、拼湊一些現(xiàn)代人所不常用的生僻字。
需要注意的是,不少生僻字在古代文獻(xiàn)典籍中具有美好內(nèi)涵和豐富意象,對(duì)這類(lèi)生僻字的認(rèn)知有助于我們理解古人所表達(dá)的思想。但在類(lèi)似于取名字等實(shí)用性較強(qiáng)的領(lǐng)域中,需要慎重考慮生僻字的使用。
羊城晚報(bào):除了取名字,對(duì)于生僻字的運(yùn)用應(yīng)該注意哪些問(wèn)題?
吳吉煌:一是不要生搬硬套。不管是影視劇中的人名、地名還是家長(zhǎng)給孩子取名,都不能只求新鮮獨(dú)特,而要充分了解生僻字背后的文化含義?!对?shī)經(jīng)》《楚辭》中有大量的生僻字,這些字記錄的是當(dāng)時(shí)的語(yǔ)言和文化,反映了當(dāng)時(shí)人們的認(rèn)知、心理和思想觀(guān)念,所以有的字我們知道了讀音和含義,但是整首詩(shī)還是很難讀懂。因?yàn)槲覀冞€沒(méi)有理解這個(gè)字背后深層次的含義。
第二,不要隨意用同音字替換。尤其是地名的使用,有的地方為了方便,用更簡(jiǎn)便易識(shí)別的漢字替代了原來(lái)較為生僻的漢字,這種替代抹掉了地名背后的文化內(nèi)涵,也不利于當(dāng)?shù)貧v史文化的研究和傳承。
原文鏈接:https://ep.ycwb.com/epaper/ycwb/html/2022-08/07/content_6_515404.htm