作為一個自媒體作者,差評君每天的日常少不了接觸電腦、鍵盤、輸入法( 和奶茶 )。
而為了能讓大家晚上早點兒睡覺,差評君也沒少琢磨打字的技巧 —— 為了打字更快,差評君還學會了雙拼打字。
不過寫了這麼久文章,差評君也發現了一些問題是打字快解決不了的:
比如打一個在電腦里根本不存在的字
。
上面這個字可能有差友覺得眼熟,也可能有差友不認識,這個字念 biáng ——“biáng biáng 面 ”裡面的那個 biáng 。
餓了,想吃了▼
但由於 biáng 字只用來表示這道著名的陝西面食,用途太少太過生僻
,導致電腦的字元編碼集遲遲沒有收錄,所以電腦裡遲遲打不出來這個字。
不信的話大家可以試下,我保證評論區裡打不出這個字 ~~
然而最近網上突然有個訊息說, Unicode 組織已經把 biáng 字收錄進了“
CJK 統一表意漢字
”的擴充套件 G 區中,從3月4日開始正式生效。
所以這下可以在電腦裡打出 biáng 字了嗎?陝西的小夥伴們可以在微信裡教別人寫 biáng biáng 面了嗎!
小夥伴們先冷靜,事情並不是這樣的,因為電腦裡的文字編碼和輸入法還不是一回事。
換句話說就是,
電腦裡能看到的,輸入法不一定能打出來
。
不過要想搞明白這件事兒,差評君得先和大家嘮嘮電腦裡的
文字編碼
是怎麼回事兒。
我們都知道,現代計算機是美國人造出來的,他們為了處理文字方便,給 26 個字母在電腦裡設定了一套編碼標準。
簡單來說,就相當於規定電腦裡的
一號
字元是“A”,
二號
字元是“B”。
只不過這個
一號
和
二號
是二進位制的“ 0100 0001 ”。
這就是大名鼎鼎的阿斯克( ASCII )碼 —— 又叫美國資訊交換標準程式碼。ASCII 碼錶在當時不亞於現在的九九乘法表,是計算機處理文字的基礎。
然而 ASCII 碼有個問題:由於當時硬碟比較小,能有個 1 MB 就算不錯的了,所以整個 ASCII 表也只能定義 256 個字元。。。
所以等到電腦漂洋過海進入其他國家之後,那些不說英語的小夥伴們憤怒了 ——
ASCII 表根本就沒給其他語言預留足夠的空間
。
如果我們現在還在用 ASCII 表的話,可 用電腦 中文字就 這樣的。( 會缺少很多常見字元 )
一時間,各個國家都開始制定自己的文字標準,比較著名的有西歐的 ISO-8859 系列標準、微軟的 Windows-12xx 系列標準。
以及咱們中國的 GB 2312 文字編碼標準。
雖然大家自己制定的一些文字編碼標準解決了不同語言文字在電腦裡儲存的問題,但經常是在一個牌子的電腦裡能正常顯示的文件,跑到別的電腦上就成了亂碼。
就好像是沒有 USB 充電口之前,功能機和山寨機們各自用著五花八門的充電頭一樣,誰也不相容誰。
所以就像充電寶上附帶了好多種插頭的萬能線一樣,電腦上的排版軟體也得整合儘可能多的文字編碼規範,才能做到自動識別出來文件的文字編碼,讓字元正確顯示出來。
不過總用萬能線也不是個辦法,要是大家都用一樣的 USB 線該多好啊。
於是上世紀 80 年代的時候,萬國碼( Unicode )組織就在微軟、蘋果、 Adobe 、惠普、 IBM 等幾個 爸爸 科技巨頭們的牽頭之下成立了。
以前 ASCII 碼吃虧在了序列位數不足上,搞得只能存 256 個字。所以這次的萬國碼直接
把序列位數拉到了 16 位
。
如果從“ 0000 0000 0000 0000 ”開始,到“ 1111 1111 1111 1111 ”結束全都塞滿字元的話,
能
存上 65,536 個字
。
這還不算完,後來 Unicode 又把字元編碼擴充套件到了 32 位,
40 多億個字
的儲存空間別說全世界的文字了,說不定等以後發現了外星文明的時候依舊夠用。
手頭寬裕了之後,辦起事來自然也就大方得多:在過去的 20 年裡, Unicode 不但陸續收錄了全世界所有主要的文字,還順帶手把古代漢字以及象形字一類的東西全給收錄了進去。
《 康熙字典 》和《 四庫全書 》在列▼
像我們平常用的 Emoji 表情,也屬於 Unicode 文字編碼的一部分:
在 Unicode 內部還專門有一個小組,負責和表情設計師一起討論下次應該再加點兒什麼表情進來。
收錄的東西又好又全,作業系統和文字排版工具們自然就不再需要跟文字編碼較勁了,反正選 Unicode 編碼就對了。
而這次所謂收錄了 biáng 字的 Unicode 13 ,實際上就是 Unicode 標準的第 13 版更新 ——
除了 biáng 字之外
,
還新收錄了 4,939 個生僻的漢字
。
反正沒一個認識的 ▼
( 這一段沒有出 Bug )
其實差評君在這段的左上角給大家複製了一個 biáng 字,不過大家現在可能只能看到一個 “ 口 ” ,或者一個黑底的大問號。
嗯,雖然從現在開始 Unicode 13 標準已經正式釋出了,不過我們還沒法馬上用到
。
這是因為
文字編碼是內置於作業系統當中的
,所以今天只是意味著廠商們可以開始著手集成了,距離我們能正式體驗到還有一個系統更新的距離。
等哪次大家更新完系統之後,發現上面的那個 biáng 字可以正常顯示了,就代表著作業系統已經更新到最新的 13。0 版 Unicode 文字編碼了。
不過即使是這樣,這個 biáng 字依舊是“ 只可遠觀,
但打不出來
”。
因為在我們的拼音規範裡
沒有 biáng 的拼音
,權威字典裡也沒有收錄這個字。
實際上, biáng 是一個由 bi ( 讀 bai )和 áng 兩個音節組合而成的合音,屬於關中地區的方言發音,
不能單獨作為一個拼音來使用
,所以無法被拼音輸入法打出來。
而 biáng 字的性質也和“ 招財進寶 ”類似,屬於民間為了這個發音生造出來的一種臆造字( 野字 )。
而且 biáng 字本身更是
在陝西的不同地區存在差異較大的不同寫法
,把誰收錄進字典估計其他地區的朋友都不會同意,所以乾脆不費這勁,讓它繼續野著去了。
孔乙己,你知道 biáng 有幾種寫法嗎?▼
所以即使以後電腦裡可以正常顯示 biáng 字了,我們也依舊沒法透過拼音輸入法正常把它打出來,只能跑到百科一類的地方複製貼上。
不過今年的時候,也有陝西民俗學家在推動 biáng 字進字典的事宜了,有 Unicode 的示例在前,說不定等再過幾年這件事也許還真能迎來個大反轉。
估計到時候我們就能正常的用 biáng 打出“ ”字了。
圖片、資料來源:
Wikipedia,Biángbiáng 面
Wikipedia,通用字符集
西安晚報,biang”字入字典 你覺得可嗎?
Unicode 13。0 Versioned Charts Index
知乎,《 Biang 字是如何躲過建國時的漢字簡化的?》
感謝方元教授( 北京資訊科技大學外國語學院 ),馬嘉晨、朱鈺同學( 首都師範大學 )為本文提供的支援
部分圖片來自網際網路
本文經授權轉載自
差評
(ID:
chaping32
1),如需二次轉載請聯絡原作者
歡迎轉發到朋友圈。