第七百四十四章 爭論
這可以解決仿古書籍錄入時的排版問題,以及打印和印刷出版問題!鎵
辜老也看出了這套標(biāo)準(zhǔn)的價值,卻又不免擔(dān)心:“要是我們占用了太多的碼位,會不會引來糾紛啊?”
“這個辜老就放心吧。”周至都樂了:“不是每個民族都是中華民族,這么說吧——全世界所有文字符算一石,我華夏獨占八斗。”
辜老也笑了:“這開討論會呢,肘子你嚴(yán)肅點!”
其實周至真不是開玩笑,因為直到兩千零五年,Unicode的第十萬個字符被引入成為標(biāo)準(zhǔn)之一。
而直到二零二零年,Unicode13.0,一共才收錄十四萬三千多個字符。
當(dāng)然現(xiàn)在有了周至的干預(yù),第一版的Unicode,光漢字字符周至就打算給它塞七八萬進去。
國際標(biāo)準(zhǔn)化組織里邊中國想要發(fā)揮作用有點困難,但是統(tǒng)一碼聯(lián)盟就不一樣了,就連繳納會費的個人都能夠發(fā)揮作用。鎵
只要周至能夠干預(yù)它,讓這個標(biāo)準(zhǔn)的1.0版,在WIN95發(fā)行之前就推出來,然后被微軟采用,信息時代的漢字編碼標(biāo)準(zhǔn)之爭,就得提前劃上句號了。
說起來微軟本身并不是不想用Unicode,恰恰相反,老比對這事兒很上心,只是實在等不到它出來,最終不得不選擇ISO/IEC 10646而已。
主要原因就是Unicode雖然好,但是屬于非官方組織搞的東西,大家都缺乏一種急迫感,否則也不至于到了2020年,GBK都擴展到七萬多漢字了,而Unicode還依舊有無數(shù)的漢字碼位空著。
周至覺得,這種急迫感,中國可以給。
“肘子……肘子?”辜老的聲音傳來。
“啊?什么?”周至這才回過神來,一臉懵。
“剛剛李教授講了那么多困難,你有沒有什么意見?”鎵
“李教授說,現(xiàn)在GB13000即將出臺,而采集七萬漢字,工作量會非常的巨大,他說你說的東西有價值,但是現(xiàn)在執(zhí)行起來也不能操之過急。”
“其實如果GB體系對多八位同意擴展的話,也能夠解決碼位容量的問題,更大的方便,是解決將來升級后的兼容問題。”
“還有就是實際應(yīng)用的問題,大字庫的使用場景到底還是有限的,我們還是要先解決有沒有的問題,再解決好不好的問題。”
“這個說法我不同意。”周至很直白:“因為與GB對標(biāo)的,說到底還是ISO/IEC 10646,這個體系本身就是存在缺陷的,除了占著一個國際標(biāo)準(zhǔn)化組織的名頭之外,遠比Unicode的理念落后。”
“哪怕是我們將來有了GB13000,甚至將之?dāng)U展為碼位更多的GB標(biāo)準(zhǔn),那最終得到的,也只是一個地方標(biāo)準(zhǔn),是我們關(guān)起門來自己造出的一個東西,除了在國內(nèi)強制推行以外,在世界其它地區(qū)是難以被接受的。”
“如果我們的新編碼能夠得到Unicode組織的認(rèn)可,那么我們的大字庫就會成為全世界絕大多數(shù)計算機軟硬件產(chǎn)商傾向使用的標(biāo)準(zhǔn),而且不僅僅是為我國大陸服務(wù),還能夠在臺島,港島,澳京,新家坡各個使用中文漢字的地區(qū)推廣應(yīng)用。”
“至于先解決有沒有的問題,再解決好不好的問題,這話我同意。”周至據(jù)理力爭:“但是有沒有的問題,我們在推出GB2312的時候就已經(jīng)解決了。”鎵
“我和李教授的分歧,其實就在他認(rèn)為還沒到解決好不好的時候,而我認(rèn)為,已經(jīng)到了!”
“肘子你沒有從事過這方面的工作,對于其中的困難可能認(rèn)識不足。”李紅江說道:“就拿那么多的漢字來說,光建立柵格數(shù)位字就是一件煩難的工作。”
“還好吧?”周至說道:“一天一百字,一年就是三萬六千五百字,兩年不就七萬多字了?”
“哪里有那么容易,這里邊涉及到字體設(shè)計,比重高低,中宮收放,制作點陣,上機輸入,整理編碼……”
“這些很難?”周至奇怪:“可我和我同學(xué),已經(jīng)用一年多的時間,做出四萬字的稿紙了啊?”
“什么?”李紅江驚訝得都站起了身來:“你?和你同學(xué)?!”
辜幼文招了招手,一名參會學(xué)生從會議室角落里拖著一個拖車過來,從上面搬下一個紙箱打開,放到李紅江的面前。鎵
“這是肘子這次帶來的,小李你看看,合不合用。”
“這是……這是……”李紅江看著箱子上面按照筆畫部首標(biāo)注的排序區(qū)間和字碼列表,打開之后,入眼是一張張工整的手工書寫四字體標(biāo)準(zhǔn)字,做上面那一個,就是這個漢子的標(biāo)準(zhǔn)點陣字,剩下三個分別是黑體,宋體,仿宋體。
“你們做了多少了?”李紅江嘴唇都有些哆嗦:“肘子你剛剛說……四萬?”
“對,到目前為止,已經(jīng)做到了四萬一千零三十三個,漢字十三結(jié)構(gòu)和標(biāo)準(zhǔn)部件,以及簡化漢字,我們?nèi)鐾炅耍缓蟆犊滴踝值洹罚沧隽艘话搿!?br />
“現(xiàn)在只需要一個類似機讀卡的程序,將這些掃到信息系統(tǒng)里,我們就有了一個四萬多字的基線版本。”
“不管我們使用GB還是用Unicode,我們都可以通過編碼將這些點陣字納入碼位,構(gòu)成一個新的大字庫。”
“那GB標(biāo)準(zhǔn)的擴容就迫在眉睫,GB13000還未推廣,就已經(jīng)落后了……”李紅江的話語里,充滿了苦澀的味道。鎵
“剛剛李教授所說的困難,我覺得都是不難解決的。”周至說道:“關(guān)鍵是我們有沒有決心和態(tài)度。”
“如果有決心,那么我們不管使用何種標(biāo)準(zhǔn),都得將華夏大字庫考慮進去,哪怕是現(xiàn)在暫時做不到,也要給將來的擴張留夠余地。”
“建庫不難,編碼也不難,難的是標(biāo)準(zhǔn)的制定。只要制定好了大字庫的標(biāo)準(zhǔn),一切工作以容納全體漢字展開,著這個前提下摸索思路和方法,我個人覺得,其意義遠大于現(xiàn)在的GB13000。”
“GB13000,還是處在頭痛醫(yī)頭腳痛醫(yī)腳,先搞一個能用的用著的思路上,這個思路本身,就是有問題的。”
“我們的目標(biāo)應(yīng)該一開始就落在構(gòu)建全世界都能夠通用的,可兼容的,可擴展的,具備海量碼位的華夏大字庫上,并且如ASCII嗎一樣,力爭使其成為唯一國際通用標(biāo)準(zhǔn)。”
“至于即將推出的GB13000,甚至更之前的GB2312,只是這個大字庫在不同應(yīng)用場景下的子集而已,將來我們還可以定義出幾個子集,分別滿足普通用戶,政府機關(guān),專業(yè)出版社,大型圖書館使用,達到效率優(yōu)化和成本縮減的兼顧。”
(https://www.dzxsw.cc/book/20803929/743782846.html)
1秒記住大眾小說網(wǎng):www.dzxsw.cc。手機版閱讀網(wǎng)址:m.dzxsw.cc