第七百四十五章 加法減法
“在我看來,新的字庫,需要達(dá)到幾個(gè)標(biāo)準(zhǔn)。”牉
“首先就是碼位要寬泛,我的意見是以二十萬為基準(zhǔn);”
“其次是對(duì)GB 2312和GB 13000的兼容,需要具備提供完整、清晰、明確的代碼映射表,實(shí)現(xiàn)自由轉(zhuǎn)換。”
“第三是對(duì)標(biāo)準(zhǔn)的用戶自定義區(qū)和標(biāo)準(zhǔn)保留區(qū)的使用做了明確、詳細(xì)的規(guī)定。既要讓用戶可以在自定義區(qū),利用字庫提供的十三筆畫和漢字基準(zhǔn)部件,造出自己需要的漢字,同時(shí)又要對(duì)這些新入庫的漢字,制定出嚴(yán)格的標(biāo)準(zhǔn)和使用方法,同時(shí)還要及時(shí)升級(jí),將通過審批的漢字加載進(jìn)標(biāo)準(zhǔn)保留區(qū)。”
“這樣可以群策群力,既減少我們的工作量,又讓廣大用戶有了參與字庫建設(shè)的機(jī)會(huì)。”
這一條在座的所有人都沒有想到過,現(xiàn)在給周至一提出來,大家都感覺眼前一亮,這小子的腦瓜子可真靈!
“最后一條,當(dāng)然就是強(qiáng)制標(biāo)準(zhǔn),我們需要一個(gè)具備強(qiáng)約束力的標(biāo)準(zhǔn)規(guī)范,提高知名度。”
“強(qiáng)制性標(biāo)準(zhǔn)的知名度最高。中文軟件的最終用戶如果知道了我們制定出了一個(gè)最佳的漢字標(biāo)準(zhǔn),肯定會(huì)要求軟件開發(fā)商來實(shí)現(xiàn)它。”牉
“而反過來,軟件開發(fā)商也不得不重視標(biāo)準(zhǔn),實(shí)現(xiàn)這個(gè)標(biāo)準(zhǔn),來提高自己的競爭力。”
“這個(gè)標(biāo)準(zhǔn),會(huì)不會(huì)……太高了啊?”麥明川摳了摳腦門:“我估計(jì)百分之九十九的用戶都用不到。”
“剛剛說了,用不到全集,可以選用不同層次的子集嘛。”周至說道:“但是這并不能說明大全集就不該有。”
“麥主任,據(jù)我所知,電子計(jì)算機(jī)使用的邏輯算法,包括設(shè)計(jì)理念,其實(shí)也是幾十年甚至一兩百年前就已經(jīng)成熟的學(xué)科,直到人類在晶體管技術(shù)實(shí)現(xiàn)突破之后,才將那些成熟學(xué)科的數(shù)學(xué)成果,應(yīng)用到了集成電路上,形成了如今的信息產(chǎn)業(yè)。”
“弗雷格,羅素和布爾,他們也沒有說過他們的數(shù)理邏輯研究,在十九世紀(jì)的時(shí)候標(biāo)準(zhǔn)太高了,得等到二十一世紀(jì)信息科技萌芽的時(shí)候,再讓后人來研究也不晚啊?”
“哈哈哈哈哈……”麥明川大笑:“周至同學(xué)這是以子之矛攻子之盾,學(xué)得一手的好邏輯啊,有沒有興趣來我們計(jì)算機(jī)系學(xué)習(xí)啊?這可是如今國家最人才稀缺,需求最迫切的好專業(yè)喲!”
“別想了。”辜老擺了擺手:“肘子第一志愿是我中文系,其次歷史系,其次哲學(xué)系,他是文科生。”牉
“文科生?”這下輪到麥明川驚訝了:“文科生有如此嚴(yán)謹(jǐn)?shù)倪壿嬎季S?”
“麥主任這就是瞧不起我們了。”周至笑道:“我們的古文有一套反復(fù)的語法,這本身就說明我們早就具備了一套嚴(yán)密的思維邏輯。”
“我們古代的名家學(xué)派,法家學(xué)派,縱橫家學(xué)派,都是運(yùn)用這套思維的高手,不能因?yàn)槲覀儧]有將之單列出來作為一門學(xué)問寫出專著,就代表我們沒有這門學(xué)問,就沒有人研究過。”
“肘子你扯遠(yuǎn)了,”辜老笑道:“不過我覺得思路是不錯(cuò)的,我們的目標(biāo)的確可以定得高一點(diǎn)。”
“辜老,您是不知道現(xiàn)在的內(nèi)外存儲(chǔ)有多貴,”麥明川說道:“字庫需要調(diào)入內(nèi)存,才能夠快捷方便地使用,現(xiàn)在的計(jì)算機(jī)系統(tǒng),內(nèi)存一般才八兆,加載了操作系統(tǒng),尤其是現(xiàn)在的可視化系統(tǒng),會(huì)耗用大量的內(nèi)存,留給應(yīng)用的,可就已經(jīng)不多了。”
“隨著技術(shù)的進(jìn)步,這些總是可以解決的嘛。”辜幼文說道:“就如肘子所言,我們可以先有思路,有理論,有儲(chǔ)備,”
說完拍了拍那堆字稿:“有這些東西,先標(biāo)準(zhǔn)后應(yīng)用,我看是完全可行的嘛!”牉
“其實(shí)這就和標(biāo)準(zhǔn)計(jì)量局里的鉑金度量衡一樣,”旦增笑道:“標(biāo)準(zhǔn)制定的時(shí)候我們不妨就高,等到應(yīng)用的時(shí)候,再因地制宜嘛。”
“其實(shí)只要有了標(biāo)準(zhǔn)點(diǎn)陣字,將字庫拓展出來就不難了。”李紅江有些興奮:“因?yàn)椴还軡h字是復(fù)雜還是簡單,是繁體還是簡體,其基準(zhǔn)筆畫和部首結(jié)構(gòu)都是一樣的。”
“也就是說,我們完全可以使用GB2312和GB13000的筆畫耦合技術(shù),有了點(diǎn)陣字,就可以創(chuàng)造出黑體,宋體,仿宋,楷體四種基準(zhǔn)字體。”
“對(duì),這就是我們漢字的優(yōu)勢。”周至說道:“我們的字稿上,點(diǎn)陣字以外的其余三種字體,其實(shí)是用來給李教授他們做修正用的,如果李教授認(rèn)為沒有問題的話,今后我就讓我同學(xué)專門寫點(diǎn)陣字了。”
“肘子你這同學(xué)也是高中生?那他有沒有興趣來我們計(jì)算機(jī)系啊?”
“呃,我這同學(xué)是水電校,職高那種,已經(jīng)畢業(yè)參加工作了,在蠻州電力公司。”周至說道:“對(duì)了我還有個(gè)要求,李教授,如果用了我們的字稿,研究者當(dāng)中,我希望把我同學(xué)的名字加進(jìn)去。”
“現(xiàn)在就剩下開發(fā)掃描程序和編碼了。”李紅江拿兩根手指敲著下巴,陷入了思索:“還是時(shí)間的問題,要是能夠趕在GB13000推出之前最好。我們說服標(biāo)準(zhǔn)委員會(huì)的機(jī)會(huì)更大……”牉
“其實(shí)我還有一個(gè)思路,”周至說道。
“你講你講。”麥明川現(xiàn)在看著小子一百個(gè)的順眼,理論上這小子已經(jīng)將大家的思路給打開了,也將最難的水磨功夫都做了,現(xiàn)在就剩下一個(gè)入庫和編碼的問題。
而這兩樣,國家在編寫GB2312和GB13000的時(shí)候,已經(jīng)有了長足的經(jīng)驗(yàn)。
“其實(shí)我們還可以反向操作。”
“什么反向操作?”
“開發(fā)一個(gè)文字識(shí)別軟件。”周至說道:“一個(gè)能夠識(shí)別漢字,將漢字加工成點(diǎn)陣字,再將之按照偏旁部首等一定的規(guī)則,給漢字自動(dòng)賦予編碼,將之放入字庫碼位的軟件。”
“設(shè)計(jì)思路有嗎?”李紅江的這下興趣來了,中文識(shí)別,好東西呀。牉
“這個(gè)程序的設(shè)計(jì)思路是這樣的。”周至說道:“因?yàn)闈h字本身是有一定組織規(guī)則的,以方塊字為主,因此我們可以利用這些規(guī)則去掃描它,對(duì)其進(jìn)行分析。”
“理論上每個(gè)漢字,尤其是印刷體,其重心位置,中宮收放等特征,在一本典籍當(dāng)中都是同一的,我們可以通過廣泛采樣,得到均值,再將這些均值作為漢字的字體設(shè)計(jì)參數(shù),賦給已有的點(diǎn)陣字,產(chǎn)生與典籍一樣的字體。”
“如果反過來思考,我們可以認(rèn)為,每一個(gè)典籍上的文字,都是被字體算法計(jì)算出來的圖形,而這個(gè)圖形,本身是全覆蓋其點(diǎn)陣字的所有邊界的。”
“如果我們對(duì)其按照之前掃出的參數(shù)進(jìn)行反耦合,也就是做減法,理論上是完全可以將文字圖形,減縮成標(biāo)準(zhǔn)點(diǎn)陣字的。”
(https://www.dzxsw.cc/book/20803929/743782833.html)
1秒記住大眾小說網(wǎng):www.dzxsw.cc。手機(jī)版閱讀網(wǎng)址:m.dzxsw.cc