第一千一百零六章 跑程序
計算中心草創(chuàng)之初,熬夜加班的時間很多,周至擔心大家餓肚子,特意騰了一個房間出來放餅干泡面火腿腸榨菜花生豆腐干等零食。
周至笑道:“那個時候條件太艱苦,現(xiàn)在好了,在我們不斷地鬧騰下,計算中心開了自己的小食堂,夜班也有人供應熱食。”
“誰鬧騰?我看其他人都沒鬧,就只有你鬧騰。”辜開來又翻起了白眼。
“我也是轉(zhuǎn)達民意,被他們逼的。”周至厚顏無恥,接好硬盤后麻利地開始操作,一邊還和柳工介紹幾款軟件升級后的新功能。
軟件版本控制,本身也屬于軟件工程的一個重要部分,現(xiàn)在華清園和蜀大沒有聯(lián)網(wǎng),兩邊各自做開發(fā),很快就會出現(xiàn)版本差異。
盡管周至一再要求雙方需要嚴格控制,也只能做到基線標準一致,然后給各自開辟出一個“自定義區(qū)”,每三個月兩方要做一次版本匯報,將自定義區(qū)的源代碼進行分析,統(tǒng)一追加到“基線區(qū)”,形成統(tǒng)一的新基線版本。
這是一件非常麻煩的事情,也壓制了程序員們的天才發(fā)揮,但是作為一個大團隊要能控,能管,能打,這也是必須的措施。
當年周至最反感的就是各種條條框框,現(xiàn)在屁股下的位置不一樣了,他又把當年的各種條條框框搬了出來,還覺得非常必要。
大家圍繞著自身工作,能聊的也不要太多,向總問管理,柳工問技術,周至的嘴根本就閑不下來。
很快新的基線版本追平,周至切換到自定義區(qū),在這里調(diào)整讀卡程序。
因為兩位老師兄制作的字卡和馮雪珊制作的瀚文標準格式不同,需要改變掃描區(qū)域,調(diào)整畫面銳利度;
又因為是楷書和隸書,需要把楷體字根和隸書字根調(diào)到對比庫中。
兩種書體結(jié)字的比例和黑體也不一樣,因此還要做字型比例配制。
所有這些加起來,就是采字的逆向工程,將識別黑體的掃描識別程序,調(diào)整為能夠識別楷書和隸書的掃描識別程序。
掃描識別程序的功能就又擴展了,將來這個新的程序,又會被追加到基線區(qū),成為新版本的一部分。
柳工坐在周至身邊做復核人員,因為這項需求比較急迫,按照規(guī)章制度,采取現(xiàn)場復核的機制。
“一次編譯通過!”柳工看著周至麻利的動作和精確的結(jié)果,不由得贊嘆:“肘子果然厲害啊!”
“就是一些小調(diào)整,當不得夸。”周至笑道:“試試看?”
“剩下的我來。”
工程轉(zhuǎn)化中心有一臺現(xiàn)在分辨率最高,掃描速度最快的膠片掃描儀,工作原理是將字卡拍攝成膠片,然后對膠片進行掃描。
這樣做也是為了提高效率,大批量拍攝制片,然后集中掃描膠卷,遠比只能一張字卡一張字卡讀取,讀一張起碼需要二十秒時間的平板掃描儀,快了無數(shù)倍。
將字卡膠片放入掃描儀,柳工開始操作軟件,也就是大家最常說的“跑程序”。
很快,終端屏幕上就出現(xiàn)了進程LOG,提示掃描儀工作的每一步。
旁邊的一臺終端上,周至調(diào)出各個程序的監(jiān)控調(diào)試畫面,讓一行過來的老同志們,能夠看到工作的進展。
第一步工作是掃描,將圖形化的文字掃入待識別區(qū)。
第二步工作是字根匹配,尋找到文字所用的字根,再將字根轉(zhuǎn)化成對應的標準黑體字根。
第三步工作是結(jié)字結(jié)構匹配,根據(jù)相應字體的結(jié)字規(guī)則,將文字字根的相應位置標志成數(shù)字坐標。
第四步工作是將黑體矢量化標準字根和結(jié)字規(guī)則結(jié)合運算起來,構成新的矢量文字。
第五步是給準備新入庫的矢量字進行偏旁部首等多種標簽定義,便與后續(xù)統(tǒng)計分析等工作使用。
最后就是編碼,根據(jù)新文字的標簽定義,通過編碼算法,給它賦予一個唯一的UNICODE編碼,再根據(jù)編碼的碼位將新字存入字庫,工作便算是完成了。
過程中遇到BUG是很正常的,不過周至和柳工都是高手,分分鐘就將程序調(diào)整好,讓過程能夠繼續(xù)。
辜開來名義上是工作組組長,但是之前都是把握大進度大方向,這還是第一次親眼看著一個文字,一步步從寫在字卡上“跑”到字庫里,不由得倍感新奇。
就連他都覺得神奇,更別說冷玉龍和韋一心兩位老師兄了。
周至打開文本編輯軟件,切換到瀚文輸入法:“現(xiàn)在我們的字庫里就有剛剛?cè)霂斓模局郏┳郑瑑晌粠熜謥碓囋嚕俊?br />
“我來。”冷玉龍興奮地說著,坐到周至讓出的座位上,輸入了NAN三個字母,在輸入法的選字框上一陣翻,在最后發(fā)現(xiàn)了(木舟)字,一敲數(shù)字索引號,(木舟)字就跳到了屏幕上。”
“哈哈哈哈……”冷玉龍很高興:“原來字庫就是這樣搞出來的呀!”
“這只是工作原理,我們只能在自定義區(qū)里玩玩,驗證驗證可行性而已。”周至笑道:“具體的實際工作,要遵循嚴格的軟件工程管理規(guī)章制度,流程手續(xù)很多的。”
“這不是耽誤事兒嗎?現(xiàn)在就能用了啊。”冷玉龍對這樣的做法有些不解。
“沒有工藝文件,不符合國際標準,我們的產(chǎn)品就沒法申請國際專利,別人就可以隨便伸手搶奪。”周至耐心地解釋道:“今天只是一點小小的嘗試,但是一個大型軟件工程,這樣的小改動,那是成千上萬,可能是幾百人,上千人在同時進行。”
“要是沒有工程管理控制,大家都各自為是的話,一定會亂套的。”
工程組里周至主抓的就是這個事情,發(fā)現(xiàn)問題最多的也是這個事情。
你讓一個工程技術人員寫段程序,他可以加班加點通宵不睡覺,可是你要他寫一段說明文檔,可能就跟要他老命一樣。
因此逮到機會周至一定會給大家做科普,要求大家重視起來。
等到將工程管理的概念和老師兄普及了一陣,另一個隸書的漢字,也完成了入庫驗證工作。
也就是說,經(jīng)過簡單的參數(shù)調(diào)整和程序升級后,《中華字海》的漢字字卡,完全可以作為基礎字卡,交給《瀚文字庫》的識別程序使用。
“所以我們的字卡可以用?”周至和柳工搞了這半天,其他人也看不懂,韋一心忐忑地問道:“接下來還要做什么?”
(https://www.dzxsw.cc/book/20803929/796121705.html)
1秒記住大眾小說網(wǎng):www.dzxsw.cc。手機版閱讀網(wǎng)址:m.dzxsw.cc