用掃描儀掃描的文字圖像,不能對(duì)個(gè)別文字進(jìn)行編輯修改,在教學(xué)中,需要利用文字識(shí)別軟件,將文字圖像進(jìn)行識(shí)別,將圖像格式轉(zhuǎn)化成文本格式,常見的文字識(shí)別軟件有很多,主要功能基本相同,尚書七號(hào)就是其中很優(yōu)秀的一款。用尚書七號(hào)對(duì)文字圖像識(shí)別轉(zhuǎn)化的過程,利用其主菜單:“文件”、“編輯”、“識(shí)別”、“輸出”可以很方便地完成。具體步驟為:
步驟1:獲取文字圖像文件
選擇“文件”菜單下的“掃描”或“打開圖像”(將已經(jīng)掃描好的圖像文件打開)命令,打開圖像文件。如果連接了多臺(tái)掃描儀,可以選擇“文件”菜單下的“選擇掃描儀”命令,調(diào)用掃描儀。
步驟2:對(duì)掃描的圖像頁進(jìn)行調(diào)整
選擇“編輯”菜單下“圖像頁面的處理”子菜單下的“圖像頁的傾斜校正”(提供自動(dòng)和手動(dòng)實(shí)現(xiàn)方法)及“旋轉(zhuǎn)”等命令,將掃描的圖像頁進(jìn)行調(diào)整。
步驟3:版面分析與文字識(shí)別轉(zhuǎn)化
版面分析,選擇識(shí)別范圍,在進(jìn)行文字識(shí)別前要選擇識(shí)別范圍,識(shí)別過程的核心是“版面分析”。
尚書七號(hào)的自動(dòng)版面分析功能很強(qiáng),對(duì)報(bào)紙雜志等復(fù)雜的版面,也能保持很高的分析正確率。
設(shè)置好后,直接點(diǎn)擊“開始識(shí)別”的按鈕就可以進(jìn)行文字識(shí)別了。
步驟4:校對(duì)修改
自動(dòng)識(shí)別完畢,識(shí)別結(jié)果的“文本窗口”會(huì)彈出,這個(gè)窗口能夠提供識(shí)別結(jié)果的校對(duì),為了校對(duì)方便,尚書七號(hào)增加了光標(biāo)跟隨顯示原圖像行的校對(duì)方法(如圖3出現(xiàn)的黃色提示行的出現(xiàn))。
提供的校對(duì)方法,一眼就能夠看到圖像原文和識(shí)別出文本的差別,如果發(fā)現(xiàn)識(shí)別有誤,可以進(jìn)行修改。
步驟5:輸出
如果檢查修改后確認(rèn)無誤,選擇識(shí)別結(jié)果的“輸出”菜單,輸出的文件格式有:RTF、HTML、XLS、22238,可以根據(jù)自己的需要選擇對(duì)應(yīng)的格式。如果用戶想得到類似原文的識(shí)別結(jié)果,請(qǐng)選擇RTF格式。把RTF格式輸出的文件用WORD打開后,會(huì)發(fā)現(xiàn)幾乎保留了原文的所有痕跡,包括原來頁面中的彩色圖像,都已經(jīng)保留在WORD中了。