尚书六号文字识别怎么用尚书六号OCR软件进行扫描校正教程

东坡下载 2014年12月25日 09:42:42

      对于一些扫描后的文件，扫描出来的文件都不是很规范，有些倾斜，那么怎么才能把这些扫描文件进行校正呢？下面小编就给大家带来尚书六号文字识别怎么用尚书六号OCR软件进行扫描校正方法。

      尚书六号OCR软件进行扫描校正教程

      下面我们主要是介绍，采用MICROTEK扫描仪的驱动软件SCANWIZARD 5，如何配合尚书六号OCR软件做好OCR识别的工作的要点。

      推荐的工作步骤如下：

      1．扫描图像文件。

      建议在桌面上直接使用SCANWIZARD 5软件，注意将软件切换到高级工作模式。原因是这样能便于用户检查扫描仪工作时的分辨率。

      推荐的扫描分辨率设定在300DPI，色彩模式可以是“RGB彩色”或者“灰阶”。

      选择“扫描到”的文件格式是TIF或者JPG两者都可以。将扫描的文件存在用户确定的目录下面。

      2．打开尚书六号读取扫描好的图像文件。

      3．被识别图片的预处理。

      这部分工作，主要包括：倾斜校正、设定正确的识别区域。

倾斜校正过程，如图所示，按下工具栏的最下面的一个工具。
按下“图像倾斜校正”工具后，会出现如下的对话窗口：
      此时按下“是”按狃。系统就给予图片做水平的倾斜校正，做完后，结果如下：

      注意，自动倾斜校正功能，只能对原稿做+-2.8度的倾角的校正，如果原稿的倾斜角度大于2.8度，系统会建议用户重新扫描稿件，以提高识别率。

      如何正确设定识别区域，这是一个值得用户注意的地方：

      如下的“海尔”一文，实际是分成两个栏目，进行阅读的，所以我们在设定识别区域的时候，注意需要将这个特点表现出来，需要设定两个识别区域，如图所示。

      对于一些文字稿件，中间有图片的时候，我们建议采用绕开的方式，进行识别区域的设定，如下图：

      对于表格类的图片，为了将标题栏也能识别进去，我们建议采用如下的识别区域设定，特点是表格部分必须整个框选，同时标题作为一个单独的框选区域。

      4．开始进行识别

在开始“识别”的时候，注意识别的软件的设定值是否正确，默认值如下：
      5．识别校对完成后，存盘格式的选择文件保存的类型有四种，建议一般文本的识别，用户选择TXT格式。

      如果是表格识别，识别结果请选择“CSV”格式，用EXCEL能够打开。

查看原文

尚书六号文字识别怎么用 尚书六号OCR软件进行扫描校正教程

尚书六号OCR软件进行扫描校正教程

尚书六号文字识别怎么用尚书六号OCR软件进行扫描校正教程