Отсканированный текст может быть сохраненен в нескольких форматах:

– изображение,

– файл pdf,

– документ MS Word.

 

Текст, сохраненный в виде изображения, не может быть изменен, его невозможно редактировать с помошью текстового редактора, использовать в нем функции поиска. Тексты, отсканированные в данном формате, редактируются как графические объекты. В них можно

– изменить размеры полученного изображения, выполнить обрезку, улучшить качетство изображения, изменив яркость/ контрастность и т.п.,

– выполнить специальное редактирование отсканированных изображений, которое называется «убрать мусор» – автоматически удалить из изображения «дефекты» первоисточника (отображение в отсканированном файле фактуры и оттенка цвета бумаги, карандашных надписей, точек, пятен и .п.).

Сохранение отсканированного документа в формате pdf позволяет редактировать весь текстовый документ только при конвертации его формат текстового редактора, или редактировать текст по частям, вручную копируя в текствый редактор отдельные фрагменты текста.

Для сохранения отсканированного документа в текстовом формате после сканирования необходимо выполнить операцию распознавания текста, позволяющую преобразовать документ в MS Word.

Возможность сканирования текcтов в том или ином формате зависит от используемого программного обеспечения. Программы сканирования, предоставляющиеся производитедями сканеров, сканируют только в графическом формате. Для распознавания текстов используется программа ABBYY FineReader, которая сохраняет отсканированные тексты во различных форматах – MS Word, графических, pdf, xls, ppt, html. Для сканирования и распознавания текста можно использовать любую из версий программы ABBYY FineReader (версии 7.0-11.0 или ознакомительную версию, скачанную с сайта разработчика http://www.abbyy.ru/download/finereader_pro).

 

Сканирование текста для подготовки электронной версии книги

 

Сканирование

1. Открыть программу ABBYY FineReader

 

Сканирование

 

2. Настроить параметры сканирования: меню  – «Сервис»/ «Опции»

 

меню  – «Сервис»/ «Опции» 

 

3. Выбрать вкладку «Сканирование/Открытие», Нажать на кнопку «Настройки сканера», в новом окне выбрать ориентацию страницы – «Альбомная» (для сканирования разворотов), размер бумаги в зависимости от размера книги, режим сканирования картинок: для цветной книги или обложки – «Цветное изображение», для черно-белой или внутренних страниц – «Серое изображение», разрешение выставлено по умолчанию – 300 dpi.

 

 Вкладка «Сканирование/Открытие»  

 

4. Для сканирования одной страницы/разворота книги нажать на стрелку рядом с кнопкой «Сканировать» и в раскрывающемся списке выбрать пункт «Сканировать изображение…»

 

Сканировать 

 

Для сканирования нескольких страниц/разворотов нажать на стрелку рядом с кнопкой «Сканировать» и в раскрывающемся списке выбрать пункт «Сканировать несколько страниц…». Можно настроить интервал сканирования (время на переворачивание страницы)  – пункт меню «Сервис» – «Опции» – «Настройки сканера» – «Пауза между страницами» – выставить нужно количество секунд.

 

Сканирования нескольких страниц/разворотов

 

* Сканирование можно прервать, нажав на кнопку «Остановить». В открывшемся диалоговом окне «Невозможно завершить фоновое сканирование. Подождать?», нажать кнопку «Отмена». После этого  сканирование можно продолжить.

 

Сканирование можно прервать 

 

5. После сканирования полученные изображения можно почистить, убрав дефекты: выделить все изображения и в пункте меню «Изображение» выбрать «Очистить от мусора». Для выделения всех изображений, нужно выделить первое изображение и нажав и удерживая кнопку клавиатуры Shift пролистать колесиком мыши до последнего изображения и щелкнуть по последнему изображению.

 

Убрать дефекты 

 

6. После того как вся книга отсканирована можно:

– сохранить все отсканированные изображения для последующего преобразования в электронную книгу в формате djvu,

– распознать все страницы, проверить правильность распознавания, откорректировать распознавание и сохранить в документ WORD.

 

Сохранение изображений

1. При сохранении изображений нужно отдельно сохранять цветные и черно-белые изображения. При этом, если в книге цветная обложка, а внутренние страницы черно-белые, то обложки сохраняем как отдельные файлы, а все внутренние страницы сохраняем в один файл. В пункте меню выбрать «Файл» – «Сохранить изображение как…»

 

Сохранение изображений  

 

2. В открывшемся окне выбрать папку для сохранения документа, ввести «Имя файла» и выбрать тип файла: для цветных изображений – TIFF, цветной, несжатый (*.tif), для черно-белых изображений – TIFF, серый, несжатый (*.tif).

 

Ввести «Имя файла» и выбрать тип файла

 

Распознавание текста

 

1. Нажать на стрелку рядом с кнопкой «Распознать» и в раскрывающемся списке выбрать пункт «Распознать все» или выделить нужные изображения и нажать на кнопку «Распознать» – в отсканированном изображении будут выделены текстовые блоки и блоки с изображениями.

 

Распознавание текста 

 

2. Исправление ошибок распознавания. Если программа неправильно определила блоки сканирования, можно внести исправления. В данном примере изображение разбито на 2 блока: таблица и картинка.

 

Исправление ошибок распознавания

 

3. Слева от изображения находиться вертикальная панель инструментов. При наведении курсора мыши на значки инструментов появляются всплывающие подсказки. Выбрать инструмент «Выделить картинку», удерживая левую кнопку мыши натянуть прямоугольник вокруг картинки.

 

Вертикальная панель инструментов

 

4. Вокруг картинки появится красная рамка и в правом окне таблица заменится на картинку. Область картинки можно менять в левом или нижнем окне, изменяя размер красной рамки левой кнопкой мыши. Таким же образом можно исправлять области текста, таблиц.

 

Область картинки

 

5. При необходимости – внести правки в текстовом блоке.

 

6. Распознанные страницы можно сохранить в документ MS Office Word, Excel, PowerPoint или как веб-страницу, щелкнув по стрелке рядом с кнопкой «Сохранить» через пункт «Мастер сохранения результатов…» или «Сохранить текст в файл».

 

Сохранить текст в файл

 

7. В появившемся окне  можно выбрать место сохранения файла, ввести его имя, выбрать тип файла, сохранять оформление документа или нет, сохранять только текущую страницу или все отсканированные и распознанные.

 

место сохранения файламесто сохранения файла

 

* В тексте сохраненного документа возможны неправильно распознанные символы и буквы, которые необходимо исправить в текстовом редакторе.