Как исправить отсканированный документ в pdf. Как отредактировать отсканированный документ

Сканирование документов на самом деле далеко не такой простой процесс, как может показаться на первый взгляд. Казалось бы, что сложного: достаточно положить документ в сканер, нажать соответствующую кнопку на корпусе, и получить документ на экране монитора.

Но если вы будете подходить к этому процессу столь пренебрежительно, то и качество сканирования окажется соответствующим. Зачастую люди видят основную проблему в самом сканере – мол, он недостаточно хороший, поэтому сканирует плохо, и действующую технику нужно заменить на более дорогостоящую.

Конечно, если у вас есть лишние деньги, всегда можно купить более хороший сканер . Но, во-первых, он далеко не всегда решит поставленную проблему. Во-вторых, потраченные деньги будут просто несоизмеримы с теми различиями, которые вы заметите. И, наконец, вы практически всегда можете «выжать» необходимый результат и из собственной техники, если будете подходить к процессу сканирования правильно. Как же это сделать?

Качество исходных документов – прежде всего

Вы можете купить самую дорогую технику, все правильно настроить, и даже уделить внимание самым мелким деталям, но все равно не получить достаточно качественного изображения на экране. Главной причиной этого является именно низкое качество исходных документов. Как его исправить? Все это зависит уже от конкретной ситуации, но к сканеру такие манипуляции не имеют никакого отношения.

В сущности, у любой техники есть свои возможности. Сканер, в какой-то мере может улучшить качество изображения, но не намного, и это самое улучшение результата, тем более дорогой должна быть техника. Если вам по каким-то причинам приходится работать с документами низкого качества, то выбирайте более дорогую и хорошую по техническим параметрам технику, если нет, то в большинстве случаев будет достаточно и самых простых моделей.

Уход за сканером

Вам стоит правильно ухаживать за сканером. В частности, стекло, которое покрыто пылью, или уже слишком поцарапано вследствие длительной эксплуатации, может снижать качество сканирования. Тоже самое можно сказать и про откровенно изношенные фотоэлементы, с помощью которых осуществляется сканирование.

Некоторая потеря качества может происходит и при передаче изображения, если оно осуществляется, например, беспроводным путем и на достаточно далеко расстояние.

В большинстве случае замена отдельных элементов или просто профилактические работы с принтером приводят к значительному улучшению качества сканирования.

Правильная настройка

Правильно настраивать нужно любую технику, и сканеры в данном случае не являются исключением. Настройка заключается не только в установке драйвера и обнаружении связи со сканером или МФУ, но и выбора должного разрешения для проведения сканирования, а также программы, в которую будет отправляться готовое изображение. Для фотографий лучше выбрать соответствующие редакторы, для текста – блокнот, Word или другие текстовые редакторы.

Если вы по каким-то причинам не можете настроить принтер самостоятельно, то лучше обратиться к специалистам , ведь так вы сможете и получить лучшее качество изображений, и сэкономить свои деньги. Ведь такой подход – куда более экономичное решение по сравнению с покупкой дорогостоящей и профессиональной техники, в которой зачастую просто нет необходимости.

Видео о том, как улучшить качество сканирования

Иногда нет времени для того чтобы создать новый документ и необходимо срочно:

  • отредактировать сканированный чертеж или схему, внести в документ дополнения, комментарии;
  • вставить в сканированный рисунок формы документа поля для заполнения;
  • просто получить чистый, без помарок и лишнего грязного фона документ.

Для этого сканированный документ предварительно необходимо преобразовать в черно-белый, при необходимости устранить перекос, и очистить от "мусора".
Предвижу вопрос - почему бы не включить при сканировании черно-белый режим? Можно, но качество полученного изображения в этом случае будет на порядок ниже, чем в рассмотренном примере.

Существуют специализированные программы для этих целей, такие как Spotlight Pro, но они сложны в использовании, и для их освоения требуется значительное время.

Я хочу предложить более простой, но эффективный вариант обработки сканированных документов, с помощью программы оптического распознавания текста ABBYY FineReader 9.0.

Сканировать документ, можно непосредственно из интерфейса программы или вставить для обработки уже сканированный рисунок.

Для наглядности и усложнения задачи, мы возьмем уже сканированный разворот книги, с перекосом страниц и пожелтевшими от времени страницами. Используя программу ABBYY FineReader 9.0, преобразуем рисунок в черно-белый, исправим перекос и очистим от мусора.

  1. Запускаем программу ABBYY FineReader и в меню Сервис , выбираем команду Опции .
    В открывшемся окне, во вкладке Сканировать/Открыть , отмечаем пункт Не обрабатывать полученные изображения , так как распознавать текст мы не будем - нам нужно только изображение. Выбираем параметры Обработки изображения :
  2. Теперь очистим изображение от мусора - мелких точек. Для этого, просто нажмем 1-3 раза кнопку Очистить изображение , при этом наблюдаем за процессом удаления мусора. при первом нажатии удаляются более мелкие точки, а при последующих, крупнее.

    Участок рисунка до начала процесса очистки от мусора.

    Участок рисунка после однократного нажатия на кнопку Очистить изображение

    Участок рисунка после второго нажатия на кнопку Очистить изображение

  3. Теперь, осталось очистить изображение от крупных "клякс" и затемненных участков. Сделать это можно с помощью инструмента Ластик .
    Принцип работы этого инструмента, отличается от работы аналогичных инструментов других распространенных графических редакторов, и конечно в лучшую сторону. В данном случае, отпадает необходимость "ёрзать" пиктограммой листика по изображению, периодически выбирая команду отмена, после нечаянно стертой полезной информации. Стереть участок изображения в программе ABBYY FineReader, можно методом выделения этого участка.
    Удерживая левую кнопку мыши, выделяем участок изображения любых размеров, и, убедившись, что в выделенный участок входят только элементы, предназначенные для удаления, отпускаем кнопку. Выделенный участок очищен.
  4. Осматриваем получившийся очищенный рисунок, и на одной из страниц обнаруживаем небольшой нюанс. Строки текста слегка искажены. Но оказывается и от этого дефекта сканирования можно легко избавится. Нажимаем кнопку Исправить искажение строк , и дефект исправлен.

    Участок изображения до исправления искажения строк

    Участок изображения после исправления искажения строк

  5. Вот и все, получилось чистое, без перекосов и искажения строк изображение.

Его можно распечатать, не тратя лишнюю краску на кляксы и грязь, отправить по электронной почте другу, без угрызения совести за не качественный скан, а так же сохранить для дальнейшего использования в любом из поддерживаемых форматов.

Для сохранения изображения в меню Файл , выбираем команду Сохранить изображение как... . Выбираем любой из поддерживаемых форматов:
Bitmap, черно-белый (*.bmp; *.dib; *.rle)
Bitmap, серый (*.bmp; *.dib; *.rle)
Bitmap, цветной (*.bmp; *.dib; *.rle)
DCX, черно-белый (*.dcx)
DCX, серый (*.dcx)
DCX, цветной (*.dcx)
JBIG2 (*.jb2; *.jbig2)
JPEG 2000, серый (*.jp2; *.j2k)
JPEG 2000, цветной (*.jp2; *.j2k)
JPEG, серый (*.jpg; *.jpeg)
JPEG, цветной (*.jpg; *.jpeg)
PCX, черно-белый (*.pcx)
PCX, серый (*.pcx)
PCX, цветной (*.pcx)
PNG, черно-белый (*.png)
PNG, серый (*.png)
PNG, цветной (*.png)
TIFF, черно-белый, несжатый (*.tif; *.tiff)
TIFF, черно-белый, packbits (*.tif; *.tiff)
TIFF, черно-белый, сжатие: ZIP (*.tif; *.tiff)
TIFF, черно-белый, сжатие: LZW (*.tif; *.tiff)
TIFF, черно-белый, Group4 (*.tif; *.tiff)
TIFF, серый, несжатый (*.tif; *.tiff)
TIFF, серый, Packbits (*.tif; *.tiff)
TIFF, серый, сжатие: JPEG (*.tif; *.tiff)
TIFF, серый, сжатие: ZIP (*.tif; *.tiff)
TIFF, серый, сжатие: LZW (*.tif; *.tiff)
TIFF, цветной, несжатый (*.tif; *.tiff)
TIFF, цветной, Packbits (*.tif; *.tiff)
TIFF, цветной, сжатие: JPEG (*.tif; *.tiff)
TIFF, цветной, сжатие: ZIP (*.tif; *.tiff)
TIFF, цветной, сжатие: LZW (*.tif; *.tiff)
PDF (*.pdf)


Очищенные сканы страниц от "мусора" и с исправленным искажением строк.

Хочется отметить, многие в настоящее время переводят свои документы (чертежи, схемы, книги...) в электронный вид. При большом объеме работ, удобнее использовать для этих целей фотоаппарат. С некоторыми моделями сканеров и фотоаппаратов, поддерживающих функцию переснятия документов, программа ABBYY FineReader, идет в комплекте. При выборе инструмента для перевода документов в электронный вид, следует учесть это, так как FineReader, с учетом её основного назначения - оптического распознавания текста, для тех, кто работает с документами не менее полезная программа, чем текстовый редактор.

При работе с документами и объемными базами данных довольно часто возникают различные проблемы. Имеются ввиду не ошибки в документации, требующие корректировки и исправления. Речь идет о простой лени. Но, как известно, лень это двигатель прогресса.


Людям во все времена хотелось побыстрее разделаться с рутинной работой и уделить больше времени отдыху.

Но ведь чтобы спокойно и беззаботно заниматься чем-то приятным, сначала нужно качественно сделать свою работу. Очень часто в случае, если документы необходимо занести в реестр или базу данных, приходится перепечатывать большой объем информации. Подобный процесс довольно часто надоедает пользователям. Чтобы упростить этот процесс можно использовать сканер и программу для редактирования.

Функции сканера

Сканер – это специальное устройство, которое позволяет перенести текст из печатного источника (журнала, газеты, книги и т.д.) на экран компьютера. В результаты работу сканера получается изображение страницы исходного документа. На некоторых устройствах используются специальные программы, которые позволяют контролировать весь процесс сканирования. Также предусмотрена возможность выбрать формат, в которых будет преобразовываться используемый материал. При сканировании фактически получается простой снимок документа. Из-за невозможности распознать символы редактирование документа выполнить не получится.

Что можно сделать со сканированным документом

Полученным в результате сканирования документом легко можно управлять, редактируя весь текст или только его фрагмент. Для этой цели обычно используется специальная программа для редактирования сканированных документов. Основная функция таких утилит состоит в распознавании сканированного изображения и перевода его в текстовый фрагмент. В дальнейшем его можно редактировать и обрабатывать. Сегодня можно найти массу подобных программ и приложений. У каждой из них есть свои особенности и нюансы. Рассмотрим некоторые из таких программных продуктов.

ABBYY FineReader

Наиболее распространенной программой для редактирования сканированных изображений является ABBYY FineReader. Данный программный продукт представляет собой совокупность редакторов, предназначенных для выполнения всевозможных операций со сканированными документами. Программа может распознавать текстовые документы со снимков любого качества. Также в программе реализована возможность распознавания многоуровневых документов, содержащих рисунки, таблицы и другие детали. Функционал программы позволяет задать язык в процессе распознавания текста.

Можно также задавать правильные символы сравнения. Это дает возможность выполнять распознавание текста с минимальным количеством ошибок. Программа ABBYY FineReader прекрасно работает с документами в формате PDF. Так что, если вам необходимо отредактировать файл данного формата, сделать это можно легко и без лишних усилий, достаточно просто использовать ABBYY FineReader.

Программа имеет удобный и интуитивно понятный интерфейс. Для использования данного программного продукта не требуется обладать никакими особыми навыками. Именно такая доступность ABBYY FineReader и повлияла на ее популярность среди пользователей по всему миру. После завершения процесса распознавания текста, вы легко может открыть файл с полученным результатом и исправить ошибки, которые сделала программа. Сделать это можно не выходя из меню редактора. Результат в итоге будет сохранен в форме отдельного документа, который можно в любой момент отредактировать.

Тонкости работы с форматом PDF

Если исходный файл имеет формат PDF, то при работе с ним можно использовать некоторые хитрости. В процессе распознавания PDF-файлов особенно удобно использовать FineReader, однако стоимость данного программного продукта зачастую отталкивает пользователей и вынуждает искать аналогичные программные продукты. К счастью, существует несколько утилит, с помощью которых можно осуществлять распознавание текста в файлах, имеющих формат PDF.

PDFill PDF Tools

Данная программа предназначена специально для работы с файлами, имеющими формат PDF. В ней имеется ряд отдельных опций, позволяющих объединять несколько документов в одно целое или, наоборот, делить один документ на несколько. Также PDFill PDF Tools позволяет редактировать содержимое PDF-файлов и преобразовывать их в изображения. Кроме этого, программа дает возможность создавать списки, работать со встроенными изображениями, выравнивать текст и проводить другие операции, которые пользователь может осуществлять при работе с пакетом программ Microsoft Office.

Программа распространяется совершенно бесплатно. Предназначена она как для домашнего, так и для корпоративного использования. Есть, конечно, и недостатки. Одним из них является интерфейс программы. Его нельзя назвать удобным. Но данный недостаток с лихвой компенсируется широким набором функций программы. Также стоит учесть, что русскоязычной версии PDFill PDF Tools пока нет.

Free PDF Editor

Еще одно бесплатное приложение, при помощи которого можно редактировать файлы в формате PDF, это Free PDF Editor. Программа обладает простым и понятным интерфейсом, поддерживается многими распространенными операционными системами. Единственный недостаток Free PDF Editor заключается в следующем: результат сканирования нельзя отредактировать. Сканировать можно прямо в программу. Однако, придется дополнительно повозиться с настройкой виртуального принтера. Иначе программа просто откажется работать.

Редактор OCR

Если уж вести разговор о бесплатных аналогах программы ABBYY Fine Reader, то следует обязательно упомянуть программу под названием OCR Form. Эта полезная и функциональная утилита особенно понравится тем пользователям, которым приходится работать сразу с несколькими языками. OCR поддерживает свыше двадцати иностранных языков. Утилита также неплохо справляется с документами плохого качества и полиграфией. Однако есть у нее и свои недостатки. Программа не очень хорошо работает с рукописным текстом.

Конечно, в функционале программы указана возможность операций с рукописным текстом, но качество результата мягко говоря сомнительное. Если говорить о внешнем виде программе, то здесь OCR вполне может составить достойную конкуренцию платным приложениям. Работать с программой очень просто: достаточно просто открыть нужный файл, сканировать его и сохранить в нужном формате. Еще одна особенность, благодаря которой OCR завоевала популярность среди пользователей – это возможность самообучения. Программа оснащена адаптивной системой распознавания, которая позволяет при каждом новом запросе все лучше и лучше осуществлять распознавание текста.

Еще одна программа из семейства OCR – SimpleOCR.

Даная утилита представляет собой упрощенный аналог OCR. В данной программе имеется возможность ручного добавления слов при помощи встроенного редактора. Кстати, редактирование текста можно проводить прямо в окне программы. Работу можно осуществлять сразу над несколькими файлами. Программа имеет немного необычный интерфейс, который может сбить с толку. Но если уделить некоторое время работе с данной программой, вы получите очень полезный инструмент для редактирования сканированного текста.

Работа с изображениями

В некоторых случаях приходиться иметь дело со сканированными документами в формате jpg. Тогда процесс распознавания текста будет осуществляться совершенно по другому принципу. Ведь нужно не просто распознать картинку, но еще привести ее к приемлемому виду. Например, если вам нужно отсканировать схему из учебника, то на скане будут отображаться следы чернил с других страниц. Для того чтобы избавиться от этих недостатков, можно использовать специальные графические редакторы.

Можно применить для этой цели такой продвинутый инструмент, как Photoshop. С его помощью можно осуществлять редактирование сканированных документов. Photoshop позволяет избавиться от таких недостатков, как отпечатки чернил и пятна. Также можно изменить яркость и цвет изображения, используя различные фильтры. В интернете можно найти множество видео-уроков, посвященных работе с данным программным продуктом. Существует и множество других графических редакторов, при помощи которых можно редактировать сканированный документ.

Как улучшить качество отсканированного изображения

Вы скачали журнал или книгу из интернета, открыли файл и увидели, например, такие страницы:



Я специально для примера взяла страницы из журналов с крючковыми схемами вязания (где в схемах много мелких обозначений) и выкройками (где много линий для разных моделей).


Я не обвиняю тех, кто выкладывает такие сканы в интернет. Часто это зависит от характеристик сканеров. Кроме того, многие журналы печатаются на тонкой просвечивающейся бумаге, а иногда и просто на газетной бумаге.


Конечно, можно пользоваться и такими сканами. Но если вы собираетесь вязать или шить, по-моему лучше почистить страницы от грязи, сделать поярче и четче.


Я расскажу, как сама поступаю в таких случая. Но возможны и другие варианты.


Для работы нужна программа Adobe Photoshop . У меня на компьютере установлена русифицированная версия, поэтому название команд я буду писать на русском языке, а в скобках давать их английское обозначение.


Не буду рассказывать о сложных манипуляциях с использованием разных слоев и множества функций фотошопа. Мне кажется, в данном случае не стоит усложнять себе работу.


Открываем в фотошопе страницу из журнала.




Если вы никогда не занимались таким делом, рекомендую создать дубликат картинки.


На панели меню открываем: Изображение (Image) → Создать дубликат (Duplicate).




Открывается окно, где вы можете указать новое название файла. Мы не будет ничего переименовывать, нажмем Да (ОК).



На странице журнала, которую мы собираемся обработать, нет никаких цветных изображений или надписей, но отсканирована она в цвете, поэтому и получился розоватый фон. Я такие картинки сразу перевожу в черно-белые, дальше чистить будет гораздо легче.


Изображение (Image) → Коррекция (Adjustment) → Черно-белый (Desaturate). Удобнее воспользоваться горячими клавишами: нажать одновременно Alt+Shift + Ctrl+B.




Откроется новое окно, в нем ничего менять не надо. Просто нажмите "Да" и получите черно-белое изображение.



Теперь попробуем его почистить. Чтобы было удобнее работать, надо увеличить изображение. В фотошопе это можно сделать разными способами.


Слева на панели инструментов есть кнопка Лупа .


Через меню: Просмотр (View)→ Увеличение (Zoom in), с помощью горячих клавиш: Ctrl ++.


Я обычно пользуюсь панелью Навигатор (Navigator), расположенной справа. Внизу есть бегунок, двигая который вправо или влево, можно увеличивать или уменьшать картинку.



Находим на картинке наиболее грязное, затемненное место.


Затем нам нужна функция "Уровни" (Levels). Открыть ее можно или через меню: Изображение (Image) → Коррекция (Adjustment) → Уровни (Levels). Или горячими клавишами Ctrl+L.




В открывшемся окне выбираем правую пипетку и отмечаем ею на скане грязное пятно. Нажимаем "Да". Если грязь не удалилась полностью, операцию можно повторить.




В результате мы получим вот такое очищенное изображение.



Оно несколько бледноватое. Можно повысить контрастность изображения: Изображение (Image) → Коррекция (Adjustment) → Автоконтраст (Auto Contrast) или Контраст/Яркость (Contrast/ Brightness ).


А можно сделать так: опять открыть окно "Уровни" и подвигать ползунок (отмечено красным) вправо. Вы сразу увидите, как улучшается вид изображения. Когда вы решите, что изображение достаточно улучшено, нажмите "Да".

Очень часто случается так, что требуется отредактировать текст, содержащийся только в бумажном варианте. Для распознавания и редактирования на данный момент имеется немало программ, которые различаются не только качеством результатов, но и расширенным функционалом. Fine Reader является одним из лучших существующих приложений для выполнения этих целей.

Вам понадобится

  • - текстовый редактор;
  • - программа Fine Reader.

Инструкция

  • Скачайте и установите программу распознавания отсканированного текста, например, Fine Reader. Ознакомьтесь с функционалом программы – многие современные версии поддерживают интеграцию отсканированного текста прямо в Word, если такая функция имеется в вашей копии программы, выполните операцию, пропустив следующие пункты.
  • Если у вас старые версии программы, отсканируйте нужный для редактирования документ при помощи стандартной программы вашего копировального оборудования, которым вы обычно пользуетесь, и сохраните его в формате.jpg на вашем компьютере.
  • Щелкните один раз правой кнопкой мыши по сохраненному изображению, выберите пункт «Открыть с помощью…» и в появившемся списке программ выберите недавно установленный вами Fine Reader. Если нужно, отметьте флажком пункт «Использовать для всех данных для файлов этого типа. Также вы можете просто отсканировать изображение при помощи уже открытой программы, выбрав пункт “Scan and Read”, при этом изображение с устройства импортируется прямиком в рабочую область. Для этого предварительно в настройках укажите параметры работы сканера в режиме программы Fine Reader.
  • В открывшемся окне программы выберите пункт «Распознать текст». Подождите, пока программа выполнит чтение документа. Если результаты операции не будут соответствовать вашим требованиям, измените настройки сканирования и распознавания и повторите процедуру заново.
  • Сохраните получившийся документ в любом формате, который поддерживается программой Microsoft Office Word. Закройте Fine Reader, перейдите в папку, в которую был сохранен ваш документ.
  • Откройте файл при помощи MS Office Word или любого другого текстового редактора, в котором вам удобно работать. Произведите нужные изменения в файле, сохраните результаты.
  • Совет добавлен 23 июня 2011 Совет 2: Как исправить документ Зачастую, когда документ уже подписан, необходимо исправить досадную опечатку либо поставить пропущенную букву. Это необходимо сделать для того, чтобы не испортить мнение о себе для тех, кому отправляется отсканированная копия документа. В случае, если документ необходимо отправить в печатном виде, исправления невозможны, но если вам предстоит отправить его отсканированную копию, вы всегда можете исправить погрешности в тексте.

    Инструкция

  • Зачастую, когда документ уже подписан, необходимо исправить досадную опечатку либо поставить пропущенную букву. Это необходимо сделать для того, чтобы не испортить мнение о себе для тех, кому отправляется отсканированная копия документа. В случае, если документ необходимо отправить в печатном виде, исправления невозможны, но если вам предстоит отправить его отсканированную копию, вы всегда можете исправить погрешности в тексте.
  • Откройте лист, который нужно исправить, в редакторе Paint. В случае, если бумага получилась не белой а чуть темной, используйте редактор Microsoft для того, чтобы высветлить фон, после чего откройте его в Paint.
  • Дислоцируйте место опечатки либо пропущенного символа. При помощи ластика сотрите ненужную букву. Следите за тем, чтобы белыйслед, который остается после ластика, не выделялся на фоне общего фона.
  • Используйте инструмент «копировать». При помощи этого инструмента обведите ту букву, которую необходимо поставить на место стертой. Скопируйте ее и аккуратно вставьте в то место, которое вы зачистили ластиком. Следите за тем, чтобы высота буквы была на том же уровне, что и высота близлежащих, а расстояние до других букв было равным.
  • Повторяйте предыдущий шаг, пока не добьетесь полной корректировки желаемого фрагмента текста. После этого проверьте, чтобы цвет букв, которые вы вставили, совпадал с цветом других, которые вы не трогали. Если вы сканировали в хорошем разрешении, проблем с этим быть не должно. Уменьшите документ в два-три раза и сохраните как файл.jpg.
  • Для того, чтобы максимально скрыть следы корректировки, используйте JPGtoPDF converter. Сконвертируйте изображение в pdf файл и высылайте отправителю.
  • Как исправить документ - версия для печати
    mob_info