xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web...

27
13.05.2020г. Группа № 11 Профессия СПО «Мастер по обработке цифровой информации» ПМ.01 Ввод и обработка цифровой информации МДК.01.01. Технологии создания и обработки цифровой мультимедийной информации Тема урока: сканирование, распознавание и обработка текста. Подготовка документа к печати. Цели урока: Обучающая: Формирование практических умений и навыков по подготовке документов к печати. Сканированию документов и распознавания с помощью программы ABBYY FineReader. Развивающая: научить применять на практике теоретические знания. Воспитывающая: формировать у обучающихся стремление к постоянному развитию профессиональных способностей и мастерства. ХОД УРОКА Сканирование и распознавание текста Сканирование и распознавание текста являются необходимыми стадиями в процессе преобразования документа на твердом носителе в цифровой формат. Это занимает гораздо меньше времени, нежели ручной способ простого перенабора текста. В результате вы получаете готовый документ, который можно редактировать в любом текстовом редакторе. На этом этапе задействуется специальное оборудование сканер, позволяющий получить оптическим способом

Transcript of xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web...

Page 1: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

13.05.2020г.

Группа № 11

Профессия СПО «Мастер по обработке цифровой информации»

ПМ.01 Ввод и обработка цифровой информации

МДК.01.01. Технологии создания и обработки цифровой мультимедийной

информации

Тема урока: сканирование, распознавание и обработка текста. Подготовка

документа к печати.

Цели урока:

Обучающая: Формирование практических умений и навыков по

подготовке документов к печати. Сканированию документов и распознавания с

помощью программы ABBYY FineReader.

Развивающая: научить применять на практике теоретические знания.

Воспитывающая: формировать у обучающихся стремление к постоянному

развитию профессиональных способностей и мастерства.

ХОД УРОКА

Сканирование и распознавание текста

Сканирование и распознавание текста являются необходимыми стадиями в

процессе преобразования документа на твердом носителе в цифровой формат. Это

занимает гораздо меньше времени, нежели ручной способ простого перенабора

текста. В результате вы получаете готовый документ, который можно

редактировать в любом текстовом редакторе.  

На этом этапе задействуется специальное оборудование сканер,

позволяющий получить оптическим способом электронную копию текстового

документа. Однако полученные файл сродни цифровой фотографии, не смотря на

то, что вроде бы на ней четко изображен текст. То есть, редактировать такой файл

придется средствами графических программ, что представляется совершенно не

рациональным.

Для того чтобы работать с текстом, привычным образом в текстовом

редакторе, текст  придется распознать. Распознавание   текста  это процесс

перевода графического изображения символов (букв) в компьютерные текстовые

символы. Сделать это можно имея качественную цифровую копию оригинального

текста и набор современных компьютерных программ для распознавания текста.

Page 2: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

Этапы сканирования и распознавание текста

Опуская процесс подготовки оригиналов, сам процесс сканирования и

распознавания можно разделить на следующие этапы. 

1. Выбор режима сканирования. Текстовый черно-белый документ, не

содержащий картинок  и иллюстраций, или же эти  элементы так же черно-белые,

достаточно выбрать режим черно-белого сканирования или в градациях серого.

Однако если текст не черно-белый, присутствуют цветные элементы, картинки,

графики, схемы, и нам нужно получить точную копию, режим сканирования

должен быть соответствующим, то есть цветным. Если цветность копии не

принципиальна, то можно ограничиться режимом сканирования в градациях

серого.

2. Далее приступаем к распознаванию текста. Для начала с помощью

специализированных программ анализируется структура документов. На этом

этапе важен контроль специалиста, так как возможные ошибки на этом этапе

потребуют серьезных усилий по их устранению в последствии.

Следующий этап - непосредственное распознавание текста. Этот процесс

так же доверяем компьютерным программам. Однако для успешного

распознавания и минимизации ошибок, специалист должен, прежде всего,

правильно подготовить документ для распознавания, настроить оборудование для

получения максимально качественной цифровой копии оригинала.

Свежеотпечатанный на принтере текст и старая газета с выцветшим 

шрифтом и пожелтевшей бумаге требуют к себе разного подхода на всех этапах

сканирования и распознавания. Однако профессиональные опытные специалисты с

помощью новейших программно-аппаратных средств отлично справляются с

любыми задачами такого рода.

3. Проверка результата и устранение ошибок. После окончания процесса

распознавания, не смотря на постоянно совершенствующееся программное

обеспечение, получившийся результат необходимо проверить и откорректировать 

вручную. Чем хуже состояние оригинала, тем больше возникает ошибок и только

человек может провести коррекцию и исправить все недочеты.

Далее происходит проверка на предмет синтаксических и орфографических

ошибок, расставляются, по необходимости, знаки препинания и специальные

символы.

Page 3: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

4. И последний этап это форматирование документа. Проверяется и если

нужно корректируется размер шрифта, стили заголовков и текста, разбивается на

абзацы, главы, проверяется нумерация страниц и оглавление документа. Также

проверяется общая структура документа и верстка. Графические элементы,

картинки, графики, схемы и другие иллюстрации так же проходят проверку на

предмет соответствия.

После проведения всех вышеописанных процедур, мы получаем точную и

самое главное редактируемую копию оригинала. Теперь мы с легкостью можем

вносить изменения, копировать и делится этим документом, получить необходимое

количество твердых копий. На основании этого документа можно создавать свои

собственные документы. При этом документ будет храниться, без риска быть

испорченным, потерянным или украденным.

Не все сразу понимают одну вещь. После сканирования (пригона всех

листов на сканере) у вас будут картинки формата BMP, JPG, PNG, GIF (могут быть

и другие форматы). Так вот с этой картинки нужно получить текст — это

процедура называется распознаванием.

1. Что нужно для сканирования и распознавания?

1) Сканер

Для перевода печатных документов в текстовый вид, вам для начала нужен

сканер и соответственно, «родные» программы и драйверы, которые с ним шли.

При помощи них можно будет сканировать документ и сохранить его для

дальнейшей обработки.

Можно воспользоваться и другими аналогами, но софт, который шел со

сканером в комплекте, обычно работает быстрее и имеет больше опций.

В зависимости от того, какой у вас сканер — скорость работы может

существенно различаться. Есть сканеры, которые могут получить картинку с листа

за 10 сек., есть которые будут получать за 30 сек. Если сканируете книгу  на 200-

300 листов — думаю, не трудно подсчитать во сколько раз будет разница во

времени?

 2) Программа для распознавания

Page 4: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

Для сканирования и распознавания абсолютно любых документов —

ABBYY FineReader.

Официальный сайт: http://www.abbyy.ru/

Одна из лучших программ в своем роде. Она предназначена для того, чтобы

распознать текст на картинке. Встроено множество опций и функций. Может

разобрать кучу шрифтов, поддерживает даже рукописные варианты.

Как правило, разные версии  ABBYY FineReader не сильно отличаются

друг от друга. Вы без труда сделаете то же самое и в другой. Главные отличия

могут быть в удобстве, быстроте работы программы и ее возможностях. Например,

более ранние версии отказываются открывать документ PDF и DJVU…

 3) Документы для сканирования

В большинстве случаев сканируют какие-нибудь учебники, газеты, статьи,

журналы и пр. Т.е. те книги и ту литературу которая пользуется спросом.

2. Параметры сканирования текста

Во всех сканерах есть одни и те же настройки, которые сильно могут

повлиять на скорость и качество вашей работы.

1) Качество сканирования — DPI

Во-первых, качество сканирования поставьте в опциях не ниже 300 DPI.

Желательно даже выставить побольше, если это возможно. Чем выше показатель

DPI — тем четче получиться ваша картинка, ну и тем самым, быстрее пройдет

дальнейшая обработка. К тому же чем выше качество сканирования — тем меньше

ошибок вам в последствии придется исправлять.

Оптимальный вариант обеспечивает, обычно, 300-400 DPI.

 2) Цветность

Этот параметр очень сильно влияет на время сканирования (кстати, DPI

тоже влияет, но те так сильно, и только когда пользователь ставит высокие

значения).

Обычно выделяют три режима:

— черно-белый (отлично подойдет для простого текста);

— серый (подойдет для текста с таблицами и картинками);

Page 5: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

— цветной (для цветных журналов, книг, в общем, документов, где важна

цветность).

Обычно от выбора цветности зависит время сканирования. Ведь если

документ у вас большой, то даже лишние 5-10 секунд на странице в целом

выльются в приличное время…

 3) Фотографии

Документ вы можете получить не только сканированием, но и

сфотографировав его. Как правило, в этом случае у вас будут некоторые другие

проблемы: искажение картинки, смазанность. Из-за этого может потребоваться

более длительная дальнейшая правка и обработка полученного текста.

Важно отметить, что не каждый такой документ получится распознать, т.к.

качество сканирования у него может быть крайне низким…

 3. Распознавание текста документа

Будем считать, что заветные сканированные страницы вы получили. Чаще

всего они представляют собой форматы: tif, bmb, jpg, png. В общем-то, для ABBYY

FineReader — это не сильно важно…

После открытия в ABBYY FineReader картинки, программа, как правило, на

автомате начинает выделять области и распознавать их. Но иногда она делает это

не правильно. Для этого-то мы и рассмотрим выделение нужных областей

вручную.

Важно! Не все сразу понимают, что после открытия документа в

программе, слева в окне отображается исходный документ, в котором вы и

выделяете различные области. После нажатия на кнопку «распознавания»

программа в окне справа выведет вам готовый текст. После распознавания, кстати,

целесообразно проверить текст на ошибки в том же самом FineReader.

 3.1 Текст

Эта область используется для выделения текста. Картинки и таблицы

нужно исключать из нее. Редкие и необычный шрифты придется вводить

вручную…

Для выделения текстовой области, обратите внимание на панель в верхней

части FineReader. Там есть кнопка «Т» (см. скриншот ниже, указатель мышки как

раз на этой кнопке). Щелкаете по ней, затем на картинке ниже выделяете аккуратно

прямоугольную область, в которой располагается текст. Кстати, в некоторых

Page 6: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

случаях нужно создавать текстовых блоков по 2-3, а иногда по 10-12 на страницу,

т.к. форматирование текста может быть разным и одним прямоугольником всю

область не выделить.

Важно отметить, что в текстовую область не должны попадать картинки! В

дальнейшем это вам сэкономит кучу времени…

3.2 Картинки

Используется для выделения картинок и тех областей, которые тяжело

распознать из-за плохого качества, или необычности шрифта.

На скриншоте ниже указатель мышки находится на кнопке, используемой

для выделения области «картинка». Кстати, в эту область можно выделить

абсолютно любую часть страницы, а FineReader вставит ее потом в документ как

обычную картинку. Т.е. просто скопирует…

Обычно эту область используют для выделения плохо отсканированных

таблиц, для выделения нестандартного текста и шрифта, само-собой картинок.

Page 7: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

3.3 Таблицы

На скриншоте ниже показана кнопка для выделения таблиц. Дело в том, что

вам придется довольно рутинно рисовать (фактически) каждую линию на таблице

и показывать что и как программе. Если таблица небольшая и в не очень хорошем

качестве, рекомендуется для этих целей использовать область «картинка». Тем

самым сэкономите кучу времени, а таблицу можно потом в Word сделать

быстренько на основе картинки.

 3.4 Ненужные элементы

Важно отметить. Иногда на странице есть ненужные элементы, которые

мешают распознать текст, или вообще не дают вам выделить нужную область. Их

можно при помощи «ластика» удалить вовсе.

Для этого переходим в режим редактирования изображения.

 

 Выбираем инструмент «ластик» и выделяем ненужную область. Она

сотрется и на ее месте будет белый лист бумаги.

Page 8: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

 

4. Распознавание файлов PDF/DJVU

Вообще, этот формат распознавания не будет отличаться ничем другим от

остальных — т.е. работать с ним можно так же как с картинками. Единственное,

программа не должна быть слишком старой версии, если файлы PDF/DJVU у вас не

открываются — обновите версию до 11.

 Небольшой совет. После открытия документа в FineReader — он

автоматически начнет распознавать документ. Часто в файлах PDF/DJVU

определенная область страницы не нужна во всем документе! Чтобы удалить такую

область на всех страницах сделайте следующее:

1. Зайдите в раздел редактирования изображения.

2. Включите опция «обрезки».

3. Выделите область, нужную вам на всех страницах.

4. Нажмите применить ко всем страницам и обрежьте.

5. Проверка ошибок и сохранение результатов работы

Чтобы включить проверку, после распознавания, в окне справа, будет

кнопка «проверка», см. скриншот ниже. После ее нажатия программа FineReader

будет автоматически показывать вам те области, где у программы возникли

Page 9: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

ошибки и она не смогла достоверно определить тот или иной символ. Вам

останется только выбирать, либо вы согласны с мнением программы, либо вводите

свой символ.

Кстати, в половине случаев, примерно, программа будет вам предлагать

готовое правильное слово — вам останется только мышкой выбрать нужный

вариант.

 

Во-вторых, после проверки вам нужно выбрать формат, в который вы

сохраните результат своей работы, можно просто передать информацию в Word

один в один, а можно сохранить ее в одном из десятков форматов. Но хотелось бы

выделить другой важный аспект. Какой формат бы не выбрали, более важно

выбрать тип копии! Рассмотрим самые интересные варианты…

 Точная копия

Все области, которые вы выделяли на странице в распознанном документе

будут соответствовать точь в точь исходному документу. Очень удобный вариант,

когда вам важно не потерять форматирование текста. Кстати, шрифты так же будут

Page 10: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

очень похожи на оригинал. Рекомендую при таком варианте передавать документ в

Word, чтобы уже там продолжить дальнейшую работу.

Редактируемая копия

Этот вариант хорош тем, что вы получите уже форматированный вариант

текста. Полезная опция, когда вы будете значительно редактировать информацию.

Простой текст

Вариант для тех, кому нужен просто текст со странице без всего

остального. Подойдет для документов без картинок и таблиц.

 

Page 11: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

Подготовка документа к печати

Перед тем как вывести информацию на печать рекомендовано сначала

посмотреть, как она будет выглядеть на листе. Это позволит не испортить бумагу, а

значит сэкономить. Для такой процедуры воспользуемся функцией

предварительного просмотра документа. Чтобы ее активировать следуйте такой

инструкции:

1. Перейдите на закладку «Файл».

2. В списке найдите ярлык

«Печать». 

Если в текущем варианте что-то не устраивает (например, весь текст не

входит на один лист), то тут же можно изменить поля. Используйте ссылку

«Параметры страницы» внизу окна. 

Page 12: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

Чтобы исправить ошибку в тексте, можно снова вернуться к закладке

«Главная». Если все устраивает, то переходим непосредственно к печати.

Печать документа из Word в этом же окне (закладка «Файл», раздел

«Печать») можно сразу нажать на пиктограмму принтера и напечатать документ.

Тут же есть такие возможности по настройке:

Указать количество экземпляров копий документа. При

необходимости пользователь должен сменить нужный вариант печатающего

устройства, которое будет использовать.

Далее указывается область печати. Это могут быть: определенная

выделенная область из всего текста, конкретные номера страниц документа,

Page 13: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

только одна текущая страница.

Двухсторонняя печать. Если принтер поддерживает технологию

«дуплекс», то можно печатать текст на обеих сторонах листа бумаги в

автоматическом режиме. Для таких целей используйте настройку

«Двухсторонняя

печать». 

Для

принтеров без duplex немного сложнее. Зайдите в свойства принтера. Отметьте

галочку «Двухсторонняя печать» нажмите «OK». Сначала отпечатаются листы с

Page 14: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

одной стороны, а потом нужно перекладывать вручную на другую. Когда это

делать программа Вам сообщит уведомлением на экране монитора.

Как еще один вариант — можно сначала распечатать четные, а потом

нечетные.

Как напечатать книгу или брошюру. Более сложной, но вполне

решаемой даже для неопытных пользователей, будет распечатка брошюры. Для

таких целей в редакторе Word предоставлен специальный инструментарий. В

конце страницы найдите ссылку «Параметры». В следующем окне на первой же

Page 15: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

закладке отметьте ориентацию как «Альбомная», а в списке ниже выберите

«Брошюра».

Как напечатать книгу или брошюру. Более сложной, но вполне

решаемой даже для неопытных пользователей, будет распечатка брошюры. Для

таких целей в редакторе «Ворд» предоставлен специальный инструментарий. В

конце страницы найдите ссылку «Параметры». В следующем окне на первой же

закладке отметьте ориентацию как «Альбомная», а в списке ниже выберите

«Брошюра».

Сочетание клавиш

Если Ваша клавиатура работает и удобней ею пользоваться, а не мышкой,

то для вывода на печать можно применить специальную комбинацию клавиш.

Одновременно нажмите «CTRL»+"P".

Page 16: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

Результатом таких действий будет вывод окна с настройками печати. В итоге Вы

увидите уже знакомое окно с настройками, которые можете изменить.

Панель быстрого запуска

Во многих программах кнопка быстрой печати часто находится

непосредственно на основной панели управления или в меню. Не исключением

стал редактор «Word». Поищите пиктограмму принтера в верхней части основного

окна. Следует помнить, что при нажатии документ будет сразу распечатан на

Page 17: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

принтере. Вносить настройки предложено не будет.

Если у Вас такого значка нет, то его можно добавить. Для этого запустите

настройку «Панели быстрого запуска».

Потом слева в перечне функций найдите пункт «Быстрая печать» и кнопкой

по центру перенесите направо. Подтвердите свои действия кнопкой

«OK». 

Теперь нужный значок будет на панели.

Контекстное меню файла

Page 18: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

Если текст ранее уже сохранен в файле и Вы на 100% уверены, что с ним

все в порядке и тот готов быть сразу напечатанным, то можно использовать

возможности контекстного меню. Как это сделать:

1. Найдите файл на диске или флешке.

2. Левой кнопкой мышки кликните по нему и выделите.

3. Нажатием правой вызовите контекстное меню.

4. В списке выберите пункт «Печать».

Черно-белая и цветная печать

Цветные принтеры поддерживают два типа печати: черно-белую и

цветную. Если стоит задание распечатать документ с текстом, то нет смысла

применять цветные краски. Тем самым мы будем экономить недешевые

расходники. В настройках следует сделать нужные изменения.

Откройте свой документ, а затем перейдите в раздел печати.

Возле принтера нажмите на ярлык «Свойства».

В окне, которое открылось отметьте пункт «Оттенки серого» для ч/б

распечатывания или настройте качество цветной печати.

В зависимости от модели устройства дизайн окна и названия пунктов

могут отличаться. Ищите схожие по смыслу.

Page 19: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком
Page 20: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

Ссылки для просмотра видео

https://www.youtube.com/watch?v=wVomcmDqO7Q - FineReader.

сканирование и подготовка к распознаванию простого текста

https://www.youtube.com/watch?v=MXGxN367ORU FineReader. работа с

более сложными документами

https://www.youtube.com/watch?v=cY6Fv6r_M4s как распечатать документ и

задать настройки печати Microsoft Office Word

Ответьте на вопросы

1. Что нужно для сканирования и распознавания?

2. ABBYY FineReader – это?

3. Что означает «Разобрать по копиям»

4. Как настроить качество печати «Черновое»?

5. Как добавить в панель быстрого доступа «Быстрая печать»

Отсканируйте и распознайте самостоятельно текс (книга, журнал и т.д)

и распечатайте его.

Зачтена будет работа в том случае, если будут ответы на вопросы и

поэтапно выполнены скриншоты сканирования, распознавания и печать документа

(отчет оформить в WORD) или запишите видео выполненной вами работы и

отправьте на электронную почту мастеру производственного обучения.

У кого нет возможности отсканировать и распечатать текст, вам

необходимо выполнить следующее задание:

Page 21: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком
Page 22: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком
Page 23: xn--5-2tbfv.xn--p1aihttps://спц5.рф/images/distancionnoe-obychenie/1475.do…  · Web viewЕдинственное, программа не должна быть слишком

Ответы на вопросы и выполненные практические задания оформить в

WORD и отправить мастеру производственного обучения на электронную

почту.

PS: Если у вас возникли, какие либо вопросы, обращаться на электронную

почту [email protected].

Всем спасибо!

Удачного дня!