Сканирование текста

Отличие электронного текста от обычного «бумажного» — не только в материальности и вещественности текста на бумаге, на восприятие которого неизбежно накладывает отпечаток цвет и фактура бумажного листа. Электронный текст вариативен, мобилен и невесом, он может легко менять размер и плотность с изменением гарнитуры, кегля и шрифта, он моментально передается с помощью интернета на другой конец земного шара, он может быть легко отредактирован, сокращен или дополнен. Бумажный текст статичен, отяжелен своим носителем и гораздо менее подвержен трансформациям. Идеальность электронного варианта провоцирует стремление к переводу бумаги в электронную форму — к сканированию текста, если мы собираемся с ним работать, если он вообще нам нужен не только для любования каллиграфическим или полиграфическим искусством.

Однако сканирование текста нередко представляет собой большую проблему, чем кажется поначалу, и часто это целый набор проблем. Мелкий шрифт, плохой и нечеткий оттиск, некачественная или пожелтевшая бумага, многочисленные карандашные пометки на полях — все это превращает сканирование текста в мучение. Приходится увеличивать разрешение при сканировании, при распознавании постоянно сверяться с оригиналом в стремлении понять, что же там за буквы превратились в нечитаемые значки. Сканер с помощью специальных программ для распознавания давно научился идеально копировать шрифт печатных машинок, но с неровностями бумажного листа ему справиться тяжело.

Впрочем, даже эти проблемы снимаются при сканировании текста в формат рисунка. Если нам не нужно редактировать или изменять текст, а только сохранить или передать его, сканирование текста в формат pdf идеально решает задачу. Именно этот формат наиболее распространен при копировании книг и документов на Западе, где закон об авторском праве тщательно соблюдается. Текст-картинка менее уязвим для воровства, его создание требует меньшего времени и внимания, он не тяжелее файла в формате *.doc и более универсален (благо программ для чтения pdf более чем достаточно, и распространяются они бесплатно). К тому же этот формат позволяет сохранить ощущение общения с подлинным бумажным листом: сохраняется аура оригинала, а ведь это нередко оказывается важно: при сканировании текста со старых документов, редких книг, уникальных рукописей.

Сканирование книг, документов, изображений