+7 (495) 660-97-64
Заказать звонок
Оборудование для создания электронных архивов и микрофильмирования

Книжный сканер или цифровая камера?

Книжные сканеры отличаются от сканеров другого типа, поскольку поверхность раскрытой книги не является плоской. С точки зрения механики, сканирование книг представляет собой сложную задачу, и, если бы книги изобретались современными инженерами, они, скорее всего, были бы созданы в бесконечной форме, прокручиваемыми между двумя небольшими трубками, подобно пленке. Если бы это было так, потребность в специализированных книжных сканерах отсутствовала бы.

К сожалению, Йоханнес Гутенберг не думал о сканировании, когда он придумывал книги 600 лет назад.

Для цели сканирования книг мы настоятельно рекомендуем использование именно книжного сканера, который сканирует раскрытую книгу сверху, так же как вы ее читаете. Для этого были разработаны разнообразные книжные колыбели и другие подобные устройства. Однако, здесь мы хотели бы сосредоточиться на более тонких моментах, которые являются более уязвимыми для некорректной и вводящей в заблуждение информации.

На рынке книжных сканеров в настоящее время доминирует несколько известных производителей, однако, множество небольших компаний также пытается получить свою долю. К сожалению, для покупателей, некоторые из этих компаний декларируют нереалистичные характеристики предлагаемых ими устройств, которые превосходят возможности современной физики.

В последние несколько лет некоторые производители стали устанавливать на штатив цифровые камеры и снабжать такие устройства экраном для большего сходства с настоящими книжными сканерами. Они тоже называют свои устройства на базе цифровых камер «книжными сканерами», которые, на самом деле, таковыми не являются, поскольку сканер сканирует документ, а цифровая камера делает фотографию. Это привело к определенной путанице на рынке, и цель данного документа – непредвзято разъяснить некоторые технические понятия и их влияние на качество сканирования, его скорость и обработку.

Цифровые камеры

В цифровых камерах используются матрицы CCD, состоящие из множества мельчайших пикселов, закрытых фильтром Байера, в свою очередь состоящим из комбинаций двух зеленых, одного красного и одного синего пиксела, организованных в квадрат. Это вдвое снижает разрешение для зеленого канала и в четыре раза – для красного и синего каналов. Малый размер пикселов также повышает уровень шума по сравнению с линейными сенсорами. На следующих рисунках показана технология создания цветного изображения с помощью фильтра Байера.

Если производитель предлагает «книжный сканер» с камерой, делающей один снимок, матричной камерой или чипом, скорее всего, это обычная цифровая камера, смонтированная на сверхдорогом стенде.
Цифровые камеры разработаны для получения изображения объектов на различных расстояниях, некоторые из которых находятся в фокусе, а другие – не в фокусе.

 

Сканеры

Профессиональные сканеры снабжены линейными сенсорами, воспринимающими красные, зеленые и синие линии одну за другой, отраженные от документа, освещаемого белым светом. Изображение уменьшается с помощью объектива и проецируется на линейный CCD сенсор. Объект (документ) движется синхронно с экспозицией элементов CCD сенсора. В ряде книжных сканеров камера и оптическая система (объективы) могут двигаться относительно документа или быть неподвижными, но дополнительно снабжаться вращающимся зеркалом, имитирующим движение. Красный элемент будет захватывать одну линию изображения, следующую за зеленым и синим элементами. И, в конечном итоге, изображение будет составлено из величин RGB с максимальным разрешением и без каких-либо искажений, вносимых фильтром Байера.

Трехэлементные сенсоры преобразуют свет, поступающий от объекта, в электрические сигналы. Красный, зеленый и синий фильтры, расположенные в трех последовательных рядах CCD элементов, обеспечивают очень высокое значение цветовой гамма-функции, что для CCD сканеров является типичным. Пиксел в высококачественном CCD сенсоре гораздо больше, чем в цифровой камере и имеет типовой размер порядка
10 мкм x 10 мкм, что очень важно, поскольку больший размер элемента позволяет снизить шумы и другие негативные эффекты.

Объективы сканеров

При разрешении 600 dpi один пиксел на оригинале имеет размер 64 мкм x 64 мкм, поэтому для получения изображения размером 10 мкм x 10 мкм в CCD сканерах используются объективы с уменьшением 1:6,4. Это обеспечивает значительную глубину фокуса на большой оптической длине. Почти все книжные сканеры на сегодняшний день используют камеру, состоящую из объектива и линейного CCD сенсора.

Качество объектива для CCD сканера является очень важным фактором, влияющим на конечное качество сканирующей системы, но при этом ограничения для него гораздо меньше, чем для объективов высококачественных цифровых камер. Причиной этого является тот факт, что в объективах CCD сканеров используется только центральная область линз. Объектив цифровой камеры должен быть не только почти в два раза больше в диаметре, но при этом он будет создавать существенные цветовые аберрации, подушкообразные геометрические искажения, а также потерю интенсивности во внешних углах. Сканеры, кроме того, используются не только для получения изображений как таковых, но и в системах управления, поэтому для сканеров точность является ключевым фактором.. Если производитель предлагает «книжный сканер» с камерой, делающей один снимок, матричной камерой или чипом, скорее всего, это обычная цифровая камера, смонтированная на сверхдорогом стенде. Цифровые камеры разработаны для получения изображения объектов на различных расстояниях, некоторые из которых находятся в фокусе, а другие – не в фокусе.

«Красивая картинка» не может заменить точный скан.

Полезное время жизни

За время своей эксплуатации книжные сканеры могут выполнить более 5 миллионов сканов, в то время как цифровые камеры считаются качественными, если они за время их эксплуатации сделают до 1 миллиона снимков (подробности см. на: www.olegkikin.com/shutterlife).

Учтите, что маркетинговые департаменты некоторых производителей цифровых камер гораздо более изобретательны чем инженерные. Мы видели рекламу цифровых камер в 300.000.000 циклов экспозиции, что должно соответствовать времени жизни в 240 лет!

Многие заказчики уже разочаровались в своих решениях о приобретении сканирующего оборудования, которые базировались на опубликованных спецификациях или даже на данных в рамках официальных тендеров, поскольку некоторые из этих спецификаций вводят в заблуждение, если не полностью противоречат истине.

Производитель должен нести ответственность за распространяемые технические спецификации.
Прежде чем купить, попросите предоставить образцы сканов при самом высоком декларируемом разрешении. Не верьте указанным цифрам разрешения или количеству мегапикселов, прежде чем не проверите это сами.

 

Но что такое разрешение и насколько высокое разрешение требуется для того или иного проекта по оцифровке? Это одна из наиболее запутанных тем на рынке книжных сканеров и задача следующей части разъяснить объективную правду на основе научного подхода.

Разрешение

Сканер, как уже говорилось, последовательно сканирует красный, зеленый и синий цвета один за другим и, таким образом, создает идеальные с геометрической точки зрения RGB пиксели. Все цифровые камеры снабжены фильтром Байера, который уменьшает эффективное разрешение наполовину для зеленого канала и на четверть для красного и синего каналов. Полученные пиксели должны быть проинтерполированы с помощью программного обеспечения, что создает еще больше погрешностей.

Изображение слева получено с помощью цифровой камеры, а правое – с помощью книжного сканера, оба при разрешении 200dpi только потому, что это максимальное разрешение, поддерживаемое цифровой камерой. Производитель называет это книжным сканером, но, если Вы сравните два изображения, разница становится очевидной. Левое изображение размыто и полно искажений. Оно также характеризуется высоким уровнем шума, что типично для цифровых камер нижнего сегмента с их крайне малым размером пиксела. При этом во многих цифровых камерах пытаются сгладить эффект шума, жертвуя при этом еще большим количеством деталей, что неприемлемо при сканировании документов. «Красивая картинка» не может заменить точный скан. Производитель должен нести ответственность за распространяемые технические спецификации. Прежде чем купить, попросите предоставить образцы сканов при самом высоком декларируемом разрешении. Не верьте указанным цифрам разрешения или количеству мегапикселов, прежде чем не проверите это сами. Неспособность воссоздавать прямые черные и белые линии также создает проблему для любого OCR программного обеспечения при распознавании
размытого текста.

Размер документа

Книжные сканеры имеют максимальную длину и ширину зоны сканирования, как правило, соответствующую формату А0. Маркетинговый департамент одного из производителей «книжных сканеров» на базе цифровых камер, которые захватывают область на 20% большую чем А3, обозначил это как «почти А2». Поэтому для Вас важно определить максимальный размер документа, предназначенного для сканирования. Чем больше исходный документ, тем более количество пикселов потребуется при сканировании. В следующей таблице дано количество пикселов, необходимое для сканера при сканировании вдоль длинной стороны документа, и при сканировании вдоль короткой стороны. В первом случае необходимо меньше пикселов, но требуется больше времени, во втором случае – больше пикселов, но меньше времени. Некоторые производители используют цифровые камеры и утверждают, что это тоже сканеры, что не соответствует действительности.
Тем не менее, в следующей таблице мы также указали необходимые требования в мегапикселах для цифровых
камер.

    A0 /E-size A1 / D-size A2 / C-size A3 / B-size A4 / letter
Слева направо 200 dpi  3 x 6700 3 x 4700 3 x 3400 3 x 2400 3 x 1700
Сверху вниз   3 x 9400 3 x 6700 3 x 4700 3 x 3400 3 x 2400
Цифровая камера   124 Mpixel 62 Mpixel 31 Mpixel 16 Mpixel 8 Mpixel
             
Слева направо 300 dpi 3 x 10000 3 x 7100 3 x 5000 3 x 3600 3 x 2500
Сверху вниз   3 x 14100 3 x 10000 3 x 7100 3 x 5000 3 x 3600
Цифровая камера   279 Mpixel 140 Mpixel 70 Mpixel 35 Mpixel 18 Mpixel
             
Слева направо 400 dpi 3 x 13300 3 x 9400 3 x 6700 3 x 4700 3 x 3400
Сверху вниз   3 x 18800 3 x 13300 3 x 9400 3 x 6700 3 x 4700
Цифровая камера   496 Mpixel 248 Mpixel 124 Mpixel 62 Mpixel 31 Mpixel
             
Слева направо 600 dpi 3 x 19900 3 x 14100 3 x 10000 3 x 7100 3 x 5000
Сверху вниз   x 28100 3 x 19900 3 x 14100 3 x 10000 3 x 7100
Цифровая камера   1116 Mpixel 558 Mpixel 279 Mpixel 140 Mpixel 70 Mpixel

Примечание: Если производитель устройств на базе цифровых камер показывает половину необходимого числа пикселов, подсчитанных в таблице выше, значит они считают красную, зеленую и синюю точки за одну и интерполируют два выпадающих цвета на точку. Другими словами, в этом случае 1/3 пикселов реальные, а 2/3 интерполированные. В приведенной таблице предполагается, что 2/3 пикселов цветовой информации являются реальными и только 1/3 интерполированными, что дает менее качественный результат, чем может дать сканер.

Некоторые производители утверждают, что они с помощью их 30-мегапиксельных камер могут оцифровать документ формата А2 с разрешением 400dpi, но приведенная таблица доказывает их неправоту, поскольку для этого требуется матрица, как минимум, 124 мегапиксела. При разрешении 600dpi самые большие матрицы, доступные сегодня по цене в тысячи долларов или евро, могут оцифровать только формат А4, что недостаточно для серьезного сканирования книг.

Все книжные сканеры оснащены линейными сенсорами высокого разрешения, а иначе они не могут называться сканерами. Если производитель, использующий для оцифровки цифровые камеры, утверждает, что их оборудование приближается к типичному разрешению сканеров в 300dpi и выше, взгляните на таблицу, приведенную выше, и выясните правду.

Скорость и экспозиция

В процессе сканирования в секунду сканером обрабатывается несколько тысяч изображений, и поэтому он нечувствителен к погрешностям движения документа относительно камеры, вибрациям и т.д. При этом в процессе сканирования освещается только небольшая область оригинала, которая сканируется в данный момент. Свет сканера является высококачественным и интенсивным. Отражаясь от оригинала, он дает изображения высокого качества с низким уровнем шумов. Типовое значение времени экспонирования для сканеров находится в диапазоне от 250 до 1500 мкс.

С другой стороны, цифровые камеры требуют времени экспозиции в пару секунд, что делает их очень чувствительными к любому виду смещения камеры, книги, оператора и даже пола в помещении, в котором используется эта цифровая камера.

Количество света также является определяющим фактором. Некоторые производители утверждают, что их сканерам не нужны источники света, в связи с чем они не производят инфракрасного и ультрафиолетового излучения. Поскольку предыдущее утверждение верно по определению, последнее является заблуждением. Такие сканеры полностью зависят от окружающего освещения, и это эквивалентно фотографированию при плохом освещении без вспышки. Все знают, что результат такого фотографирования непредсказуем с точки зрения цветового баланса, шумов, отражений и т.д.

Хорошие книжные сканеры снабжены собственным, точно управляемым высококачественным источником света. Уровень освещения в зоне сканирования должен быть высоким и при этом не должны освещаться объекты вне указанной зоны.

Высокий уровень освещения, обеспечиваемый сканером, необходим для усиления «полезной составляющей» относительно фонового освещения для того чтобы перекрыть все проблемы, создаваемые окружающим светом.
Источники света сканеров должны быть, как правило, в 10 – 20 раз ярче, чем окружающий свет, подавляя
восприятие неконтролируемого окружающего освещения до уровня невидимого.

В то же время, все области оригинала, не подвергающиеся сканированию в данный момент времени, должны быть защищены от световой экспозиции, также как и оператор. Книжные сканеры, в которых данные правила выполняются, снабжены движущейся световой линейкой или LED источником высокой интенсивности, свет от которого разворачивается по поверхности книги в процессе ее сканирования. Интенсивность света в процессе сканирования поддерживается постоянной даже при различных расстояниях до объекта и углах. Все книжные сканеры большинства участников рынка снабжены движущейся световой линейкой.

В современном книжном сканере используется движущаяся световая линейка, составленная из высококачественных белых светодиодов. Устройство, освещающее сразу всю область сканирования, или не освещающая ее вообще, скорее всего, представляет собой не сканер, а сверхдорогую цифровую камеру.

Биты, плотность и шум

Вероятно, самое большое заблуждение, касающееся технологии сканирования, это глубина цвета, также называемая цветовым разрешением. Первое, что необходимо запомнить, глубина цвета и динамический диапазон это не одно и то же. Здесь мы объясним это различие. Большинство сканеров сегодня имеют глубину цвета, по крайней мере, 30 bit, а многие - 36, 42 или 48 bit. Большее количество бит необходимо для передачи цифровых величин, поддерживающих лучший динамический диапазон. Поскольку эти два фактора часто связаны, существует также второе требование. Для высококачественных CCD линеек с низким уровнем шумов, а также для электроники, необходим больший динамический диапазон сигнала. Если утверждается, что сканер
имеет глубину цвета 48 bit, это не имеет никакого отношения к реальной оптической плотности, а означает лишь то, что в устройстве используется 16-разрядный аналогоцифровой преобразователь.

В следующей таблице приведены теоретические значения максимальной оптической плотности при различных значениях глубины цвета. Если Вы найдете эти значения в спецификации сканера, их спокойно можно игнорировать, поскольку они определяют «размер контейнера», а не его содержимое.

Разрядность, (bit) Двоичныхъ единиц Макс. плотность (шум -0) Макс. плотность (шум - 1 bit)
30 1024 3.0 2.7
36 4096 3.6 3.3
42 16384 4.2 3.9
48 65536 4.8 4.5

Диапазон плотностей в реальности гораздо ниже расчетного. Таблица ниже дает диапазон плотностей для
реальных материалов.

Материал Макс. плотность
Газета 1.8
Отражающая фотобумага 2.0
Высококачественная печать на бумаге 2.6
Высококачественная пленка 3.2

 

Вывод понятен: глубины цвета 36 bit достаточно для передачи всей необходимой цифровой информации о диапазоне оптической плотности самых качественных оригиналов на пленке. Большие величины «контейнера» являются излишними, к тому же замедляющими работу системы. Некоторые системы могут использовать разрядность больше чем 36 bit для обеспечения возможности коррекции яркости и значения гамма-функции на этапе последующей обработки, однако это не означает, что диапазон оптической плотности при этом будет выше.

Гораздо более существенным моментом чем глубина цвета является уровень шума системы. Современные книжные сканеры снабжены линейными сенсорами с большими размерами элементов до 10 х 10 мкм, которые могут накапливать большое количество фотонов до момента насыщения. Большое количество фотонов означает меньший уровень шума. Если уменьшить размер элемента вдвое, уровень шума удваивается, и одна из проблем цифровых камер именно в этом. На сегодняшний день размеры элемента матрицы цифровой камеры составляют одну десятую часть размера элемента линейного сенсора, и требуется большое количество вычислений для того чтобы получить более или менее приличное изображение на выходе.

Глубины цвета в 36 bit более чем достаточно для книжного сканера. Более высокие значения могут казаться привлекательными, но они являются бесполезными. Гораздо более важными моментами являются уровень освещения и размер элемента приемника.

По материалам сайта www.imageaccess.de