Графика

Максим Отставнов

Векторное и растровое кодирование изображений

Максим Отставнов

Способы кодирования графических данных делятся на две категории: растровый (точки равномерно размеченного прямоугольника) и векторный (описания линий и фигур, составляющих изображение).

Например, растровое изображение окружности может быть таким: «заполняем квадрат 5х5: белая точка (Б), черная точка (Ч), Ч, Ч, Б, Ч, Б, Б, Б, Ч, Ч, Б, Б, Б, Ч, Ч, Б, Б, Б, Ч, Б, Ч, Ч, Ч, Б». (Более умные «форматы со сжатием», возможно, позволят сократить запись до чего-нибудь, подобного: «заполняем квадрат 5х5: Б, 3Ч, Б, 3(Ч, 3Б, Ч), Б, 3Ч, Б», а то и еще более компактно, но суть не в этом).

Векторное ее изображение совсем другое: «черная окружность с центром в (3,3), радиусом 2 и толщиной линии 1».

Важно понимать, что большинство компьютерных графических устройств сегодня — и терминалы, и сканеры, и принтеры — по своей природе растровые. Исключение составляют только графопостроители (плотерры).

Соответственно, изображение, вне зависимости от его собственной природы (векторной или растровой), будет при отображении преобразовано в растр и доступно человеческим чувствам в растровой форме (даже если растр почти незаметен, как на дисплеях с высоким разрешением, или вообще имеет сетку ниже порога восприятия, как при печати на качественных струйных или лазерных принтерах). И указанные два способа вполне могут привести к неотличимому результату. Разница может проявиться тогда, когда мы начнем обрабатывать элементы изображения.

Векторное изображение может без ущерба масштабироваться (увеличиваться или уменьшаться), причем эта операция обратима. В приведенном примере мы можем без труда увеличить векторную окружность в пять раз: «черная окружность с центром в (15,15), радиусом 10 и толщиной линии 5», и она останется окружностью.

А вот растровое изображение при увеличении обнаружит лишь свой растр в увеличенном виде (и на окружность наш пример похож уже будет мало). Более того, операция уменьшения (или увеличения в нецелое число раз) растрового изображения уже не является обратимой: информация при осуществлении такой операции безвозвратно теряется.

Кроме того, векторное изображение, содержащее более одного элемента (например, изображение двух пересекающихся окружностей), может быть разъято на элементы без каких-либо потерь. С растровым изображением такое, в общем случае, невозможно: программа «не знает» об элементах изображения и о принадлежности тех или иных точек отдельным элементам.

В общем случае, векторное кодирование хорошо подходит для работы с чертежами, схемами, картами, диаграммами, графиками и т. п., а растровое — для обработки фотографий и рисунков. Векторное изображение может быть без ущерба для восприятия преобразовано в растр, в то время, как обратное преобразование в общем случае проблематично (хотя есть программы, позволяющие с той или иной точностью распознавать графические образы). Векторное кодирование часто компактнее растрового, но его отображение требует больших вычислительных ресурсов[37].

Пример, который всегда перед глазами пользователя компьютера — шрифты. Когда точно известен масштаб, в котором будет отображаться текст, часто используются растровые («фиксированные») шрифты, представляющие собой набор растровых изображений отдельных букв и других символов используемого алфавита (например, растровые шрифты используются видеокартой, работающей в текстовом режиме, но также часто и как элемент графического интерфейса). Их применение позволяет отображать символы с недостижимой иным способом четкостью, но, если нужно более одного размера шрифта, потребуется трудоемкая работа по разработке нескольких таких шрифтов.

Когда необходимо свободное масштабирование шрифтов, используются векторные шрифты (на самом деле, большинство масштабируемых шрифтов — это библиотеки программ, «рисующих» соответствующие буквы, часто — с учетом важности их отдельных элементов для восприятия; но разница в данном случае несущественна). Качество отображения мелкого кегля или на экране с низкой разрешающей способностью у них ниже, но они универсальнее.

Прочие элементы графических пользовательских интерфейсов также используют как векторную (большинство органов управления и большинство элементов оформления окон), так и растровую (пиктограммы-«значки») графику.

Из множества свободных программ, предназначенных для редактирования векторных графических файлов можно назвать следующие наиболее распространённые приложения:

  • очень простой векторный редактор Xfig для оконной системы XFree86;

  • Sodipodi (обычно поставляется со всеми операционными системами, включающими среду GNOME);

  • Kontour (компонент популярного «офисного» пакета KOffice);

и, наконец,

  • OpenDraw (входящая в пакет OpenOffice.org).

Редактор растровой графики gimp

Источники и параметры растровой графики

Обычным источником растровых изображений является сканер — устройство, «проходящее» (сканирующее) лист бумаги или кадр фотопленки точка за точкой и передающее компьютеру значения, соответствующее интенсивности базовых цветов в каждой точке. Все большей популярностью пользуются цифровые фотокамеры — аппараты, вместо фотопленки фокусирующие изображение на светочувствительной матрице, передающей цифровую запись изображения на энергонезависимый носитель информации (гибкий диск или т. н. флэш-карту), который затем может читаться компьютером.

Растровые изображения могут также создаваться человеком на компьютере с помощью устройств координатного ввода («мыши» или более подходящего для этой цели графического планшета) или синтезироваться различными программами.

Важнейшими параметрами растрового изображения являются его растровый размер (в точках) и «глубина цвета» (количество бит, используемых для представления цвета каждой точки). Эти параметры часто записывают в виде 1024х728x24, что означает 1024 точки по горизонтали, 728 точек по вертикали и 24 бит на цвет (двадцати четырех бит достаточно для получения «фотореалистичных» изображений, дальнейшее повышение разрядности не приводит к увеличению качества отображаемых или печатаемых современными средствами изображений, хотя в промежуточной обработке или при синтезе изображений иногда используется большие значения глубины цвета). Еще одним параметром, предусмотренным некоторыми форматами хранения растровой графики, является его «масштаб», который принято измерять в точках на дюйм (DPI); это чисто информационный параметр, который может учитываться при печати изображений, но не влияет на возможность их обработки.

Источники и параметры и форматы представления растровой графики

За тридцатилетнюю историю компьютерной графики разработано великое множество (сотни) форматов хранения изображений. Большинство из них является плодом несогласованности «технического творчества» отдельных групп исследователей и компаний, а также отражает особенности давно вышедших из употребления специфических устройств. Важными свойствами форматов являются присущие им внутренние ограничения, из которых наиболее значимы ограничения на глубину цвета, поддерживаемые цветовые модели («мониторная» RGB, «полиграфическая» CMYK и т. д.) возможность сохранения нескольких слоев изображения (понятия слоев, контуров и масок здесь не обсуждаются), наличие т. н. «альфа-канала» (фиктивного «цвета», соответствующего степени прозрачности изображения при наложении его на другое изображение) и поддерживаемые алгоритмы сжатия.

Применяемые в растровой графике алгоритмы сжатия подразделяются на неразрушающие и форматы с потерей качества (последние используют психофизиологическую модель человеческого зрения для того, чтобы избавиться от незначимых деталей изображения, что несколько снижает его качество, но позволяет добиться гораздо большей компактности кода).

Практически универсальными являются форматы TIFF (обычно применяемый в полиграфии, допускает лишь неразрушающее сжатие), PNG (наиболее удобный для представления графических данных в мультимедийных системах и WWW, допускающий неразрушающее сжатие), а также медленно вытесняемые последним JPEG (допускающий сжатие с потерями) и GIF (ограниченный 8 бит (256) цветами). Кроме того, многие графические редакторы (включая описанный ниже gimp) обладают собственным форматом, позволяющим сохранять в том же файле массу вспомогательной информации, полезной при продолжающейся более одного сеанса работе с файлами.

Общие сведения о gimp

GNU Image Manipulation Program (Программа ГНУ для манипуляции изображениями), или сокращенно gimp — потомок курсового проекта двух студентов, Питера Маттаса и Спенсера Кимболла (1995–96 гг.).

За восемь лет и при участии десятков программистов gimp вырос в один из самых насыщенных функциональностью графических редакторов, уступающих лишь «под завязку» набитому сторонними модулями редактору Photoshop[38]. Текущая стабильная версия — 1.2 (как и в некоторых других проектах нечетным «малым» номерам соответствуют экспериментальные (разработческие) версии, а четным — стабильные).

Интересно, что в рамках проекта gimp была создана библиотека работы с экранными примитивами GTK (ныне GTK+), являющаяся на сегодня одной из самых развитых и широко используемых в своем классе (в частности, на GTK+ основана популярная графическая операционная среда GNOME).

gimp, доступный для всех популярных настольных платформ (включая стандартные, а также Microsoft Windows, Mac OS и др.), широко используется для работы над WWW и мультимедийной графикой, обработки любительского, репортажного и даже художественного фото, ретуширования кинокадров. Правда, для последней цели чаще используется модификация, известная как FilmGIMP, ее, в частности, активно эксплуатировали при монтаже первого фильма о Гарри Поттере.

gimp редко используется для предпечатной подготовки графики: в нем пока нет поддержки «полиграфических» цветовых моделей и системы цветоделения. Еще одним ограничением текущих версий gimp является относительно низкая производительность, затрудняющая работу с действительно большими (сотни тысяч точек) и сложными (десятки слоев) изображениями. Для создания и обработки достаточно компактных и простых изображений, а также для их отображения на мониторе и печати на оборудовании потребительского класса эти ограничения не важны.

gimp способен работать с продвинутыми координатными устройствами — графическими планшетами, в том числе, моделями, распознающими силу нажатия на перо.

gimp — программируемый графический редактор

Вероятно, успехом gimp не в малой степени обязан своей изначально модульной и программируемой архитектуре. Сам по себе этот редактор — достаточно компактная и простая программа, однако его возможности приумножаются за счет открытости архитектуры и наличия множества модулей (в текущей поставке — около трехсот), реализующих те или иные дополнительные функции, такие как импорт-экспорт сторонних форматов или обработку изображения или его фрагмента по тому или иному алгоритму.

Такие модули можно разрабатывать как отдельные программы с использованием библиотеки GDK, а можно пользоваться одним из встроенных в gimp интерпретаторов языков программирования. Именно наличие таких интерпретаторов и делает gimp программируемым графическим редактором. Можно сказать, что его архитектура подобна архитектуре текстового редактора Emacs.

Таких интерпретаторов на сегодня два. Забавное название Script-fu, видимо, следует понимать как английско-китайское выражение, означающее «мастерство сценирования» (напомним, что «сценариями» («скриптами») называют программы, написанные на интерпретируемых языках). Script-fu — это первый встроенный в gimp интерпретатор функционального языка Схема (Schema), являющегося потомком первого языка функционального программирования Лисп. Разработчик скрипта имеет доступ к многочисленным базовым функциям-графическим примитивам.

Схема — весьма продуманный и стройный язык, однако его методический потенциал не может в полной мере быть раскрыт в сегодняшних курсах информатики в средней школе, программирование в которых вводится в директивной (сентенциональной) парадигме. На Схеме, так же, как и на Лиспе, можно писать в директивном стиле, однако изящества и простоты, столь необходимых в обучении, достичь при этом возможным не представляется.

Директивен другой язык, интерпретатор которого также встроен в gimp. Это Перл (Perl), его gimp-овская реализация называется Perl-fu. Хороший программист может писать на Перле чисто и аккуратно, однако синтаксис языка сам по себе настолько гибок (чтобы не сказать «жидок»), что, по нашему мнению, Перл совершенно не годится на роль изучаемых в числе первых (хотя существуют и другие мнения, весьма авторитетные).

Добавление в gimp еще одного интерпретатора (например, алголо- или паскалеподобного языка) не представляется особо сложной задачей, однако о таких проектах ничего не известно, и, наверное, от программирования обработки изображений «внутри» gimp как от простой в методическом освоении темы большинству педагогов стоит пока отказаться.

Интерактивная функциональность и эргономика

Тем не менее, базовой интерактивной функциональности gimp (включая доступные модули) вполне достаточно, чтобы покрыть обычно изучаемые в школе вопросы обработки графики.

При запуске gimp на экране открывается ряд окон. Главное окно содержит меню основных функций, панель пиктографически обозначенных «инструментов» и области, в которых отображаются текущие значения основного и фонового цветов, формы кисти, текущего градиента. Окна изображения соответствуют отдельным открытым графическим файлам (или слоям в них).

Дополнительные инструментальные окна (по какой-то причине названные «диалогами») могут открываться из меню главного окна. Однако их всего десяток («Слои, каналы и контуры», «Параметры инструментов», «Кисти», «Шаблоны», «Градиенты», «Палитра», «Устройства ввода», «Индекс документов», «Консоль ошибок»), а основной массив функций, применяемых к текущему или вновь создаваемому изображению или выбранному участку изображения (включая функции, реализованные внешними модулями-фильтрами) «достаются» через контекстное меню, открывающееся по щелчку правой кнопкой мыши в окне изображения.

Зато можно воспользоваться (непривычным для пользователей упрощенных графических сред, таких, как Microsoft Windows) свойством графической библиотеки GTK+, называемым «линия отрыва». Каждое меню наверху содержит пунктирную линию, щелкнув мышью на которой можно превратить это меню в самостоятельное инструментальное окно, сохраняющееся, пока пользователь явным образом его не закроет. Таким образом (учитывая настраиваемость самой системы меню) можно в любой момент создать на экране дополнительные «панели инструментов», содержащие функции, которыми в ближайшее время предполагается воспользоваться. Привыкшему к другому стилю работы пользователю это непривычно, однако, привыкнув, эту интерфейсную особенность можно использовать весьма эффективно.

Множественность окон, к сожалению, может создавать некоторые неудобства в средах без развитого инструментария управления окнами. В более развитых средах можно «склеить» несколько окон, чтобы они перемещались как единое целое или «поднять» окно, чтобы оно продолжало оставаться видимым, даже если будет активизировано окно, расположенное «под ним» (собственно, многооконное визуальное решение и создано в расчете на наличие таких средств), а если такие средства отсутствуют (как, например, в Microsoft Windows), пользование редактором на мониторе с малым разрешением может быть отягощено необходимостью совершать какие-то дополнительные действия.

Основная интерактивная функциональность, доступная посредством «инструментов» в главном окне, достаточно традиционна для программ этого класса. Она включает, в том числе:

  • выделение области изображения (прямоугольной, эллиптической или произвольной формы, а также ограниченной кривыми Безье). Последовательно выделяемые области могут образовывать пересечения, объединения или вычитания;

  • выделение связной области («волшебная палочка») с заданием параметров связности;

  • перемещение, копирование, заливку выделенных областей;

  • кадрирование (обрезку) изображения;

  • изменение масштаба отображения на экране;

  • вращение, масштабирование, искривление и зеркальное отображение изображения;

  • ввод текста;

  • выбор текущего цвета («пипетка»);

  • заливку области сплошным цветом или градиентом;

  • рисование «карандашом» или «кистью» произвольной формы и очистку «ластиком».

В базовую функциональность gimp входит также возможность захвата изображения со сканера и с экрана.

Фильтрация и синтез изображений

Основной прием автоматизированной обработки изображений — фильтрация их целиком, либо выделенных в них областей. Большая часть упомянутых внешних модулей реализует именно функцию фильтрации. Среди наиболее важных в практической обработке изображений фильтров отметим:

  • изменение цвета, насыщенности, яркости и контраста изображения;

  • удаление «шума»;

  • повышение резкости и размывание, выделение краев.

Значительное количество фильтров имитирует различные «эффекты»: от просмотра изображения через волнистое стекло до натяжения его на сферу, цилиндр или тор.

Синтез изображений в базовой поставке gimp и известных нам фильтрах не слишком развит, однако есть ряд фильтров, создающих фрактальные изображения (в том числе, натуроморфные).

Программы просмотра графических файлов

ee

Программа просмотра изображений. Этот пакет содержит приложение просмотра изображений Electric Eyes для графической среды GNOME. Помимо просмотра, программа позволяет производить различные базовые манипуляции над изображением. Установите этот пакет, если вам нужна программа просмотра.

gqview

GQview — это утилита для просмотра графических файлов. Позволяет легко и удобно просматривать графические файлы и производить над ними простейшие операции.

ImageMagick

Программы: animate, composite, conjure, convert, display, identify, import, mogrify, montage.

ImageMagick — это многофункциональное приложение для просмотра, преобразования изображений и манипулирования ими. Программа предназначена для работы в среде Х Window.

Данный пакет устанавливает файлы, необходимые для работы ImageMagick.

qiv

qiv — небольшая программа просмотра изображений для X, основанная на gdk и imlib.

kdegraphics-kview

Программы: kview.

KView — это программа просмотра графики, поддерживающая большое количество форматов данных.

Создание и редактирование графических файлов

gimp

Программы: gimp, gimp-1.2, gimp-remote, gimp-remote-1.2, xcftopnm.

GIMP — это программа для обработки изображений, предназначенная для корректировки фотографий, создания собственных изображений и коллажей. Многие находят эту программу исключительно удобной для создания логотипов и других графических элементов веб-страниц. Для GIMP существует множество фильтров и инструментов, многие из которых обладают функциональностью, схожей с их аналогами из дорогих коммерческих пакетов обработки графики. Набор инструментов включает средства работы с каналами и слоями, создания эффектов, сглаживание, преобразования, возможность отката по каждой операции.

В данной версии GIMP есть возможность работы со сценариями, но многие из них, включённые в этот пакет, работают со шрифтами, которые мы не можем распространять. Вы можете найти архивы с этими шрифтами на ftp-сайте проекта GIMP и установить их самостоятельно. На некоторые шрифты наложены лицензионные ограничения, не позволяющие свободно использовать их; все лицензии на шрифты вы можете найти в соответствующих архивах. Кроме того, перед использованием сценариев вы можете указать имеющиеся в вашей системе шрифты.

kdegraphics-kpaint

Программы: kpaint.

Простая программа рисования для окружения KDE.

kdegraphics-kiconedit

Программы: kiconedit.

Утилита для создания значков для KDE.

kdegraphics-ksnapshot

Программы: ksnapshot.

Аплет окружения KDE для создания снимков рабочего стола. ksnapshot позволяет получать снимки как всего экрана целиком, так и отдельно взятого активного окна.

Сканирование

В Linux поддержка сканеров обеспечивается при помощи общего интерфейса под названием SANE (Scanner Access Now Easy — «доступ к сканерам теперь прост»), который обеспечивает доступ к драйверам (backends) для сканеров.

Определить, поддерживается ли ваш сканера в Linux, поможет таблица поддержки сканеров, находящаяся по адресу http://panda.mostang.com/sane/sane-mfgs.html.

Если имеющийся у вас сканер присоединяется через USB-порт, то он будет обнаружен и подключён kudzu — системным монитором аппаратного обеспечения или же автоматически определён при первом запуске программы сканирования. Если этого не произойдёт, прочитайте документацию SANE на вашу модель сканера (на каждую модельную линейку приходится по man-странице) при помощи команды man.

sane

Программы: gamma4scanimage, sane-find-scanner, scanimage.

SANE (Scanner Access Now Easy) — это достаточно разумный и в то же время простой интерфейс для локальных и сетевых сканеров и других устройств оцифровки изображений, таких как цифровые фотоаппараты и видеокамеры. В настоящее время SANE включает модули для использования широкого круга сканеров, включая модели от Agfa SnapScan, Apple, Artec, Canon, CoolScan, Epson, HP, Microtek, Mustek, Nikon, Siemens, Tamarack, UMAX, Connectix, QuickCams и другие устройства SANE через сеть.

Для получения самой последней информации о SANE, описания стандарта SANE, и получения доступа к списку рассылки, см. http://www.mostang.com/sane/.

Этот пакет не включает возможность сетевого сканирования по умолчанию; если вы желаете включить эту возможность, прочитайте страницу man saned.

xsane

xsane — это графический интерфейс к библиотеке SANE, которая предоставляет доступ к сканерам, цифровым камерам и другим устройствам ввода изображения. xsane написана на GTK+ и позволяет управлять сканированием и обработкой полученного изображения. Установите xsane, если вы хотите получить графическую оболочку для sane, работающую в системе XFree86.

Поскольку xsane является универсальным интерфейсом для всех сканеров, вы можете вызывать эту программу из других приложений, таких как gimp и OpenOffice.org.

В gimp программа xsane вызывается через меню Файл->Захватить. Отсканированное изображение сразу будет передано в gimp для дальнейшей обработки.

kdegraphics-kooka

Программы: kooka.

Kooka — это приложение KDE для предварительного просмотра, масштабирования и получения изображений со сканера.

Утилиты для работы с графикой

libjpeg-utils

Программы: cjpeg, djpeg, jpegtran, rdjpgcom, wrjpgcom.

Этот пакет содержит простые программы для доступа к функциям библиотеки libjpeg. Пакет включает в себя программыcjpeg, djpeg, jpegtran, rdjpgcom и wrjpgcom. Cjpeg сжимает файлы изображений в формат JPEG. Djpeg преобразует JPEG-файлы в обычные изображения. Jpegtran выполняет всевозможные преобразования JPEG-файлов. Rdjpgcom отображает любые текстовые комментарии, включённые в файл JPEG. Wrjpgcom вставляет текстовые комментарии в JPEG-файл.

gif2png

Программы: gif2png, web2png.

Программа gif2png преобразует файлы из защищённого патентом формата Graphic Interchange Format в формат Portable Network Graphics.

Пакет также содержит web2png, интерфейс для gif2png, написанный на Python. Эта небольшая программа автоматически преобразует всю иерархию веб-страниц (непосредственно графические файлы и ссылки на них со страниц).



[37] Мы не касаемся здесь специального вопроса о сложных форматах кодирования, включающих векторные элементы и фрагменты растра, так же, как и — растрового и векторного — кодирования движущихся изображений и вопросов сжатия растровых изображений.

[38] Стоит отметить, что стоимость одной копии последнего, самого по себе не дешевого, вместе со всеми такими модулями составляет несколько тысяч долларов.