Работа с текстами

Данный раздел включает доступные средства обработки текста: редакторы, средства перекодировки и проверки орфографии, потоковой обработки текста, словари, шрифты, средства форматирования и подготовки электронных и бумажных изданий.

Текстовые редакторы

Одна из наиболее часто возникающих задач — создание и редактирование текстовых файлов. Любой компьютер будет практически нежизнеспособен, если в нем отсутствуют текстовые редакторы. Поэтому в состав стандартного программного обеспечения ОС UNIX с самого момента её появления входил стандартный редактор ed. По мере развития UNIX ed постоянно совершенствовался и в конце концов была разработана его расширенная и существенно дополненная версия — редактор vi (visual interpretator). Linux — это свободная реализация UNIX и поэтому «классический» редактор vi в продолжение традиции остаётся редактором по умолчанию в Linux.

Редактор vi может работать на любом видеотерминале (дисплее). Однако полная универсальность неизбежно приводит к определённым ограничениям, в т. ч. в удобстве работы. Так как не все терминалы имеют функциональную клавиатуру, vi не может рассчитывать на нее, поэтому для команд редактирования используются те же клавиши, что и для ввода текста. А последнее возможно только при наличии двух состояний — командном и ввода; и пользователю необходимо явно переходить от одного к другому. Однако к этому неудобству легко привыкнуть, а в остальном редактор vi вполне безупречен.

vim-common

Программы: ex, rview, rvim, update-vimhelp, view, vimdiff, vimtutor, xxd.

VIM (VIsual editor iMproved) — обновлённый и улучшенный вариант классического редактора vi. Хотя vi был первым полноэкранным редактором для UNIX, он по-прежнему широко используется. vim, сохраняя совместимость с vi, является современным текстовым редактором, со всеми (или почти всеми) свойствами, какие только можно пожелать: разбивка экрана на рабочие области — окна, подцветка синтаксических конструкций, три вида выделения блоков текста, фолдинг, мощный макроязык, сравнение текстов (vimdiff), полная документация и т. д. и т. п.

Пакет common содержит макробиблиотеку, документацию и другие необходимые для полноценной работы vim файлы. Установите этот пакет, если вы устанавливаете vim-enhanced или vim-X11.

vim-minimal

Этот пакет нужен для аварийно-спасательных работ. В отличие от других вариантов vim, устанавливается в /bin, и, поэтому, доступен всегда. Установите его, даже если вы планируете установить один из расширенных пакетов vim.

vim-X11

Программы: eview, evim, gview, gvim, gvimdiff, rgview, rgvim,

vim-X11 предоставляет полную функциональность vim, включая графический интерфейсдля X11. Может работать и в терминальном режиме, поэтому замещает пакет vim-enhanced.

emacs-base

emacs — один из наиболее мощных и широко распространённых редакторов, используемых в мире UNIX. По популярности он соперничает с редактором vi и его клонами.

В зависимости от ситуации, emacs может быть:

  • текстовым редактором;

  • программой для чтения почты и новостей Usenet;

  • интегрированной средой разработки (IDE);

  • операционной системой;

  • всем, чем угодно.

Всё это разнообразие достигается благодаря архитектуре emacs, которая позволяет расширять возможности редактора при помощи языка Emacs Lisp. На языке C написаны лишь самые базовые и низкоуровневые части emacs, включая полнофункциональный интерпретатор языка Lisp. Таким образом, emacs имеет встроенный язык программирования, который может использоваться для настройки, расширения и изменения поведения редактора.

emacs является одним из старейших редакторов. Он использовался тысячами программистов на протяжении последних 20 с лишним лет, для него создано много дополнительных пакетов расширений.

kdebase-kate

Программы: kate, kwrite.

Быстрый и расширяемый текстовый редактор с различными модулями.

kdeutils-kedit

Программы: kedit.

Удобный в использовании редактор текста.

kdeutils-khexedit

Программы: khexedit.

Редактор бинарных файлов для окружения KDE.

sed

Программы: sed, subst.

SED — неинтерактивный текстовый редактор, предназначенный для пакетного редактирования файлов. Полезен для:

  • редактирования очень больших файлов;

  • редактирования файлов любой величины, если последовательность команд редактирования является слишком длинной и сложной и, следовательно, неудобной для выполнения интерактивного редактирования;

  • выполнения множества раз одной и той же операции редактирования.

Программа копирует файлы (по умолчанию из стандартного ввода) в стандартный вывод, преобразовывая их в соответствии с указанными командами.

Перекодировка, проверка орфографии, обработка текстов

iconv

Пакет iconv содержит программу, которая позволяет конвертировать текстовые файлы из одной кодировки в другую.

Например:

iconv -f CP1251 - t KOI8-R foo.txt > foo.new.txt

перекодирует foo.txt из cp1251 (стандартная кириллическая кодировка Windows) в koi8-r (стандартная кириллическая кодировка Linux). Названия кодировок должны соответствовать их именам в /usr/share/i18n/charmaps. Список доступных кодировок можно увидеть по команде iconv -list.

recode

Библиотека recode преобразует файлы из одних кодировок в другие.

Библиотека recode преобразует файлы из используемой кодировки в заданную и наоборот. Библиотека распознает около 150 разных кодировок и способна производить преобразования между любыми возможными парами.

Данный пакет также содержит программу recode, реализующую функции этой библиотеки.

Пакет стремительно эволюционирует, и его спецификация может меняться от версии к версии. Например, работа с параметром -f уже реализована, но ещё не до конца.

ispell

Интерактивная программа проверки правописания. Используется для поиска орфографических ошибок и опечаток. При обнаружении слова, отсутсвующего в словаре, программа предлагает список исправлений.

Этот пакет следует установить, если вам нужна программа проверки орфографии.

Примечание: в этом пакете находится только механизм проверки. Вам нужно будет дополнительно установить словари для своего языка (пакеты, начинающиеся с ispell-*).

aspell

Программы: aspell, aspell-import, pspell-config, run-with-aspell, word-list-compress.

GNU Aspell — программа проверки правописания, разработанная для замены, в конечном счёте, ispell. Она может быть использована и как библиотека, и как независимая программа проверки правописания. Она значительно лучше своих аналогов, включая Ispell и модуль проверки орфографии Microsoft Word, предлагает возможные варианты написания. По крайней мере это верно для английского языка. В отличие от ispell, aspell значительно улучшен технически, например, используется общая память для словарей, если запущено более одного процесса программы.

gawk

Программы: awk, gawk.

Пакет gawk содержит GNU-версию программы awk, предназначенной для обработки текста, простых механических и вычислительных манипуляций над данными. Довольно несложные операции часто необходимо выполнить над целыми пакетами файлов, а писать для этого программу на одном из стандартных языков программирования утомительно и, как правило, не очень легко. Оптимальное решение проблемы — использование специальной утилиты AWK, включающей в себя не громоздкий и удобный язык программирования, позволяющий решать задачи обработки данных с помощью коротких программ, состоящих из двух-трёх строк.

Утилита AWK была создана в 1977 г. американскими авторами Альфредом Ахо (Alfred V. Aho), Брайаном Керниганом (Brian W. Kernighan) и Питером Вайнбергером (Peter J.Weinberger). Подробное описание всех возможностей утилиты AWK для UNIX дает их издание: The AWK Programming Language, 1988. Gawk совместим с awk от Bell Labs и почти целиком совместим со стандартом 1993 POSIX 1003.2 для awk.

Установите пакет gawk, если ваи нужна программа обработки текста. Gawk должен рассматриваться как стандартный инструмент Linux для этих целей.

Словари

dictd

Этот пакет содержит сервер словарей, который поддерживает DICT клиентов (DICT — словарный протокол). Существует несколько консольных и графических программ, позволяющих работать со словарями по протоколу DICT.

dict

Этот пакет содержит консольный клиент для DICT сервера. Он очень прост в использовании: достаточно набрать в любой командной строке dict слово — и вы увидите список всех определений для этого слова, найденных в доступных словарях (как установленных в системе, так и доступных через Интернет).

Для полноценного использования возможностей словарей (чтобы иметь возможность одновременно и транскрипцию, и русский текст, и немецкие умляуты, и множество других символов) рекомендуется запускать программу dict в терминале, поддерживающем работу с кодировкой UTF-8. В систему XFree86 входит стандартный скрипт uxterm, который сам устанавливает нужную локаль и запускает xterm с необходимыми параметрами.

kdict

Клиент dict (RFC 2229) для окружения KDE.

dict-web1913

Это наиболее полный английский словарь написанный Вебстером и опубликованный в 1913 году. Он стал свободным из-за того, что прошло много времени с его опубликования. Однако, он до сих пор сохраняет свою актуальность и помогает в работе.

dict-mueller7-utf8

Электронная версия англо-русского словаря Мюллера 7-ой редакции в формате DICT и кодировке utf8. Вы можете использовать его со своим любимым dict-клиентом.

dict-slovnyk_en-ru

Словарь Словник англо-русский.

dict-slovnyk_ru-en

Словарь Словник русско-английский.

dict-engcom

Пакет engcom содержит свободный англо-русский словарь компьютерных терминов в формате словарей DICT, составленный по мотивам реальной жизни, содержанию компьютерной прессы и рассылок.

dict-jargon

Словарь сообщества хакеров. Здесь вы найдёте пояснения к непонятным аббревиатурам, словам, выражениям и массу другой информации о профессиональном и жаргонном словоупотреблении.

ksocrat

Простая оболочка к русско-английскому и англо-русскому словарям Socrat для KDE.

Подготовка печатных документов

lyx-common

Программы: lyx.

LyX — это современных подход к написанию документов, разрывающий с устаревшей парадигмой использования компьютеров в качестве пишуших машинок, использованной в большинстве других систем подготовки документов.

Он разработан для тех, кто хочет получить профессиональное качество документа при печати, не тратя при этом много времени и усилий, и не становясь специалистом по полиграфическому оформлению.

Основное новшество в LyX — это WYSIWYM (What You See Is What You Mean — вы видите то, что вы имели в виду), которое означает, что автор сосредотачивается над своей работой, а не над деталями оформления документа. Это позволяет продуктивно работать, оставляя заключительное оформление специальному движку (такому как LaTeX), который специально разработан для подобных задач.

С LyX автор может сконцентрироваться на содержании своей работы и позволить компьютеру взять большинство забот об оформлении на себя.

lyx-rusdoc

Пакет lyx-rusdoc содержит дополнительные описания LyX'а на русском языке, а также документацию для класса текста GOST LyX/LaTeX, предназначенного для подготовки технической текстовой документации в соответствии с ГОСТ 2.105-95.

tetex

Система форматирования текста.

teTeX — это реализация системы TeX для Linux и UNIX. TeX обрабатывает текстовый файл командами форматирования и создает независмый от устройства вывода файл .dvi (DeVice Independent). Обычно TeX используется совместно с пакетами форматирования более высокого уровня, например, LaTeX или PlainTeX, потому как сам по себе TeX не очень дружелюбен к пользователю.

Установите пакет teTeX, если хотите использовать систему форматирования текста TeX. При установке teTeX можно дополнительно установить пакет tetex-afm (преобразование шрифтов PostScript(TM) для TeX), tetex-dvilj (преобразование файлов .dvi в формат HP PCL, пригодный для вывода текста на принтеры HP и совместимые с ними), tetex-dvips (преобразование файлов .dvi в формат PostScript для печати на принтерах PostScript), tetex-latex (пакет форматирования с понятным пользовательским интерфейсом) и tetex-xdvi (просмотр файлов .dvi в графической среде X Window). Если вы ещё не эксперт в ТеХ, то дополнительно можете установить пакет tetex-doc, который содержит документацию по системе TeX.

tetex-latex

Программы: elatex, hugelatex, latex, pdfelatex, pdflatex, pslatex.

Дружелюбный пользовательский интерфейс к системе TeX

LaTeX — это набор написанных на языке TeX макропакетов, предоставляющих удобный интерфейс к возможностям системы форматирования текста TeX. В LaTeX определено оформление для нескольких стандартных классов документов.

groff

Система форматирования документов. Groff берет в качестве входных данных текст и команды форматирования и на их основе создает форматированный вывод. Созданный документ может быть отображен на экране или напечатан на принтере. Команды форматирования позволяют указывать тип и размер шрифта, количество и размер колонок на странице и другие параметры.

scribus

Издательская система для Linux.

Программа создания оригинал-макетов, подобная Adobe PageMaker, QuarkXPress или Adobe InDesign, которая, в отличие от последних, является свободной программой, опубликованной под лицензией GNU GPL.

gv

Программы: ghostview, gv.

Графический интерфейс для ghostscript — интерпретатора PostScript(TM).

Графический интерфейс для интерпретатору PostScript(TM) — ghostscript. gv может отображать документы форматов PostScript и PDF в графической среде X Window.

Установите этот пакет, если вам нужно просматривать документы в форматах PostScript и PDF. Однако вам также придется установить пакет ghostscript, и, естественно, систему X Window.

xpp

Панель управления принтерами в окнной системе X.

Панель принтеров в среде X (XPP) — это полностью свободный инструмент для простого выбора нужного принтера из списка доступных и изменения его настроек посредством простого и удобного графического интерфейса пользователя. Для запуска программы просто вызовите программу xpp (вместо обычных утилит lpr или lp) из командной строки или вашего приложения.

ghostscript

Интерпретатор и средство визуализации PostScript. Ghostscript — интерпретатор языка описания страниц PostScript и файлов в формате PDF (формат переносимых документов). Ghostscript преобразует PostScript во множество других растровых форматов, данные в которых можно выводить на принтер или экран. Обычно Ghostscript используется для просмотра файлов PostScript и для их печати на принтерах, не поддерживающих язык PostScript. Множество приложений используют PostScript для вывода данных на печать.

Установите пакет ghostscript, если вам нужен просмотр документов формата PostScrip или если ваш принтер не поддерживает этот язык.

Шрифты

Растровые шрифты

Основными растровыми шрифтами в distro являются шрифты misc из поставки XFree86, а также шрифты Дмитрия Болховитянова XFree86-cyr_rfx-koi8-r в различных кириллических кодировках и шрифты XFree86-75dpi-fonts-unicode, созданные ASP Linux путём объединения шрифтов XFree86 и шрифтов Дмитрия Болховитянова.

Для правильной работы некоторых приложений с кириллицей важно, чтобы шрифты в требуемой кириллической кодировке стояли первыми в списке сервера шрифтов xfs. При установке системы это требование соблюдается, но если вы изменили основную кодировку системы, то может понадобиться доустановить пакет шрифтов в новой кодировке и поменять порядок путей в /etc/X11/fs/config.

Масштабируемые шрифты

Type1

Свободные шрифты Type1 в ALT Linux 2.3 Junior стали основными шрифтами для приложений, использующих сглаживание (антиалиасинг). Современные версии библиотеки freetype2 позволяют обеспечить их качественный рендеринг.

Большинство приложений Qt/KDE и Gtk+2/GNOME 2 используют по умолчанию шрифты пакета urw-fonts с кириллическими глифами Валентина Филиппова. Эти же шрифты используются при печати из большинства приложений.

Мы рекомендуем также установить пакеты свободных шрифтов sharatype-fonts и dmtr40in-fonts, созданных Сергеем Шарашкиным (на основе шрифтов bitstream) и Дмитрием Сорокиным (оригинальный шрифт XlinSans).

Пакет шрифтов cm-super-fonts, созданный Владимиром Воловичем на основе шрифтов Ольги Лапко, является основным для нашего пакета teTeX, но, отчасти, может быть использован для отображения и печати. В TeX используется специфическая система именования шрифтов в отличная от системы, которая используется в библиотеках для работы со шрифтами Type1, поэтому большинство этих прекрасных шрифтов пока недоступны вне TeX.

Наконец, в Junior включены декоративные шрифты проекта Vedi. Они не свободные, но бесплатные для многих применений — не забудьте ознакомиться с их лицензией.