pwn.college DOJO

В предыдущих разделах вы освоили перенаправление данных через конвейер, указание источников ввода и ряд других приёмов работы в командной строке. Настало время объединить полученные знания на практике. В данном модуле вы познакомитесь с набором команд для обработки данных, которые позволят эффективно решать задачи в среде командной оболочки.

Существует огромное количество программ, которые опытные пользователи применяют для работы с данными. Каждая из них выполняет строго определённую функцию, следуя философии Unix: делать одно дело, но делать его хорошо.

Мы рассмотрим не весь список ПО для обработки данных, но построим наше обучения так чтобы утилиты можно было объединять в сложные цепочки для решения любых задач. Вот список изучаемых инструментов в курсе:

sed для сложных манипуляций с текстом (использовали в модуле "Управление потоками")
tr посимвольное преобразование данных
head вывод первых строк
cut для извлечения частей строк
sort для сортировки данных

Приведённые ниже инструменты рекомендуем вам изучить самостоятельно:

awk для сложной обработки текста
less как интерактивный просмотрщик файлов
more для постраничного чтения файлов
paste для объединения файлов
tail обратный аналог изученного head
uniq для фильтрации повторяющихся строк в потоке

Обработка данных