pwncollege
DojosLeaderboardCommunity
Back to linux

Обработка данных

linux
0/6 challenges completed

В предыдущих разделах вы освоили перенаправление данных через конвейер, указание источников ввода и ряд других приёмов работы в командной строке. Настало время объединить полученные знания на практике. В данном модуле вы познакомитесь с набором команд для обработки данных, которые позволят эффективно решать задачи в среде командной оболочки.

Существует огромное количество программ, которые опытные пользователи применяют для работы с данными. Каждая из них выполняет строго определённую функцию, следуя философии Unix: делать одно дело, но делать его хорошо.

Мы рассмотрим не весь список ПО для обработки данных, но построим наше обучения так чтобы утилиты можно было объединять в сложные цепочки для решения люых задач. Вот список изучаемых инструментов в курсе:

  • sed для сложных манипуляций с текстом (использовали в модуле "Управление потоками")
  • tr посимвольное преобразование данных
  • head вывод первых строк
  • cut для извлечения частей строк
  • sort для сортировки данных

Приведённые ниже инструменты рекомендуем вам изучить самостоятельно:

  • awk для сложной обработки текста
  • less как интерактивный просмотрщик файлов
  • more для постраничного чтения файлов
  • paste для объединения файлов
  • tail обратный аналог изученного head
  • uniq для фильтрации повторяющихся строк в потоке
1
Замена символов
2
Удаление символов
3
Удаление переносов строк
4
Извлечение первых строк с помощью head
5
Извлечение определённых фрагментов текста
6
Сортировка данных