猫のこたつ

元理系研究職。日々の自分のメモとして書き始めました。

テキスト処理(列の抽出や重複抜きなど)のメモ

カンマの入っているファイル形式(CSV)のテキスト処理

  • CSVファイル(test.csv)から2行目だけを抜き出す
[kotatsu@cat01 ~]$  cat test.csv | awk -F',' '{print $2}'
  • CSVファイル(test.csv)から2行目だけを抜き出し、その後ソートして重複抜きにして別ファイル(test1.txt)として保存する
[kotatsu@cat01 ~]$ cat test.csv | awk -F',' '{print $2}' | sort | uniq > test1.txt

その他コマンド

  • test1.txt を new.txt にリネーム
[kotatsu@cat01 ~]$ mv test1.txt new.txt