差分
この文書の現在のバージョンと選択したバージョンの差分を表示します。
次のリビジョン | 前のリビジョン | ||
memo:awk [2014/12/03 02:37] hasegawa 作成 |
memo:awk [2016/07/17 04:22] (現在) |
||
---|---|---|---|
ライン 5: | ライン 5: | ||
今扱っている固定長データ(大きいのでも600MBくらいだけど)から分析に使うフィールドを切り出すのに便利そうだ. | 今扱っている固定長データ(大きいのでも600MBくらいだけど)から分析に使うフィールドを切り出すのに便利そうだ. | ||
- | ※改行コードはLFを前提としていることに注意(2012/11/27追記) | + | ※[[https://ja.wikipedia.org/wiki/%E6%94%B9%E8%A1%8C%E3%82%B3%E3%83%BC%E3%83%89|改行コード]]はLFを前提としていることに注意(2012/11/27追記) |
網羅的なガイドは以下 | 網羅的なガイドは以下 | ||
http://www.kt.rim.or.jp/~kbk/gawk-30/gawk_toc.html | http://www.kt.rim.or.jp/~kbk/gawk-30/gawk_toc.html | ||
+ | |||
+ | こちらの方が取っつきやすいかも | ||
+ | http://antibayesian.hateblo.jp/entry/2014/09/15/162605 | ||
===== フィールドの指定方法 ===== | ===== フィールドの指定方法 ===== | ||
ライン 49: | ライン 52: | ||
</code> | </code> | ||
+ | awk.txtのレコード番号が5未満(1~4)またはレコード番号が7の,全てのフィールドをout.txtに出力するには | ||
+ | <code awk> | ||
+ | awk 'NR < 5 || NR == 7 { print }' awk.txt > out.txt | ||
+ | </code> | ||
+ | ※これは一行目がラベルになっているデータを分割する際に有用 | ||
===== フィールド区切り文字の指定 ===== | ===== フィールド区切り文字の指定 ===== | ||
-Fオプションにより,フィールドの区切り文字を指定することが出来る. | -Fオプションにより,フィールドの区切り文字を指定することが出来る. | ||
ライン 82: | ライン 90: | ||
awk.txt | awk.txt | ||
- | <file txt awk.txt> | + | ```text |
1 B1 C1 | 1 B1 C1 | ||
2 B2 C2 | 2 B2 C2 | ||
ライン 116: | ライン 124: | ||
32 B32 C32 | 32 B32 C32 | ||
33 B33 C33 | 33 B33 C33 | ||
- | </file> | + | ``` |
awk.csv | awk.csv | ||
+ | |||
```csv | ```csv | ||
1,B1,C1 | 1,B1,C1 |