2017年4月29日土曜日

見せてあげよう、もじ堀ノ助の力を。

今回は、”もじ堀ノ助”の持つ力を少しだけ見せます。

下のような、名前と住所が書かれたテキストがあります。
これを表にまとめる作業をしてみます。

===
名前:佐藤
住所:東京都
=====
名前:田中
住所:大阪府
=====
名前:鈴木
住所:愛知県
===

このテキストに対し、下のようなパターンを書きます。
今は理解不要ですが、名前と住所を抽出しろ、という意味のパターンなのです。

@pattern
# 抽出パターンの定義
main {
  "名前:" > word$name
  >-> "住所:" > word$pref
}

@format
# 出力フォーマット
  $name,$pref
@end

さっきのテキストファイルと、今書いたパターンファイルを”もじ堀ノ助”に読み込ませれば、下のように出力されます。

佐藤,東京都
田中,大阪府
鈴木,愛知県

これをcsvファイルとしてエクセルで読み込みます。
すると、見事に表として使えるようになりました。


実際、この程度の量であれば、手作業でもなんということはありません。
しかし、何千行、何万行のテキストであれば、ソフトウェアを使えば、時間を短縮することができ、価値があると言えます。

また、この作業が毎月あったとすると、一度パターンを書いてしまえば、次からは自動的に作業が完了するわけです。

次は、もう少し複雑なパターンに挑戦してみようと思います。

0 件のコメント:

コメントを投稿