松下昇への接近

 旧 湾曲していく日常

OLのためのawk入門

windowsで使用。(windows2000かな)
前提:職場にシートフィーダー付きスキャナがある。
   2000円で、OCRソフト「本格読取2」を購入。(data1.txtを作成)
   数十枚の印刷されたデータを エクセルファイルにしたい。

1.ダウンロード
http://www.kt.rim.or.jp/~kbk/gawk-3.1/ とかから

2.
「すべてのプログラム−アクセサリ」のDOSプロンプトを、コントロールを押しながらドラッグしてデスクトップへ。DOSプロンプトを開き、gawk.exeがあるフォルダにpathを通す。

3.
最初の項目に「み くし」のように不必要な空白が入っているものがあったので抜く。
4.
連続する空白を減らしてタブに換える。

次の内容のファイルを作成。「NUKU」とする。
{gsub(/み /,"み");
gsub(/[ ]+/,"\t"); *1
print $0;}




gawk -f NUKU data1.txt >test10.txt とする。

5.できあがったものをエディターで開き、全部複写しエクセルにそのまま貼り付ける。 (以上)

*1:[と]の間に半角ブランクがある。+ の記号は正規表現というものの一つで、対象(この場合半角ブランクが一つ以上あるものを指す。)