ruby入門3日目
えーと、事務のお仕事で大事なのは「住所」というデータですね。ふつう、コンピュータでは郵便番号(地名コード)と番地部分に分けて管理しているでしょう。ところが、今回のデータは、「○○市○○町3丁目4ー56」といったべたっとした住所と郵便番号だけなので、丁目以降を分離する必要があります。しかも数字も全角と半角がまじっているもの。全部全角にすることにして、rubyでプログラムを書いてみた。
require "jcode" $KCODE="U" file=open("./JUSHOT2.TXT","r") while line=file.gets line=line.tr('0-9','0-9') if /\d.*/ =~ line then line2=$&.tr('0-9','0-9') print line2,"\n" else print "\n" end end file.close
ふむ。これでうまく行くだろうかね? 「三宮町」とか地名に数字の付くものはエラーになるし、小字(こあざ)にも対応できない。例外は少ししかないから事前に処理することでいけるだろうと。(数字がなくても行が飛ばないように少し変えた。)