松下昇への接近

 旧 湾曲していく日常

ruby入門3日目

えーと、事務のお仕事で大事なのは「住所」というデータですね。ふつう、コンピュータでは郵便番号(地名コード)と番地部分に分けて管理しているでしょう。ところが、今回のデータは、「○○市○○町3丁目4ー56」といったべたっとした住所と郵便番号だけなので、丁目以降を分離する必要があります。しかも数字も全角と半角がまじっているもの。全部全角にすることにして、rubyでプログラムを書いてみた。 

require "jcode"
$KCODE="U"
file=open("./JUSHOT2.TXT","r")
while line=file.gets
  line=line.tr('0-9','0-9')
	 if /\d.*/ =~ line	then
		  line2=$&.tr('0-9','0-9')
	  print line2,"\n"
	else print "\n"
	 end
end
file.close

ふむ。これでうまく行くだろうかね? 「三宮町」とか地名に数字の付くものはエラーになるし、小字(こあざ)にも対応できない。例外は少ししかないから事前に処理することでいけるだろうと。(数字がなくても行が飛ばないように少し変えた。)