@ITの記事
http://www.atmarkit.co.jp/news/200702/20/scrubyt.html
スクレイピングという技術の、その泥臭い作業の末にデータが得られた瞬間が個人的には好きで、スクレイピングのコードをよく書きます。
Javaだと手に馴染んでいるのでコーディングは速いのですが、いかんせんライブラリがいま一つパワー不足なため、ここのページに書いてあるようなことをするにもわりと手間がかかりますね。このページのコードみたいに、RubyやPerlでさくっとできたらすごくいいなーと思います。
昔、会社にPerl使いの人がいて、「perlは数行書けばYahooのページを取ってこれる最強に強まってる言語です」と言っていて実演してみせてくれたことがあったのですが、その当時は「JSPに書いたJavaScriptはサーバサイドで動くもの」と思っていた位の駆け出しプログラマーだったので、むしろJavaはServletがあるからこっちが最強、とかなりズレた事を思って見向きもしませんでしたが、今から考えるとあの時教わっておけば・・・と思います。
で、スクレイピングに限らず、日常業務のテキスト処理とかを手軽に行える言語・方法はないかなといつも思っているんですが、何かいいのないですかね。
特にテキスト処理は日常使うわけで、個人的には秀丸のShift+F1のマクロ記録が今のところ最強なんですが、皆さんどういうの使ってるんでしょうか?
例えば、
hoge.Hoge hoge.Huga huga.HogeHoge huga.HogeHogeHuga
の4つの文字列を
{hoge_Hoge:hoge.imp.HogeImp} {hoge_Huga:hoge.imp.HugaImp} {huga_HogeHoge:huga.imp.HogeHogeImp} {huga_HogeHogeHoge:huga.imp.HogeHogeHugaImp}
に変換せよ、と言われたらなに使いますかね?