Tomcat5.5から、request.setCharacterEncoding()でセットしたエンコードがGETパラメータに適用されません。
これを今までどおりにするには、server.xmlもしくはcontextファイルのContextタグで、usebodyEncodingForURI="true"とする必要があります。
ただし、Servletコンテナ自体のコンテキストを設定するのは面倒なので、いままではフィルターを作って対応していました。
RequestWrapperクラスのgetParameter()およびgetParameterValues()をオーバーライドし、エンコードを行います。
@Override public String[] getParameterValues(String name) { String[] values = super.getParameterValues(name); if(isGET()){ if (values != null) { for (int i = 0; i < values.length; i++) { values[i] = encode(values[i]); } values = newValues; } } return values; }
で、いままではこのコードだったのですが、最近Tomcat6で使ったら文字化けするようになって、「?」と思っていたら、
@Override public String[] getParameterValues(String name) { String[] values = super.getParameterValues(name); if(isGET()){ if (values != null) { String[] newValues = new String[values.length]; for (int i = 0; i < values.length; i++) { newValues[i] = encode(values[i]); } values = newValues; } } return values; }
と変更することで直りました。
つまり、Tomcat6のgetParameterValues()は新しいStringの配列を毎回作るのではなく、一度作ったStringの配列を内部で保持しているという挙動だった為、初回にgetParameterValues()を読んだ後にもう一度同じnameでgetParameterValues()を呼ぶと、返ってくるStringの配列は初回にエンコード済みのものなので、もう一度エンコードをかけてしまい化けてしまう、という現象だったわけです。
本当はどういう挙動が正しいのかはJ2EEの仕様を読んでみないとわからないですが、久しぶりに配列の直接変更が不具合の原因となったケースにあたったので、私もまだまだだなぁと思った次第です。