Tomcatの仕様

Tomcat5.5から、request.setCharacterEncoding()でセットしたエンコードがGETパラメータに適用されません。
これを今までどおりにするには、server.xmlもしくはcontextファイルのContextタグで、usebodyEncodingForURI="true"とする必要があります。
ただし、Servletコンテナ自体のコンテキストを設定するのは面倒なので、いままではフィルターを作って対応していました。
RequestWrapperクラスのgetParameter()およびgetParameterValues()をオーバーライドし、エンコードを行います。

    @Override
    public String[] getParameterValues(String name) {
      String[] values = super.getParameterValues(name);
      if(isGET()){
        if (values != null) {
          for (int i = 0; i < values.length; i++) {
            values[i] = encode(values[i]);
          }
          values = newValues;          
        }
      }
      return values;
    }

で、いままではこのコードだったのですが、最近Tomcat6で使ったら文字化けするようになって、「?」と思っていたら、

    @Override
    public String[] getParameterValues(String name) {
      String[] values = super.getParameterValues(name);
      if(isGET()){
        if (values != null) {
          String[] newValues = new String[values.length];
          for (int i = 0; i < values.length; i++) {
            newValues[i] = encode(values[i]);
          }
          values = newValues;          
        }
      }
      return values;
    }

と変更することで直りました。


つまり、Tomcat6のgetParameterValues()は新しいStringの配列を毎回作るのではなく、一度作ったStringの配列を内部で保持しているという挙動だった為、初回にgetParameterValues()を読んだ後にもう一度同じnameでgetParameterValues()を呼ぶと、返ってくるStringの配列は初回にエンコード済みのものなので、もう一度エンコードをかけてしまい化けてしまう、という現象だったわけです。
本当はどういう挙動が正しいのかはJ2EEの仕様を読んでみないとわからないですが、久しぶりに配列の直接変更が不具合の原因となったケースにあたったので、私もまだまだだなぁと思った次第です。