TITLE:JTextComponentでサロゲートペアのテスト

Posted by aterai at 2012-05-14

JTextComponentでサロゲートペアのテスト

JEditorPaneなどで数値文字参照やUnicodeエスケープを使ってサロゲートペアのテストをします。

  • &jnlp;
  • &jar;
  • &zip;
SurrogatePair.png

サンプルコード

final URL url = getClass().getResource("SurrogatePair.html");
try{
  editor1.read(new InputStreamReader(url.openStream(), "UTF-8"), "html");
}catch(Exception ex) {
  editor1.setText("<html><p>(&#xD85B;&#xDE40;) (&#x26E40;)<br />(&#xD842;&#xDF9F;) (&#x00020B9F;)</p></html>");
}

JEditorPane editor2 = new JEditorPane();
//editor2.setFont(new Font("IPAexGothic", Font.PLAIN, 24));
editor2.putClientProperty(JEditorPane.HONOR_DISPLAY_PROPERTIES, Boolean.TRUE);
editor2.setText("(\uD85B\uDE40) (\u26E40)\n(\uD842\uDF9F) (\u20B9F)");

解説

以下、サロゲートペア対応フォントを使えるようにしてテストしています。Java Web Start で起動した場合、"browse"ボタンでSurrogatePair.htmlを表示することはできません。

  • 上: 数値文字参照(Numeric character reference)
    • JEditorPane(HTMLEditorKit)の場合
      JEditorPane OK: &#xD85B;&#xDE40;
      JEditorPane NG: &#x26E40;
  • ブラウザ(試したのはIE, FireFox, Chrome, Opera)の場合
    Browser NG: &#xD85B;&#xDE40;
    Browser OK: &#x26E40;
  • 下: Unicodeエスケープ(Unicode escapes)
    JEditorPane OK: \uD85B\uDE40
    JEditorPane NG: \u26E40

JTextComponentとブラウザでサロゲートペアの表現が異なるようなので、これらの文字をどちらの環境でも正しく表示したい場合は、数値文字参照やUnicodeエスケープは使用せず、ソースコードなどをUTF-8にしてそのまま𦹀や𠮟と書く*1のがよさそうです。


Windows7, JDK 1.7.0_02 の環境では、JTextComponentからメモ帳などにサロゲートペアの文字をコピーペーストは可能ですが、逆にメモ帳やブラウザからJTextComponentにサロゲートペアの文字をコピーペーストすることができないようです。


現状ではJTextComponentは、異体字セレクタに対応していない?

  • フォントをIVS(Adobe-Japan1-6)に対応している小塚明朝 Pr6N や IPAex明朝 などに変更して、数値文字参照、Unicodeエスケープを使っても下駄になったり、ソースコードをUTF-8にしても以下のような IllegalArgumentException が発生するようです。
Exception in thread "AWT-EventQueue-0" java.lang.IllegalArgumentException: Length must be >= 0.
   at javax.swing.text.GlyphPainter2.getBoundedPosition(GlyphPainter2.java: 205)
  • IllegalArgumentExceptionと異体字セレクタは関係なくて、Windows環境のJavaと'小塚明朝 Pr6N R'(OTFフォントだから?)と相性が悪いだけ?
  • Font.createFont(...)で、C:\Program Files (x86)\Adobe\Acrobat 9.0\Resource\CIDFont\KozMinPr6N-Regular.otf からフォントを作ると???
import java.awt.*;
import java.io.*;
import java.net.*;
import javax.swing.*;
public class OTFTest {
  public JComponent makeUI() {
    JTextArea textArea = new JTextArea("1234567890");
    String str = "file:///C:/Program Files (x86)/Adobe/Acrobat 9.0/Resource/CIDFont/KozMinPr6N-Regular.otf";
    //String str = "file:///C:/Windows/Fonts/meiryo.ttc";
    //String str = "file:///C:/Windows/Fonts/ipaexg.ttf";
    //String str = "file:///C:/Windows/Fonts/A-OTF-ShinGoPro-Regular.otf";
    try(InputStream is = (new URL(str)).openStream()) {
      Font font = (Font.createFont(Font.TRUETYPE_FONT, is)).deriveFont(32.0f);
      textArea.setFont(font);
      is.close();
    }catch(IOException|FontFormatException ex) {
      ex.printStackTrace();
    }
    JPanel p = new JPanel(new BorderLayout());
    p.add(new JScrollPane(textArea));
    return p;
  }
  public static void main(String[] args) {
    EventQueue.invokeLater(new Runnable() {
      @Override public void run() {
        createAndShowGUI();
      }
    });
  }
  public static void createAndShowGUI() {
    JFrame f = new JFrame();
    f.setDefaultCloseOperation(WindowConstants.EXIT_ON_CLOSE);
    f.getContentPane().add(new OTFTest().makeUI());
    f.setSize(320, 240);
    f.setLocationRelativeTo(null);
    f.setVisible(true);
  }
}

参考リンク

コメント

  • 結合文字(À が)もJTextComponentは未対応。ブラウザだとChromeは対応されているが、他は部分的な対応になっている? -- aterai
  • Windows 7 + Java 7 でOTFフォントは使えない??? -- aterai