在JVM虚拟机内是unicode字符集的UTF-16编码,主流文字占2个byte,新增的生僻文字占4个byte...但输入输出(IO)到文件、数据库、或其他设备时常常使用不同的字符编码,比如GBK,这时就汉字2个byte,拉丁(英文)字符1个byte