A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

一:char的初始化

char是Java中的保留字,与别的语言不同的是,char在Java中是16位的,因为Java用的是Unicode。不过8位的ASCII码包含在Unicode中,是从0~127的。

Java中使用Unicode的原因是,Java的Applet允许全世界范围内运行,那它就需要一种可以表述人类所有语言的字符编码。Unicode。但是English,Spanish,German, French根本不需要这么表示,所以它们其实采用ASCII码会更高效。这中间就存在一个权衡问题。

因为char是16位的,采取的Unicode的编码方式,所以char就有以下的初始化方式:

char c='c'; //字符,可以是汉字,因为是Unicode编码

char c=十进制数,八进制数,十六进制数等等; //可以用整数赋值

char c='\u数字'; //用字符的编码值来初始化,如:char='\0',表示结束符,它的ascll码是0,这句话的意思和 char c=0 是一个意思。



二:关于char占几个字节的问题如下:

1:“字节”是byte,“位”是bit ;

  2: 1 byte = 8 bit ;

  char 在java中是2个字节。java采用unicode,2个字节(16位)来表示一个字符。

  例子代码如下:



[java] 代码

  • public class Test {  
  •   
  •   
  •     public static void main(String[] args) {  
  •         String str= "中";  
  •         char x ='中';  
  •         byte[] bytes=null;  
  •         byte[] bytes1=null;  
  •         try {  
  •             bytes = str.getBytes("utf-8");  
  •             bytes1 = charToByte(x);  
  •         } catch (UnsupportedEncodingException e) {  
  •             // TODO Auto-generated catch block  
  •             e.printStackTrace();  
  •         }  
  •         System.out.println("bytes 大小:"+bytes.length);  
  •         System.out.println("bytes1大小:"+bytes1.length);  
  •     }  
  •     public static byte[] charToByte(char c) {   
  •         byte[] b = new byte[2];   
  •         b[0] = (byte) ((c & 0xFF00) >> 8);   
  •         b[1] = (byte) (c & 0xFF);   
  •         return b;   
  •     }  
  • }  


运行结果:

bytes 大小:3
bytes1大小:2


java是用unicode来表示字符,"中"这个中文字符的unicode就是2个字节。

String.getBytes(encoding)方法是获取指定编码的byte数组表示,

通常gbk/gb2312是2个字节,utf-8是3个字节

如果不指定encoding则取系统默认的encoding。


1 个回复

正序浏览
楼主写的好详细
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马