深入理解Java对象序列化
关于Java序列化的文章早已是汗牛充栋了,本文是对我个人过往学习,理解及应用Java序列化的一个总结。此文内容涉及Java序列化的基本原理,以及多种方法对序列化形式进行定制。在撰写本文时,即参考了《Thinking in Java》,《Effective Java》,《JavaWorld》,《developerWorks》中的相关文章和其它网络资料,也加入了自己的实践经验与理解,文码并茂,希望对大家有所帮助。
1.什么是Jav对象序列化
Java平台允许我们在内存中创建可复用的Java对象,但一般情况下,只有当JVM处于运行时,这些对象才可能存在。即,这些对象的生命周期不会比JVM的生命周期更长。但在现时应用中,就可能要求在JVM停止运行之后能够保存(持久化)指定的对象,并在将来重新读取被保存的对象。JAVA对象序列化就能够帮助我们实现该功能。
使用JAVA对象序列化,在保存对象时,会把其状态保存为一组字节,在未来,再将这些字节组装成对象。必须注意地是,对象序列化保存的是对象的“状态”,即它的成员变量。由此可知,对象序列化不会关注类中的表态变量。
除了在持久化对象时会用到对象序列化这外,当使用RMI(远程方法调用),或在网络中传递对象时,都会用到对象序列化。Java序列化API为处理对象序列化提供了一个标准机制,该API简单易用,在本文的后续章节中将会陆续讲到。
简单示例
在Java中,只要在一个类实现了java.io.Serializable接口,那么它就可以被序列化。此处将创建一个可序列化的类Person,本文中的所有示例将围绕着该类或其修改版。
Gender类,是一个枚举类型,表示性别
public enum Gender{
MALE, FEMALE
}
如果熟悉Java枚举类型的话,应该知道每个枚举类型都会默认继承类java.lang.Enum,而该类实现了Serializable接口,所以枚举类型对象都是默认可以被序列化的。
Person类,实现了Serializable接口,它包含三个字段:name, String类型; age Integer类型;gender, Gender类型。另外,还重写该类的toString()方法,以方便打印Person实例中的内容。
public class Person implements Serializable{
private static final long serialVersionUID = 4145851069225399488L;
private String name = null;
private Integer age = null;
private Gender gender = null;
public Person() {
System.out.println("none-arg constructor");
}
public Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public Integer getAge() {
return age;
}
public void setAge(Integer age) {
this.age = age;
}
public Gender getGender() {
return gender;
}
public void setGender(Gender gender) {
this.gender = gender;
}
@Override
public String toString() {
return "Person{" +
"name='" + name + '\'' +
", age=" + age +
", gender=" + gender +
'}';
}
}
下面是一个简单的序列化程序,它先将一个Person对象保存到文件person.out中,然后再从该文件中读取被存储的Person对象,并打印该对象
public class PersonTest {
@Test
public void test01() throws IOException, ClassNotFoundException {
File file = new File("person.out");
ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file, false));
Person p = new Person("jianglei", 19, Gender.FEMALE);
oout.writeObject(p);
oout.close();
ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));
Object newPerson = oin.readObject();
oin.close();
System.out.println(newPerson);
}
}
上述程序的输出的结果为:
arg constructor
Person{name='jianglei', age=19, gender=FEMALE}
此时必须注意的是,当重新读取被保存的Person对象时,并没有调用Person的任何构造器,看起来就像是直接使用字节将Person对象还原出来的。
当Person对象被保存到person.out文件中之后,我们可以在其它地方读取该文件以还原对象,但必须确保该读取程序的CLASSPATH中包含有Person.class(哪怕在读取Person对象时并没有显示地使用Person类,如上例所示),否则会抛出ClassNotFoundException。
3.Serializable的作用
为什么一个类实现了Serializable接口,它就可以被序列化呢?在上节的示例中,使用ObjectOutputStream来持久化对象,在该类中有如下代码:
private void writeObject0(Object obj, boolean unshared)
throws IOException
{
boolean oldMode = bout.setBlockDataMode(false);
depth++;
try {
// handle previously written and non-replaceable objects
int h;
if ((obj = subs.lookup(obj)) == null) {
writeNull();
return;
} else if (!unshared && (h = handles.lookup(obj)) != -1) {
writeHandle(h);
return;
} else if (obj instanceof Class) {
writeClass((Class) obj, unshared);
return;
} else if (obj instanceof ObjectStreamClass) {
writeClassDesc((ObjectStreamClass) obj, unshared);
return;
}
从上述代码可知,如果被写对旬的类型是String,或数组,或Enum,或Serializable,那么就可以对该对象进行序列化,否则将抛出NotSerializableException。
4.默认序列化机制
如果仅仅只是让某个类实现Serializable接口,而没有其它任何处理的话,则就是使用默认序列化机制。使用默认机制,在序列化对象时,不仅会序列化当前对象本身,还会对该对象引用的其它对象也进行序列化,同样地,这些其它对象引用的别外对象也将被序列化,以此类推。所以,如果一个对象包含的成员变量是容器类对象,而这些容器所含有的元素也是容器类对象,那么这个序列化的过程就会较复杂,开销也较大。
5.影响序列化
在现实应用中,有些时候不能使用默认序列化机制。比如,希望在序列化过程中忽略掉敏感数据,或者简化序列化过程。下面将介绍若干影响序列化的方法。
5.1 transient关键字
当某个字段被声明为transient后,默认序列化机制就会忽略该字段。此处将Person类中的age字段声明为transient,如下所示,
public class Person implements Serializable{
...
transient private Integer age = null;
...
}
再执行测试程序,会有如下输出:
arg constructor
Person{name='jianglei', age=null, gender=FEMALE}
可见,age字段未被序列化。
5.2writeObject()方法与readObject()方法
对于上述已被声明为transitive的字段age,除了将transitive关键字去掉之外,是否还有其它方法能使它再次被序列化?方法之一就是Person类中添加两个方法:writeObject()与readObject(),如下所示:
public class Person implements Serializable{
...
transient private Integer age = null;
...
private void writeObject(ObjectOutputStream out) throws IOException {
out.defaultWriteObject();
out.writeInt(new Random().nextInt());
}
private void readObject(ObjectInputStream ois) throws IOException, ClassNotFoundException {
ois.defaultReadObject();
age = ois.readInt();
}
}
在writeObject()方法中会先调用ObjectOutputStream中的defaultWriteObject()方法,该方法会执行的序列化机制,如5.1节所述,此时会忽略掉age字段。然后调用writeInt()方法显示地将age字段写入到ObjectOutputStream中。readObject()的作用则是针对对象的读取,其原理与writeObject()方法相同。再次执行,则又会有如下输出:
arg constructor
Person{name='jianglei', age=1378213970, gender=FEMALE}
必须注意地是,writeObject()与readObject()都是private方法,那么它们是如何调用的呢?毫无疑问,是使用反射。详情可以看看ObjectOutputStream中的writeSerialData方法,以及ObjectInputStream中的readSerialData方法。
5.3 Externalizable接口
无论是使用transient关键字,还是使用writeObject()和readObject()方法,其实都是基于Serializable接口的序列化。JDK中提供了另一个序列化接口--Externalizable,使用该接口之后,这前基于Serializable接口的序列化机制就将失效。此时将Person类作如下修改,
public class Person implements Externalizable{
private static final long serialVersionUID = 4145851069225399488L;
private String name = null;
private transient Integer age = null;
private Gender gender = null;
public Person() {
System.out.println("none-arg constructor");
}
private void writeObject(ObjectOutputStream out) throws IOException {
out.defaultWriteObject();
out.writeInt(new Random().nextInt());
}
private void readObject(ObjectInputStream ois) throws IOException, ClassNotFoundException {
ois.defaultReadObject();
age = ois.readInt();
}
public Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public Integer getAge() {
return age;
}
public void setAge(Integer age) {
this.age = age;
}
public Gender getGender() {
return gender;
}
public void setGender(Gender gender) {
this.gender = gender;
}
@Override
public String toString() {
return "Person{" +
"name='" + name + '\'' +
", age=" + age +
", gender=" + gender +
'}';
}
@Override
public void writeExternal(ObjectOutput out) throws IOException {
}
@Override
public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
}
}
此时再执行测试程序之后得到如下结果:
arg constructor
none-arg constructor
Person{name='null', age=null, gender=null}
从该结果,一方面,可以看出Person对象中任何个字段都没被序列化。另一方面,如果细心的话,还可以发现这次序列化过程调用了Person类的无参构造器。
Externalizable继承于Serializable,当使用该接口时,序列化的细节需要由程序员去完成。如上所示的代码,由于writeExternal()与readExternal()方法未作任何处理,那么该序列化行为将不会保存/读取任何一个字段。这也就是为什么输出结果中所有字段的值均为空。
另外,使用Externalizable进行序列化时,当读取对象时,会调用被序列化类的无参构造器去创建一个新的对象,然后再将被保存对象的字段的值分别填充到新对象中。这就是为什么在此次化过程种Person类的无参构造器会被调用。由于这个原因,实现Externalizable接口的类必须要提供一个无参的构造器,且它的访问权限为public。
对上述的Person类进行进一步修改,使其能够对name与age字段进行序列化,但忽略掉gender字段,如下代码所示:
@Override
public void writeExternal(ObjectOutput out) throws IOException {
out.writeObject(name);
out.writeInt(age);
}
@Override
public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
name = (String) in.readObject();
age = in.readInt();
}
执行测试程序之后会有如下结果:
arg constructor
none-arg constructor
Person{name='jianglei', age=19, gender=null}
5.4 readResolve()方法
当我们使用Singleton模式,应该是期望某个类的实例应该是唯一的,但如果该类是可序列化的,那么情况可能略有不同。此时对第2节使用 Person进行修改,使其实现Singleton模式,如下所示:
public class Person2 implements Serializable {
private static class InstanceHolder{
private static final Person instance = new Person("John", 31, Gender.MALE);
}
public static Person getInstance() {
return InstanceHolder.instance;
}
private String name = null;
private Integer age = null;
private Gender gender = null;
private Person2() {
System.out.println("none-arg constructor");
}
public Person2(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
@Override
public String toString() {
return "Person2{" +
"name='" + name + '\'' +
", age=" + age +
", gender=" + gender +
'}';
}
}
同时要修改测试应用,使得能够保存/获取上述单例对象,并进行对象相等性比较,如下代码所示:
public class Person2Test {
@Test
public void test01() throws IOException, ClassNotFoundException {
File file = new File("person2.out");
ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file));
oout.writeObject(Person2.getInstance());
oout.close();
ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));
Object newPerson = oin.readObject();
oin.close();
System.out.println(newPerson);
System.out.println(Person2.getInstance() == newPerson);
}
}
执行上述应用程序后会得到如下结果:
arg constructor
Person{name='John', age=31, gender=null}
false
值得注意是, 从文件person2.out中获取的Person2对象与Person2类中的单例对象并不相等。为了参在序列化过程仍能保持单例的特性,可以在Person2类中添加一个readResolve()方法, 在该方法上直接返回Person2的单例对象,如下所示:
private Object readResolve() throws ObjectStreamException{
return InstanceHolder.instance;
}
再次执行本节的测试应用事将如下输出:
arg constructor
Person2{name='John', age=31, gender=MALE}
true
无论是实现Serializable接口,或是Externalizalbe接口,当从I/O流中读取对象时,readResolve()方法都会被调用到。实际上就是用readResolve()中返回的对象直接替换在反序列化过程中创建的对象。