Java有类似于C语言中sizeof()的操作器吗? 表面答案是Java没有提供任何类似于C语言的sizeof()的操作器。但是,我们应该想想为什么Java 程序员偶尔也需要它。 C语言程序员自己管理大多数的数据结构存储分配,并且 sizeof()不负责了解分配的存储块的尺寸大小。C 存储分配器如malloc(),只要涉及到对象初始化几乎什么事都不做:程序员必须设置作为更深一层对象指针的所有对象域。但是当所有的都说过并且编码过的时候, C/C++ 存储分配是相当有效的。 相比而言,Java对象分配和构造紧密结合(不可能使用一个已经分配但是没有初始化的对象)。如果Java类定义了作为更深一层对象的引用的域,在构造阶段设置他们也是很普遍的。Java对象分配器因此频繁地分配互连对象:对象图形。与自动垃圾收集耦合,所有这一切都太方便了,并且让你觉得你根本不必担心Java存储分配的细节。 当然,这只有对简单的Java应用才有效。相比C/C++而言,同样的Java数据结构往往占据更多的物理存储。在企业软件开发中,接近当今32位JVM上的最大虚拟存储是一个普遍的可缩放性限制。因此,Java 程序员可从sizeof() 或者其他类似的函数中获益,因为这些函数能够观察它的数据结构是否过大或者是否包含存储瓶颈。幸运的是,Java反射允许你相当容易的编写这种工具。 接下来,我先讨论几个经常出现的对该问题的错误理解。 误区1:因为Java类型的大小确定所以不需要 Sizeof() 不错,Java int在所有JVM和所有的平台上都是32位,但是这只是一种语言规范要求,程序员可以接受的这种数据类型的宽度。这种int基本上是一种抽象的数据类型,并且可以被 64位设备上的64位存储器字所支持。非初级的类型也不例外:Java语言规范根本没有涉及这类问题:类域在物理存储中应该如何校准或者布尔排列在JVM 内部不能作为一个简单的位向量来实现。 误区2: 将对象串行成一个位通量然后查看所产生的通量长度就可以测量对象的尺寸大小 这个方法无效的原因就是串行布局只是真实存储器内布局的远程反射。举例说,通过观察String是如何串行的:在存储器内每个char至少2个字节,但是在串行的格式中 String是UTF-8编码的,所以任何ASCII内容只占了一半的空间。 另外一个解决方式 你可能想起在"Java Tip 130: Do You Know Your Data Size?"一文中描述了一个技巧:在创建大量的标记类的基础上,仔细的测量在JVM使用的堆栈尺寸中所产生的增长。如果合适的话,这个技巧相当有用,实际上我在本文中也用它来引导备用的方法。 注意:Java 技巧130中的类Sizeof需要一个静态的JVM (这样堆栈活动只能由测量线程请求的对象分配和垃圾收集的操作引起),还需要大量的同一对象实例。如果你想测量单一大型对象(可能作为调试跟踪输出的一部分)的尺寸大小,特别是如果你想测试出实际上是什么使他变得这么大的时候,这个方法就无效了。 2.什么是对象的尺寸? 上述讨论突出了一个哲学问题:假设你经常处理对象图形,那么对象尺寸的定义是什么呢?他是指你正在测量的对象实例的尺寸大小还是指根于对象实例的整个数据图形?后者在实际生活中使用的更多一些。如你所见,事情不总是划分得如此清楚,但是对于启动程序来说你可以参照以下方法: · 一个对象的所有非静态数据域(包括在超类中定义的域)的总和就是它的尺寸 · 与C++不同,类方法以及他们的虚拟不影响对象的尺寸 · 类超接口不影响对象尺寸(见该列表末尾的注释) · 完整的对象尺寸可作为根于启动对象的整个对象图形的闭合来获得 注释:实现任何Java接口只对怀疑类做标记,而且不添加任何数据到它的定义上。实际上, JVM 甚至不校验接口实现有没有提供接口所请求的所有方法:在目前的规范中,这严格说来是编译器的责任。 为了引导整个进程,对于初级数据类型,我使用Java 技巧130的Sizeof 类来测量物理尺寸。正如它所证明的一样,对于普通的32位JVM来说,一个简单的java.lang.Object 占了8位,并且基本数据类型通常都是能够适应语言要求的最少的物理尺寸 (除了boolean 要占据整个字节之外): // java.lang.Object shell size in bytes: public static final int OBJECT_SHELL_SIZE = 8; public static final int OBJREF_SIZE = 4; public static final int LONG_FIELD_SIZE = 8; public static final int INT_FIELD_SIZE = 4; public static final int SHORT_FIELD_SIZE = 2; public static final int CHAR_FIELD_SIZE = 2; public static final int BYTE_FIELD_SIZE = 1; public static final int BOOLEAN_FIELD_SIZE = 1; public static final int DOUBLE_FIELD_SIZE = 8; public static final int FLOAT_FIELD_SIZE = 4;
(这些常量不是永远硬编码的,并且对于一个给定的JVM,它们必须独立测量,认识到这一点很重要)当然,幼稚的计算对象域尺寸总和往往忽略了JVM中的存储队列问题。存储队列真的很有关系(例如,Java Tip 130中的初级排列类型),但是我认为在这种低级别的细节上做文章是没有用的。这种细节不但由JVM开发商决定,它们也处在程序员的控制之下。我们的目标是获取对象尺寸的最好估测,并且希望在类域多余、域应该简单组装、或者有必要更紧凑的嵌入数据库等这些时候可以获得提示。为了绝对的物理精度,你可以总是回到Java Tip 130中的Sizeof 类。 为了帮助组成对象实例的配置文件,我们的工具不仅仅计算尺寸,还建立一个附带的有用的数据结构:由IObjectProfileNode组成的图形: interface IObjectProfileNode { Object object (); String name (); int size (); int refcount (); IObjectProfileNode parent (); IObjectProfileNode [] children (); IObjectProfileNode shell (); IObjectProfileNode [] path (); IObjectProfileNode root (); int pathlength (); boolean traverse (INodeFilter filter, INodeVisitor visitor); String dump (); } // End of interface
public static IObjectProfileNode profile (Object obj) { final IdentityHashMap visited = new IdentityHashMap ();
final ObjectProfileNode root = createProfileTree (obj, visited, CLASS_METADATA_CACHE); finishProfileTree (root);
return root; }
private static ObjectProfileNode createProfileTree (Object obj, IdentityHashMap visited, Map metadataMap) { final ObjectProfileNode root = new ObjectProfileNode (null, obj, null);
final LinkedList queue = new LinkedList ();
queue.addFirst (root); visited.put (obj, root);
final ClassAccessPrivilegedAction caAction = new ClassAccessPrivilegedAction (); final FieldAccessPrivilegedAction faAction = new FieldAccessPrivilegedAction ();
while (! queue.isEmpty ()) { final ObjectProfileNode node = (ObjectProfileNode) queue.removeFirst ();
obj = node.m_obj; final Class objClass = obj.getClass ();
if (objClass.isArray ()) { final int arrayLength = Array.getLength (obj); final Class componentType = objClass.getComponentType ();
// Add shell pseudo-node: final AbstractShellProfileNode shell = new ArrayShellProfileNode (node, objClass, arrayLength); shell.m_size = sizeofArrayShell (arrayLength, componentType);
node.m_shell = shell; node.addFieldRef (shell);
if (! componentType.isPrimitive ()) { // Traverse each array slot: for (int i = 0; i < arrayLength; ++ i) { final Object ref = Array.get (obj, i);
if (ref != null) { ObjectProfileNode child = (ObjectProfileNode) visited.get (ref); if (child != null) ++ child.m_refcount; else { child = new ObjectProfileNode (node, ref, new ArrayIndexLink (node.m_link, i)); node.addFieldRef (child);
queue.addLast (child); visited.put (ref, child); } } } } } else // the object is of a non-array type { final ClassMetadata metadata = getClassMetadata (objClass, metadataMap, caAction, faAction); final Field [] fields = metadata.m_refFields;
// Add shell pseudo-node: final AbstractShellProfileNode shell = new ObjectShellProfileNode (node, metadata.m_primitiveFieldCount, metadata.m_refFields.length); shell.m_size = metadata.m_shellSize;
node.m_shell = shell; node.addFieldRef (shell);
// Traverse all non-null ref fields: for (int f = 0, fLimit = fields.length; f < fLimit; ++ f) { final Field field = fields [f];
final Object ref; try // to get the field value: { ref = field.get (obj); } catch (Exception e) { throw new RuntimeException ("cannot get field [" + field.getName () + "] of class [" + field.getDeclaringClass ().getName () + "]: " + e.toString ()); }
if (ref != null) { ObjectProfileNode child = (ObjectProfileNode) visited.get (ref); if (child != null) ++ child.m_refcount; else { child = new ObjectProfileNode (node, ref, new ClassFieldLink (field)); node.addFieldRef (child);
...} // End of interface 节点访问者只有当伴随的过滤器为null或者过滤器接收该节点时才对树节点进行操作。为了简便,节点的子节点只有当节点本身已经测试时才进行测试。前序遍历和后序遍历访问都支持。来自java.lang.Object处理程序的尺寸提供以及所有初级数据都集中放在一个伪码内,这个伪码附属于代表对象实例的每个"真实"节点。这种处理程序节点可通过IObjectProfileNode.shell()访问,也可在 IObjectProfileNode.children()列表中显示出来:目的就是能够编写数据过滤器和访问者,使它们可在实例化的数据类型的同一起点上考虑初级数据。 如何实现过滤器和访问者就是你的事了。作为一个起点,类ObjectProfileFilters (见本文的download)提供几种有用的堆栈过滤器,它们可帮助你在节点尺寸、与父节点的尺寸相关的节点尺寸、与根对象相关的节点尺寸等等的基础上剪除大对象树。 ObjectProfilerVisitors类包含IObjectProfileNode.dump()使用的默认访问者,也包含能够为更高级的对象浏览创建XML转储的访问者。将配置文件转换为SwingTreeModel也是很容易的。 为了便于理解,我们创建了一个上文提及的两个字符串排列对象的完整转储: public class Main { public static void main (String [] args) { Object obj = new String [] {new String ("JavaWorld"), new String ("JavaWorld")};
StringInspector si = new StringInspector (); profile.traverse (si, si); System.out.println ("wasted " + si.wasted () + " bytes (out of " + profile.size () + ")");
为了使用sizeof(),我们看看LinkedList() vs ArrayList()。该代码繁殖了拥有1000个空引用的列表: List obj = new LinkedList (); // or ArrayList for (int i = 0; i < 1000; ++ i) obj.add (null);