C++ typeid实现原理 C++中typeid实现原理详解
passion_wu128 人气:0最近看了boost::any类源码,其实现主要依赖typeid操作符。很好奇这样实现的时间和空间开销有多大,决定探一下究竟。
VS2008附带的type_info类只有头文件,没有源文件,声明如下:
class type_info { public: virtual ~type_info(); _CRTIMP_PURE bool __CLR_OR_THIS_CALL operator==(const type_info& rhs) const; _CRTIMP_PURE bool __CLR_OR_THIS_CALL operator!=(const type_info& rhs) const; _CRTIMP_PURE int __CLR_OR_THIS_CALL before(const type_info& rhs) const; _CRTIMP_PURE const char* __CLR_OR_THIS_CALL name(__type_info_node* __ptype_info_node = &__type_info_root_node) const; _CRTIMP_PURE const char* __CLR_OR_THIS_CALL raw_name() const; private: void *_m_data; char _m_d_name[1]; __CLR_OR_THIS_CALL type_info(const type_info& rhs); type_info& __CLR_OR_THIS_CALL operator=(const type_info& rhs); _CRTIMP_PURE static const char *__CLRCALL_OR_CDECL _Name_base(const type_info *,__type_info_node* __ptype_info_node); _CRTIMP_PURE static void __CLRCALL_OR_CDECL _Type_info_dtor(type_info *); };
测试代码:
#include <iostream> using namespace std; class Object { }; int main() { Object obj; cout << "type name:" << typeid(obj).name() << endl; cout << "type raw name:" << typeid(obj).raw_name() << endl; if(typeid(obj) == typeid(Object)) { cout << "type is equal" << endl; } else { cout << "type is not equal" << endl; } return 0; }
输出:
type name:class Object
type raw name:.?AVObject@@
type is equal
在解释每个函数的实现原理前先开看type_info类的存储方式。
typeid返回的是type_info的引用,这个类不能拷贝,也不能自己构造,所以每个类最多只有一个type_info的数据,这个数据存放在哪里的呢?
用UltraEdit打开exe文件,搜索“Object”,能找到这个字符串。再用PE工具打开这个exe,发现这个字符串属于data节(这是可读可写的全局数据段)。再把有typeid的代码都注释,PE文件中没有了这个字符串。得出一个结论:
编译器会为每一种typeid操作的类型生成一份保存在数据段的type_info数据。
这份数据有多大呢?看下面这段代码:
#include <iostream> using namespace std; class Object { }; int main() { const type_info* p = &typeid(Object); cout << p << endl; return 0; }
在cout那一行下断点,查看到p的值为:
再看下这个类的声明,析构函数为virtual类型的,所以p的头四字节为虚函数表。p+4为_m_data,void*类型,四个字节,调试时发现都是0,还不清楚其表示什么。
p+8为_m_d_name,char类型数组,存储的是raw_name,每种类型的raw_name大小不定长,所以数组长度为1。现在type_info的存储结构已经一目了然:
每种类型的type_info数据长度依赖于类型名称,至少9个字节。
现在假设一个复杂的工程里面有50个类型用了typeid操作符,平均每个type_info长度为24,这些数据增加的PE大小为1200B,就1K左右。而现在的PE动辄几十M,所以这点空间开销根本不算什么。
再看看这些函数调用的开销:
- raw_name函数直接返回_m_d_name的地址,非常快;
- name函数将_m_d_name存储的字符串解码成实际的名称,也是很快;
- ==操作符是比较raw_name是否相等,也是很快。
读者可能会有两点疑惑:
- 存储的时候为什么不直接存储成name呢?我想最大的原因是节省空间,比如double的raw_name为".N",name为"double"多了四字节。
- ==操作符为什么不直接比较两个type_info引用的地址是否相等呢?我也很疑惑,我看汇编码发现它是比较raw_name。
备注:C++并没有规定typeid实现标准,各个编译器可能会不一样,上述分析过程基于VS2008自带的编译器。
总结:typeid带来的时间和空间开销是非常小的,不过使用的时候尽量不要违背开放封闭原则。
加载全部内容