C++通用动态抽象工厂
用户2471098440237 人气:0背景
一开始,我是想到了下面这个场景:
struct A { void Foo() {} }; struct B { void Bar() { A().Foo(); } };
如上面代码,B的Bar中构造了A,然后调用了A的Foo函数。假如我想在别的场景中复用B的Bar,但是这时A的Foo就不符合需求了,需要定制,于是我们想到可以用多态,把A的Foo改成虚函数,然后写出A1:
struct A { A() = default; virtual ~A() = default; virtual void Foo() {} }; struct A1 : public A { void Foo() override {} };
B不应该知道A1的存在,为了让B用上A1,同时也为以后可能会拓展的A2、A3做准备,我们写了个A的工厂函数GetA()来生成A。于是代码变成:
std::unique_ptr<A> GetA() { if (Condition1()) { return std::unique_ptr<A>(new A1()); } else { return std::unique_ptr<A>(new A()); } } struct B { void Bar() { GetA()->Foo(); } };
如果B中还要构造别的C、D等类,难道我们要为每个类都写一个工厂函数吗?这成本也太高了,而且可能大部分类都只有一个,不用搞继承,写工厂函数就是无用功。那么,有没有一种通用的方式可以在写B代码的时候就对A、C、D等类的构造都留一手,使得以后可以由B外的代码控制实际构造的是A1等,而不需要修改B的代码?这就是我写动态抽象工厂的原始需求。
实现
思路很简单,就是为每个类都自动生成一个工厂函数就好了,然后在B中不直接构造A、C、D等对象,而是都调用对应类的工厂函数。然后这个自动生成的工厂默认就是构造原始的类的对象,比如A,也有接口可以改成生成子类,比如A1。对每个类生成一个工厂函数自然就想到用模板了。至于这个接口怎么实现,就有两大分支,分别是编译期和运行期。编译期一般就是用模板特化了。我觉得运行期会更有趣,用法会更多,就选了运行期。
运行期的意思就是要搞个变量来存下这个修改的工厂函数,自然就想到用std::function。当然免不了的是要把这个变量传给B。如果管理A的是一个变量,管理C、D的是另外两个变量,那就要传很多很多变量给B,这样也太繁琐了,所以应该一个变量存下所有类的工厂函数,然后把这个变量传遍所有需要使用工厂函数的对象或函数当中。所以这个变量的类型是一个确定的类型,不能带模板(或者说模板参数不能跟工厂对应的类相关,如A、C、D等)。那么模板就放到方法当中了。很自然地,这个类型的接口就应该是这样:
struct DynamicAbstractFactory { template <typename T, typename... Args> std::unique_ptr<T> New(Args&&...); };
这里插一段,为什么叫动态抽象工厂呢?按照我的理解,工厂模式就是实现一个返回T*的函数F,里面用ifelse来控制最终返回的是T还是T的某个子类。抽象工厂模式就是连这个函数F都是可变的。动态是指这个F是运行时可变。
那么这个接口怎么实现呢?我的想法是用一个map来记录类型组合(T, Args&&...)到工厂函数std::function<T*(Args&&...)>的映射,并存储std::function<T*(Args&&...)>。New的实现就是查找map中有没有对应的工厂函数,有就调用工厂函数,没有就调用T本身的构造函数。当然,也需要提供一个接口来修改这个map。
要实现这个map还有三个细节:
- 存储的std::function<T*(Args&&...)>是不同的类型,需要用类型擦除存储。如果可用C++17的话可直接用std::any,但我的环境有些老代码用gcc7编不过,所以还是只能用C++11,于是用std::shared_ptr<void>来代替(我一开始还是用std::unique_ptr+虚析构函数+继承来实现的,后来才知道std::shared_ptr自带这个功能)。
- map的key是一个类型组合,就用std::type_index吧。由于std::function<T*(Args&&...)>已经把整个类型组合包进去了,而且一定会实例化,就直接用它吧。于是key就成了std::type_index(typeid(std::function<T*(Args&&...)>))。
- 由于接口New(Args&&...)的每个参数类型Args&&都是引用类型,为了保持一致性,为了map能找到正确的函数,要求std::function中的每个参数也是引用类型,所以上面都写作std::function<T*(Args&&...)>。比如std::function<T*(int)>会转换成std::function<T*(int&&)>。
再加上修改map的接口SetFunc,第一版的动态抽象工厂就做好了:
class DynamicAbstractFactory { public: template <typename T, typename... Args> std::unique_ptr<T> New(Args&&... args) { auto iter = index2func_.find(std::type_index(typeid(std::function<T*(Args&&...)>))); if (iter != index2func_.end()) { return std::unique_ptr<T>((*reinterpret_cast<std::function<T*(Args&&...)>*>(iter->second.get()))(std::forward<Args>(args)...)); } return std::unique_ptr<T>(new T(std::forward<Args>(args)...)); } template <typename T, typename... Args> void SetFunc(std::function<T*(Args...)>&& func) { index2func_[std::type_index(typeid(std::function<T*(Args&&...)>))] = std::make_shared<std::function<T*(Args&&...)>>(std::move(func)); } protected: std::unordered_map<std::type_index, std::shared_ptr<void>> index2func_; };
于是B的代码及使用就变成这样:
class B { public: B(DynamicAbstractFactory& factory) : factory_(factory) {} void Bar() { factory_.New<A>()->Foo(); factory_.New<C>(); factory_.New<D>(); } protected: DynamicAbstractFactory& factory_; }; // 旧环境,用原始A、C、D // 当然B也可以用factory来生成 void Run() { DynamicAbstractFactory factory; factory.New<B>(factory)->Bar(); } // 新环境,用A1、C、D void Run1() { DynamicAbstractFactory factory; std::function<A*()> get_a = []() { return new A1(); }; factory.SetFunc<A>(std::move(get_a)); factory.New<B>(factory)->Bar(); }
这样就满足了一开始的需求,B在构造A、C、D的时候都留了一手,B并不需要知道实际构造的是什么,在B的外部,Run()和Run1(),可控制在B里具体要构造的对象。
写完后发现这东西作用不止于此,下面写写一些扩展用法。
寄存参数
子类的构造函数的参数可以跟父类不一样,通过lambda捕获来寄存。
struct A2 : public A { A2(int i) {} void Foo() override {} }; void Run2() { DynamicAbstractFactory factory; int i = 0; std::function<A*()> get_a = [i]() { return new A2(i); }; factory.SetFunc<A>(std::move(get_a)); factory.New<B>(factory)->Bar(); }
存储所有构造出来的对象
上面的接口返回std::unique_ptr,还要管理对象生命周期,不如更进一步,用factory来管理所有它构造的对象,在factory析构时统一析构。因为我一般写后台rpc接口,可以在rpc请求开始时构造factory,在构造好回包后析构factory,这样在整个请求周期构造的对象都在,指针不会失效,而且在请求结束后可以很方便地进行异步析构,直接把factory丢到析构线程就好。
于是New接口返回值由std::unique_ptr改成T*,同时New可能会造成误解,改成Get。当然,存储肯定要用到类型擦除存储。就成了下面这样:
class GeneralStorage { public: GeneralStorage(size_t reserve_size = 256) { storage_.reserve(reserve_size); } ~GeneralStorage() { // 保证按添加顺序逆序析构 while (storage_.size() > 0) { storage_.pop_back(); } } template <class T, class... Args> T* EmplaceBack(Args&&... args) { auto p_obj = std::make_shared<T>(std::forward<Args>(args)...); storage_.push_back(p_obj); return p_obj.get(); } protected: std::vector<std::shared_ptr<void>> storage_; }; class DynamicAbstractFactoryWithStorage { public: template <typename T, typename... Args> T* Get(Args&&... args) { auto iter = index2func_.find(std::type_index(typeid(std::function<T*(Args&&...)>))); if (iter != index2func_.end()) { return (*reinterpret_cast<std::function<T*(Args&&...)>*>(iter->second.get()))(std::forward<Args>(args)...); } return storage_.EmplaceBack<T>(std::forward<Args>(args)...)); } template <typename T, typename... Args> void SetFunc(std::function<T*(Args...)>&& func) { index2func_[std::type_index(typeid(std::function<T*(Args&&...)>))] = std::make_shared<std::function<T*(Args&&...)>>(std::move(func)); } protected: std::unordered_map<std::type_index, std::shared_ptr<void>> index2func_; GeneralStorage storage_; };
有个细节是对于改变过的工厂函数返回的指针是不应该存在storage_中的,而应该是在工厂函数中把对象存进storage_。上面的Run1()应该改成这样:
void Run1() { DynamicAbstractFactoryWithStorage factory; std::function<A*()> get_a = [&factory]() { return factory.Get<A1>(); }; factory.SetFunc<A>(std::move(get_a)); factory.Get<B>(factory)->Bar(); }
寄存指针,可析构的单例
当返回值由std::unique_ptr改成T*,就可以实现寄存指针了。可析构的单例指每次请求都重新构造,在请求结束后析构,但是请求之中只构造一次。看下面例子:
struct C { C(DynamicAbstractFactoryWithStorage& factory) { std::function<C*(DynamicAbstractFactoryWithStorage&)> func = [this](DynamicAbstractFactoryWithStorage& factory) { return this; }; factory.SetFunc<C>(std::move(func)); } }; void Run() { DynamicAbstractFactoryWithStorage factory; factory.Get<C>(factory); // 构造C,并通过SetFunc把对象的指针寄存到factory中 factory.Get<C>(factory); // 调用C构造函数中的func,直接返回寄存的指针,不重复构造C // factory析构时C的对象将被析构 }
装饰工厂函数,责任链工厂
只要再加个接口GetFunc来获取当前的工厂函数,就可以对工厂函数玩装饰模式了。
GetFunc接口:
// 其它代码与上面一样 class DynamicAbstractFactoryWithStorage { public: template <typename T, typename... Args> std::function<T*(Args&&...)> GetFunc() { auto iter = index2func_.find(std::type_index(typeid(std::function<T*(Args&&...)>))); if (iter != index2func_.end()) { return *reinterpret_cast<std::function<T*(Args&&...)>*>(iter->second.get()); } std::function<T*(Args&&...)> default_func = [this](Args&&... args) { return storage_.EmplaceBack<T>(std::forward<Args>(args)...)); }; return default_func; } };
统计调用次数:
struct C { C(DynamicAbstractFactoryWithStorage& factory) { std::function<C*(DynamicAbstractFactoryWithStorage&)> func = [this](DynamicAbstractFactoryWithStorage& factory) { return this; }; factory.SetFunc<C>(std::move(func)); } uint32_t cnt_ = 0; }; void Run() { DynamicAbstractFactoryWithStorage factory; auto func = factory.GetFunc<A>(); std::function<A*()> get_a = [func, &factory]() { ++factory.Get<C>()->cnt_; return func(); }; factory.SetFunc<A>(std::move(get_a)); factory.Get<B>(factory)->Bar(); }
用责任链模式搞个工厂:
struct D { D() {} D(int i) {} }; struct D1 : public D { D1(int i) {} static void SetFactoryD(DynamicAbstractFactoryWithStorage& factory) { // GetFunc的结果是std::fuction<D*(int&&)>类型的,这里经过了一次类型转换 std::function<D*(int)> func = factory.GetFunc<D, int>(); std::function<D*(int)> new_func = [func, &factory](int i) -> D* { // 责任链模式 if (Check(i)) { return factory.Get<D1>(i); } else { return func(i); } }; factory.SetFunc<D>(std::move(new_func)); } // 构造D1的条件 static bool Check(int i) { return i == 1; } }; // 与D1类似,除了Check struct D2 : public D { D2(int i) {} static void SetFactoryD(DynamicAbstractFactoryWithStorage& factory) { std::function<D*(int)> func = factory.GetFunc<D, int>(); std::function<D*(int)> new_func = [func, &factory](int i) -> D* { if (Check(i)) { return factory.Get<D2>(i); } else { return func(i); } }; factory.SetFunc<D>(std::move(new_func)); } // 构造D2的条件 static bool Check(int i) { return i == 2; } }; void Run() { DynamicAbstractFactoryWithStorage factory; D1::SetFactoryD(factory); D2::SetFactoryD(factory); factory.Get<D>(0); // D factory.Get<D>(1); // D1 factory.Get<D>(2); // D2 }
允许构造函数之外的参数组合
上面的实现要求new T(std::forward(args)...)能合法生成一个T对象指针,在一些情况下很难做到,比如T中有难以初始化的成员,又比如T是一个抽象类:
struct E { E() = default; virtual ~E() = default; virtual void Foo() = 0; };
这样就要修改Get接口的逻辑,改成如果能合法调用构造函数,就调用,否则就不调用。但是这样放开之后,就各种参数组合都可以搞了,我觉得这样可能会很混乱,这边设置了这个参数组合,那边设置了另外的参数组合,不知道一共设置了哪几种参数组合。我觉得还是要加点限制,就规定参数组合必须在基类中定义。规定了一个方法名FactoryGet,所有非构造函数的参数组合要定义一个静态FactoryGet方法,方法返回T*,比如:
struct E { E() = default; static E* FactoryGet(int) { return nullptr; } virtual ~E() = default; virtual void Foo() = 0; };
这样Get接口的逻辑就可以改成如果能合法调用构造函数,就调用,否则就调用对应的FactoryGet方法,其他参数组合将会编译报错。同时也规定FactoryGet获得的指针不存进通用存储。于是DynamicAbstractFactoryWithStorage就改成这样:
// new T(std::forward<Args>(args)...) // T::FactoryGet(std::forward<Args>(args)...) // 要求上面两个表达式有且仅有一个合法并且返回T*,Get调用合法的那个。 template <typename T, typename F, typename = void> struct DefaultGet; template <typename T, typename... Args> struct DefaultGet<T, void(Args...), typename std::enable_if<std::is_same<decltype(std::decay<T>::type::FactoryGet(std::forward<Args>(*reinterpret_cast<typename std::decay<Args>::type*>(0))...)), T*>::value, void>::type> { static T* Get(GeneralStorage& storage, Args&&... args) { return T::FactoryGet(std::forward<Args>(args)...); } }; template <typename T, typename... Args> struct DefaultGet<T, void(Args...), typename std::enable_if<std::is_same<decltype(new typename std::decay<T>::type(std::forward<Args>(*reinterpret_cast<typename std::decay<Args>::type*>(0))...)), typename std::decay<T>::type*>::value, void>::type> { static T* Get(GeneralStorage& storage, Args&&... args) { return storage.EmplaceBack<typename std::decay<T>::type>(std::forward<Args>(args)...); } }; class DynamicAbstractFactoryWithStorage { public: // 每个Args都要是引用 template <typename T, typename... Args> using FuncType = std::function<T*(Args&&...)>; template <typename T, typename... Args> T* Get(Args&&... args) { auto iter = index2func_.find(std::type_index(typeid(FuncType<T, Args...>))); if (iter != index2func_.end()) { return (*reinterpret_cast<FuncType<T, Args...>*>(iter->second.get()))(std::forward<Args>(args)...); } return DefaultGet<T, void(Args&&...)>::Get(storage_, std::forward<Args>(args)...); } template <typename T, typename... Args> void SetFunc(std::function<T*(Args...)>&& func) { index2func_[std::type_index(typeid(FuncType<T, Args...>))] = std::make_shared<FuncType<T, Args...>>(std::move(func)); } template <typename T, typename... Args> FuncType<T, Args...> GetFunc() { auto iter = index2func_.find(std::type_index(typeid(FuncType<T, Args...>))); if (iter != index2func_.end()) { return *reinterpret_cast<FuncType<T, Args...>*>(iter->second.get()); } FuncType<T, Args...> default_func = [this](Args&&... args) { return DefaultGet<T, void(Args&&...)>::Get(storage_, std::forward<Args>(args)...); }; return default_func; } protected: std::unordered_map<std::type_index, std::shared_ptr<void>> index2func_; GeneralStorage storage_; };
这样E就能像上面那样用了。另外,想要返回const指针也是可以的。
struct E { E() = default; // 返回值改成了const E* static const E* FactoryGet(int) { return nullptr; } virtual ~E() = default; virtual void Foo() = 0; }; struct E1 : public E { E1(int i) {} static void SetFactoryE(DynamicAbstractFactoryWithStorage& factory) { std::function<const E*(int)> func = factory.GetFunc<const E, int>(); std::function<const E*(int)> new_func = [func, &factory](int i) -> const E* { if (Check(i)) { return factory.Get<const E1>(i); } else { return func(i); } }; factory.SetFunc<const E>(std::move(new_func)); } static bool Check(int i) { return i == 1; } void Foo() override {} }; void Run() { DynamicAbstractFactoryWithStorage factory; E1::SetFactoryE(factory); factory.Get<const E>(0); // nullptr factory.Get<const E>(1); // const E1* }
总结
加载全部内容