C++11 新特性 智能指针详解

C++ 程序设计中使用堆内存是非常频繁的操作,堆内存的申请和释放都由程序员自己管理。但使用普通指针,容易造成内存泄露(忘记释放)、二次释放、程序发生异常时内存泄露等问题等。所有 C++11 就引入了智能指针。

一、原始指针容易发生内存泄漏

C 语言中最常使用的是malloc()函数分配内存,free()函数释放内存,而 C++ 中对应的是new、delete关键字。malloc()只是分配了内存,而new则更进一步,不仅分配了内存,还调用了构造函数进行初始化。使用示例:

int main()
{
    // malloc返回值是 void*
    int* argC = (int*)malloc(sizeof(int));
    free(argC);

    char *age = new int(25); // 做了两件事情 1.分配内存 2.初始化
    delete age;
}

new和delete必须成对出现,有时候是不小心忘记了delete,有时候则是很难判断在这个地方自己是不是该delete,这个和资源的生命周期有关,这个资源是属于我这个类管理的还是由另外一个类管理的(其它类可能要使用),如果是别人管理的就由别人delete。

如果需要自己管理内存的话,最好显示的将自己的资源传递进去,这样的话,就能知道是该资源确实应该由自己来管理。

char *getName(char* v, size_t bufferSize) {
    //do something
    return v;
}

上面还是小问题,自己小心一点,再仔细看看文档,还是有机会避免这些情况的。但是在 C++ 引入异常的概念之后,程序的控制流就发生了根本性的改变,在写了 delete 的时候还是有可能发生内存泄漏。如下例:

void badThing(){
    throw 1;// 抛出一个异常
}

void test() {
    char* a = new char[1000];

    badThing();
    // do something
    delete[] a;
}
int main() {
    try {
        test();
    }
    catch (int i){
        cout << "error happened " << i << endl;
    }
}

上面的new和delete是成对出现的,但是程序在中间的时候抛出了异常,由于没有立即捕获,程序从这里退出了,并没有执行到delete,内存泄漏还是发生了。

二、使用构造函数和析构函数解决内存泄漏

C++ 中的构造函数和析构函数十分强大,可以使用构造和析构解决上面的内存泄漏问题,比如:

class SafeIntPointer {
public:
    explicit SafeIntPointer(int v) : m_value(new int(v)) { }
    ~SafeIntPointer() {
        delete m_value;
        cout << "~SafeIntPointer" << endl;
    }
    int get() { return *m_value; }
private:
    int* m_value;
};

void badThing(){
    throw 1;// 抛出一个异常
}

void test() {
    SafeIntPointer a(5);

    badThing();
}

int main() {
    try {
        test();
    }
    catch (int i){
        cout << "error happened " << i << endl;
    }
}

// 结果
// ~SafeIntPointer
// error happened 1

可以看到,就算发生了异常,也能够保证析构函数成功执行!这里的例子是这个资源只有一个人使用,我不用了就将它释放掉。但还有种情况,一份资源被很多人共同使用,要等到所有人都不再使用的时候才能释放掉,对于这种问题,就需要对上面的SafeIntPointer增加一个引用计数,如下:

class SafeIntPointer {
public:
    explicit SafeIntPointer(int v) : m_value(new int(v)), m_used(new int(1)) { }
    ~SafeIntPointer() {
        cout << "~SafeIntPointer" << endl;
        (*m_used) --; // 引用计数减1
        if(*m_used <= 0){
            delete m_used;
            delete m_value;
            cout << "real delete resources" << endl;
        }
    }
    
    SafeIntPointer(const SafeIntPointer& other) {
        m_used = other.m_used;
        m_value = other.m_value;
        (*m_used)++; // 引用计数加1
    }
    SafeIntPointer& operator= (const SafeIntPointer& other) {
        if (this == &other) // 避免自我赋值!!
           return *this;

        m_used = other.m_used;
        m_value = other.m_value;
        (*m_used)++; // 引用计数加1
        return *this;
    }

    int get() { return *m_value; }
    int getRefCount() {
        return *m_used;
    }

private:
    int* m_used; // 引用计数
    int* m_value;
};

int main() {
    SafeIntPointer a(5);
    cout << "ref count = " << a.getRefCount() << endl;
    SafeIntPointer b = a;
    cout << "ref count = " << a.getRefCount() << endl;
    SafeIntPointer c = b;
    cout << "ref count = " << a.getRefCount() << endl;
}

/*
ref count = 1
ref count = 2
ref count = 3
~SafeIntPointer
~SafeIntPointer
~SafeIntPointer
real delete resources
*/

可以看到每一次赋值,引用计数都加一,最后每次析构一次后引用计数减一,知道引用计数为 0,才真正释放资源。要写出一个正确的管理资源的包装类还是蛮难的,比如上面那个例子就不是线程安全的,只能属于一个玩具,在实际工程中简直没法用。

所以 C++11 中引入了智能指针(Smart Pointer),它利用了一种叫做 RAII(资源获取即初始化)的技术将普通的指针封装为一个栈对象。当栈对象的生存周期结束后,会在析构函数中释放掉申请的内存,从而防止内存泄漏。这使得智能指针实质是一个对象,行为表现的却像一个指针。

智能指针主要分为shared_ptrunique_ptrweak_ptr三种,使用时需要引用头文件<memory>。C++98 中还有auto_ptr,基本被淘汰了,不推荐使用。而 C++11 中shared_ptrweak_ptr都是参考boost库实现的。

三、shared_ptr共享的智能指针

3.1 shared_ptr的初始化

最安全的分配和使用动态内存的方法是调用一个名为 make_shared 的标准库函数。 此函数在动态内存中分配一个对象并初始化它,返回指向此对象的 shared_ptr。与智能指针一样,make_shared 也定义在头文件 memory 中。

// 指向一个值为42的int的shared_ptr
shared_ptr<int> p3 = make_shared<int>(42);

// p4 指向一个值为"9999999999"的string
shared_ptr<string> p4 = make_shared<string>(10,'9');

// p5指向一个值初始化的int
shared_ptr<int> p5 = make_shared<int>();

我们还可以用 new 返回的指针来初始化智能指针,不过接受指针参数的智能指针构造函数是 explicit 的。因此,我们不能将一个内置指针隐式转换为一个智能指针,必须使用直接初始化形式来初始化一个智能指针:

shared_ptr<int> pi = new int (1024); // 错误:必须使用直接初始化形式
shared_ptr<int> p2(new int(1024));	// 正确:使用了直接初始化形式

出于相同的原因,一个返回 shared_ptr 的函数不能在其返回语句中隐式转换一个普通指针:

shared_ptr<int> clone(int p)
{
    return new int(p); // 错误:隐式转换为 shared_ptr<int>
}

3.2 shared_ptr的基本使用

std::shared_ptr的基本使用很简单,看几个例子就明白了:

#include <memory>
#include <iostream>

class Test
{
public:
    Test()
    {
        std::cout << "Test()" << std::endl;
    }
    ~Test()
    {
        std::cout << "~Test()" << std::endl;
    }
};

int main()
{
    std::shared_ptr<Test> p1 = std::make_shared<Test>();
    std::cout << "1 ref:" << p1.use_count() << std::endl;
    {
        std::shared_ptr<Test> p2 = p1;
        std::cout << "2 ref:" << p1.use_count() << std::endl;
    }
    std::cout << "3 ref:" << p1.use_count() << std::endl;
    return 0;
}

输出如下:

Test()
1 ref:1
2 ref:2
3 ref:1
~Test()

针对代码解读如下:

  • std::make_shared里面调用了 new 操作符分配内存;
  • 第二个p1.use_count()之所以显示为 2,是因为增加了引用对象 p2,而随着大括号的结束,p2 的作用域结束,所以 p1 的引用计数变回 1,而随着 main 函数的结束,p1 的作用域结束,此时检测到计数为 1,那就会在销毁 p1 的同时,调用 p1 的析构函数 delete 掉之前分配的内存空间;

3.3 shared_ptr常用操作

下面列出了shared_ptr独有的操作:

make_shared<T>(args) // 返回一个shared_ptr,指向一个动态分配的类型为T的对象。使用args初始化此对象
shared_ptr<T> p(q) // p是shared_ptr q的拷贝;此操作会递增q中的引用计数。q中的指针必须能转换成T*
p = q // p和q都是shared_ptr,所保存的指针必须能相互转换。此操作会递减p中的引用计数,递增q中的引用计数。若p中的引用计数变为0,则将其管理的原内存释放
p.unique() // 若p.use_count()为1,返回true;否则返回false
p.use_count() // 返回与p共享对象的智能指针数量;可能很慢,主要用于调试

下面介绍一些改变shared_ptr的其他方法:

p.reset () //若p是唯一指向其对象的shared_ptr,reset会释放此对象。
p.reset(q) //若传递了可选的参数内置指针q,会令P指向q,否则会将P置为空。
p.reset(q, d) //若还传递了参数d,将会调用d而不是delete 来释放q

四、weak_ptr弱引用的智能指针

4.1 shared_ptr相互引用会有什么后果?

shared_ptr的一个最大的陷阱是循环引用,循环引用会导致堆内存无法正确释放,导致内存泄漏。看下面的例子:

#include <iostream>
#include <memory>

class Parent;  // Parent类的前置声明

class Child {
public:
    Child() { std::cout << "hello child" << std::endl; }
    ~Child() { std::cout << "bye child" << std::endl; }

    std::shared_ptr<Parent> father;
};

class Parent {
public:
    Parent() { std::cout << "hello Parent" << std::endl; }
    ~Parent() { std::cout << "bye parent" << std::endl; }

    std::shared_ptr<Child> son;
};

void testParentAndChild() {

}

int main() {
    std::shared_ptr<Parent> parent(new Parent());  // 1  资源A
    std::shared_ptr<Child> child(new Child());  // 2   资源B
    parent->son = child;     // 3   child.use_count() == 2 and parent.use_count() == 1 
    child->father = parent;  // 4   child.use_count() == 2 and parent.use_count() == 2

    return 0;
}

/*
输出:
hello Parent
hello child
*/

很惊讶的发现,用了shared_ptr管理资源,没有调用 Parent 和 Child 的析构函数,表示资源最后还是没有释放!内存泄漏还是发生了。
分析:

  • 执行编号1的语句时,构造了一个共享智能指针p,称呼它管理的资源叫做资源A(new Parent()产生的对象)吧, 语句2构造了一个共享智能指针c,管理资源B(new Child()产生的对象),此时资源A和B的引用计数都是1,因为只有1个智能指针管理它们,执行到了语句3的时候,是一个智能指针的赋值操作,资源B的引用计数变为了2,同理,执行完语句4,资源A的引用计数也变成了2。
  • 出了函数作用域时,由于析构和构造的顺序是相反的,会先析构共享智能指针c,资源B的引用计数就变成了1;接下来继续析构共享智能指针p,资源A的引用计数也变成了1。由于资源A和B的引用计数都不为1,说明还有共享智能指针在使用着它们,所以不会调用资源的析构函数!
  • 这种情况就是个死循环,如果资源A的引用计数想变成0,则必须资源B先析构掉(从而析构掉内部管理资源A的共享智能指针),资源B的引用计数想变为0,又得依赖资源A的析构,这样就陷入了一个死循环。

4.2 weak_ptr如何解决相互引用的问题

要想解决上面循环引用的问题,只能引入新的智能指针std::weak_ptrstd::weak_ptr有什么特点呢?与std::shared_ptr最大的差别是在赋值的时候,不会引起智能指针计数增加。

  • weak_ptr被设计为与shared_ptr共同工作,可以从一个shared_ptr或者另一个weak_ptr对象构造,获得资源的观测权。但weak_ptr没有共享资源,它的构造不会引起指针引用计数的增加。

  • 同样,在weak_ptr析构时也不会导致引用计数的减少,它只是一个静静地观察者。weak_ptr没有重载operator*和->,这是特意的,因为它不共享指针,不能操作资源,这是它弱的原因。

  • 如要操作资源,则必须使用一个非常重要的成员函数lock()从被观测的shared_ptr获得一个可用的shared_ptr对象,从而操作资源。

    当我们创建一个weak_ptr时,要用一个shared_ptr来初始化它:

    auto p = make_shared<int>(42);
    weak_ptr<int> wp(p); // wp弱共享p; p的引用计数未改变

    我们在上面的代码基础上使用std::weak_ptr进行修改,如下:

    #include <iostream>
    #include <memory>
    
    class Parent;  // Parent类的前置声明
    
    class Child {
    public:
        Child() { std::cout << "hello child" << std::endl; }
        ~Child() { std::cout << "bye child" << std::endl; }
    
        // 测试函数
        void testWork()
        {
            std::cout << "testWork()" << std::endl;
        }
    
        std::weak_ptr<Parent> father;
    };
    
    class Parent {
    public:
        Parent() { std::cout << "hello Parent" << std::endl; }
        ~Parent() { std::cout << "bye parent" << std::endl; }
    
        std::weak_ptr<Child> son;
    };
    
    void testParentAndChild() {
    
    }
    
    int main() {
        std::shared_ptr<Parent> parent(new Parent());
        std::shared_ptr<Child> child(new Child());
        parent->son = child;
        child->father = parent;
        std::cout << "parent_ref:" << parent.use_count() << std::endl;
        std::cout << "child_ref:" << child.use_count() << std::endl;
    
        // 把std::weak_ptr类型转换成std::shared_ptr类型,以调用内部成员函数
        std::shared_ptr<Child> tmp = parent.get()->son.lock();
        tmp->testWork();
        std::cout << "tmp_ref:" << tmp.use_count() << std::endl;
    
        return 0;
    }
    
    /*
    输出:
    hello Parent
    hello child
    parent_ref:1
    child_ref:1
    testWork()
    tmp_ref:2
    bye child
    bye parent
    */

    由以上代码运行结果我们可以看到:

  • 所有的对象最后都能正常释放,不会存在上一个例子中的内存没有释放的问题;

  • parent 和 child 在 main 函数中退出前,引用计数均为 1,也就是说,对std::weak_ptr的相互引用,不会导致计数的增加。

4.3 weak_ptr常用操作

weak_ptr<T> w;	// 空weak_ptr可以指向类型为T的对象
weak_ptr<T> w(shared_ptr p);	// 与p指向相同对象的weak_ptr, T必须能转换为sp指向的类型
w = p;	// p可以是shared_ptr或者weak_ptr,赋值后w和p共享对象
w.reset();	// weak_ptr置为空
w.use_count();	// 与w共享对象的shared_ptr的计数
w.expired();	// w.use_count()为0则返回true,否则返回false
w.lock();	// w.expired()为true,返回空的shared_ptr;否则返回指向w的shared_ptr

五、unique_ptr独占的智能指针

5.1 unique_ptr的基本使用

unique_ptr相对于其他两个智能指针更加简单,它和shared_ptr使用差不多,但是功能更为单一,它是一个独占型的智能指针,不允许其他的智能指针共享其内部的指针,更像原生的指针(但更为安全,能够自己释放内存)。不允许赋值和拷贝操作,只能够移动。

std::unique_ptr<int> ptr1(new int(0));
std::unique_ptr<int> ptr2 = ptr1; // 错误,不能复制
std::unique_ptr<int> ptr3 = std::move(ptr1); // 可以移动

在 C++11 中,没有类似std::make_shared的初始化方法,但是在 C++14 中,对于std::unique_ptr引入了std::make_unique方法进行初始化。

#include <iostream>
#include <memory>

int main()
{
    std::unique_ptr<std::string> ptr1(new std::string("unique_ptr"));
    std::cout << "ptr1 is " << *ptr1 << std::endl;

    std::unique_ptr<std::string> ptr2 = std::make_unique<std::string>("make_unique init!");
    std::cout << "ptr2 is " << *ptr2 << std::endl;

    return 0;
}
/*
输出:
ptr1 is unique_ptr
ptr2 is make_unique init!
*/

5.2 unique_ptr常用操作

下面列出了unique_ptr特有的操作。

unique_ptr<T> u1 // 空unique_ptr,可以指向类型为T的对象。u1会使用delete来释放它的指针
unique_ptr<T, D> u2 // u2会使用一个类型为D的可调用对象来释放它的指针
unique_ptr<T, D> u(d) // 空unique_ptr,指向类型为T的对象,用类型为D的对象d替代delete
u = nullptr // 释放u指向的对象,将u置为空
u.release() // u放弃对指针的控制权,返回指针,并将u置为空
u.reset() // 释放u指向的对象
u.reset(q) // 如果提供了内置指针q,另u指向这个对象;否则将u置为空
u.reset(nullptr)

虽然我们不能拷贝或赋值unique_ptr,但可以通过调用 release 或 reset 将指针的所有权从一个(非const)unique_ptr转移给另一个unique_ptr:

unique_ptr<string> p1(new string("Stegosaurus"));
// 将所有权从pl (指向string Stegosaurus)转移给p2 
unique_ptr<string> p2(p1, release()); // release 将 p1 置为空 
unique_ptr<string> p3(new string("Trex"));

// 将所有权从p3转移给p2
p2.reset(p3.release()); // reset 释放了 p2 原来指向的内存

调用 release 会切断unique_ptr和它原来管理的对象间的联系,如果我们不用另一个智能指针来保存 release 返回的指针,我们的程序就要负责资源的释放:

p2.release(); // 错误:p2不会释放内存,而且我们丢失了指针
auto p = p2.release(); // 正确,但我们必须记得 delete(p)
delete(p);

5.3 传递unique_ptr参数和返回unique_ptr

不能拷贝 unique_ptr 的规则有一个例外:我们可以拷贝或赋值一个将要被销毁的 unique_ptr。最常见的例子是从函数返回一个unique_ptr:

unique_ptr<int> clone (int p) 
{
	unique_ptr<int> ret(new int (p));
	// ...
    return ret;
}

对于上面这段代码,编译器都知道要返回的对象将要被销毁。在此情况下,编译器执行一种特殊的“拷贝”,在《C++ Primer》13.6.2节(第473页)中有介绍。

六、性能与安全的权衡

使用智能指针虽然能够解决内存泄漏问题,但是也付出了一定的代价。以shared_ptr举例:

  • shared_ptr的大小是原始指针的两倍,因为它的内部有一个原始指针指向资源,同时有个指针指向引用计数。
  • 引用计数的内存必须动态分配。虽然一点可以使用make_shared()来避免,但也存在一些情况下不能够使用make_shared()。
  • 增加和减小引用计数必须是原子操作,因为可能会有读写操作在不同的线程中同时发生。比如在一个线程里有一个指向一块资源的shared_ptr可能调用了析构(因此所指向的资源的引用计数减一),同时,在另一线程里,指向相同对象的一个shared_ptr可能执行了拷贝操作(因此,引用计数加一)。原子操作一般会比非原子操作慢。但是为了线程安全,又不得不这么做,这就给单线程使用环境带来了不必要的困扰。

我觉得还是分场合吧,看应用场景来进行权衡,我也没啥经验,但我感觉安全更重要,现在硬件已经足够快了,其他例如java这种支持垃圾回收的语言不还是用的很好吗。

参考:

https://www.cnblogs.com/linuxandmcu/p/10409723.html


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!