在实际项目中,很多地方都有IO。
IO需要时间。 例如,new,malloc。
对现代计算机来说,往往是GHz量级的主频,似乎没有感觉到影响。 但是,在大型项目中,重复new和delete不仅会花费很多时间,还会导致内存碎片。
new是非常麻烦的东西。
有new的地方,就是你有可能种坑的地方。
new发出的内存无法正确释放,会导致内存泄漏。 细微的内存泄漏会积累很长时间,使程序崩溃。
掌握内存管理是C程序员必备的能力。
其次,在这里实现简单的内存池。
这个内存池不能与STL的内存池相媲美。 STL的内存池实现更为复杂,当然提供了更强大的功能。 但是,其本质是一样的。 这个简单的内存池用于模板。
所需的知识点:
c基本语法: reinterpret_cast(para ) ) ) ) ) ) ) ) ) )。
数据结构:链表
C通用编程:模板
操作系统:临界区域,锁定
placement new (这需要自己去看C Primer ) )。
那么,现在开始:
实践中的一个基本点: reinterpret_cast(para ) ) ) ) ) ) ) ) )。
查看reinterpret_cast(para )的字面,重新解释。 深奥的话,怎么解释? 在《C++ Primer》这本书中,对此的说明也很少。
我以前也不知道,但后来看多了,有点感觉。 我的理解是使用新的expr结构重新解释。
在以下代码中,您将看到以下内容
phead=*(reinterpret_cast ) (phead ) ) ) ) )。
实际上,pHead是T*型。 在reinterpret_cast中将T*结构的pHead强制转换为T**结构,然后对T**结构执行*运算符。 怎么样,很暴力吧。 之后,结合代码进行说明。
实践要点之二:数据结构:链表
对所有程序员来说,熟悉基本的数据结构必须是一项必备技能。 我经常听鲜艳的莲花们说话。 基础决定了你能爬多高。 想想看。 万丈高楼从平地开始。 我在大二学习数据结构的时候,完全不知道老师在讲台上一个人唾沫四溅是什么意思,完全不知道他在说什么。 临近考试,拼命啃书,对数据结构到底在说什么,有点眉目了。 好了,回到正题吧。
所谓链表,是指有头部的节点h,该节点指向下一个节点NodeA,NodeA指向自己的下一个节点nodeb到最后的节点为止指向空值。 这样,就成了一系列的俗称链接列表。
举个例子:
类型结构节点
{
int _content;
Node* next;
}
节点*头部; //define a head of a LinkList
Node* pNode; //define another node
pHead-next=pNode; //the head point to another node。
上面的代码是一个简单的例子,省略了初始化部分。 实际操作的时候不能这样写。
实践要点之三: c通用编程:模板
基于模板的APP应用的典型示例是STL。 因此,可以轻松使用vector、list、map等容器。 STL已成为C的重要库之一,在工程中得到广泛应用。 忽略此类型的定义可以提高代码的可重用性。 模板在网络编程中的作用是必不可少的。
模板在《C++ Primer》这本书里做了非常详细的说明。 模板函数,模板类。 如果你不认识,请仔细阅读这本书的通用编程部分。
实践要点之四:操作系统:临界区、摇滚
现代计算机的硬件已经很抢手了。 多核,多线程。 为了充分发挥处理器的作用,在实际工程中多线程技术已经相当成熟。 但是,在多线程操作的情况下,线程a对某个共享数据进行写入,同时线程b也对相同的共享数据进行多少写入,如果没有好好控制,共享数据就会成为脏数据。 这个时候该怎么办? 解决方法各种各样,锁定、互斥变量、信号量、临界区。 Windows提供了一系列用于处理这些内容的api。 我们需要用
初始化安全性(critical _ section *; //初始化极限区域
deletecriticalsection (critical _ section *; //解放界限区
企业安全(critical _ section *; //进入临界区
leavecriticalsection (critical _ section *; //离开临界区
其中CRITICAL_SECTION是在Windows中定义的临界区域结构。 我们不用深入,只要知道其作用就可以了。
处理共享区域的整个过程应该如下所示:
共享数据Data在初始化时声明并初始化关键节结构,在线程a操作共享数据Data时
候,让Data进入临界区域,然后操作。这样,线程B就无法对Data进行写操作了。操作完成,让Data离开临界区域。线程B这个时候才可以对Data进行写操作。在Data析构的时候,释放临界区域。介绍完这些知识点,下面是应该上代码的时候了。在命名上,我们把临界区取个别名:锁。
定义临界区(因为要使用到Windows的API函数,记得包含Windows.h)
class CBaseLock
{
public:
CBaseLock()
{
InitializeCriticalSection(&m_sect);
}
~CBaseLock()
{
DeleteCriticalSection(&m_sect);
}
void Lock()
{
EnterCriticalSection(&m_sect);
}
void Unlock()
{
LeaveCriticalSection(&m_sect);
}
private:
CRITICAL_SECTION m_sect;
};
定义锁
template
class CLockImpl
{
public:
CLockImpl(T* l) : m_lock(l)
{
m_lock->Lock();
}
~CLockImpl()
{
m_lock->Unlock();
}
private:
T* m_lock;
};
定义内存池
template
class MyPool
{
public:
MyPool()
{
AllocatedCount = 0;
ElemSize = sizeof(T) > sizeof(T*) ? sizeof(T) : sizeof(T*);
pHead = NULL;
}
~MyPool()
{
while(pHead)
{
T* ret = pHead;
pHead = *(reinterpret_cast(pHead));
::free(ret);
}
}
int GetCount()const
{
return numAllocated;
}
T *alloc()
{
CLockImpl lock(&m_lock);
numAllocated++;
if(pHead == NULL)
return new(malloc(ElemSize))T;
T* ret = freeListHead;
pHead = *(reinterpret_cast(pHead));
return new(ret)T;
}
template
T *alloc(const T1& p)
{
CLockImpl lock(&m_lock);
numAllocated++;
if(pHead == NULL)
return new(malloc(ElemSize))T(p);
T* ret = pHead;
pHead = *(reinterpret_cast(pHead));
return new(ret)T(p);
}
template
template
……//这些情况我就不写了
void dealloc(T* elem)
{
elem->~T();
if(true)
{
CLockImpl lock(&m_lock);
memset(elem, 0xfe, elementSize);
--AllocatedCount;
*(reinterpret_cast(elem)) = pHead;
pHead = elem;
}
}
private:
int AllocatedCount; // 已经分配的内存节点个数
size_t ElemSize; // 内存节点的大小
T* pHead; // 空闲内存的链表表头
LockMode m_lock;
}
以上代码,基本完成了一个简单的内存池。
下面,对内存池中的一些重点语句进行解释。
构造函数
内存池初始化出来,是什么都没有的。因此,指向空闲内存区域的指针应指向NULL。而已分配的内存节点个数,当然必须是0。最最富有深意的,就应该是这句:
ElemSize = sizeof(T) > sizeof(T*) ? sizeof(T) : sizeof(T*);
其含义是,ElemSize的大小,应该是木板参数T与T*二者中较大的一个。(为什么要这么设计?往下看。)
public 接口 alloc()
对于内存池中的元素对象,若需要多个参数来初始化,就需要传入多个参数。这样,alloc()接口显然要满足多种情况,就需要把alloc()定义为模板函数,提供对应构造形参。而形参在内存池中,用模板参数指定,这样,调用alloc(),传入实参,就可以初始化元素,并为之分配内存了。
仔细看alloc()的实现,发现pHead指向空的时候,需要new一个ElemSize大小的空间。而pHead不为空的时候,就把pHead指向的空间返回。
pHead = *(reinterpret_cast(pHead));
pHead指向T*类型,然后把pHead用reinterpret_cast重新解释,这个时候,pHead指向的地址的空间(逻辑)结构就改变了。假设pHead指向ElemA类型, sizeof(ElemA) = 5,用reinterpret_cast重新解释,pHead指向就是指向指针的指针了。然后*reinterpret_cast就是向重新解释的地址区域取 值(取的是什么?继续往下看)。
析构
析构的时候,有这么一句:
*(reinterpret_cast(elem)) = pHead;
按照之前的解释,是把elem的地址用T**重新解释,然后取值,把pHead指向的地址放到该处。而pHead指向的地址,一定是比T和T*中,较大的一个的。32位操作系统下,T*是4字节,这说明pHead指向的地址,至少是4字节,至少足够容纳一个T**的类型。也就是说,我把elem这块内存的内容删除了,然后把这块地址分成若干4字节(32位系统下)的连续块,把pHead指向的第一个空闲地址块的地址放倒这块抵制块的第一个4字节中保存,然后pHead = elem; pHead指向elem的地址,则第一个空闲地址快就是刚刚释放了的elem的地址,elem地址中的第一个4字节保存了下一个空闲地址块的地址……如此链成链表。
然后又回到alloc上,alloc先检查有没有空闲地址,即pHead是否指向NULL,如果指向NULL,则new一块ElemSize大小的内存,在该内存中,用placement new技术,在申请的内存中,构造需要的元素对象。若pHead不指向NULL,则说明已经有申请好的内存(可能是某个对象析构之后,留下来,没有返还给系统的),取到pHead指向的第一块空闲内存块的地址,然后然pHead指向这块空闲地址质指向的空闲地址块(即 pHead = *(reinterpret_cast(pHead));这句的含义),然后构造元素对象。这样减少了想系统new的次数,节省了系统寻找合适大小内存块的时间,提高了效率。
加锁的原因,是因为防止多个线程,同时对某一对象内存池进行操作。
这样把简单的内存池解释了一遍。内存池的运行机制,大致是这样的。有些内存池会比这个内存池复杂得多。但是,理解了其中分配的要点,什么内存池都能玩得游刃有余。
总结:
内存池的存在,减少了系统IO次数,缩减了系统查找合适大小内存块的时间。提高了程序的运行效率,并有效减少了内存碎片的产生。
=====>THE END<=====