`
dogasshole
  • 浏览: 842152 次
文章分类
社区版块
存档分类
最新评论

STL系列之六 set与hash_set

 
阅读更多

对我挺有帮助,转载过来,已注明出处,还是挺厚道的吧

STL系列之六 set与hash_set

set和hash_set是STL中比较重要的容器,有必要对其进行深入了解。在STL中,set是以红黑树(RB-tree)作为底层数据结构的,hash_set是以Hash table(哈希表)作为底层数据结构的。set可以在时间复杂度为O(logN)情况下插入、删除和查找数据。hash_set操作的时间复杂度则比较复杂,这取决于哈希函数和哈希表的负载情况。下面列出set和hash_set的常用函数:

set和hase_set的更多函数请查阅MSDN

set的使用范例如下(hash_set类似):

  1. //byMoreWindows(http://blog.csdn.net/MoreWindows)
  2. #include<set>
  3. #include<ctime>
  4. #include<cstdio>
  5. usingnamespacestd;
  6. intmain()
  7. {
  8. printf("--set使用byMoreWindows(http://blog.csdn.net/MoreWindows)--\n\n");
  9. constintMAXN=15;
  10. inta[MAXN];
  11. inti;
  12. srand(time(NULL));
  13. for(i=0;i<MAXN;++i)
  14. a[i]=rand()%(MAXN*2);
  15. set<int>iset;
  16. set<int>::iteratorpos;
  17. //插入数据insert()有三种重载
  18. iset.insert(a,a+MAXN);
  19. //当前集合中个数最大容纳数据量
  20. printf("当前集合中个数:%d最大容纳数据量:%d\n",iset.size(),iset.max_size());
  21. //依次输出
  22. printf("依次输出集合中所有元素-------\n");
  23. for(pos=iset.begin();pos!=iset.end();++pos)
  24. printf("%d",*pos);
  25. putchar('\n');
  26. //查找
  27. intfindNum=MAXN;
  28. printf("查找%d是否存在-----------------------\n",findNum);
  29. pos=iset.find(findNum);
  30. if(pos!=iset.end())
  31. printf("%d存在\n",findNum);
  32. else
  33. printf("%d不存在\n",findNum);
  34. //在最后位置插入数据,如果给定的位置不正确,会重新找个正确的位置并返回该位置
  35. pos=iset.insert(--iset.end(),MAXN*2);
  36. printf("已经插入%d\n",*pos);
  37. //删除
  38. iset.erase(MAXN);
  39. printf("已经删除%d\n",MAXN);
  40. //依次输出
  41. printf("依次输出集合中所有元素-------\n");
  42. for(pos=iset.begin();pos!=iset.end();++pos)
  43. printf("%d",*pos);
  44. putchar('\n');
  45. return0;
  46. }

运行结果如下:

下面试下在set中使用类(结构体也可以类似这样做)。这个类很简单,只有一个成员变量,及设置和获取这个成员变量的成员函数。

  1. //在set中使用类要重载‘<’并实现拷贝构造函数
  2. //byMoreWindows(http://blog.csdn.net/MoreWindows)
  3. #include<set>
  4. #include<ctime>
  5. #include<cstdio>
  6. usingnamespacestd;
  7. classNode
  8. {
  9. public:
  10. Node(intnAge=0)
  11. {
  12. m_nAge=nAge;
  13. }
  14. Node(constNode&na)//拷贝构造函数
  15. {
  16. m_nAge=na.GetAge();
  17. }
  18. intGetAge()
  19. {
  20. returnm_nAge;
  21. }
  22. private:
  23. intm_nAge;
  24. };
  25. //不能写成类的成员函数
  26. inlinebooloperator<(constNode&na,constNode&nb)
  27. {
  28. returnna.GetAge()<nb.GetAge();
  29. }
  30. intmain()
  31. {
  32. inti;
  33. set<Node>nset;
  34. for(i=0;i<MAXN;++i)
  35. nset.insert(Node(i));
  36. return0;
  37. }

编译,直接报了3个错误!!1个在拷贝构造函数,2个在operator<()函数。如下图所示:

3个错误都是一样的:

errorC2662: “Node::GetAge”: 不能将“this”指针从“const Node”转换为“Node &” 转换丢失限定符

这是怎么回事呀?分析下,拷贝构造函数与operator<()函数出错,错误都指向了GetAge()函数,有点古怪,比较下它们与GetAge()函数,可以发现最大的不同点在于这2个函数都用到了const而GetAge()函数没有使用const。难道是这个导致报错了吗?先给GetAge()函数加个const看看,如下:

int GetAge()const//增加这个const

{

returnm_nAge;

}

再编译,不报错了。再查下资料,原因如下——因为那2个函数都使用了const修饰的对象,但GetAge()没有加上const以保证它不修改对象,编译器认为这种写法是不安全的,所以就毫不犹豫报了个错误。

这种错误如果不亲身体会下,到笔试面试时很可能写了个错误程序而自己还处于一无所知中(死在这些小细节上最不值得)。另外,如果使用VC6.0则不会提示详细的错误信息——“转换丢失限定符”。

STL还为set提供了一些集合运算的函数,如交集set_intersection()、并集set_union()、差集set_difference()和对称差集set_symmetric_difference()。这些就不详细介绍了,有兴趣可以自己动手试一试。

下面开始对set和hash_set作个性能测试(Win7 +VS2008Release下)。

测试代码如下:

  1. //byMoreWindows(http://blog.csdn.net/MoreWindows)
  2. #include<set>
  3. #include<hash_set>
  4. #include<iostream>
  5. #include<ctime>
  6. #include<cstdio>
  7. #include<cstdlib>
  8. usingnamespacestd;
  9. usingnamespacestdext;//hash_set
  10. //MAXN个数据MAXQUERY次查询
  11. constintMAXN=1000000,MAXQUERY=5000000;
  12. inta[MAXN],query[MAXQUERY];
  13. voidPrintfSetUseTime(char*pszOperator,longlElapsetime)
  14. {
  15. printf("set的%s操作用时%d毫秒\n",pszOperator,lElapsetime);
  16. }
  17. voidPrintfHashSetUseTime(char*pszOperator,longlElapsetime)
  18. {
  19. printf("hash_set的%s操作用时%d毫秒\n",pszOperator,lElapsetime);
  20. }
  21. intmain()
  22. {
  23. printf("setVShash_set性能测试数据容量%d个查询次数%d次\n",MAXN,MAXQUERY);
  24. constintMAXNUM=MAXN*4;
  25. constintMAXQUERYNUM=MAXN*8;
  26. printf("容器中数据范围[0,%d)查询数据范围[0,%d)",MAXNUM,MAXQUERYNUM);
  27. printf("--byMoreWindows(http://blog.csdn.net/MoreWindows)--\n\n");
  28. //随机生成在[0,MAXNUM)范围内的MAXN个数
  29. inti;
  30. srand(time(NULL));
  31. for(i=0;i<MAXN;++i)
  32. a[i]=(rand()*rand())%MAXNUM;
  33. //随机生成在[0,MAXQUERYNUM)范围内的MAXQUERY个数
  34. srand(time(NULL));
  35. for(i=0;i<MAXQUERY;++i)
  36. query[i]=(rand()*rand())%MAXQUERYNUM;
  37. set<int>nset;
  38. hash_set<int>nhashset;
  39. clock_tclockBegin,clockEnd;
  40. //insert
  41. printf("-----插入数据-----------\n");
  42. clockBegin=clock();
  43. nset.insert(a,a+MAXN);
  44. clockEnd=clock();
  45. PrintfSetUseTime("insert",clockEnd-clockBegin);
  46. clockBegin=clock();
  47. nhashset.insert(a,a+MAXN);
  48. clockEnd=clock();
  49. PrintfHashSetUseTime("insert",clockEnd-clockBegin);
  50. //find
  51. printf("-----查找数据-----------\n");
  52. intnFindSucceedCount,nFindFailedCount;
  53. nFindSucceedCount=nFindFailedCount=0;
  54. clockBegin=clock();
  55. for(i=0;i<MAXQUERY;++i)
  56. if(nset.find(query[i])!=nset.end())
  57. ++nFindSucceedCount;
  58. else
  59. ++nFindFailedCount;
  60. clockEnd=clock();
  61. PrintfSetUseTime("find",clockEnd-clockBegin);
  62. printf("查找成功次数:%d查找失败次数:%d\n",nFindSucceedCount,nFindFailedCount);
  63. nFindSucceedCount=nFindFailedCount=0;
  64. clockBegin=clock();
  65. for(i=0;i<MAXQUERY;++i)
  66. if(nhashset.find(query[i])!=nhashset.end())
  67. ++nFindSucceedCount;
  68. else
  69. ++nFindFailedCount;
  70. clockEnd=clock();
  71. PrintfHashSetUseTime("find",clockEnd-clockBegin);
  72. printf("查找成功次数:%d查找失败次数:%d\n",nFindSucceedCount,nFindFailedCount);
  73. return0;
  74. }

在数据容量100万,查询次数500万时,程序运行结果如下:

由于查询的失败次数太多,这次将查询范围变小使用再测试下:

由于结点过多,80多万个结点,set的红黑树树高约为19(2^19=524288,2^20=1048576),查询起来还是比较费时的。hash_set在时间性能上比set要好一些,并且如果查询成功的几率比较大的话,hash_set会有更好的表现。想知道为什么hash_set会有优良的性能表现,请看继集——《STL系列之七 深入分析hash_set》。

注1.MSDN上讲set的erase()是有返回值的,但在VS2008中查看set的源代码,erase()函数的三个重载版本中,有二个返回值都为void即无返回值,另一个返回size_type。 可以通过http://msdn.microsoft.com/zh-cn/library/8h4a3515(v=VS.90).aspx查看MSDN上对set的erase()说明。

转载请标明出处,原文地址:http://blog.csdn.net/morewindows/article/details/7029587

分享到:
评论

相关推荐

    stl_code.rar_STL vector_hash_stl set code_vector_vector stl

    c++ STL source code, hash and vector etc

    STL.源码剖析_____________

    源码之前了无秘密,你将看到vector的实现、list的实现、heap的实现、deque的实现、RB-tree的实现、hash-table的实现、set/map 的实现;你将看到各种算法(排序、搜寻、排列组合、数据移动与复制…)的实现;你甚至将...

    C++ STL 参考手册Cpp_STL_ReferenceManual.pdf

    STL 是“Standard Template Library”的缩写,中文译为“标准模板库”。...例如,vector 的底层为顺序表(数组),list 的底层为双向链表,deque 的底层为循环队列,set 的底层为红黑树,hash_set 的底层为哈希表。

    STL源码剖析_Table_stlmemory_c++prim_vector_

    STL源码剖析,这本书所呈现的源码,使读者看到vector的实现、list的实现、heap的实现、deque的实现、Red Black tree的实现、hash table的实现、set/map的实现;看到各种算法(排序、查找、排列组合、数据移动与复制...

    C++ STL开发技术导引(第5章)

    23.22 集合求异set_symmetric_difference 399 23.23 最小值min 401 23.24 最大值max 402 23.25 最小元素min_element 403 23.26 最大元素max_element 404 23.27 字典比较lexicographical_compare 405 23....

    细讲c++ 各种STL容器的应用场合及性能

    c++ std stl各容器的应用场合及性能 map hash_map unordered_map multimap list forward_list vector set hash_set multiset unsorted_set queue deque priority_queue

    STL.zip_Map 排序_STL_Table_stl map实现

    源码之前了无秘密,你将看到vector的实现、list的实现、heap的实现、deque的实现、Red Black tree的实现、hash table的实现、set/map的实现;你将看到各种算法(排序、查找、排列组合、数据移动与复制技术)的实现;你...

    STL源码剖析.pdg

    1.2 stl 六大组件 - 功能与运用 004 1.3 gnu源码开放精神 007 1.4 hp stl实现版本 009 1.5 p.j. plauger stl实现版本 010 1.6 rouge wave stl实现版本 011 1.7 stlport 实现版本 012 1.8 sgi stl实现版本 总...

    C++ STL 开发技术导引(随书源码)

    本书共分5篇26章,以“C++编程技术→C++ STL泛化技术基础→C++ STL容器技术→C++ STL算法技术→C++ STL迭代器技术”为线索具体展开,通过大量的源码分析和应用实例,详细介绍了C++ STL的技术原理和使用方法。...

    C++ STL 开发技术导引(第6章)

    23.22 集合求异set_symmetric_difference 399 23.23 最小值min 401 23.24 最大值max 402 23.25 最小元素min_element 403 23.26 最大元素max_element 404 23.27 字典比较lexicographical_compare 405 23....

    STL 源码剖析(侯捷先生译著)

    1.2 STL 六大组件 - 功能与运用 004 1.3 GNU源码开放精神 007 1.4 HP STL实现版本 009 1.5 P.J. Plauger STL实现版本 010 1.6 Rouge Wave STL实现版本 011 1.7 STLport 实现版本 012 1.8 SGI STL实现版本 总...

    linked_hash:L链式哈希[LRU]用于C ++的快速,仅标头,跨平台和类似STL的linked_hash_map和linked_hash_set。 (在leetcode上击败100%的提交)

    linked_hash测试结果

    C++ STL开发技术导引(第3章)

    23.22 集合求异set_symmetric_difference 399 23.23 最小值min 401 23.24 最大值max 402 23.25 最小元素min_element 403 23.26 最大元素max_element 404 23.27 字典比较lexicographical_compare 405 23....

    Effictive STL CHM中文版

    》灰《《常好的STL教程Effective STL 目录 容器 条款1: 仔细选择你要的容器 条款2: 小心对“容器无关代码”的幻想 条款3: 使容器里对象的拷贝操作轻量而正确 条款4: 用empty来代替检查size是否为0 条款5: ...

    STL源码剖析 电子版

    这本书所呈现的源码,使读者看到vector的实现、list的实现、heap的实现、deque的实现、Red Black tree的实现、hash table的实现、set/map的实现;看到各种算法(排序、查找、排列组合、数据移动与复制技术)的实现;...

    Analysis of STL Source Code

    这本书所呈现的源码,使读者看到vector的实现、list的实现、heap的实现、deque的实现、Red Black tree的实现、hash table的实现、set/map的实现;看到各种算法(排序、查找、排列组合、数据移动与复制技术)的实现;...

    STL源码剖析简体中文完整版(清晰扫描带目录).pdf

    这本书所呈现的源码,使读者看到vector的实现、list的实现、heap的实现、deque的实现、Red Black tree的实现、hash table的实现、set/map的实现;看到各种算法(排序、查找、排列组合、数据移动与复制技术)的实现...

    STL实现代码(SGI版本,侯捷 STL源码解析)

    源码之前了无秘密,你将看到vector的实现、list的实现、heap的实现、deque的实现、Red Black tree的实现、hash table的实现、set/map的实现;你将看到各种算法(排序、查找、排列组合、数据移动与复制技术)的实现;...

    标准模板库(STL)源码剖析

    源码之前了无秘密,你将看到vector的实现、list的实现、heap的实现、deque的实现、RB-tree的实现、hash-table的实现、set/map 的实现;你将看到各种算法(排序、搜寻、排列组合、数据移动与复制…)的实现;你甚至将...

    STL源码剖析

    侯捷 STL源码剖析:一本剖析下面内容的书籍:vector、list、heap、deque、red black tree、hash table、set、map等等

Global site tag (gtag.js) - Google Analytics