【高性能C++奇技淫巧】当你要用很多短字符串当字典key

如果你有这样的情景：

那么你会怎么做呢？

很常见的做法是：

1
std::unordered_map<std::string, T> dict;

但是其实，我们可以针对这个场合做出神奇的优化：

众所周知，字符串是由字符组成的，而每个字符占1个字节，也就是说相当于一个int8_t或者uint8_t。而如果key都不超过8，那么$8 \times 8 = 64$，我们完全可以将其convert为一个uint64_t。即

1
2
3
std::unordered_map<uint64_t, T> dict;
char str[10];   // strlen(str) <= 8
dict.insert({*reintepret_cast<uint64_t*>(str), _});

这么一看你就懂了吧！无须多言。最后我们上个效率对比吧，看看能有多大的提升：

可以看到，find操作是2.6倍的快

此外，你也可以考虑采取其它实现方式的map，比如这里有位大神总结的Comprehensive C++ Hashmap Benchmarks 2022，根据你需要的场景，选择更合适的map，也能继续压低时延。