Leetcode460. LFU 缓存

2021年5月31日 174点热度 1人点赞 0条评论

题目描述

请你为 最不经常使用(LFU)缓存算法设计并实现数据结构。

实现 LFUCache 类:

  • LFUCache(int capacity) - 用数据结构的容量 capacity 初始化对象
  • int get(int key) - 如果键存在于缓存中,则获取键的值,否则返回 -1。
  • void put(int key, int value) - 如果键已存在,则变更其值;如果键不存在,请插入键值对。当缓存达到其容量时,则应该在插入新项之前,使最不经常使用的项无效。在此问题中,当存在平局(即两个或更多个键具有相同使用频率)时,应该去除 最近最久未使用 的键。

注意「项的使用次数」就是自插入该项以来对其调用 getput 函数的次数之和。使用次数会在对应项被移除后置为 0 。

为了确定最不常使用的键,可以为缓存中的每个键维护一个 使用计数器 。使用计数最小的键是最久未使用的键。

当一个键首次插入到缓存中时,它的使用计数器被设置为 1 (由于 put 操作)。对缓存中的键执行 getput 操作,使用计数器的值将会递增。

示例:

输入:
["LFUCache", "put", "put", "get", "put", "get", "get", "put", "get", "get", "get"]
[[2], [1, 1], [2, 2], [1], [3, 3], [2], [3], [4, 4], [1], [3], [4]]
输出:
[null, null, null, 1, null, -1, 3, null, -1, 3, 4]

解释:
// cnt(x) = 键 x 的使用计数
// cache=[] 将显示最后一次使用的顺序(最左边的元素是最近的)
LFUCache lFUCache = new LFUCache(2);
lFUCache.put(1, 1);   // cache=[1,_], cnt(1)=1
lFUCache.put(2, 2);   // cache=[2,1], cnt(2)=1, cnt(1)=1
lFUCache.get(1);      // 返回 1
                      // cache=[1,2], cnt(2)=1, cnt(1)=2
lFUCache.put(3, 3);   // 去除键 2 ,因为 cnt(2)=1 ,使用计数最小
                      // cache=[3,1], cnt(3)=1, cnt(1)=2
lFUCache.get(2);      // 返回 -1(未找到)
lFUCache.get(3);      // 返回 3
                      // cache=[3,1], cnt(3)=2, cnt(1)=2
lFUCache.put(4, 4);   // 去除键 1 ,1 和 3 的 cnt 相同,但 1 最久未使用
                      // cache=[4,3], cnt(4)=1, cnt(3)=2
lFUCache.get(1);      // 返回 -1(未找到)
lFUCache.get(3);      // 返回 3
                      // cache=[3,4], cnt(4)=1, cnt(3)=3
lFUCache.get(4);      // 返回 4
                      // cache=[3,4], cnt(4)=2, cnt(3)=3

提示:

  • $0 \leq capacity, key, value \leq 10^4$
  • 最多调用 $10^5 $次 getput 方法

进阶:你可以为这两种操作设计时间复杂度为 O(1) 的实现吗?

解题思路

首先得定义一个缓存的结点结构:

struct Node
{
    int key;
    int value;
    int frenquency;
    Node(int _key,int _value,int _frequency):key(_key),value(_value),frenquency(_frequency){}
};

里面包含keyvaluefrenquency信息。

如果要让get操作达到$O(1)$的时间复杂度,缓存结点可以存储在动态数组或者哈希表中。但是如果用动态数组存储的话,put操作肯定无法达到$O(1)$的时间复杂度。要使put操作达到$O(1)$的时间复杂度,得用双向链表来组织缓存结点。所以,如果要让putget操作同时达到$O(1)$的时间复杂度,我们可以考虑用哈希表+双向链表的方式来实现。

首先定义一个frequency_table哈希表,索引为频率frenquency,每一个索引存放一个双向链表,这个双向链表里面存放所有使用频率为frenquency的缓存。每一次添加的时候在这个双向链表的头部进行插入,在删除的时候在双向链表的尾部删除,这样就可以实现访问时间的有序排列,用于实现LFU。然后我们还需要定义一个变量来记录最小的使用频率minfreq,用于删除操作。

接着,我们还需要定义一个key_table的哈希表,索引为key,每一个索引存放这key值对应的frequency_table中链表的具体节点内存地址。然后利用这两个哈希表就可以让putget操作同时达到$O(1)$的时间复杂度。

对于 get(key) 操作,我们能通过索引 key key_table 中找到缓存在 frequency_table 中的链表的结点的内存地址,如果不存在直接返回 -1,否则我们能获取到对应缓存的相关信息,这样我们就能知道缓存的键值还有使用频率,直接返回 key 对应的值即可。但是,进行一次get(key)操作,这个缓存的使用频率就要加一,同时就需要更新这两个哈希表的值。还有可能需要更新minfreq的值。在整体的操作中,都是常数时间的复杂度,所以时间复杂度为$O(1)$。

对于 put(key, value) 操作,我们先通过索引 key key_table 中查看是否有对应的缓存,如果有的话,其实操作s类似于 get(key) 操作,唯一的区别就是我们需要将当前的缓存里的值更新为 value。如果没有的话,相当于是新加入的缓存,如果缓存已经到达容量,需要先删除最近最少使用的缓存,再进行插入。

先考虑插入,由于是新插入的,所以缓存的使用频率一定是 1,所以我们将缓存的信息插入到 frequency_table1 索引下的列表头即可,同时更新 key_table[key] 的信息,以及更新 minfreq = 1

那么剩下的就是删除操作了,由于我们实时维护了 minfreq,所以我们能够知道 frequency_table 里目前最少使用频率的索引,同时因为我们保证了链表中从链表头到链表尾的插入时间是有序的,所以 frequency_table[minfreq] 的链表中链表尾的节点即为使用频率最小且插入时间最早的节点,我们删除它同时根据情况更新 minfreq ,整个时间复杂度均为 $O(1)$。

具体细节如下述代码所述:

struct Node
{
    int key;
    int value;
    int frenquency;
    Node(int _key,int _value,int _frequency):key(_key),value(_value),frenquency(_frequency){}
};

class LFUCache {
public:
    LFUCache(int _capacity) {
        capacity=_capacity;
        minfreq=0;
        frequency_table.clear();
        key_table.clear();
    }

    int get(int key) {
        if(capacity==0) return -1;
        auto it=key_table.find(key);
        if(it==key_table.end()) return -1;
        auto node=it->second;
        int val=node->value;
        int freq=node->frenquency;
        //删除操作
        frequency_table[freq].erase(node);
        if(frequency_table[freq].size()==0)
        {
            //记录freq频率的双链表没结点了
            frequency_table.erase(freq);
            if(minfreq==freq) minfreq++;
        }
        //添加结点
        frequency_table[freq+1].push_front(Node(key,val,freq+1));
        key_table[key]=frequency_table[freq+1].begin();
        return val;
    }

    void put(int key, int value) {
        if(capacity==0) return;
        auto it=key_table.find(key);
        //key表中找不到值,分缓存满和不满两种情况
        if(it==key_table.end())
        {
            //缓存已经满的情况
            if(key_table.size()==capacity)
            {
                auto it2=frequency_table[minfreq].back();
                key_table.erase(it2.key);
                frequency_table[minfreq].pop_back();
                if(frequency_table[minfreq].size()==0)
                {
                    frequency_table.erase(minfreq);
                }
            }
            //两种情况都要添加操作,所以合并在一起
            frequency_table[1].push_front(Node(key,value,1));
            key_table[key]=frequency_table[1].begin();
            minfreq=1;
        }
        else{
            //如果表中存在,需要更新frequency的值
            auto node=it->second;
            int freq=node->frenquency;
            //删除操作
            frequency_table[freq].erase(node);
            if(frequency_table[freq].size()==0)
            {
                //记录freq频率的双链表没结点了
                frequency_table.erase(freq);
                if(minfreq==freq) minfreq++;
            }
            //添加结点
            frequency_table[freq+1].push_front(Node(key,value,freq+1));
            key_table[key]=frequency_table[freq+1].begin();
        }
    }

private:
    int minfreq;
    int capacity;
    unordered_map<int,list<Node>>frequency_table;
    unordered_map<int,list<Node>::iterator>key_table;
};

时间复杂度:putget操作都为$O(1)$

空间复杂度:$O(capacity)$

agedcat_xuanzai

这个人很懒,什么都没留下

文章评论