黑马程序员技术交流社区
标题: 缓存 [打印本页]
作者: qinchog 时间: 2013-7-4 16:30
标题: 缓存
本文章主要从如何查询及构建缓存开始,主要参考了Java Concurrency In Practice的一些章节,及网上的一些资料,结合实际的项目,做了一些应用。
首先,你一般设置缓存是否是这样写的呢?
Java代码
- //计算缓存的key
- String cacheKey = getCacheKey(param1,param2);
- //查询memcached
- List<Long> list = (List<Long>)memcached.get(cacheKey);
- if(list == null){
- //memcache 已经失效或者不存在,去查询数据库
- list = getFromDB(param1,param2);
- memcached.set(list,5*60);
- return list;
- }
这个方法在并发小的时候,应该不存在问题,但是当是一个高并发的系统时,那么这样的写法可能会导致缓存失效时,向数据库发起多个查询,然后查询完之后,还要向memcache Set多次。为什么,因为在如果同时过来10个请求,都发现缓存中没有数据(list == null),那么就都会去查询数据库,然后直到其中一个最先获得结果的线程,将结果设置到memcache,之后到来的线程,才会走缓存,但已经进来的线程,则还会继续查数据库,然后再将结果设置到memcache,这显然是我们不想看到的。那么如何处理呢,在方法上面加synchronized锁?开销太大。
既可以不使用锁,又保证多个线程同时请求时只有一个线程会访问数据库执行查询,其他线程都只读取计算结果的方法。 你只需要构建一个自己的Callable类,就能正确的设置与读取缓存。
假设concurrentService是一个先读缓存,没有缓存则读取数据库的方法,其代码如下:
Java代码
- public List<Long> concurrentService(int para1,int param2){
- long beginTime = System.nanoTime();
- final String cacheKey = "IamKey";
- List<Long> list = (List<Long>)memCachedClient.get(cacheKey);
- if(list == null){
- Callable<Object> caller = new Callable<Object>() {
- public Object call() throws InterruptedException {
- System.out.println(" go to dao or rmi");
- List<Long> list = new ArrayList<Long>();
- list.add(1l);list.add(2l);
- //将计算结果缓存
- System.out.println("结果计算完毕,存入分布式缓存中");
- memCachedClient.set(cacheKey, 5*60, list);
- / Thread.sleep(500);
- //计算结果,通常是访问数据库或者远程服务
- return list;
- }
- };
- List<Long> result = (List<Long>)TaskUtils.getInTask(cacheKey,caller);
- long end = System.nanoTime();
- useTimes.add(end-beginTime);
- return result;
- }
- else {
- System.out.println("1.缓存命中,直接返回");
- long end = System.nanoTime();
- useTimes.add(end-beginTime);
- return list;
- }
- }
其中的TaskUtils.getInTask定义如下:
Java代码
- import java.util.concurrent.Callable;
- import java.util.concurrent.ConcurrentHashMap;
- import java.util.concurrent.ConcurrentMap;
- import java.util.concurrent.FutureTask;
-
- public class TaskUtils {
- private static final ConcurrentMap<String, FutureTask<Object>> cache = new ConcurrentHashMap<String, FutureTask<Object>>();
- public static Object getInTask(String cacheKey, Callable<Object> caller) {
- System.out.println("1.缓存未命中,将查询数据库或者调用远程服务");
- //未命中缓存,开始计算
- FutureTask<Object> f = cache.get(cacheKey);
- if (f == null) {
- FutureTask<Object> ft = new FutureTask<Object>(caller);
- f = cache.putIfAbsent(cacheKey, ft);
- if (f == null) {
- System.out.println("2.任务未命中,将查询数据库或者调用远程服务");
- f = ft;
- ft.run();
- }
- }
- else {
- System.out.println("2.任务命中,直接从缓存取结果");
- }
- try {
- Object result = f.get();
- System.out.println("取回的结果result:"+result);
- return result;
- } catch (Exception e) {
- e.printStackTrace();
- }
- finally{
- //最后将计算任务去掉,虽然已经移除任务对象,但其他线程
- //仍然能够获取到计算的结果,直到所有引用都失效,被垃圾回收掉
- boolean success = cache.remove(cacheKey,f);
- System.out.println(success);
- }
- return null;
- }
- }
经过测试,使用这种方法读取与设置缓存,比使用synchronized方法和锁定键值的方法要快3-10倍,不信大家可以试试。
有人可能有疑问,如果并发的线程很多,同时都没有命中缓存,那么不就会产生很多Callable<Object>对象吗?这样岂不会浪费很大内存吗?其实,我们仔细分析一下代码,可以看到Callable对象不管创建了多少,但最终经过putIfAbsent方法之后,就留下了一个有效的对象,其他的对象都成为失效对象,随时可以被GC掉。因此,使用这种方法,并不会造成JVM的内存溢出。
另外,Callable<Object>就是一个普通的对象,跟线程一点关系都没有,里面虽然包括了一个runnable方法,但是并不是说这个会启动一个线程。里面的runnable方法在本代码中是在调用者线程中执行,但执行结果共享给了其他没有命中缓存的线程。
赶紧回去review你们项目的代码吧,你们设置缓存的方式对吗?
实际上这个TaskUtil的方法只是使用了两个重要的并发工具类,一个是ConcurrentMap,主要支持并发中经常使用的putIfAbsent方法,和一个FutureTask对象,这个对象的get方法能够阻塞调用者线程,直到结果可用。
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) |
黑马程序员IT技术论坛 X3.2 |