大文件的读取

奋斗的青春

本帖最后由李长波于 2012-11-10 16:32 编辑

看了基础视频想问下大家！对于大文件的读取的解决方案！要求效率！同样写大文件大家有什么解决方案！

李长波 · 李长波

看了基础视频想问下大家！对于大文件的读取的解决方案！要求效率！同样写大文件大家有什么解决方案！

奋斗的青春 · 奋斗的青春

无非是clob和blob.

Java代码
　　Blob blob = rs.getBlob("article_content");
　　InputStream instream = blob.getBinaryStream();
　　int flength=(int)blob.length();
　　byte[] b = new byte[flength];
　　byte[] nb=new byte[1024];
　　int len=0;
　　int tlen=0;
　　while(flength>0){
　　len=instream.read(nb);
　　System.arraycopy(nb, 0, b, tlen, len);
　　tlen+=len;
　　flength-=len;
　　}
　　instream.close();
　　a.setArticleContent(new String(b,"GBK"));

复制代码

平凡是福 · 平凡是福

我也想知道，有什么好方法

李长波 · 李长波

本帖最后由李长波于 2012-11-12 10:54 编辑

上网查了半天  总算给出了大文件读的解决方案！

java读取一个200M的文本格式文件，而且还需要对文件的内容做解析，进行分词。如果用JVM的默认设置，利用Scanner类只能读出4M大小内容，于是我就在网上搜索，但是网上没有找到一篇文章是我所需要的内容。于是我只好翻thinking in java，发现了一个java的nio里有个MappedByteBuffer类，他的作用可以把一个文件映射到内存中，然后就能像访问数组一样去读取这个文件。于是我在JDK中查了MappedByteBuffer的详细的用法，然后将其和Scanner类结合一下，便能得到一边读取大文件，一边解析读取的内容了功能了，具体的代码如下：

public void readResource() {
long fileLength = 0;
final int BUFFER_SIZE = 0x300000;// 3M的缓冲

for(String fileDirectory:this.readResourceDirectory())//得到文件存放路径，我这里使用了一个方法从XML文件中读出文件的
            //存放路径，当然也可以用绝对路径来代替这里的fileDriectory
{
File file = new File(fileDirectory);
fileLength = file.length();
try {
   MappedByteBuffer inputBuffer =
   new RandomAccessFile(file,"r").getChannel().map(FileChannel.MapMode.READ_ONLY, 0, fileLength);//读取大文件

所以大家有问题先百度吧！网上一定有解决方案！

   byte[] dst = new byte[BUFFER_SIZE];//每次读出3M的内容

   for(int offset=0; offset < fileLength; offset+= BUFFER_SIZE)
   {
   if(fileLength - offset >= BUFFER_SIZE)
   {
         for(int i = 0;i < BUFFER_SIZE;i++)
         dst = inputBuffer.get(offset + i);
   }
   else
   {
      for(int i = 0;i < fileLength - offset;i++)
            dst = inputBuffer.get(offset + i);
      }
   //将得到的3M内容给Scanner，这里的XXX是指Scanner解析的分隔符
   Scanner scan = new Scanner(new ByteArrayInputStream(dst)).useDelimiter("XXX");
   while(scan.hasNext())
   {
         //这里为对读取文本解析的方法
   }
   scan.close();
   }
} catch (Exception e)
{
   e.printStackTrace();
}
}
}

帐号		自动登录	找回密码
密码			加入黑马

大文件的读取

评分

4 个回复

浏览过的版块