Java如何实现零拷贝

什么是零拷贝

在操作系统中,从内核的形态区分,可以分为内核态(Kernel Space)和用户态(User Space)。

在传统的IO中,如果把数据通过网络发送到指定端的时候,数据需要经历下面的几个过程:

IO

  1. 当调用系统函数的时候,CPU执行一系列准备工作,然后把请求发送给DMA处理(DMA可以理解为专门处理IO的组件),DMA将硬盘数据通过总线传输到内存中。

  2. 当程序需要读取内存的时候,这个时候会执行CPU Copy,内存会有内核态写入用户的缓存区。

  3. 系统调用write()方法时,数据从用户态缓冲区写入到网络缓冲区(Socket Buffer), 由用户态编程内核态。

  4. 最后由DMA写入网卡驱动中,传输到网卡的驱动。

可以看到,传统的IO的读写,数据会经历4次内存的拷贝,这种拷贝拷贝会带来资源的浪费和效率的底下。


如何实现零拷贝


内存映射方式I/O

在顺序IO中有一个mmap的机制,具体数据是怎么流转的呢?

IO

  1. 数据通过DMA读取写入的内核空间的内存,通过内存共享的方式,把这块数据与用户空间的进行共用,减少了一次CPU的拷贝

  2. 然后数据直接写入到网络的缓存区

  3. 最后由DMA写入的网卡的驱动的缓存。

从上面的图可以看出,内存映射的方式减少了CPU的读写次数,但是拷贝的次数还是有四次。


通过sendfile实现的零拷贝I/O

通过sendfile()系统调用,可以做到内核空间内部直接进行I/O传输。

IO

与内存映射方法不同,sendfile的方式用户态是无法看到真正的内存,是无法修改的。仅仅是一个指令,让内存从内核空间拷贝到socket buffer中。

同样sendfile也会有一次CPU的拷贝。

真正的零拷贝

IO

上图中的数据流转,都是通过DMA的来进行处理的,没有经过CPU Copy操作,这个需要硬件支持,具体的操作系统会根据硬件条件来选择实现的方式。


Java实现

Java的实现是FileChanneltransferTo方法的调用

 File file = new File("test.zip");
  RandomAccessFile raf = new RandomAccessFile(file, "rw");
  FileChannel fileChannel = raf.getChannel();
  SocketChannel socketChannel = SocketChannel.open(new InetSocketAddress("", 1234));
  // 直接使用了transferTo()进行通道间的数据传输
  fileChannel.transferTo(0, fileChannel.size(), socketChannel);
作者

付威

发布于

2020-02-03

更新于

2020-09-27

许可协议

评论