Эффективный перенос данных с помощью zero copy

Многие Web-приложения выдают значительный объём статического контента, что означает чтение данных с диска и их последующую запись вотвечающий сокет. Возможно, эта деятельность требует относительно маленькой загрузки процессора, но и эффективность её невелика: ядро считывает данные с диска, отправляет их через границу ядро-пользовательв приложение, а затем приложение возвращает эти же данные через границу ядро-пользователь, чтобы записать в сокет. На деле приложение работаеткак неэффективное промежуточное звено, передающее данные с диска в сокет.

Каждый раз, когда данные пересекают границу пользователь-ядро, их необходимо копировать; при этом затрачиваются ресурсы процессора и памяти. К счастью, этого копирования можно избежать с помощью технологии с соответствующим названием— zero copy. Приложения, использующие zero copy, запрашивают ядро о копировании данных прямо с диска в сокет, не затрагивая приложения. Zero copy значительно улучшает производительность приложений и уменьшает число контекстных переключений между режимами пользователя и ядра.

Библиотеки классов Java поддерживают zero copy в системах Linux и UNIX с помощью метода transferTo() из java.nio.channels.FileChannel. МетодtransferTo()позволяет передать информацию прямо из канала, в котором они вызваны, вдругой канал с поддержкой записи без необходимости пропускать данные через приложение. В данной статье сначала наглядно описываются системные издержки, возникающие при простой передаче файлов с помощьютрадиционной семантики копирования, а затем показывается, как с помощьютехнологии zero-copy, использующей transferTo() повышается производительность.

Передача данных: традиционный метод

Рассмотрим сценарий чтения из файла и передачу данных в другуюпрограмму по сети. (Этот сценарий описывает поведение многих серверных приложений, включая Web-приложения, выдающие статическое содержимое,FTP серверов, почтовые серверы и т.д.) Суть операции заключается в двухвызовах, показанных в Листинге 1 :

Листинг 1. Копирование байтов из файла в сокет

File.read(fileDesc, buf, len);
Socket.send(socket, buf, len);

Хотя листинг 1 в принципе прост, внутренне операция копирования требует четырех контекстных переключений между режимом пользователя ирежимом ядра, и данные в процессе операции копируются четыре раза. На рисунке 1 показано, как перемещаются данные внутри от файла к сокету:

Рисунок 1. Традиционный подход к копированию данных

На рисунке 2 показано переключение контекста:

Рисунок 2. Традиционное переключение контекста

Этапы операции:

Вызов read() производит переключение контекста (см. рис.2) из режима пользователя в режим ядра. Внутри запускается sys_read() (или его эквивалент), чтобы прочитать данные из файла. Первое копирование совершается с помощью механизма прямого доступа в память (DMA), который считывает содержимое файла с диска и сохраняет его в буфере пространства адресов ядра.
Требуемое количество данных копируется из буфера чтения в пользовательский буфер, и возвращается вызов read(). Ответ из вызова производит еще одно переключение контекста из режима ядра обратно в пользовательский режим. Теперь данные находятся в буфере пользовательского пространства адресов.
При вызове функции для работы с сокетом send()контекст переключается из режима пользователя в режим ядра. Производится третье копирование для повторного помещения данных в буфер пространства адресов ядра. На этот раз данные помещаются в другой буфер, связанный с сокетом назначения.
Send() возвращает системный вызов, инициируя четвертое переключение контекста. Независимо и асинхронно происходит четвертое копирование, так как механизм DMA передает данные из буфера ядра в механизм протокола.

Использование промежуточного буфера ядра (вместо прямой передачи данных в пользовательский буфер) кажется не эффективным. Но промежуточные буфера ядра были введены в процессы, чтобы улучшить производительность. Применение промежуточного буфера на стороне чтения позволяет буферу ядра действовать как кэш опережающего считывания,когда приложение не запрашивало столько данных, сколько содержится вбуфере ядра. Это существенно улучшает производительность, когда количество требуемых данных меньше размера буфера ядра. Промежуточный буфер на стороне записи позволяет завершить запись асинхронно.

К несчастью, этот метод сам может стать узким местом в производительности, если размер запрашиваемых данных значительно превосходит размер буфера ядра. Прежде чем данные попадут в приложение, происходит многократное их копирование между диском, буфером ядра ибуфером пользователя.

Метод Zero copy улучшает производительность, устраняя необходимость лишнего копирования данных.

Передача данных: метод zero-copy

Если снова просмотрев традиционный сценарий,можно заметить, что второе и третье копирование на самом деле не нужны. Приложение не делает ничего, кроме кэширования данных и передачи ихобратно в буфер. Вместо этого данные могут быть переданы прямо избуфера чтения в буфер сокета. Метод transferTo() позволяет сделать именно так. В листинге 2 показана сигнатура метода transferTo():

Листинг 2. Метод transferTo() method

public void transferTo(long position, long count, WritableByteChannel target);

Метод transferTo() передает данные из файлового каналав записываемый байтовый канал. Внутренне он опирается на поддержку zerocopy на уровне операционной системы; в UNIX и разновидностях Linux этотвызов направляется к системному вызову sendfile() , показанному в листинге 3, который передает данные от одного файлового дескриптора другому:

Листинг 3. Системный вызов sendfile()

#include <sys/socket.h>
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

Действие вызовов file.read() и socket.send() calls in Listing 1 в листинге 1 может быть заменено простым вызовом transferTo() , как показано в листинге 4:

Листинг 4. Применение transferTo() для копирования данных из файла на диске в сокет

transferTo(position, count, writableChannel);

На рисунке 3 показан путь данных при использовании метода transferTo() :

Рисунок 3. Копирование данных с помощью transferTo()

На рисунке 4 показаны переключения контекста при использовании метода transferTo():

Рисунок 4. Переключения контекста при использовании transferTo()

Этапы работы transferTo() , показанные в листинге 4 :

Метод transferTo() инициирует ставляет скопированиеться содержимогое файла в буфер чтения с помощью механизма DMA. Затем данные копируются ядром в буфер ядра, связанный с выходнымсокетом.
В ходе третьего копирования механизм DMA передает данные из буфера ядра в механизм протокола.

Здесь заметно улучшение: мы уменьшили число контекстных переключений с четырех до двух и уменьшили число копирований данных с четырех до трех(при этом только одно из них использует процессор). Но цель пока ещё недостигнута. Мы можем дальше уменьшить дублирование данных ядром, если используемая плата сетевого интерфейса поддерживает операции сбора. В ядрах Linux 2.4 и более новых дескриптор буфера сокета был модифицирован в соответствии с этим требованием. Этот метод не только уменьшает число множественных переключений контекста,но и избавляет от повторного копирования данных, использующего процессор. С пользовательской стороны все остается неизменным, но внутренняя механика меняется:

При вызове метода transferTo() содержимое файла копируется в буфер ядра с помощью механизма DMA.
Данные в буфер сокета не копируются. Вместо этого в буфер сокета отправляются только дескрипторы с информацией о местоположении и размере данных. Механизм DMA передает данные прямо из буфера ядра в механизм протокола, избавляя, таким образом, от последнего копирования с участием процессора.

На рисунке 5 показано копирование данных с помощью transferTo() с операцией сбора:

Рисунок 5. Копирование данных с применением transferTo() и операций сбора

Создание файлового сервера

Теперь давайте применим zero copy на практике, используя вышеупомянутый пример передачи файла между клиентом и сервером. TraditionalClient.java и TraditionalServer.java основаны на традиционной семантике копирования, использующейFile.read() и Socket.send(). TraditionalServer.java—программа-сервер, которая слушает определенный порт в ожидании подсоединения клиента и затем считывает 4K байт данных за один раз из сокета. TraditionalClient.java подключается к серверу, читает (используяFile.read()) ) 4K байт данных из файла и отправляет (используяsocket.send()) содержимое на сервер через сокет.

Аналогично, TransferToServer.java и TransferToClient.java выполняют те же функции, только используют метод transferTo() (и в свою очередь системный вызов sendfile() ), чтобы передать файл от сервера клиенту.

Сравнение производительности

Мы запускали программу-пример в системе Linux с ядром 2.6 и измерили скорость выполнения в миллисекундах как для традиционного метода, так идля метода transferTo() для различных размеров файла. Результаты показаны в таблице 1:

Таблица 1. Сравнение производительности: традиционный метод против zero copy

Размер файла	Обычная передача файла (мс)	transferTo (мс)
7МБ	156	45
21МБ	337	128
63МБ	843	387
98МБ	1320	617
200МБ	2124	1150
350МБ	3631	1762
700МБ	13498	4422
1ГБ	18399	8537

Как видим, API transferTo() уменьшает время приблизительно на 65% в сравнении с традиционным методом. Это потенциал для значительного увеличения производительности приложений, которые совершают большую работу с копированием данных из одного канала ввода-вывода в другой, в частности, Web-серверов.

Мы продемонстрировали преимущества использования transferTo()по сравнению с чтением из одного канала и записью в другой. Промежуточное буферное копирование — даже скрытое в ядре — может быть заметно ресурсоёмким. Технология zero-copy обеспечивает существенное улучшение производительности в приложениях, связанных с интенсивным копированием данных между каналами.