Контакты
Подписка
МЕНЮ
Контакты
Подписка

Современные технологии повышения скорости и надежности передачи данных через глобальные сети

В рубрику "All-over-IP" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Современные технологииповышения скорости и надежности передачи данных через глобальные сети

С 2011 по 2014 г. независимое аналитическое агентство Vanson Bourne провело опрос среди топ-менеджмента более 1500 различных крупных организаций о том, какие факторы являются наиболее важными в процессе передачи данных как внутри предприятия, так и при взаимодействии с внешними контрагентами. Среди возможных вариантов ответов были такие, как безопасность, скорость передачи, объем передаваемой информации и сложность самой передачи
Георгий Забадаев
Руководитель направления компании IBM Aspera в России и СНГ

В результате проведенного опроса с очевидным отрывом лидировал показатель безопасности, однако очевидным явился тот факт, что скорость передачи данных демонстрирует наибольший рост от года к году.

Современные тренды

Повышение безопасности и скорости передаваемой информации соответствует всем трендам, которые наблюдаются в области передачи данных.

1. Распространение Big Data:

  • 90% сегодняшних данных являются наборами файлов или неструктурированными массивами, которые не имеют явной связи друг с другом;
  • вариативность размеров от килобайт до терабайт;
  • повсеместный рост объемов.

2. Рост и вариативность IP-сетей:

  • различная ширина каналов (от Кбит/c до десятков Гбит/c);
  • увеличение пропускной способности и параллельное уменьшение стоимости;
  • разнообразие сетей передачи данных (наземные, спутниковые, IP-Based и беспроводные);
  • вариативность условий – влияние на производительности при изменении расстояния передачи.

3. Глобализация и аутсорсинг:

  • географическое распределение команд (особенно актуально для России, где часто нескольким командам из разных городов нужно ежедневно обмениваться колоссальным количеством данных между собой, чтобы завершить проект);
  • при увеличении расстояния происходит деградация сети, негативно влияющая на передачу контента;
  • современные решения по ускорению TCP не рассчитаны на передачу Big Data и репликацию.

4. Развитие облачных технологий:

  • широкий выбор (IBM SoftLayer, AWS, Microsoft Azure, OpenStack, Google, HDS);
  • переход компаний из нишевых в масс-маркет – Netflix (транскодирование), MTV (глобальная дистрибуция видео), BGI (корпорация из Китая по геномному секвенированию), Sony Media Cloud Services (производственные процессы).

Фундаментальные сложности

Вышеуказанные тренды сопряжены с определенными сложностями, с которыми можно столкнуться при передаче данных.

  1. Размер и количество информации. Серьезные затруднения с надежной передачей, обменом и синхронизацией больших файлов и массивов данных по WAN.
  2. Скорость. Ограничение пропускной способности, количества потоков и скорости передачи данных.
  3. Расстояние. Перегруженные публичные каналы передачи данных, неизбежная деградация производительности при увеличении расстояния.
  4. Контроль. Необходимость в увеличении безопасности и прозрачности контроля при передаче файлов и массивов данных как сотрудникам и бизнес-партнерам, так и конечным потребителям, оптимизация без увеличения трафика и нагрузки на сеть.

Корнем всех проблем при передаче данных является использование традиционных подходов, от которого "страдают" практически все индустрии. Большой объем данных и их размер создают проблемы во многих отраслях промышленности:

  • телеком-СМИ и развлечения. Необходимо эффективно распространять большие объемы медиаданных по растущей дистрибуционной сети;
  • биологические науки. Трудности при распространении и доступе к постоянно обновляющимся комплектам Big Data (например, геномная информация, цифровые снимки);
  • производство. Существенные временные затраты в рамках рабочих процессов, связанные с обменом проектными CAD- и дизайн-файлами между инженерами-проектировщиками, внешними подрядчиками и непосредственным заказчиком;
  • разработка ИТ-приложений. Проблемы при поддержке территориально распределенной сети разработки, тестирования и обеспечения качества;
  • нефтегазовая отрасль. Необходимо передавать огромные объемы данных, полученных при геологической разведке месторождений. До сих пор зачастую для доставки данных, полученных при бурении скважин, задействуется "специально обученный" человек, который забирает жесткий диск и на вертолете летит на континент, чтобы передать эти данные на анализ, что существенно замедляет рабочий процесс;
  • финансовые услуги. Требуется постоянная синхронизация большого объема данных между географически удаленными точками, ежедневная отправка отчетности в регулирующие органы со сканами документов.

Даже обычные пользователи ежедневно сталкиваются с данными трудностями, когда, например, хотят скачать файл с удаленного файлового обменника или FTP.

Недостатки TCP и традиционных технологий

Давайте разберемся, в чем проблема традиционных технологий. На рис. 1 представлена взаимозависимость скорости передачи протоколов, использующих на транспортном уровне протокол TCP, и таких параметров, как время приема-передачи (Round-Trip Time) и процент потери пакетов. Очевидно, что чем дальше друг друга расположены источник и приемник данных, тем медленнее будет передаваться информация. К сожалению, мы не можем одним проводом обернуть Землю, поэтому необходимы пограничные маршрутизаторы и другие промежуточные точки, напрямую влияющие на производительность передачи данных.


Дело в том, что протокол TCP был спроектирован в 1973 г.: перед учеными поставили задачу разработать протокол, который сможет перенести ядерный удар. Требовалось создать протокол, который смог бы безопасно передавать данные. Поэтому при создании TCP основные усилия были направлены на создание механизма именно надежной, а не скоростной передачи. В те годы не было ни мобильных, ни спутниковых сетей, а единственный трансатлантический канал из США в Европу имел скорость 64 Кбит/с, что показывает состояние технологии на тот период. TCP был разработан так, что скорость передачи обратно пропорциональна расстоянию между конечными точками. Кроме того, в случае потери пакетов TCP считает, что канал перегружен, и самостоятельно уменьшает скорость передачи. Производительность TCP снижается с ростом расстояния передачи и из-за низкого качества сети. Чем больше расстояние, тем больше задержка, и тем ниже скорость передачи. Задержку обычно измеряют величиной Round-Trip Time (RTT). Это время, которое потребуется на отправку пакета и получение подтверждения от получателя.

Задержка возникает из-за законов физики, ограничивающих скорость света или электромагнитного сигнала. Например, задержка при передаче по спутниковым сетям может достигать 800 мс. Более того, при передаче на большие расстояния по глобальной сети Интернет (WAN) пакет должен пройти через большое количество маршрутизаторов, прежде чем его получит адресат. Маршрутизатору требуется время на обработку пакета, а если он настроен неправильно или перегружен, может произойти потеря пакета. Чем выше количество потерянных пакетов, тем более затратной по времени становится передача. TCP, безусловно, имеет хорошую производительность в локальных сетях (LAN) относительно доступной пропускной способности сети, но при этом чем больше RTT и потеря пакетов, тем ниже будет производительность передачи.

Производительность протокола TCP также не растет с увеличением канала. Другими словами, если у вас медленная передача на канале в 10 Мбит/c, нет никаких гарантий, что при увеличении канала до 1 Гбит/c скорость вырастет. Конечно, если необходимо передать файл на соседнюю улицу, рост производительности будет заметен, но если стоит задача передать данные на большие расстояния, то увеличение канала до 1 Гбит/c мало чем поможет.

Альтернативные технологии передачи данных

Разумеется, TCP многократно пытались улучшать. Одну из последних реализаций подобного протокола представила корпорация Google, которая переделала механизм работы с окном (изменение размеров окна каждый раз, когда передаются пакеты), но получила повышение производительности лишь на 30% по сравнению с обычными традиционными протоколами, основанными на TCP.

Самой известной альтернативой TCP стали протоколы на базе UDP. Чистый UDP сам по себе – замечательный протокол передачи, однако не до конца эффективный, а самое главное – не предоставляющий гарантии доставки передаваемой информации. Все мы сталкивались с периодическими скачками изображения и артефактами при просмотре трансляции по Интернету – это происходит при потере некоторого количества пакетов при потоковой передаче.

Другими альтернативными подходами к оптимизации передачи данных являются технологии компрессии (Data Compression) и кеширования (Data Caching). Но их нельзя назвать действительно ускоряющими передачу, они ее только оптимизируют. Кеширование можно применять далеко не всегда – когда имеется большое количество одновременных потоков и при этом передаются разные данные, кеширование становится абсолютно бесполезным. Что касается компрессии, то известно, что сейчас очень много информации передается уже в сжатом виде, и никакого явного преимущества мы не получим.

Высокоскоростные протоколы передачи данных

Современные технологии способны повысить скорость передачи, в частности модифицированные UDP-протоколы с дополнительным уровнем надежности на прикладном уровне. Самыми популярными среди них являются Aspera FASP, File Catalyst и Signiant.

Идея этих протоколов заключается в том, чтобы свести к нулю два фактора, которые сильнее всего влияют на деградацию производительности при передаче данных, а именно Round-Trip Time и Packet Loss. Это было достигнуто за счет совершенно нового подхода к тому, как передаются данные, а именно – использования механизма подтверждения. Он заключается в том, что если какой-то пакет теряется при передаче, не нужно ждать подтверждение о том, получен он или потерян, можно приступать сразу к передаче следующего пакета, а потерянный пересылается в процессе, как только появляется некое окно. За счет этого мы можем высчитать теоретическую максимальную скорость, с которой передаются пакеты.

Важнейшими параметрами таких протоколов являются:

  • настраиваемая политика использования канала, когда можно подстраиваться под весь остальной трафик (чтобы не забить весь канал при передаче большого массива);
  • задание лимитов вручную для каждого потока (потоки строго определенной ширины, чтобы они друг с другом не конкурировали);
  • приоритизация и распределение потоков передачи "на лету".

Для таких протоколов характерны высокий уровень безопасности, двухфакторная авторизация при возможности передачи, шифрование, автоматическое восстановление передачи при сбое (при тотальном обрыве на сети), а также масштабирование, управление и мониторинг. То есть чем выше ширина канала, тем быстрее нужно передавать данные, отслеживать и мониторить каждый отдельный поток передачи и выдавать по нему детальный итог. Все это достигается благодаря программному обеспечению – наработкам по ускорению, которые ведутся на прикладном уровне. Замечательные команды разработчиков рассчитывают эти алгоритмы и методы ускорения данных или обхода стандартных ограничений, которые накладывают протоколы.

Очень важным фактором для использования таких протоколов является полная независимость от расстояния передачи и размера, количества, формата и типа файлов (шифрованные, компрессионные и др.). Это дает возможность использовать модифицированные UDP-протоколы в совершенно любой топологии (лучевая, кольцевая, точка-точка и т.д.). Фактически надо указать только на источник, откуда нужно забирать данные (файловая система или поток). Если передавать миллион файлов по 1 Мбайт или один файл весом в 1 Тбайт, скорость может меняться, но она будет относительно сравнимой за счет алгоритмов оптимизации передаваемых блоков данных, которые работают на прикладном уровне, а синхронизировать эти процессы можно с помощью приоритизации.

Полностью соответствует трендам и тот факт, что эти технологии можно использовать в локальном дата-центре, в облаке и в гибридном режиме, так как все больше и больше компаний задумываются о том, чтобы часть рабочих нагрузок переносить в облако.

Техническая реализация

Решение заключается в установке специализированного ПО или скачивании определенного набора библиотек, при работе в клиентском режиме. Для этого достаточно просто зайти на портал, на котором находится средство по ускорению данных. Оно проверяет, стоят ли на компьютере определенные библиотеки, необходимые для инициации и начала трансфера. Если он их не находит, то автоматически предлагает поставить плагин на браузер. Плагин устанавливается, браузер перезапускается и все – можно использовать новые протоколы. Многие организации в России уже успешно применяют данное решение.

Результаты меняются от случая к случаю и зависят от условий передачи: можно достичь ускорения в 2, 10, 30 и даже в тысячи раз. Например, при тестировании видеопотока из Москвы во Владивосток ускорение составило порядка 30–40 раз.

Задержка передачи остается прежней – если Roundtrip Time был 200 мс, он таким и останется, но данные будут передаваться быстрее. Это происходит за счет программной обработки на прикладном уровне и оптимизации самой схемы передачи данных.

Распространенные сценарии использования

К распространенным сценариям применения протоколов по ускорению передачи данных относятся практически все, с которыми можно столкнуться при ежедневной работе с файлами.

  • Инжестирование/транспорт. Перемещение массивов данных любого размера и количества каждый день на высокой скорости для сотрудников и партнеров, используя стандартные IP-сети вместо того, чтобы использовать жесткие диски или строить дорогостоящие аппаратные решения.
  • Дистрибуция. Быстрая передача информации разным получателям, где низкая пропускная способность вызывает длительный перенос. Улучшение или замена дорогостоящих систем распределения контента, которые перемещают и хранят дублирующие файлы на пограничных серверах
  • Передача и обмен файлами. Обмен и взаимодействие при помощи стандартной структуры папок, с возможностью использования как в ДЦ, так и в облаке. Безопасная отправка и получение файлов и папок любого размера пользователями где угодно, используя простой Dropbox-Like-интерфейс с ПК, ноутбука или мобильного устройства.
  • Копирование и синхронизация. Передача миллионов файлов и массивов данных между разными площадками и инфраструктурами на высокой скорости, особенно актуально при репликации дата-центров.
  • Потоковая передача данных. Побайтная передача контента от провайдера к конечному пользователю, при котором данные находятся на удаленном сервере с возможностью получения доступа в реальном времени к файлу прямо на лету. В условиях глобализации и увеличения объема передаваемой информации прямые трансляции, которые ведутся с другого континента, должны вестись без обрыва, а это достаточно большой челлендж при передаче потока данных.

Индустриальные примеры внедрений

Приведем примеры компаний, которые уже успешно используют протоколы по ускорению.

  • Bank of America существенно оптимизирует документооборот.

Результаты: сокращение времени передачи в 42 раза, сокращение затрат на сетевую ИТ-инфраструктуру, значительное увеличение операционной эффективности.

  • Universal Pictures оптимизирует и ускоряет совместную работу. Среди задач компаний такого уровня можно отметить сложные процессы постобработки (затрагивающие много участников как внутри, так и вовне студии), совместную обработку большого количества медиа контента высокого разрешения по всему миру, длительную установку и высокие требования к тренингу для каждого проекта, высокие требования к безопасности и аудиту для защиты критичных I P.

Результаты: сокращение времени ряда процессов с 2–3 недель до 2–3 часов.

  • Jabil оптимизирует рабочие процессы и ускоряет обмен дизайн-файлами между инженерами, вендорами и заказчиками. Передача больших дизайн- и CAD-файлов, документации через глобальные сети существенно сказывалась на сроках производства продукта.

Результаты: ускорение процесса работы и выведения продукта на рынок. l Leica Biosystems внедряет высокоскоростной протокол в собственное решение по передаче снимков пациентов. Это позволило решить задачу быстрой передачи оцифрованных снимков пациентов (которые могут легко превышать гигабайт памяти) как клиентам, так и медицинским специалистам для улучшения постановки диагнозов. Результаты: быстрая загрузка существенно сокращает время обработки и постановки диагноза, что позволяет значительно улучшить диагностику и уход за пациентами.

Как определить потребность в решении?

Как понять, нужно ли в каком-либо из рабочих процессов использовать высокоскоростные протоколы передачи данных? В этом помогут ответы на шесть вопросов:

  1. Передаете ли вы данные большого размера или большое количество файлов?
  2. Нужно ли вам передавать данные на большие расстояния или по плохим каналам?
  3. Критично ли для вас время передачи файлов? Каковы будут последствия несвоевременной передачи?
  4. Нужна ли вам автоматизация передачи файлов?
  5. Сталкиваетесь ли вы c ограничениями при работе с файлами и вложениями в Microsoft Outlook или MS SharePoint?
  6. Есть ли у вас потребность в корпоративном или внешнем Dropbpx/FTP?

Все эти задачи можно решить с помощью современных средств программного обеспечения по ускорению и передаче передаваемых данных и файлов.

Опубликовано: Журнал "Системы безопасности" #1, 2018
Посещений: 10639

  Автор

Георгий Забадаев

Георгий Забадаев

Руководитель направления компании IBM Aspera в России и СНГ

Всего статей:  1

В рубрику "All-over-IP" | К списку рубрик  |  К списку авторов  |  К списку публикаций