PGEDGE спонсировал этот пост.
Доступность заявки и время простоя — это проблемы, с которыми сталкивается ни одна организация, которую не может позволить себе упускать из виду.
В то время как жесткие числа варьируются в зависимости от использования, общая картина ясна: время простоя применения почти всегда переводится как потерянные деньги. Согласно исследованию Oxford Economics, незапланированное простоя затраты на глобальные 2000 миллиардов долларов в год, что является среднего годового потери в размере 200 миллионов долларов сша на компанию.
И это только начало. В соответствии с новым опросом, проведенным PGGEGE по PostgresQL в критически важных приложениях, когда предприятия превышают максимальные цели простоя, 56% опыта работы в сфере бизнеса, 49% видят увеличение объема поддержки или жалобы клиентов, 47% требуют экстренного технического восстановления и 33% теряют выручку или видят отсроченные транзакции.
Риск еще больше для организаций с высокими ставками, таких как тех, которые предоставляют здравоохранение, государственные или финансовые услуги, такие как управление инвестициями, пояснил Филипп Меррик, соучредитель и генеральный директор Pggedge.
«Если торговая платформа, которую вы используете для управления вашими акциями, снижается даже в течение пяти минут, это может привести к миллионам долларов убытков», — сказал Меррик.
Конечно, не каждый отключение обязательно является причиной для паники.
«Некоторые приложения, некоторые предприятия … возможно, могут переносить полчаса или час простоя», — отметил Меррик. «Но тогда вы должны спросить себя:« Учитывая, как я зачислил свои приложения, и, учитывая, где они работают, каков мой вероятный риск простоя? »» »
И вот где многие компании сталкиваются с проблемами.
Почему открытый исходный код нуждается в стратегии высокой доступности
За последние два десятилетия Merrick заметил развивающиеся морские изменения в корпоративном программном обеспечении.
Сначала был постоянный переход от помещений к облачной инфраструктуре. В то же время предприятия все чаще полагаются на программное обеспечение с открытым исходным кодом, которое Merrick объясняет возможностью больших инноваций и снижением затрат при выборе открытого исходного кода, а не на устаревших поставщиках.
Переход к облачной инфраструктуре и программному обеспечению с открытым исходным кодом представляет собой резкое изменение в отрасли, но это был постепенный, почти незаметный переход.
«Раннее использование облака было буквально разработчиками, поставляемыми в облачных подписках на свою кредитную карту», - вспоминает он. «А потом, прежде чем вы это узнаете, у вас действительно есть несколько важных приложений, которые работают в облаке».
Аналогичная тенденция разыгрывалась с программным обеспечением с открытым исходным кодом. И когда компании начали использовать больше компонентов с открытым исходным кодом, они в конечном итоге поняли, что полагаются на программное обеспечение с открытым исходным кодом для многих важных приложений, но у них не было стратегии для высокой доступности.
Риски времени простоя одного облачного региона
«Если вы думаете о компаниях, которые полагаются на облачных провайдеров, — отметил Меррик, — ваше приложение обычно будет проживать только в одном регионе».
Это может показаться неприятным, но если учесть, что облачные провайдеры не являются незнакомцами для крупных, многожильных перебоев, это пугающая — или, по крайней мере, беспокойство — перспектива.
При рассмотрении 212 лиц, принимающих решения в организациях, с 500+ сотрудниками по финансовым услугам, программным обеспечениям, вычислительным и производству, PGEDGE обнаружил, что 21% респондентов испытали сбой облачного региона в прошлом году.
Они, безусловно, сделали заголовки. Отключение AWS Tokyo в 2021 году, отключение Google Google 2023 года и отключение AWS US-EAST-1 2023 года-это лишь некоторые из них, которые приходят на ум. Опять же, Google Cloud увидел отключение в июне этого года, услуги за закрытием в течение нескольких часов с волновыми эффектами для поставщиков нижестоящих поставщиков, включая Cloudflare и OpenAI.
Поэтому неудивительно, что каждый четвертый ИТ -лидеры сказали Splunk, по их мнению, перебои в инфраструктуре являются наиболее вероятным источником нарушений их организации.
К сожалению, организации могут ожидать дальнейших отключений, просто «из -за того, как облачные провайдеры заархивировали свои облака. По словам Меррика, по умолчанию ваше приложение — только в одном регионе».
В этом заключается опасность. Когда организации связывают приложения к одному региону, они вводят одну точку отказа, доступность MAR и создают риски для отключений и дорогостоящего простоя.
«Многие предприятия, возможно, не задумывались об этом или действительно не определили количественную оценку того, каковы эти риски для их бизнеса на самом деле», — сказал Меррик. «Высокая доступность является проблемой для любого бизнеса, который имеет значительную стоимость для их критических приложений, находящихся внизу. Каждый бизнес должен понимать и количественно определить то, что будет означать для них простоя, а затем действовать соответствующим образом».
Высокая доступность: растущая обеспокоенность
Конечно, проблемы простоя и доступности не являются чем -то новым », но это то, на что все становятся все более сосредоточенными», — подчеркнул Меррик.
Это в значительной степени результат потребительских пользователей, которые теперь осуждают даже малейшую задержку при прокрутке Instagram или других общих приложениях. Этот спрос на скорость превратился в почти нулевую толерантность к задержкам или временному времени в разных доменах: «Мы хотим, чтобы приложения, на которые мы всегда находимся, всегда были доступны»,-подчеркнул Merrick.
В то время как ожидания конечного пользователя в последние годы выросли, многие отрасли уже были настроены на важность высокой доступности.
«В некоторых отраслях — здравоохранение, финансовые услуги, некоторые государственные услуги — они просто не могут быть недовольны», — добавил Меррик. «И это всегда было так».
Тем не менее, это не означает, что у этих отраслей была эффективная стратегия для минимизации времени простоя и обеспечения высокой доступности.
Многие организации — например, банки — продолжают полагаться на запланированное техническое обслуживание, снимая системы в автономном режиме в течение нескольких часов в якобы неудобные времена, например, от 2 до 5 часов утра.
Но Меррик утверждал, что «запланированное обслуживание должно быть в прошлом».
Во -первых, все более глобальные сообщества означают, что «время от времени» больше не существует. Ожидается, что они предоставляют критически важные или более коммерческие услуги, предприятия будут работать и бегать по часам.
«Вы должны иметь возможность выполнять техническое обслуживание — модернизировать программное обеспечение, применяя новейшие исправления безопасности — без необходимости быть снятым приложением для поддержки обслуживания», — сказал Меррик.
Реальности такова, что многих предприятий просто нет, хотя 79% респондентов в недавнем опросе PGEDGE говорят, что они оценивают или рассматривают распределенные или специально построенные продукты с высокой доступностью для среды PostgreSQL.
Задача сохранения данных синхронизирована в разных регионах
Независимо от того, занимаются ли организации с физическим центром обработки данных, который они контролируют, или облачный регион, принадлежащий облачному поставщику, было постоянной проблемой, чтобы держать данные в синхронизации в разных регионах, особенно с Postgres, широко принятой реляционной базой данных для транзакционных рабочих нагрузок, которые изначально не были разработаны для распределенных развертываний.
Как объяснил Меррик: «Вы не можете сделать мгновенное отказоустойчивость из одного региона в другую, если база данных в обоих местах не будет постоянно синхронизироваться».
То есть, если вы не выберете распределенную архитектуру мультимастера, которая позволяет нескольким узлам, каждый из которых способен как чтение, так и писать, оставаться непрерывно синхронизированными в разных регионах. Таким образом, если один узел или даже весь регион остается в автономном режиме, приложение может продолжать работать с минимальными нарушениями.
Если это так, то что стоит за постоянной зависимостью от традиционных, однорегионных подходов?
Одним из колебаний была воспринимаемая сложность архитектуры мультимастера. «В заблуждение заключается в том, что это будет слишком сложно», — сказал Меррик.
То же самое касается стратегии мультирегиона, где он признал, что «иметь возможность архитектуры для Multiregion на самом деле сложно, если у вас нет распределенной базы данных».
Тем не менее, несмотря на оговорки о сложности, это не означает, что это не было на радарах компаний. Например, в недавнем опросе PGEDGE почти половина (47%) организаций, которые развертывают приложения в нескольких облачных регионах, заявили, что они заинтересованы в репликации мультимастера.
«Я знаю о нескольких компьютерах, у которых есть многореагионный отказ в качестве предмета в дорожной карте продукта, но они просто подумали, что это будет так тяжело», — вспоминает Меррик, — так что он томился как предмет, который был очень важен, но всегда ниже на дорожной карте ».
Меррик считает, что это не должно быть так — по крайней мере, больше.
Как pggege делает Multimaster Postgres осуществимым
Postgres — это мощная база данных, широко распространенная за ее надежность и гибкость, но она не поставляется с распределенной опцией для высокой доступности из коробки.
Это то, что Pgedge стремится решить с помощью полностью открытого исходного кода, полностью Postgres Software.
PGEDGE обеспечивает распределенную архитектуру Postgres, позволяющая мультимастеру, мультирегионному развертыванию для обеспечения высокой доступности и низкой задержки и устранить дорогостоящие риски отключений в облаке.
Меррик сказал, что это стало возможным отчасти благодаря способности Pgedge реплицироваться между узлами, где изменения, внесенные в одном месте, автоматически синхронизируются с другими в режиме реального времени.
Примечательно, что эта репликация не требует ручного вмешательства, которое Меррик назвал частой задачей между инженерными группами.
«Некоторые из людей, с которыми мы работаем, пытались использовать собственную логическую репликацию Postgres в прошлом, и это требовало довольно много ручного вмешательства».
Это не тот случай с Pggege, сказал он.
Но как насчет возможности двух авторов в двух разных местах, пытающихся одновременно обновить одни и те же данные?
Именно тогда в игре вступает разрешение конфликтов, где Pggege разрешает конфликты через набор предопределенных правил — короче говоря, вторая запись выигрывает. В случаях, когда это правило не может применяться, PGEDGE использует «избегание конфликтов», чтобы предотвратить операции, которые, скорее всего, приведут к конфликту.
«Между разрешением конфликтов и предотвращением конфликтов, никакого ручного вмешательства не требуется», — пояснил он, победа для команд, любопытных о распределенной архитектуре Multimaster Postgres, но сомнительно относится к труду, необходимой для переключения.
Будущее распределенной архитектуры мультимастера
При поддержке мультимастера, мультирегионов развертываний и встроенного разрешения и предотвращения конфликтов PGEDGE стремится расширить возможности организаций с последовательной, высокой доступностью для более плавного пользовательского опыта и менее разрушительного времени простоя.
Одна глобальная фирма по управлению инвестициями уже видит преимущества.
Основная многочисленные географии, классы активов и временные рамки с более чем 1000 сотрудников и активами в размере 20 миллиардов долларов, фирме нуждалась в высокой доступности для подкрепления своей торговой платформы с большим объемом. С помощью PGEDGE он получает решение с открытым исходным кодом, полностью основываясь на стандартных Postgres, которое обеспечивает высокодоступность и возможности логической репликации для обновлений простоя в почти нулевом, улучшая производительность и устранение единой точки отказа-все более резкая проблема, поскольку сдача облаков продолжает угрожать непрерывности обслуживания.
Глядя за пределы финансов, Меррик видит растущую потребность в распределенной архитектуре мультимастера в разных отраслях.
После нескольких лет экспериментов с приложениями ИИ, «компании находятся в процессе того, чтобы фактически раскатывать их и сделать их доступными для сотрудников и клиентов, иногда на глобальной основе», — заметил он. Понимание этого сдвига потребует новых стратегий для обеспечения всегда доступного, всегда доступного доступа к данным, низкой задержки и минимального простоя.
«И оказывается, что PGEDGE действительно отлично подходит для приложений искусственного интеллекта, которые должны быть доступны на глобальном уровне», — добавил он.
Узнайте больше о том, как Multimaster Distributed Postgres решает высокую доступность и проблемы с низкой задержкой для обеспечения глобальных приложений.
PGEDGE Distributed PostgreSQL облегчает развертывание высокой доступности, приложения с низкой задержкой распределенной базы данных. Только PGEDGE-это мульти-мастер, мультирегион и мультифуд, в то время как полностью основан на стандартных Postgres и на 100% открытый. Узнайте больше последних из Pggege Trending Stories youtube.com/thenewstack Tech Moving быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом.