Как распределенные Postgres решают проблему высокой доступности Cloud

PGEDGE спонсировал этот пост.

Доступность заявки и время простоя — это проблемы, с которыми сталкивается ни одна организация, которую не может позволить себе упускать из виду.

В то время как жесткие числа варьируются в зависимости от использования, общая картина ясна: время простоя применения почти всегда переводится как потерянные деньги. Согласно исследованию Oxford Economics, незапланированное простоя затраты на глобальные 2000 миллиардов долларов в год, что является среднего годового потери в размере 200 миллионов долларов сша на компанию.

И это только начало. В соответствии с новым опросом, проведенным PGGEGE по PostgresQL в критически важных приложениях, когда предприятия превышают максимальные цели простоя, 56% опыта работы в сфере бизнеса, 49% видят увеличение объема поддержки или жалобы клиентов, 47% требуют экстренного технического восстановления и 33% теряют выручку или видят отсроченные транзакции.

Риск еще больше для организаций с высокими ставками, таких как тех, которые предоставляют здравоохранение, государственные или финансовые услуги, такие как управление инвестициями, пояснил Филипп Меррик, соучредитель и генеральный директор Pggedge.

«Если торговая платформа, которую вы используете для управления вашими акциями, снижается даже в течение пяти минут, это может привести к миллионам долларов убытков», — сказал Меррик.

Конечно, не каждый отключение обязательно является причиной для паники.

«Некоторые приложения, некоторые предприятия … возможно, могут переносить полчаса или час простоя», — отметил Меррик. «Но тогда вы должны спросить себя:« Учитывая, как я зачислил свои приложения, и, учитывая, где они работают, каков мой вероятный риск простоя? »» »

И вот где многие компании сталкиваются с проблемами.

Почему открытый исходный код нуждается в стратегии высокой доступности

За последние два десятилетия Merrick заметил развивающиеся морские изменения в корпоративном программном обеспечении.

Сначала был постоянный переход от помещений к облачной инфраструктуре. В то же время предприятия все чаще полагаются на программное обеспечение с открытым исходным кодом, которое Merrick объясняет возможностью больших инноваций и снижением затрат при выборе открытого исходного кода, а не на устаревших поставщиках.

Переход к облачной инфраструктуре и программному обеспечению с открытым исходным кодом представляет собой резкое изменение в отрасли, но это был постепенный, почти незаметный переход.

«Раннее использование облака было буквально разработчиками, поставляемыми в облачных подписках на свою кредитную карту», ​​- вспоминает он. «А потом, прежде чем вы это узнаете, у вас действительно есть несколько важных приложений, которые работают в облаке».

Аналогичная тенденция разыгрывалась с программным обеспечением с открытым исходным кодом. И когда компании начали использовать больше компонентов с открытым исходным кодом, они в конечном итоге поняли, что полагаются на программное обеспечение с открытым исходным кодом для многих важных приложений, но у них не было стратегии для высокой доступности.

Риски времени простоя одного облачного региона

«Если вы думаете о компаниях, которые полагаются на облачных провайдеров, — отметил Меррик, — ваше приложение обычно будет проживать только в одном регионе».

Это может показаться неприятным, но если учесть, что облачные провайдеры не являются незнакомцами для крупных, многожильных перебоев, это пугающая — или, по крайней мере, беспокойство — перспектива.

При рассмотрении 212 лиц, принимающих решения в организациях, с 500+ сотрудниками по финансовым услугам, программным обеспечениям, вычислительным и производству, PGEDGE обнаружил, что 21% респондентов испытали сбой облачного региона в прошлом году.

Они, безусловно, сделали заголовки. Отключение AWS Tokyo в 2021 году, отключение Google Google 2023 года и отключение AWS US-EAST-1 2023 года-это лишь некоторые из них, которые приходят на ум. Опять же, Google Cloud увидел отключение в июне этого года, услуги за закрытием в течение нескольких часов с волновыми эффектами для поставщиков нижестоящих поставщиков, включая Cloudflare и OpenAI.

Поэтому неудивительно, что каждый четвертый ИТ -лидеры сказали Splunk, по их мнению, перебои в инфраструктуре являются наиболее вероятным источником нарушений их организации.

К сожалению, организации могут ожидать дальнейших отключений, просто «из -за того, как облачные провайдеры заархивировали свои облака. По словам Меррика, по умолчанию ваше приложение — только в одном регионе».

В этом заключается опасность. Когда организации связывают приложения к одному региону, они вводят одну точку отказа, доступность MAR и создают риски для отключений и дорогостоящего простоя.

«Многие предприятия, возможно, не задумывались об этом или действительно не определили количественную оценку того, каковы эти риски для их бизнеса на самом деле», — сказал Меррик. «Высокая доступность является проблемой для любого бизнеса, который имеет значительную стоимость для их критических приложений, находящихся внизу. Каждый бизнес должен понимать и количественно определить то, что будет означать для них простоя, а затем действовать соответствующим образом».

Высокая доступность: растущая обеспокоенность

Конечно, проблемы простоя и доступности не являются чем -то новым », но это то, на что все становятся все более сосредоточенными», — подчеркнул Меррик.

Это в значительной степени результат потребительских пользователей, которые теперь осуждают даже малейшую задержку при прокрутке Instagram или других общих приложениях. Этот спрос на скорость превратился в почти нулевую толерантность к задержкам или временному времени в разных доменах: «Мы хотим, чтобы приложения, на которые мы всегда находимся, всегда были доступны»,-подчеркнул Merrick.

В то время как ожидания конечного пользователя в последние годы выросли, многие отрасли уже были настроены на важность высокой доступности.

«В некоторых отраслях — здравоохранение, финансовые услуги, некоторые государственные услуги — они просто не могут быть недовольны», — добавил Меррик. «И это всегда было так».

Тем не менее, это не означает, что у этих отраслей была эффективная стратегия для минимизации времени простоя и обеспечения высокой доступности.

Многие организации — например, банки — продолжают полагаться на запланированное техническое обслуживание, снимая системы в автономном режиме в течение нескольких часов в якобы неудобные времена, например, от 2 до 5 часов утра.

Но Меррик утверждал, что «запланированное обслуживание должно быть в прошлом».

Во -первых, все более глобальные сообщества означают, что «время от времени» больше не существует. Ожидается, что они предоставляют критически важные или более коммерческие услуги, предприятия будут работать и бегать по часам.

«Вы должны иметь возможность выполнять техническое обслуживание — модернизировать программное обеспечение, применяя новейшие исправления безопасности — без необходимости быть снятым приложением для поддержки обслуживания», — сказал Меррик.

Реальности такова, что многих предприятий просто нет, хотя 79% респондентов в недавнем опросе PGEDGE говорят, что они оценивают или рассматривают распределенные или специально построенные продукты с высокой доступностью для среды PostgreSQL.

Задача сохранения данных синхронизирована в разных регионах

Независимо от того, занимаются ли организации с физическим центром обработки данных, который они контролируют, или облачный регион, принадлежащий облачному поставщику, было постоянной проблемой, чтобы держать данные в синхронизации в разных регионах, особенно с Postgres, широко принятой реляционной базой данных для транзакционных рабочих нагрузок, которые изначально не были разработаны для распределенных развертываний.

Как объяснил Меррик: «Вы не можете сделать мгновенное отказоустойчивость из одного региона в другую, если база данных в обоих местах не будет постоянно синхронизироваться».

То есть, если вы не выберете распределенную архитектуру мультимастера, которая позволяет нескольким узлам, каждый из которых способен как чтение, так и писать, оставаться непрерывно синхронизированными в разных регионах. Таким образом, если один узел или даже весь регион остается в автономном режиме, приложение может продолжать работать с минимальными нарушениями.

Если это так, то что стоит за постоянной зависимостью от традиционных, однорегионных подходов?

Одним из колебаний была воспринимаемая сложность архитектуры мультимастера. «В заблуждение заключается в том, что это будет слишком сложно», — сказал Меррик.

То же самое касается стратегии мультирегиона, где он признал, что «иметь возможность архитектуры для Multiregion на самом деле сложно, если у вас нет распределенной базы данных».

Тем не менее, несмотря на оговорки о сложности, это не означает, что это не было на радарах компаний. Например, в недавнем опросе PGEDGE почти половина (47%) организаций, которые развертывают приложения в нескольких облачных регионах, заявили, что они заинтересованы в репликации мультимастера.

«Я знаю о нескольких компьютерах, у которых есть многореагионный отказ в качестве предмета в дорожной карте продукта, но они просто подумали, что это будет так тяжело», — вспоминает Меррик, — так что он томился как предмет, который был очень важен, но всегда ниже на дорожной карте ».

Меррик считает, что это не должно быть так — по крайней мере, больше.

Как pggege делает Multimaster Postgres осуществимым

Postgres — это мощная база данных, широко распространенная за ее надежность и гибкость, но она не поставляется с распределенной опцией для высокой доступности из коробки.

Это то, что Pgedge стремится решить с помощью полностью открытого исходного кода, полностью Postgres Software.

PGEDGE обеспечивает распределенную архитектуру Postgres, позволяющая мультимастеру, мультирегионному развертыванию для обеспечения высокой доступности и низкой задержки и устранить дорогостоящие риски отключений в облаке.

Меррик сказал, что это стало возможным отчасти благодаря способности Pgedge реплицироваться между узлами, где изменения, внесенные в одном месте, автоматически синхронизируются с другими в режиме реального времени.

Примечательно, что эта репликация не требует ручного вмешательства, которое Меррик назвал частой задачей между инженерными группами.

«Некоторые из людей, с которыми мы работаем, пытались использовать собственную логическую репликацию Postgres в прошлом, и это требовало довольно много ручного вмешательства».

Это не тот случай с Pggege, сказал он.

Но как насчет возможности двух авторов в двух разных местах, пытающихся одновременно обновить одни и те же данные?

Именно тогда в игре вступает разрешение конфликтов, где Pggege разрешает конфликты через набор предопределенных правил — короче говоря, вторая запись выигрывает. В случаях, когда это правило не может применяться, PGEDGE использует «избегание конфликтов», чтобы предотвратить операции, которые, скорее всего, приведут к конфликту.

«Между разрешением конфликтов и предотвращением конфликтов, никакого ручного вмешательства не требуется», — пояснил он, победа для команд, любопытных о распределенной архитектуре Multimaster Postgres, но сомнительно относится к труду, необходимой для переключения.

Будущее распределенной архитектуры мультимастера

При поддержке мультимастера, мультирегионов развертываний и встроенного разрешения и предотвращения конфликтов PGEDGE стремится расширить возможности организаций с последовательной, высокой доступностью для более плавного пользовательского опыта и менее разрушительного времени простоя.

Одна глобальная фирма по управлению инвестициями уже видит преимущества.

Основная многочисленные географии, классы активов и временные рамки с более чем 1000 сотрудников и активами в размере 20 миллиардов долларов, фирме нуждалась в высокой доступности для подкрепления своей торговой платформы с большим объемом. С помощью PGEDGE он получает решение с открытым исходным кодом, полностью основываясь на стандартных Postgres, которое обеспечивает высокодоступность и возможности логической репликации для обновлений простоя в почти нулевом, улучшая производительность и устранение единой точки отказа-все более резкая проблема, поскольку сдача облаков продолжает угрожать непрерывности обслуживания.

Глядя за пределы финансов, Меррик видит растущую потребность в распределенной архитектуре мультимастера в разных отраслях.

После нескольких лет экспериментов с приложениями ИИ, «компании находятся в процессе того, чтобы фактически раскатывать их и сделать их доступными для сотрудников и клиентов, иногда на глобальной основе», — заметил он. Понимание этого сдвига потребует новых стратегий для обеспечения всегда доступного, всегда доступного доступа к данным, низкой задержки и минимального простоя.

«И оказывается, что PGEDGE действительно отлично подходит для приложений искусственного интеллекта, которые должны быть доступны на глобальном уровне», — добавил он.

Узнайте больше о том, как Multimaster Distributed Postgres решает высокую доступность и проблемы с низкой задержкой для обеспечения глобальных приложений.

PGEDGE Distributed PostgreSQL облегчает развертывание высокой доступности, приложения с низкой задержкой распределенной базы данных. Только PGEDGE-это мульти-мастер, мультирегион и мультифуд, в то время как полностью основан на стандартных Postgres и на 100% открытый. Узнайте больше последних из Pggege Trending Stories youtube.com/thenewstack Tech Moving быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *