Page 3 of 3

Re: Улучшить BACKUP

Posted: Tue Oct 16, 2018 2:41 pm
by demian
еще раз.
Дедупликация (также дедубликация; от лат. deduplicatio — устранение дубликатов) — специализированный метод сжатия массива данных, использующий в качестве алгоритма сжатия исключение дублирующих копий повторяющихся данных. Данный метод обычно используется для оптимизации использования дискового пространства систем хранения данных, однако может применяться и при сетевом обмене данных для сокращения объема передаваемой информации.

сетевой обмен в расчет можно не брать, т.к. данные передаются в сжатом виде, при инкрементном бакапе в принципе не играет роли. вывод дедубликация имеет смысл исключительно на стороне хранилища.
Ansy wrote:
Tue Oct 16, 2018 9:44 am
+ Есть на гитхабе, не намного сложнее.
+ Можно вообще скачать-залить один бинарник и не париться с репами, новичкам и клиентам особенно.
+ В свежих версиях добавили команду self-update -- само скачивается, проверяет GPG и обновляет бинарник.
как осуществлялся контроль кода(нет ли закладок скрытых закладок), как собирались собирал бинарники, как осуществлялся контроль, нет ли закладок
в хранилищах гитхаба не единожды наблюдались трояны и руткиты, а говорить о том что гитхабом рулит корпорация зла подконтрольная спецслужбам имхо никому не надо.
Ansy wrote:
Tue Oct 16, 2018 9:44 am
+ Только упрощает переносимость -- не надо помнить, где что раскидано и форматы файлов.
+ Из конфигурации надо только переменные среды, и можно наскриптить ключи командной строки.
+ Файлы конфигурации тоже можно использовать (пароли те же, списки исключений), в ключах указать где искать.
скопировать на новый сервер одну папку со всеми конфигурациями в пользователе для бакапов надо очень много помнить. и пользователь в этом сильно запутается намного больше, чем в том что ему надо наколотить какие то ему непонятные команды через консоль.
и набрать yum install duply(в результате чего поставиться весь необходимый софт покрывающий 98% всевозможных хранилищ) намного сложнее, чем искать по разрозненным сайтам бинарники(не думая о том, что написано выше)
Ansy wrote:
Tue Oct 16, 2018 9:44 am
+ А зря. Удачный ход rclone перекрывает даже больше вариантов хранилищ, чем в "нативном" функционале.
+ Ставится rclone столь же просто, и конфигурируется менюшкой -- новичкам меньше шансов накосячить.
+ Кроме платных сервисов есть толпа других, в т.ч. бесплатных -- тот же Яндекс.Диск шустро жужжит. Далеко не у всех есть возможность пользоваться забугорными платными сервисами.
сдается мне вы не понимаете что такое облачное хранилище, системы хранения и резервирования.
О какой менюшке вы говорите, менющки остались в форточках от гейТСа. Да и тема про расширение функционала бакапа в данной панели управления.
Яндекс диск если вы не в курсе работает через webdav, который поддерживается индейцем и nginx практически из коробки, при желании конфигурируется за пару минут.
И еще я надеюсь Вы внимательно читали лицензионное соглашение по продуктам Яндекса - 98% бесплатны для домашнего не коммерческого использования. Наблюдал актах проверки не лицензионного ПО компаний, не единожды, продукты: Punto Switcher, Yandex.Disk, Yandex Browser.
EULA очень коварная штука когда ее читаешь или нет - либо получишь 100к баксов, либо штраф за использование.
Использование Yandex.Disk в качестве средства хранения бакапов коммерческого ресурса, классифицируется как коммерческое использование. Опять же хранение бакапов содержащих личные данные пользователей на ресурсах третьей стороны без заключения договора на хранение - КоАП РФ Статья 13.11
Ansy wrote:
Tue Oct 16, 2018 9:44 am
Вот именно что велосипед.
Различия в скорости обработки, объёмах перекачиваемого трафика, способах хранения, организации дедупликации, удобстве применения restic (borgbackup) vs duply (duplicity) легко нагуглить.
Особенно в применении к современным облачным хранилищам.
скорость обработки на идентичном оборудовании одна скорость одного ядра CPU, занятие больше одного ядра не приемлимо для продакшен сервера 24x7
объем перекачки смотрим выше.
способ хранения учитывать бред. используется удаленное хранилище - черный ящик.
об удобстве применения читаем выше. установки - я помолчу.

про велосипед (первый релиз можно не учитывать, не найденных багов не бывает) :
duply (duplicity) - v0.1.1 (2002/09/16) - 20 дней после первого релиза.
restic - v0.2.0 (2016-07-30) - спустя 10 месяцев после первого релиза

Выбор за читающими тему. Я все сказал.