Я мог бы восстановить содержание файл с его контрольную сумму/хэш?

Позвольте'ы сказать, у меня есть видео файл, который разделяется на несколько частей. Каждая часть 2 мегабайт. У меня тоже есть список *вставить имя хэш здесь* для каждой части, а также на полный файл.

Теперь предположим, что я потерял/потеряла/кранты одну из этих штук.

Я мог бы получить потерял кусок из его хэш, используя грубую силу или любой другой способ на человека-продолжительность жизни количество времени?

Радуга-стиль таблицы практически невозможно, я думаю.

Бонус числовой вопрос - сколько потребуется на средних распределенной вычислительной сети на основе преимущественно потребительских ПК? (Пример: 4 ГГц процессор + начального уровня процессор + 8 ГБ ОЗУ)

Комментарии к вопросу (12)
Решение

Простой ответ, нет.

Это как спрашивать, если я знаю, что x%4 = 3, можно найти значение "х"? Нет. Конечно, не было бы бесконечных значений х, удовлетворяющих этому уравнению, но вы не'Т просто знаете, какой из них правильный.

Кроме того, многие(или бесконечного) видеоклипов может привести к заданному хэш-значение(очевидно, бесконечные видеоклипы должны быть сопоставлено определенное количество хэш-значений, поэтому столкновения неизбежны). Вы бы'т знаю, что клип является правильным.

Что тоже, в человеческое время? Нет.

Редактировать: Как указал в комментариях, так как файл разбит на куски по 2 МБ, там выиграл'т быть бесконечные возможности, но это будет довольно большой(2 В мощность 16.7 млн., Примерно). Подобрав такое большое количество возможностей, в человеческое время, по-прежнему почти невозможно. Но да, это's не бесконечность.

Комментарии (12)

Это не возможно, не важно, насколько быстр ваш компьютер, просто потому, что нельзя воссоздать необходимую информацию из практически ничего.

Вы действительно просите для восстановления 2 МБ от 32 байт (размер SHA-256) или максимум 64 байта (SHA-256 для блока и для всего файла). Это будет соотношение 1:65536 или 1:32768. Учитывая, что они уже сильно сжатый шанс практически нулевой, что можно восстановить исходные данные этого мало информации. Это может быть то, что вы могли бы создать 2 блока МБ какие результаты в конкретные хэши SHA-256, но шансы очень низкие, что это будет что оригинальный кусок.

Комментарии (2)

Вы не могли воспроизводить файлы в любые разумные сроки. Причина в том, что единственный способ 'обратный' хэш с помощью грубой силы, а с учетом того, что и исходный файл, он будет считать вас, что точное количество байт к грубой силе.

Позвольте'ы сказать, у вас есть видео файл, который 100МБ большие, точно.

  • 1МБ = 1 000 000 байт
  • 100МБ = 100,000,000 байт

Это означает, что вы должны грубой силы, этот оригинальный файл и проверить его'ы хэш, вы'd нужен, чтобы попробовать перестановок н^р. Если видео файл использует только 256 символов в байт (в формате ASCII), мы'd быть глядя на:

256<суп>100,000,000</SUP-серфинг> &приблизительно; 10<суп>240,823,997</SUP-серфинг> &приблизительно; ∞

Что'ы, по сути, бесконечен, он будет принимать в основном навсегда, чтобы вычислить это, независимо от ресурсов процессора.

Обновление: там's также, конечно, вопрос с хэш-коллизий, которые я оставил здесь ... с SHA256 хэш, вы'повторно, вероятно, собирается запустить в почти бесконечное количество столкновений с файл такой большой, как в нашем примере. Я забыл упомянуть об этом раньше для простоты'ы ради.

Комментарии (12)

Позвольте'ы сказать, у вас есть компьютер, который имеет бесконечное количество вычислительной мощности, и может надежно проверить все возможные сообщения от всех возможных хэш в короткие сроки. Здесь's проблема теперь вы сталкиваетесь: наездом.

Что'ы столкновения? Много разных файлов могут совпадать с точно такой же подписью. Много разных сообщений может совпадать с точно такой же подписью.

Хэширование в одну сторону. Преобразовать последовательность символов в хэш. Когда вы проверить ваш хэш-код, вы просто проверка, чтобы увидеть, если сообщение соответствует вычисленное значение хэш. Проблема в том, что много разных сообщений может соответствовать этому же хэш. Это'называется "коллизия".

Однако, поскольку вы тоже бесконечные вычислительные мощности, вы можете в конечном итоге восстановить файл через сверхмассивные проб и ошибок. Однако, если у вас есть все возможные примеры для данного хэш-значения, как вы собираетесь сказать, кто из них кто?


Итак, вы'вновь рассказывал мне, что там'ы есть шанс?

С сегодня's технология, и поскольку мы'll никогда не безграничные вычислительные мощности, это будет совершенно невозможно. Даже принимая весь мир'ов сочетании вычислительные мощности, и умножив его на миллиард, вы не можете сделать это. Даже если вы каким-то образом сделал это, как вы могли бы сказать, какой посыл был правильный?


Где бы моя идея применить?

  • Хэширование в одну сторону. С помощью прилагаемого ключа, вы утверждаете только, что оно совпадает с вашим вычисляется хэш.
  • Шифрования двухстороннее. С помощью прилагаемого ключа, вы получите результаты.

Ваша идея будет применяться при шифрования, а не хэширования. С шифрованием, если у вас есть ключ, вы можете получить расшифровать содержимое файла.

Комментарии (0)

Это трудно, если исходный файл имеет достаточно высокую энтропию. Если вы знаете что-нибудь о базовых данных, то вы вполне сможете его восстановить. Например, если хакер нигде в окрестностях он выиграл'т будет долго, прежде, чем кто-то говорит вам, что я хэш MD5 получить:

73868cb1848a216984dca1b6b0ee37bc

Однако видео usually имеет много энтропии, что делает это гиблое дело или по крайней мере чертовски сложно. Вы'd нужен видео для видеокамеры и вы'd есть надежда, что пропавший кусок показывают час черный как черная ночь. Позвольте'ы поставить это в перспективе: создание биткоин-это по сути дело инвертирование хэша. Переворачивать очень короткое видео СНиП-это, наверное, сродни около 20 биткоинов, а может и больше. Так что на вашем месте я'd сделать биткоины, купить свежую копию видео и карман мелочи. Почти восемь тысяч долларов на изменение. Может быть, я'd не покупайте акции в квантовом компьютере компании и сделать будущие подвиги легче; его'с удовольствие делают в "невозможно" по.

Для тех, кто говорит, что "хэши многие к одному, поэтому вы не можете сказать, что был хэширован и": это правда, но из всех многочисленных значений хэш значений, некоторые из них будут более правдоподобными, чем другие. Если вы инвертировать хэш-выше вы не имеют ни малейшего сомнения в том, что вы нашли правильный вход. Получайте удовольствие! :-)

Комментарии (2)

Есть только одна возможность для этого: Google это - буквально.

Если файл был загружен на какой-либо из ряда файлообменных сайтах, они, вероятно, размещены хэш, и она может быть проиндексирована.

Например, Google '60CCE9E9C6557335B4F7B18D02CFE2B438A8B3E2'.

Комментарии (0)

Это´Лл в основном берут слишком долго для достижения удовлетворяющего результата, обращаясь к обоим: генерация недостающих видео-часть (по данным расчетных критериев) и сортировки самые лучшие из них (что должен человеческий разум или чрезвычайно высокоразвитым ИИ). Даже если Вы, наконец, хорошее видео, соответствующие всем критериям, вы´ll никогда не знаете, если оригинальный фильм имел то же самое содержание. Это может сделать никакого смысла пытаясь "реконструировать" и то, что может быть самых разных - быстрее и лучше: используйте свои собственные фантазии.

Конечно, какая-то "срабатывание" в 10 байт хэш-значения могут´т представляет/содержит информацию, 10 МБ, так что я думаю, свою суть состоит в следующем:

Даже если у вас много дополнительной информации для исправления внутри весь видео-файл данных-формат, кадры, раскадровка себя, голоса актеров и так далее: там будут тысячи более или менее разные видео, которые будут соответствовать всем известным критериям. Я´г даже предположить, что горсть одном видео-кадров здесь и там могли бы сделать любое видео ведущая на тот же хеш.

Этот вопрос очень похожи: можно ли (небольшую) вирусов, чтобы добавить себя (большой) файл при сохранении файла´с контрольной суммой той же стоимости путем заполнения (не очень большой) суммы переменной байт? Я думаю, это´s возможно, хотя трудно вычислить время сегодня. С другой стороны, мы знаем, что множество возможных кодов приведет к тем же хэш, так что времени вычислений может быть переоценена. Может быть, это´С можно в секундах - будет знать только хакеры.

Редактировать: за ночь я получил вдохновение для хорошего дополнительного сравнения вашу "проиграли-видео-часть-проблема-то": Для таких случаев (полного восстановления данных) там уже изобрели рейд-5 технологии (Вики-см. здесь: https://en.wikipedia.org/wiki/RAID ). Один из трех или более жестких диска выйдут из строя и все данные могут быть восстановлены без потерь. Конечно, у вас есть много данных-накладные расходы (избыточность для коррекции ошибок) сохраняется за все диски должны быть в состоянии сделать это.

Хешей/контрольных сумм хороши для обнаружения маленьких (биты или несколько байт) искажения/ошибки, что где-то произошло внутри файла. Более прогрессивными являются циклические коды с исправлением ошибок. По крайней мере, у нас есть redundacy-системы, такие как рейд.

Комментарии (0)

Ответа нет, и похоже, что вы'вновь путаете две разные вещи :

  • Контрольные и хэш и в одну сторону целостности шашки. Цель их применения в том и дело, чтобы убедиться, что данные не были повреждены, и ничего
  • Коды восстановления кем вы'повторно используя, если нужно восстановить данные с помощью кода, приведенного. Наиболее ярким примером является код Рида-Соломона для восстановления данных на компакт-дисках. Цель их использования в данном вопросе, чтобы помочь вам восстановление поврежденных данных/потерял по каким-либо причинам

Они'вновь кажутся похожими с первого взгляда, но они'Ре очень разные вещи.

Комментарии (0)

Комментарий, но он's слишком долго:

Как уже показано, это'т возможно. Однако, существует проблема, что, конечно, разумно:

Ок, вы можете'т восстановлению что 200Мб видео, который был разделен на 100 2Мб файлы, которые у вас есть 99.

Однако, вы можете создать другой файл, который будет волосы на 2 Мб, которая позволит вам восстановить любые один отсутствующий файл. Два таких файлов позволит вам восстановить любые две недостающие файлы и так далее. В то время как размер блока может'т быть с пользой установлены выше, чем размер файла (а файл ремонт 4Мб еще только фиксирует один файл) может быть установлен ниже, что может иметь значение при частичном повреждении возможность. (Расчетное время идет вверх, то файлы будут немного больше, но у вас есть больше возможностей, чтобы оправиться от повреждения.)

Стандартные программы в течение длительного времени был: Quickpar но он еще'т обновлялся целую вечность. Более современной альтернативой, что я'м курсе (но не используется пока) Multipar (Примечание: этот сайт на японском языке. Программа на хорошем английском, правда.)

Если я'м собираюсь резервное копирование некоторых данных на DVD я регулярно создавать дополнительные исправления файлов только в случае, если что-то случится--дополнительное пространство на диске, все равно тратить, то почему бы не поставить там какие-нибудь страховки? Multipar даже есть режимы специально для этого (хотя я еще не пробовал их), где он будет генерировать блоки, чтобы заполнить диск DVD-R или BD-R диск.

Комментарии (0)

Это фактически невозможно, из-за теории информации. Практически невозможно, как в "Тепловая смерть Вселенной" становится законной ограничивающим фактором на ваш поиск.

У вас есть 2,000,000 байт (2Мб) фрагмент отсутствует. Хэш как ша-1 имеет 20 байт информации в нем. По теории информации, мы должны ожидать, что есть 1,999,980 байт, которые до сих пор неизвестны. Это означает, что 2^(8*1,999,980) возможные файлы для изучения. Это число настолько велико, что вы начинаете говорить о Тепловой смерти Вселенной до каждого атома во Вселенной волшебным образом действует как процессор 2ГГц, работая в паре, могли найти его. И это вовсе'т относятся задача на самом деле выяснить, какое из решений является правильным. Это's просто стоимость в конечном счете производя правильный.

Некоторые упоминали, что у вас есть дополнительная информация. Например, у вас есть ша-1 всего файла. К сожалению, это не очень полезно. Предполагая, что у вас есть этот хэш как хорошо, теперь у вас есть 1,999,960 байт информации, которые до сих пор неизвестны, и, следовательно, 2^(8*199,960) можно кружочками рассматривать. Мы'вновь еще в жару смерти царство Вселенной. Мы могли бы добавить дополнительные ограничения, такие как преемственность с существующими видео, но в конце концов, мы'ре собирается столкнуться ограничений относительно того, сколько мы можем знать о слайсе, не имея достаточно информации, чтобы воссоздать его непосредственно от информации, которую мы знаем.

Лучший шанс, вы бы это уже весь мир все вместе, чтобы решить вашу проблему, и кормить вас каждый 2Мб срез данных во всем интернете. Весьма вероятно, что если тебя "потеряли" и данные, кто-то еще может быть копия. Это'ы гораздо легче сканировать через петабайт данных человечество собралось, чем через гораздо большее количество возможностей 2Мб произвольных данных, чтобы предложить.

Комментарии (0)

Хеши предназначены для одного пути. Его легко путешествовать слева направо, но это практически невозможно проехать справа налево, когда речь идет о хешировании.

Комментарии (0)

Предисловие: хэш обычно используется для проверки целостности файла или набора данных.

Предлагаемые контрольные суммы хэш включает данные и имя, затем, что может служить ориентиром для контейнера, который затем может быть реализован в поиск через сопоставление с образцом контрольной суммы. При условии, что вы знали соли (которая может включать в значение даты или времени, например).

Хотя причиной одного столкновения со скоростью 1МГ/С может потребоваться еще около 3 лет, чтобы устранить все абсолютные возможности для результата, как мало, как 15 числа. Поэтому понять другую ссылку, например, где этот файл находится на носителе помогло бы быть более конкретными .е.г. сектор или файл идентификатора записи.

Но это достоверная отметить, что передача данных (особенно по сети), как правило, часто встают на пути, со своими контрольную сумму для справки.

И в случае, если кто-то хочет поспорить, соль-это, как правило, бесплатный и криптографии должны'т связываться с восстановлением, как при шифровании не только какие-то жалкие криптографии стандартный, и вы забудете ключ, то вы'МР вообще не смогут восстановить ваши данные.

Комментарии (0)