Какие алгоритмы хеширования поддерживаются и в C#, и в Java, и позволяют получать совместимые (идентичные) значения хешей?

Question

Артемий

java , c#

Какие алгоритмы хеширования поддерживаются и в C#, и в Java, и позволяют получать совместимые (идентичные) значения хешей?

Существует ли какой‑то недорогой и совместимый между C# и Java алгоритм хеширования двумерных массивов float[][] (аналогичный xxHash3)? В интернете я не нашёл однозначного ответа — обсуждения часто заходят в тупик. <br/> <br/> В Java есть Arrays.deepHashCode, но аналогичного готового решения в C# нет; в C# можно использовать GetHashCode или поэлементно накапливать хеш через HashCode.Add(), но эквивалента этого подхода в Java у меня не нашлось, и явных формул хеширования для такой задачи я тоже не обнаружил.

11 марта 2026 г. 10:01

Ответы на вопрос 4

Похожие вопросы

Answer 1

Кратко — да, совместимые (идентичные) хеш‑значения между Java и C# получить можно, но нужно:
- выбрать алгоритм, который реализован в обеих экосистемах (или иметь реализацию одной и той же библиотеки в обеих), и
- определить каноническое представление входных данных (порядок байт, обработка NaN и −0.0, включать ли длины и т.п.).

Ниже — детали, варианты и практические советы для float[][].

1) Алгоритмы, доступные в обеих платформах
- Криптографические: MD5, SHA‑1, SHA‑256, SHA‑512, SHA‑3 — одинаковый результат при одинаковых входных байтах. (Java: java.security.MessageDigest, C#: System.Security.Cryptography.SHA256/MD5 и т.д.)
- CRC/Adler: CRC32, Adler32 — доступны в Java (java.util.zip) и в C# через библиотеки/реализации.
- Популярные non‑crypto быстрые хеши (через библиотеки): xxHash (xxHash32/64/3), MurmurHash3 — есть реализации для Java и для C#. Если вы используете одну и ту же версию/вариант и одинаковую семантику (seed, endian, формат входа), результаты совпадут.

2) Важные нюансы при работе с float[][] (чтобы получить идентичный результат)
- Представление float в байтах: IEEE‑754 одноточечное — но порядок байт (endianness) должен быть зафиксирован (рекомендуется BIG_ENDIAN / network order) на обеих сторонах.
- NaN: Java Float.floatToIntBits нормализует NaN в canonical NaN, а floatToRawIntBits нет; C# BitConverter.SingleToInt32Bits возвращает «сырые» биты. Решите заранее: хотите ли свести все NaN к одному представлению или сохранить битовую вариативность. Для совместимости приведите к одному правилу на обеих сторонах.
- −0.0 и +0.0 дают разные бит‑паттерны, но арифметически равны. Если хотите считать их равными — нормализуйте (0.0f).
- Размерности/границы: если просто подряд записывать все элементы, разные вложенные форматы (например, [[1,2],[3]] vs [[1],[2,3]]) могут дать одинаковую последовательность float — безопаснее включать в поток длины строк/число строк.

3) Рекомендации какие подходы использовать

Вариант A — хотим быстрый non‑crypto и совместимый: используйте xxHash (рекомендуется xxHash64 или xxHash3) на обеих сторонах и подавайте одинаковые байты.
- Java: есть библиотеки (пример: "net.jpountz.xxhash", "com.github.luben:xxhash").  
- C#: есть реализации (K4os.Hash.xxHash, XXHashSharp и др.).  
Обязательно: тот же вариант (xxHash64 vs xxHash3), тот же seed, фиксированный порядок байт (рекомендуем Big‑Endian), и нормализация NaN/−0.0 если нужно.

Вариант B — если вам нужен именно int‑hash идентичный Java Arrays.deepHashCode:
Java Arrays.hashCode(float[]) делает примерно:
  int res = 1;
  for (float f : a) res = 31 * res + Float.floatToIntBits(f);
Для двумерного массива Arrays.deepHashCode вызывает Arrays.hashCode для каждой подмассивa и комбинирует аналогично. Этот алгоритм можно воспроизвести в C#, и тогда вы получите абсолютно идентичные int‑значения (нужно повторить те же правила относительно Float.floatToIntBits и overflow семантики).
Пример (псевдо/реалистичный код):

Java (ять):
```java
public static int deepFloatArrayHash(float[][] a) {
    if (a == null) return 0;
    int result = 1;
    for (float[] row : a) {
        int rowHash;
        if (row == null) rowHash = 0;
        else {
            rowHash = 1;
            for (float v : row) rowHash = 31 * rowHash + Float.floatToIntBits(v);
        }
        result = 31 * result + rowHash;
    }
    return result;
}
```

C# (эквивалент, важно использовать unchecked для 32‑бит переполнения и BitConverter.SingleToInt32Bits для raw‑бит):
```csharp
public static int DeepFloatArrayHash(float[][] a) {
    if (a == null) return 0;
    unchecked {
        int result = 1;
        foreach (var row in a) {
            int rowHash;
            if (row == null) rowHash = 0;
            else {
                rowHash = 1;
                foreach (var v in row) {
                    int bits = BitConverter.SingleToInt32Bits(v); // raw bits
                    rowHash = 31 * rowHash + bits;
                }
            }
            result = 31 * result + rowHash;
        }
        return result;
    }
}
```
Обратите внимание: Java использует Float.floatToIntBits — он нормализует NaN. Если вы хотите повторить поведение Java точно, нужно в C# вручную нормализовать NaN в canonical NaN‑паттерн (или использовать эквивалентную нормализацию).

Вариант C — если хотите крипто‑совместимость (например, SHA‑256) — сериализуйте массив строго (сначала numberOfRows, потом для каждой строки length и затем big‑endian байты float) и пропустите через MessageDigest/SHA256 в Java и через SHA256Managed/SHA256.Create() в C#. Тогда результаты совпадут.

Пример сериализации (оба языка — согласованный формат):
- Записать int rows (4 байта, big‑endian)
- Для каждой строки: записать int cols (4 байта, big‑endian), затем для каждого float — 4 байта big‑endian, где float представлен через IEEE‑754 bits (после выбранной нормализации NaN/−0.0).
Передать полученные байты в xxHash64 (одинаково с обеих сторон) или в SHA‑256.

4) Практические маленькие подсказки
- Тестируйте на наборе входов (включая NaN, ±0.0, разные порядка строк) и сравнивайте хеши Java↔C#.
- Если нужен быстрый и лёгкий путь — возьмите xxHash в обеих платформах и используйте согласованную сериализацию. xxHash даёт очень высокую скорость и есть готовые реализации.
- Не полагайтесь на стандартный .GetHashCode() объектов/массивов: у C# у некоторых типов реализован hash, ненадёжный между процессами/запусками (и он не будет совпадать с Java).

5) Библиотеки (что поискать)
- Java: MessageDigest (встроено), net.jpountz.xxhash, com.github.luben:xxhash
- C#: System.Security.Cryptography (SHA*), K4os.Hash.xxHash, XXHashSharp и др.

Итог
- Да, есть много алгоритмов, которые доступны в обеих — MD5/SHA/xxHash/Murmur — и при одинаковой сериализации входа дают идентичные хеши.
- Для float[][] проще всего: выбрать формат сериализации (endianness, NaN/−0.0 нормализация, включить размеры) и использовать либо xxHash (быстро), либо SHA‑256 (крипто, чуть медленнее), либо воспроизвести Java Arrays.deepHashCode в C# (если нужен именно тот же int‑результат).

Answer 2

Ваш вопрос не имеет никакого смысла, т.к. алгоритм реализуется идентично и независимо от ЯП. И ответ прост: все алгоритмы хэширования совместимы между любыми ЯП. Поэтому вам просто надо найти реализацию одного и того же алгоритма для обоих ЯП.

Answer 3

Но ведь xxhash есть для всего <br/> <a href="https://xxhash.com/" rel="nofollow">https://xxhash.com/</a>

Answer 4

Если речь идет о встроенных в стандартные библиотеки методы, то: <br/> <br/> crc32 не хватает? кажется быстрее некуда, есть практически во всех языках и фреймворках. если 32бита мала, можно делить хешируемые данные на части, считать для каждого crc32 и получить 2х..4х больше битность и меньше вероятность коллизий.. <br/> <br/> md5 так же есть везде, да, он тяжелее, но зато относительно криптостойкий (был взломан десятилетие назад, текущих мощностей железа хватает). <br/> <br/> sha256... более чем хорош (так же реализация встроена как в c# так и в java), кстати оно по умолчанию должно аппаратное ускорение использовать, может так получиться что будет даже быстрее crc32.. но там все зависит от размера данных, например много мелких блоков данных обрабатываются дольше чем мало больших