提问



如何将字节数组转换为十六进制字符串,反之亦然?

最佳参考


或者:


public static string ByteArrayToString(byte[] ba)
{
  StringBuilder hex = new StringBuilder(ba.Length * 2);
  foreach (byte b in ba)
    hex.AppendFormat("{0:x2}", b);
  return hex.ToString();
}


要么:


public static string ByteArrayToString(byte[] ba)
{
  return BitConverter.ToString(ba).Replace("-","");
}


还有更多的变种,例如这里。[190]


反向转换将如下所示:


public static byte[] StringToByteArray(String hex)
{
  int NumberChars = hex.Length;
  byte[] bytes = new byte[NumberChars / 2];
  for (int i = 0; i < NumberChars; i += 2)
    bytes[i / 2] = Convert.ToByte(hex.Substring(i, 2), 16);
  return bytes;
}





使用Substring是与Convert.ToByte结合使用的最佳选择。有关更多信息,请参阅此答案。如果你需要更好的表现,你必须避免Convert.ToByte才能放弃SubString

其它参考1


绩效分析



注:截至2015-08-20的新领导者。


我通过一些原始Stopwatch性能测试运行各种转换方法,使用随机句子(n=61,1000次迭代)和使用Project Gutenburg文本(n=1,238,957,150次迭代)运行。以下是结果,大致从最快到最慢。所有测量均以刻度(10,000滴= 1 ms)为单位,所有相关注释均与[[最慢]] StringBuilder实施进行比较。对于使用的代码,请参阅下面或测试框架repo,我现在维护运行它的代码。[192] [193]


声明



警告:不要将这些属性用于任何具体的事情;它们只是样本数据的样本运行。如果您确实需要一流的性能,请在代表您的生产需求的环境中测试这些方法,并使用代表您将使用的数据。


结果




  • 按字节unsafe查询(通过CodesInChaos)(通过airbreather添加到测试仓库)


    • 文字:4,727.85(105.2X)

    • 句子:0.28(99.7X)


  • 按字节查找(通过CodesInChaos)


    • 文字:10,853.96(快45.8倍)

    • 句子:0.65(快42.7倍)


  • Byte Manipulation 2(通过CodesInChaos)


    • 文字:12,967.69(快38.4倍)

    • 句子:0.73(快37.9倍)


  • Byte Manipulation(通过Waleed Eissa)


    • 文字:16,856.64(快29.5倍)

    • 句子:0.70(快39.5倍)


  • 查找/转移(通过Nathan Moinvaziri)


    • 文字:23,201.23(快21.4倍)

    • 句子:1.24(快22.3倍)


  • 通过轻咬(通过Brian Lambert)查找


    • 文字:23,879.41(快20.8倍)

    • 句子:1.15(快23.9倍)


  • BitConverter(来自Tomalak)


    • 文字:113,269.34(快4.4倍)

    • 句子:9.98(快2.8倍)


  • {SoapHexBinary}.ToString(通过Mykroft)


    • 文字:178,601.39(快2.8倍)

    • 句子:10.68(快2.6倍)


  • {byte}.ToString("X2")(使用foreach)(来自Will Dean的回答)


    • 文字:308,805.38(快2.4倍)

    • 句子:16.89(快2.4倍)


  • {byte}.ToString("X2")(使用{IEnumerable}.Aggregate,需要System.Linq)(通过Mark)


    • 文字:352,828.20(快2.1倍)

    • 句子:16.87(快2.4倍)


  • Array.ConvertAll(使用string.Join)(通过Will Dean)


    • 文字:675,451.57(快1.1倍)

    • 句子:17.95(快2.2倍)


  • Array.ConvertAll(使用string.Concat,需要.NET 4.0)(通过Will Dean)


    • 文字:752,078.70(快1.0倍)

    • 句子:18.28(快2.2倍)


  • {StringBuilder}.AppendFormat(使用foreach)(通过Tomalak)


    • 文字:672,115.77(快1.1倍)

    • 句子:36.82(快1.1倍)


  • {StringBuilder}.AppendFormat(使用{IEnumerable}.Aggregate,需要System.Linq)(源自Tomalak的回答)


    • 文字:718,380.63(快1.0倍)

    • 句子:39.71(快1.0倍)




查找表已经超过了字节操作。基本上,有一些形式的预计算任何给定的半字节或字节将以十六进制表示。然后,当您浏览数据时,只需查找下一部分即可看到它将是什么十六进制字符串。然后以某种方式将该值添加到结果字符串输出中。对于长时间的字节操作,一些开发人员可能更难阅读,是表现最好的方法。 [195] [200]


您最好的选择仍然是找到一些有代表性的数据并在类似生产的环境中进行尝试。如果您有不同的内存约束,您可能更喜欢使用较少分配的方法,但速度更快但消耗更多内存的方法。


测试代码



随意玩我使用的测试代码。这里包含一个版本,但可以随意克隆存储库并添加自己的方法。如果您发现任何有趣的内容或希望帮助改进其使用的测试框架,请提交拉取请求。[209]



  1. 将新的静态方法(Func<byte[], string>)添加到/Tests/ConvertByteArrayToHexString/Test.cs。

  2. 将该方法的名称添加到同一类中的TestCandidates返回值。

  3. 通过切换同一班级GenerateTestInput中的评论,确保您运行所需的输入版本,句子或文本。

  4. 点击 F5 并等待输出(在/bin文件夹中也会生成HTML转储)。





static string ByteArrayToHexStringViaStringJoinArrayConvertAll(byte[] bytes) {
    return string.Join(string.Empty, Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaStringConcatArrayConvertAll(byte[] bytes) {
    return string.Concat(Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaBitConverter(byte[] bytes) {
    string hex = BitConverter.ToString(bytes);
    return hex.Replace("-", "");
}
static string ByteArrayToHexStringViaStringBuilderAggregateByteToString(byte[] bytes) {
    return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.Append(b.ToString("X2"))).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachByteToString(byte[] bytes) {
    StringBuilder hex = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes)
        hex.Append(b.ToString("X2"));
    return hex.ToString();
}
static string ByteArrayToHexStringViaStringBuilderAggregateAppendFormat(byte[] bytes) {
    return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.AppendFormat("{0:X2}", b)).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachAppendFormat(byte[] bytes) {
    StringBuilder hex = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes)
        hex.AppendFormat("{0:X2}", b);
    return hex.ToString();
}
static string ByteArrayToHexViaByteManipulation(byte[] bytes) {
    char[] c = new char[bytes.Length * 2];
    byte b;
    for (int i = 0; i < bytes.Length; i++) {
        b = ((byte)(bytes[i] >> 4));
        c[i * 2] = (char)(b > 9 ? b + 0x37 : b + 0x30);
        b = ((byte)(bytes[i] & 0xF));
        c[i * 2 + 1] = (char)(b > 9 ? b + 0x37 : b + 0x30);
    }
    return new string(c);
}
static string ByteArrayToHexViaByteManipulation2(byte[] bytes) {
    char[] c = new char[bytes.Length * 2];
    int b;
    for (int i = 0; i < bytes.Length; i++) {
        b = bytes[i] >> 4;
        c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
        b = bytes[i] & 0xF;
        c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
    }
    return new string(c);
}
static string ByteArrayToHexViaSoapHexBinary(byte[] bytes) {
    SoapHexBinary soapHexBinary = new SoapHexBinary(bytes);
    return soapHexBinary.ToString();
}
static string ByteArrayToHexViaLookupAndShift(byte[] bytes) {
    StringBuilder result = new StringBuilder(bytes.Length * 2);
    string hexAlphabet = "0123456789ABCDEF";
    foreach (byte b in bytes) {
        result.Append(hexAlphabet[(int)(b >> 4)]);
        result.Append(hexAlphabet[(int)(b & 0xF)]);
    }
    return result.ToString();
}
static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_Lookup32, GCHandleType.Pinned).AddrOfPinnedObject();
static string ByteArrayToHexViaLookup32UnsafeDirect(byte[] bytes) {
    var lookupP = _lookup32UnsafeP;
    var result = new string((char)0, bytes.Length * 2);
    fixed (byte* bytesP = bytes)
    fixed (char* resultP = result) {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++) {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return result;
}
static uint[] _Lookup32 = Enumerable.Range(0, 255).Select(i => {
    string s = i.ToString("X2");
    return ((uint)s[0]) + ((uint)s[1] << 16);
}).ToArray();
static string ByteArrayToHexViaLookupPerByte(byte[] bytes) {
    var result = new char[bytes.Length * 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        var val = _Lookup32[bytes[i]];
        result[2*i] = (char)val;
        result[2*i + 1] = (char) (val >> 16);
    }
    return new string(result);
}
static string ByteArrayToHexViaLookup(byte[] bytes) {
    string[] hexStringTable = new string[] {
        "00", "01", "02", "03", "04", "05", "06", "07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F",
        "10", "11", "12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C", "1D", "1E", "1F",
        "20", "21", "22", "23", "24", "25", "26", "27", "28", "29", "2A", "2B", "2C", "2D", "2E", "2F",
        "30", "31", "32", "33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D", "3E", "3F",
        "40", "41", "42", "43", "44", "45", "46", "47", "48", "49", "4A", "4B", "4C", "4D", "4E", "4F",
        "50", "51", "52", "53", "54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E", "5F",
        "60", "61", "62", "63", "64", "65", "66", "67", "68", "69", "6A", "6B", "6C", "6D", "6E", "6F",
        "70", "71", "72", "73", "74", "75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F",
        "80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A", "8B", "8C", "8D", "8E", "8F",
        "90", "91", "92", "93", "94", "95", "96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F",
        "A0", "A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB", "AC", "AD", "AE", "AF",
        "B0", "B1", "B2", "B3", "B4", "B5", "B6", "B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF",
        "C0", "C1", "C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC", "CD", "CE", "CF",
        "D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7", "D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF",
        "E0", "E1", "E2", "E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED", "EE", "EF",
        "F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8", "F9", "FA", "FB", "FC", "FD", "FE", "FF",
    };
    StringBuilder result = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes) {
        result.Append(hexStringTable[b]);
    }
    return result.ToString();
}


更新(2010-01-13)



添加了Waleed对分析的回答。非常快。


更新(2011-10-05)



为完整性添加了string.Concat Array.ConvertAll变体(需要.NET 4.0)。与string.Join版本相同。


更新(2012-02-05)



测试回购包括更多变体,如StringBuilder.Append(b.ToString("X2"))。没有打乱任何结果。例如,foreach{IEnumerable}.Aggregate快,但BitConverter仍然胜利。


更新(2012-04-03)



添加了Mykroft的SoapHexBinary分析答案,取得了第三名。


更新(2013-01-15)



添加了CodesInChaos的字节操作答案,它接管了第一名(在大块文本上有很大的余地)。


更新(2013-05-23)



添加了Nathan Moinvaziri的查找答案以及Brian Lambert博客的变体。两者都相当快,但在我使用的测试机器上没有带头(AMD Phenom 9750)。


更新(2014-07-31)



添加了@CodesInChaos的新的基于字节的查找答案。它似乎在句子测试和全文测试中起了带头作用。


更新(2015-08-20)



增加了空气呼吸器的优化和unsafe变体到这个答案的回购。如果你想在不安全的游戏中玩游戏,你可以获得比短线和大文本中任何先前的顶级赢家更大的性能提升。[210] [211]

其它参考2


有一个名为SoapHexBinary的类完全符合你的要求。[212]


using System.Runtime.Remoting.Metadata.W3cXsd2001;

public static byte[] GetStringToBytes(string value)
{
    SoapHexBinary shb = SoapHexBinary.Parse(value);
    return shb.Value;
}

public static string GetBytesToString(byte[] value)
{
    SoapHexBinary shb = new SoapHexBinary(value);
    return shb.ToString();
}

其它参考3


在编写加密代码时,通常会避免数据相关的分支和表查找,以确保运行时不依赖于数据,因为数据相关的时序可能会导致旁路攻击。


它也很快。


static string ByteToHexBitFiddle(byte[] bytes)
{
    char[] c = new char[bytes.Length * 2];
    int b;
    for (int i = 0; i < bytes.Length; i++) {
        b = bytes[i] >> 4;
        c[i * 2] = (char)(55 + b + (((b-10)>>31)&-7));
        b = bytes[i] & 0xF;
        c[i * 2 + 1] = (char)(55 + b + (((b-10)>>31)&-7));
    }
    return new string(c);
}


Phnglui mglwnafh Cthulhu Rlyeh wgahnagl fhtagn






  进入这里的人,放弃所有的希望



对奇怪的小提琴的解释:



  1. bytes[i] >> 4提取字节
    的高半字节
    bytes[i] & 0xF提取字节的低半字节

  2. b - 10,点击
    对于值b < 10< 0,它将成为十进制数字

    b > 10>= 0,它将成为AF的字母。

  3. 在带符号的32位整数上使用i >> 31提取符号,这要归功于符号扩展。
    对于i >= 0i < 00-1

  4. 结合2)和3),表示(b-10)>>31对于字母为0,对于数字为-1

  5. 查看字母的大小写,最后一个加数变为0b的范围为10到15.我们想将它映射到A(65)到[[F(70),这意味着增加55('A'-10)。

  6. 查看数字的情况,我们想调整最后一个加数,以便将b从0到9的范围映射到范围0(48)到9(57 )。这意味着它需要变成-7('0' - 55)
    现在我们可以乘以7.但由于-1表示所有位为1,我们可以使用& -7,因为(0 & -7) == 0(-1 & -7) == -7



进一步考虑:



  • 我没有使用第二个循环变量来索引c,因为测量显示从i计算它更便宜。

  • 使用i < bytes.Length作为循环的上限允许JITter消除bytes[i]上的边界检查,因此我选择了该变体。

  • b设为int允许从字节到字节进行不必要的转换。


其它参考4


如果你想要比BitConverter更灵活,但又不想要那些笨重的20世纪90年代风格的显式循环,那么你可以这样做:


String.Join(String.Empty, Array.ConvertAll(bytes, x => x.ToString("X2")));


或者,如果您使用的是.NET 4.0:


String.Concat(Array.ConvertAll(bytes, x => x.ToString("X2")));


(后者来自对原帖的评论。)

其它参考5


您可以使用BitConverter.ToString方法:


byte[] bytes = {0, 1, 2, 4, 8, 16, 32, 64, 128, 256}
Console.WriteLine( BitConverter.ToString(bytes));


输出:



  00-01-02-04-08-10-20-40-80-FF



更多信息: BitConverter.ToString方法(字节[[]]) [213]

其它参考6


另一种基于查找表的方法。这个每个字节只使用一个查找表,而不是每个半字节的查找表。


private static readonly uint[] _lookup32 = CreateLookup32();

private static uint[] CreateLookup32()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
    }
    return result;
}

private static string ByteArrayToHexViaLookup32(byte[] bytes)
{
    var lookup32 = _lookup32;
    var result = new char[bytes.Length * 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        var val = lookup32[bytes[i]];
        result[2*i] = (char)val;
        result[2*i + 1] = (char) (val >> 16);
    }
    return new string(result);
}


我还在查找表中使用ushortstruct{char X1, X2}struct{byte X1, X2}测试了它的变体。


根据编译目标(x86,X64),它们具有大致相同的性能或略慢于此变体。





并且为了更高的性能,它的unsafe兄弟:


private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe,GCHandleType.Pinned).AddrOfPinnedObject();

private static uint[] CreateLookup32Unsafe()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        if(BitConverter.IsLittleEndian)
            result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
        else
            result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
    }
    return result;
}

public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new char[bytes.Length * 2];
    fixed(byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return new string(result);
}


或者,如果您认为直接写入字符串是可以接受的:


public static string ByteArrayToHexViaLookup32UnsafeDirect(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new string((char)0, bytes.Length * 2);
    fixed (byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return result;
}

其它参考7


我今天刚遇到同样的问题,我遇到了这段代码:


private static string ByteArrayToHex(byte[] barray)
{
    char[] c = new char[barray.Length * 2];
    byte b;
    for (int i = 0; i < barray.Length; ++i)
    {
        b = ((byte)(barray[i] >> 4));
        c[i * 2] = (char)(b > 9 ? b + 0x37 : b + 0x30);
        b = ((byte)(barray[i] & 0xF));
        c[i * 2 + 1] = (char)(b > 9 ? b + 0x37 : b + 0x30);
    }
    return new string(c);
}


来源:论坛帖子 byte [[]]数组到十六进制字符串(参见PZahra的帖子)。我稍微修改了代码以删除0x前缀。[214]


我对代码进行了一些性能测试,它比使用BitConverter.ToString()快了近八倍(根据patridge的帖子最快)。

其它参考8


使用查找表也可以解决此问题。这将需要编码器和解码器的少量静态存储器。然而,这种方法会很快:



  • 编码器表512 字节或1024 字节(两次
    大小如果大小写
    需要)

  • 解码器表256  bytes或
    64  KiB(单个查询
    或双重查询)



我的解决方案使用1024个字节作为编码表,使用256个字节进行解码。


解码



private static readonly byte[] LookupTable = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static byte Lookup(char c)
{
  var b = LookupTable[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

public static byte ToByte(char[] chars, int offset)
{
  return (byte)(Lookup(chars[offset]) << 4 | Lookup(chars[offset + 1]));
}


编码



private static readonly char[][] LookupTableUpper;
private static readonly char[][] LookupTableLower;

static Hex()
{
  LookupTableLower = new char[256][];
  LookupTableUpper = new char[256][];
  for (var i = 0; i < 256; i++)
  {
    LookupTableLower[i] = i.ToString("x2").ToCharArray();
    LookupTableUpper[i] = i.ToString("X2").ToCharArray();
  }
}

public static char[] ToCharLower(byte[] b, int bOffset)
{
  return LookupTableLower[b[bOffset]];
}

public static char[] ToCharUpper(byte[] b, int bOffset)
{
  return LookupTableUpper[b[bOffset]];
}


比较



StringBuilderToStringFromBytes:   106148
BitConverterToStringFromBytes:     15783
ArrayConvertAllToStringFromBytes:  54290
ByteManipulationToCharArray:        8444
TableBasedToCharArray:              5651 *


*这个解决方案


注意



在解码过程中,IOException和IndexOutOfRangeException可能会发生(如果一个字符的值太大> 256)。应该实现de/encoding流或数组的方法,这只是一个概念证明。

其它参考9


这是对托马拉克非常受欢迎的答案(以及随后的编辑)修订版4的答案。


我将说明这个编辑是错误的,并解释为什么它可以被还原。一路上,你可能会学到一些关于某些内部的东西,并看到另一个例子,说明过早优化到底是什么以及如何咬你。


tl; dr:如果你匆忙(下面的原始代码),只需使用Convert.ToByteString.Substring,如果你不这样做,这是最好的组合想要重新实现Convert.ToByte。如果你需要性能,请使用不使用Convert.ToByte的更高级的东西(参见其他答案)。 使用除String.Substring以外的任何其他内容与Convert.ToByte结合使用,除非有人在此回答的评论中有一些有趣的内容。


警告:如果在框架中实现了Convert.ToByte(char[], Int32)重载,则此答案可能会过时。这不太可能很快发生。


作为一般规则,我不太喜欢说不要过早优化,因为没有人知道什么时候过早。在决定是否优化时,您必须考虑的唯一事项是:我是否有时间和资源来正确调查优化方法?。如果你没有,那就太早了,等到你的项目更成熟或者直到你需要表演(如果真的需要,那么你将制作时间)。与此同时,尽可能做最简单的事情。


原始代码:


    public static byte[] HexadecimalStringToByteArray_Original(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        for (var i = 0; i < outputLength; i++)
            output[i] = Convert.ToByte(input.Substring(i * 2, 2), 16);
        return output;
    }


修订版4:


    public static byte[] HexadecimalStringToByteArray_Rev4(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
                output[i] = Convert.ToByte(new string(new char[2] { (char)sr.Read(), (char)sr.Read() }), 16);
        }
        return output;
    }


修订避免String.Substring并使用StringReader代替。给出的理由是:



  编辑:您可以使用单个字符串来提高长字符串的性能
  传递解析器,如下:



那么,看String.Substring的参考代码,它已经明确地单通了;为什么不应该呢?它在字节级操作,而不是在代理对上操作。[217]


它确实分配了一个新的字符串,但是你需要分配一个传递给Convert.ToByte。此外,修订中提供的解决方案在每次迭代时分配另一个对象(双字符数组);您可以安全地将该分配放在循环之外并重用该数组以避免这种情况。


    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
            {
                numeral[0] = (char)sr.Read();
                numeral[1] = (char)sr.Read();
                output[i] = Convert.ToByte(new string(numeral), 16);
            }
        }
        return output;
    }


每个十六进制numeral表示使用两个数字(符号)的单个八位字节。


但是,为什么要两次打StringReader.Read?只需调用它的第二个重载并让它一次读取两个char数组中的两个字符;并将通话量减少两个。


    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
            {
                var read = sr.Read(numeral, 0, 2);
                Debug.Assert(read == 2);
                output[i] = Convert.ToByte(new string(numeral), 16);
            }
        }
        return output;
    }


您剩下的是一个字符串阅读器,其唯一添加的值是您可以自己声明的并行索引(内部_pos)(例如j),冗余长度变量(内部_length),以及对输入字符串的冗余引用(内部_s)。换句话说,它没用。


如果您想知道Read如何读取,只需查看代码,它所做的就是在输入字符串上调用String.CopyTo。剩下的就是保持书本,以维持我们不需要的价值。[218]


所以,已经删除了字符串阅读器,并自己调用CopyTo;它更简单,更清晰,更有效率。


    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        for (int i = 0, j = 0; i < outputLength; i++, j += 2)
        {
            input.CopyTo(j, numeral, 0, 2);
            output[i] = Convert.ToByte(new string(numeral), 16);
        }
        return output;
    }


你真的需要一个j索引,它以两个平行于i的步长递增吗?当然不是,只需将i乘以2(编译器应该能够优化为加法)。


    public static byte[] HexadecimalStringToByteArray_BestEffort(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        for (int i = 0; i < outputLength; i++)
        {
            input.CopyTo(i * 2, numeral, 0, 2);
            output[i] = Convert.ToByte(new string(numeral), 16);
        }
        return output;
    }


现在的解决方案是什么样的?完全像在开始时一样,只是使用String.Substring来分配字符串并将数据复制到它,而不是使用中间数组来复制十六进制数字,然后自己分配字符串,将数据再次从数组复制到字符串中(当您在字符串构造函数中传递它时)。如果字符串已经在实习池中,则第二个副本可能会被优化 - 但是[[String.Substring在这些情况下也可以避免它。


实际上,如果再次查看String.Substring,您会发现它使用了一些关于如何构造字符串的低级内部知识来比通常情况下更快地分配字符串,并且它使用了相同的代码。 CopyTo直接在那里避免呼叫开销。


String.Substring



  • 最坏情况:一次快速分配,一次快速复制。

  • 最佳情况:没有分配,没有副本。



手动方法



  • 最坏情况:两次正常分配,一次正常复制,一次快速复制。

  • 最佳案例:一次正常分配,一次正常复制。



结论? 如果你想使用Convert.ToByte(String, Int32) (因为你不想自己重新实现这个功能),似乎没有办法击败String.Substring;你所做的只是在圆圈中运行,重新发明轮子(仅使用次优材料)。


请注意,如果您不需要极端性能,使用Convert.ToByteString.Substring是完全有效的选择。请记住:如果您有时间和资源来调查它是如何正常工作的,请选择替代方案。


如果有Convert.ToByte(char[], Int32),那么事情会有所不同(有可能做我上面所描述的并完全避免String)。


我怀疑通过避免String.Substring来报告性能更好的人也避免Convert.ToByte(String, Int32),如果你还需要表演,你应该这样做。看看无数的其他答案,发现所有不同的方法来做到这一点。


免责声明:我没有反编译最新版本的框架,以验证参考源是最新的,我认为是。


现在,这一切听起来都很好而且合乎逻辑,如果你能够成功到目前为止,甚至是显而易见的。但这是真的吗?


Intel(R) Core(TM) i7-3720QM CPU @ 2.60GHz
    Cores: 8
    Current Clock Speed: 2600
    Max Clock Speed: 2600
--------------------
Parsing hexadecimal string into an array of bytes
--------------------
HexadecimalStringToByteArray_Original: 7,777.09 average ticks (over 10000 runs), 1.2X
HexadecimalStringToByteArray_BestEffort: 8,550.82 average ticks (over 10000 runs), 1.1X
HexadecimalStringToByteArray_Rev4: 9,218.03 average ticks (over 10000 runs), 1.0X


是!


Props to Partridge for bench framework,它很容易入侵。使用的输入是以下SHA-1哈希重复5000次以产生100,000字节长的字符串。


209113288F93A9AB8E474EA78D899AFDBB874355


玩的开心! (但要适度优化。)

其它参考10


补充@CodesInChaos(反向方法)


public static byte[] HexToByteUsingByteManipulation(string s)
{
    byte[] bytes = new byte[s.Length / 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        int hi = s[i*2] - 65;
        hi = hi + 10 + ((hi >> 31) & 7);

        int lo = s[i*2 + 1] - 65;
        lo = lo + 10 + ((lo >> 31) & 7) & 0x0f;

        bytes[i] = (byte) (lo | hi << 4);
    }
    return bytes;
}


说明:


& 0x0f也支持小写字母


hi = hi + 10 + ((hi >> 31) & 7);与以下内容相同:


hi = ch-65 + 10 + (((ch-65) >> 31) & 7);


对于0..9它与hi = ch - 65 + 10 + 7;相同,即hi = ch - 48(这是因为0xffffffff & 7)。


对于A..F,它是hi = ch - 65 + 10;(这是因为0x00000000 & 7)。


对于a..f,我们必须使用大数字,因此我们必须通过使用& 0x0f制作一些位0来从默认版本中减去32。


65是'A'的代码


48是'0'的代码


7是ASCII表(...456789:;<=>?@ABCD...)中'9''A'之间的字母数。

其它参考11


这是一篇很棒的文章。我喜欢Waleed的解决方案。我没有通过patridge的测试来运行它,但它看起来很快。我还需要反向过程,将十六进制字符串转换为字节数组,所以我把它写成一个逆转Waleed的解决方案。不确定它是否比Tomalak的原始解决方案更快。同样,我没有通过patridge的测试运行相反的过程。


private byte[] HexStringToByteArray(string hexString)
{
    int hexStringLength = hexString.Length;
    byte[] b = new byte[hexStringLength / 2];
    for (int i = 0; i < hexStringLength; i += 2)
    {
        int topChar = (hexString[i] > 0x40 ? hexString[i] - 0x37 : hexString[i] - 0x30) << 4;
        int bottomChar = hexString[i + 1] > 0x40 ? hexString[i + 1] - 0x37 : hexString[i + 1] - 0x30;
        b[i / 2] = Convert.ToByte(topChar + bottomChar);
    }
    return b;
}

其它参考12


为什么要复杂?这在Visual  Studio  2008中很简单:


C#:


string hex = BitConverter.ToString(YourByteArray).Replace("-", "");


VB:


Dim hex As String = BitConverter.ToString(YourByteArray).Replace("-", "")

其它参考13


不要在这里找到很多答案,但我发现了一个相当优化的(比接受的好4.5倍),十六进制字符串解析器的直接实现。首先,从我的测试输出(第一批是我的实现):


Give me that string:
04c63f7842740c77e545bb0b2ade90b384f119f6ab57b680b7aa575a2f40939f

Time to parse 100,000 times: 50.4192 ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

Accepted answer: (StringToByteArray)
Time to parse 100000 times: 233.1264ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

With Mono's implementation:
Time to parse 100000 times: 777.2544ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

With SoapHexBinary:
Time to parse 100000 times: 845.1456ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F


base64和BitConverterd行是为了测试正确性。请注意它们是相同的。


实施:


public static byte[] ToByteArrayFromHex(string hexString)
{
  if (hexString.Length % 2 != 0) throw new ArgumentException("String must have an even length");
  var array = new byte[hexString.Length / 2];
  for (int i = 0; i < hexString.Length; i += 2)
  {
    array[i/2] = ByteFromTwoChars(hexString[i], hexString[i + 1]);
  }
  return array;
}

private static byte ByteFromTwoChars(char p, char p_2)
{
  byte ret;
  if (p <= '9' && p >= '0')
  {
    ret = (byte) ((p - '0') << 4);
  }
  else if (p <= 'f' && p >= 'a')
  {
    ret = (byte) ((p - 'a' + 10) << 4);
  }
  else if (p <= 'F' && p >= 'A')
  {
    ret = (byte) ((p - 'A' + 10) << 4);
  } else throw new ArgumentException("Char is not a hex digit: " + p,"p");

  if (p_2 <= '9' && p_2 >= '0')
  {
    ret |= (byte) ((p_2 - '0'));
  }
  else if (p_2 <= 'f' && p_2 >= 'a')
  {
    ret |= (byte) ((p_2 - 'a' + 10));
  }
  else if (p_2 <= 'F' && p_2 >= 'A')
  {
    ret |= (byte) ((p_2 - 'A' + 10));
  } else throw new ArgumentException("Char is not a hex digit: " + p_2, "p_2");

  return ret;
}


我用unsafe尝试了一些东西并将(明显多余的)字符到半字节if序列移动到另一个方法,但这是它得到的最快。


(我承认这回答了问题的一半。我觉得字符串 - > byte [[]]转换的代表性不足,而字节[[]] - >字符串角度似乎得到了很好的覆盖。因此,这个答案。)

其它参考14


安全版本:


public static class HexHelper
{
    [System.Diagnostics.Contracts.Pure]
    public static string ToHex(this byte[] value)
    {
        if (value == null)
            throw new ArgumentNullException("value");

        const string hexAlphabet = @"0123456789ABCDEF";

        var chars = new char[checked(value.Length * 2)];
        unchecked
        {
            for (int i = 0; i < value.Length; i++)
            {
                chars[i * 2] = hexAlphabet[value[i] >> 4];
                chars[i * 2 + 1] = hexAlphabet[value[i] & 0xF];
            }
        }
        return new string(chars);
    }

    [System.Diagnostics.Contracts.Pure]
    public static byte[] FromHex(this string value)
    {
        if (value == null)
            throw new ArgumentNullException("value");
        if (value.Length % 2 != 0)
            throw new ArgumentException("Hexadecimal value length must be even.", "value");

        unchecked
        {
            byte[] result = new byte[value.Length / 2];
            for (int i = 0; i < result.Length; i++)
            {
                // 0(48) - 9(57) -> 0 - 9
                // A(65) - F(70) -> 10 - 15
                int b = value[i * 2]; // High 4 bits.
                int val = ((b - '0') + ((('9' - b) >> 31) & -7)) << 4;
                b = value[i * 2 + 1]; // Low 4 bits.
                val += (b - '0') + ((('9' - b) >> 31) & -7);
                result[i] = checked((byte)val);
            }
            return result;
        }
    }
}


不安全的版本对于那些喜欢表现并且不怕不安全的人。 ToHex快35%,FromHex快10%。


public static class HexUnsafeHelper
{
    [System.Diagnostics.Contracts.Pure]
    public static unsafe string ToHex(this byte[] value)
    {
        if (value == null)
            throw new ArgumentNullException("value");

        const string alphabet = @"0123456789ABCDEF";

        string result = new string(' ', checked(value.Length * 2));
        fixed (char* alphabetPtr = alphabet)
        fixed (char* resultPtr = result)
        {
            char* ptr = resultPtr;
            unchecked
            {
                for (int i = 0; i < value.Length; i++)
                {
                    *ptr++ = *(alphabetPtr + (value[i] >> 4));
                    *ptr++ = *(alphabetPtr + (value[i] & 0xF));
                }
            }
        }
        return result;
    }

    [System.Diagnostics.Contracts.Pure]
    public static unsafe byte[] FromHex(this string value)
    {
        if (value == null)
            throw new ArgumentNullException("value");
        if (value.Length % 2 != 0)
            throw new ArgumentException("Hexadecimal value length must be even.", "value");

        unchecked
        {
            byte[] result = new byte[value.Length / 2];
            fixed (char* valuePtr = value)
            {
                char* valPtr = valuePtr;
                for (int i = 0; i < result.Length; i++)
                {
                    // 0(48) - 9(57) -> 0 - 9
                    // A(65) - F(70) -> 10 - 15
                    int b = *valPtr++; // High 4 bits.
                    int val = ((b - '0') + ((('9' - b) >> 31) & -7)) << 4;
                    b = *valPtr++; // Low 4 bits.
                    val += (b - '0') + ((('9' - b) >> 31) & -7);
                    result[i] = checked((byte)val);
                }
            }
            return result;
        }
    }
}


顺便说一句
对于每次调用转换函数错误时初始化字母表的基准测试,字母必须是const(对于字符串)或静态只读(对于char [[]])。然后,byte [[]]到string的基于字母的转换变得和字节操作版本一样快。


当然,必须在Release(优化)中编译测试,并关闭调试选项Suppress JIT optimization(如果代码必须是可调试的,则启用我的代码相同)。

其它参考15


Waleed Eissa代码的反函数(Hex String To Byte Array):


    public static byte[] HexToBytes(this string hexString)        
    {
        byte[] b = new byte[hexString.Length / 2];            
        char c;
        for (int i = 0; i < hexString.Length / 2; i++)
        {
            c = hexString[i * 2];
            b[i] = (byte)((c < 0x40 ? c - 0x30 : (c < 0x47 ? c - 0x37 : c - 0x57)) << 4);
            c = hexString[i * 2 + 1];
            b[i] += (byte)(c < 0x40 ? c - 0x30 : (c < 0x47 ? c - 0x37 : c - 0x57));
        }

        return b;
    }


Waleed Eissa功能,支持小写:


    public static string BytesToHex(this byte[] barray, bool toLowerCase = true)
    {
        byte addByte = 0x37;
        if (toLowerCase) addByte = 0x57;
        char[] c = new char[barray.Length * 2];
        byte b;
        for (int i = 0; i < barray.Length; ++i)
        {
            b = ((byte)(barray[i] >> 4));
            c[i * 2] = (char)(b > 9 ? b + addByte : b + 0x30);
            b = ((byte)(barray[i] & 0xF));
            c[i * 2 + 1] = (char)(b > 9 ? b + addByte : b + 0x30);
        }

        return new string(c);
    }

其它参考16


扩展方法(免责声明:完全未经测试的代码,BTW ......):


public static class ByteExtensions
{
    public static string ToHexString(this byte[] ba)
    {
        StringBuilder hex = new StringBuilder(ba.Length * 2);

        foreach (byte b in ba)
        {
            hex.AppendFormat("{0:x2}", b);
        }
        return hex.ToString();
    }
}


等。使用Tomalak的三个解决方案(最后一个是字符串的扩展方法)。

其它参考17


来自Microsoft的开发人员,一个很好的,简单的转换:


public static string ByteArrayToString(byte[] ba) 
{
    // Concatenate the bytes into one long string
    return ba.Aggregate(new StringBuilder(32),
                            (sb, b) => sb.Append(b.ToString("X2"))
                            ).ToString();
}


虽然上面的内容很简洁,但是性能迷们会使用枚举器来尖叫它。使用改进版Tomolak的原始答案,您可以获得最佳性能:


public static string ByteArrayToString(byte[] ba)   
{   
   StringBuilder hex = new StringBuilder(ba.Length * 2);   

   for(int i=0; i < ga.Length; i++)       // <-- Use for loop is faster than foreach   
       hex.Append(ba[i].ToString("X2"));   // <-- ToString is faster than AppendFormat   

   return hex.ToString();   
} 


这是迄今为止我在这里发布的所有例程中最快的。不要只听我的话......对每个例程进行性能测试并自己检查它的CIL代码。

其它参考18


在速度方面,这似乎比这里的任何东西都要好:


  public static string ToHexString(byte[] data) {
    byte b;
    int i, j, k;
    int l = data.Length;
    char[] r = new char[l * 2];
    for (i = 0, j = 0; i < l; ++i) {
      b = data[i];
      k = b >> 4;
      r[j++] = (char)(k > 9 ? k + 0x37 : k + 0x30);
      k = b & 15;
      r[j++] = (char)(k > 9 ? k + 0x37 : k + 0x30);
    }
    return new string(r);
  }

其它参考19


我没有得到你建议工作的代码,Olipro。 hex[i] + hex[i+1]显然返回int


我做了,但是通过从Waleeds代码中获取一些提示并将其拼凑在一起取得了一些成功。它很丑陋,但它似乎工作并且在1/3的时间内执行比较根据我的测试(使用patridges测试机制)给其他人。取决于输入大小。首先切换?:s以分离出0-9可能会产生稍快的结果,因为数字多于字母。


public static byte[] StringToByteArray2(string hex)
{
    byte[] bytes = new byte[hex.Length/2];
    int bl = bytes.Length;
    for (int i = 0; i < bl; ++i)
    {
        bytes[i] = (byte)((hex[2 * i] > 'F' ? hex[2 * i] - 0x57 : hex[2 * i] > '9' ? hex[2 * i] - 0x37 : hex[2 * i] - 0x30) << 4);
        bytes[i] |= (byte)(hex[2 * i + 1] > 'F' ? hex[2 * i + 1] - 0x57 : hex[2 * i + 1] > '9' ? hex[2 * i + 1] - 0x37 : hex[2 * i + 1] - 0x30);
    }
    return bytes;
}

其它参考20


此版本的ByteArrayToHexViaByteManipulation可能更快。


从我的报告:



  • ByteArrayToHexViaByteManipulation3:1,68个平均价格(超过1000次运行),17,5X

  • ByteArrayToHexViaByteManipulation2:1,73个平均价格(超过1000次运行),16,9X

  • ByteArrayToHexViaByteManipulation:2,90平均刻度(超过1000次运行),10,1X

  • ByteArrayToHexViaLookupAndShift:3,22平均刻度(超过1000次运行),9,1X

  • ...


    static private readonly char[] hexAlphabet = new char[]
        {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    static string ByteArrayToHexViaByteManipulation3(byte[] bytes)
    {
        char[] c = new char[bytes.Length * 2];
        byte b;
        for (int i = 0; i < bytes.Length; i++)
        {
            b = ((byte)(bytes[i] >> 4));
            c[i * 2] = hexAlphabet[b];
            b = ((byte)(bytes[i] & 0xF));
            c[i * 2 + 1] = hexAlphabet[b];
        }
        return new string(c);
    }
    



我认为这是一个优化:


    static private readonly char[] hexAlphabet = new char[]
        {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    static string ByteArrayToHexViaByteManipulation4(byte[] bytes)
    {
        char[] c = new char[bytes.Length * 2];
        for (int i = 0, ptr = 0; i < bytes.Length; i++, ptr += 2)
        {
            byte b = bytes[i];
            c[ptr] = hexAlphabet[b >> 4];
            c[ptr + 1] = hexAlphabet[b & 0xF];
        }
        return new string(c);
    }

其它参考21


我将进入这个小小的竞争对手,因为我有一个答案也使用了比特摆弄解码十六进制。请注意,使用字符数组可能会更快,因为调用StringBuilder方法需要时间同样。


public static String ToHex (byte[] data)
{
    int dataLength = data.Length;
    // pre-create the stringbuilder using the length of the data * 2, precisely enough
    StringBuilder sb = new StringBuilder (dataLength * 2);
    for (int i = 0; i < dataLength; i++) {
        int b = data [i];

        // check using calculation over bits to see if first tuple is a letter
        // isLetter is zero if it is a digit, 1 if it is a letter
        int isLetter = (b >> 7) & ((b >> 6) | (b >> 5)) & 1;

        // calculate the code using a multiplication to make up the difference between
        // a digit character and an alphanumerical character
        int code = '0' + ((b >> 4) & 0xF) + isLetter * ('A' - '9' - 1);
        // now append the result, after casting the code point to a character
        sb.Append ((Char)code);

        // do the same with the lower (less significant) tuple
        isLetter = (b >> 3) & ((b >> 2) | (b >> 1)) & 1;
        code = '0' + (b & 0xF) + isLetter * ('A' - '9' - 1);
        sb.Append ((Char)code);
    }
    return sb.ToString ();
}

public static byte[] FromHex (String hex)
{

    // pre-create the array
    int resultLength = hex.Length / 2;
    byte[] result = new byte[resultLength];
    // set validity = 0 (0 = valid, anything else is not valid)
    int validity = 0;
    int c, isLetter, value, validDigitStruct, validDigit, validLetterStruct, validLetter;
    for (int i = 0, hexOffset = 0; i < resultLength; i++, hexOffset += 2) {
        c = hex [hexOffset];

        // check using calculation over bits to see if first char is a letter
        // isLetter is zero if it is a digit, 1 if it is a letter (upper & lowercase)
        isLetter = (c >> 6) & 1;

        // calculate the tuple value using a multiplication to make up the difference between
        // a digit character and an alphanumerical character
        // minus 1 for the fact that the letters are not zero based
        value = ((c & 0xF) + isLetter * (-1 + 10)) << 4;

        // check validity of all the other bits
        validity |= c >> 7; // changed to >>, maybe not OK, use UInt?

        validDigitStruct = (c & 0x30) ^ 0x30;
        validDigit = ((c & 0x8) >> 3) * (c & 0x6);
        validity |= (isLetter ^ 1) * (validDigitStruct | validDigit);

        validLetterStruct = c & 0x18;
        validLetter = (((c - 1) & 0x4) >> 2) * ((c - 1) & 0x2);
        validity |= isLetter * (validLetterStruct | validLetter);

        // do the same with the lower (less significant) tuple
        c = hex [hexOffset + 1];
        isLetter = (c >> 6) & 1;
        value ^= (c & 0xF) + isLetter * (-1 + 10);
        result [i] = (byte)value;

        // check validity of all the other bits
        validity |= c >> 7; // changed to >>, maybe not OK, use UInt?

        validDigitStruct = (c & 0x30) ^ 0x30;
        validDigit = ((c & 0x8) >> 3) * (c & 0x6);
        validity |= (isLetter ^ 1) * (validDigitStruct | validDigit);

        validLetterStruct = c & 0x18;
        validLetter = (((c - 1) & 0x4) >> 2) * ((c - 1) & 0x2);
        validity |= isLetter * (validLetterStruct | validLetter);
    }

    if (validity != 0) {
        throw new ArgumentException ("Hexadecimal encoding incorrect for input " + hex);
    }

    return result;
}


从Java代码转换而来。

其它参考22


并插入到SQL字符串中(如果您不使用命令参数):


public static String ByteArrayToSQLHexString(byte[] Source)
{
    return = "0x" + BitConverter.ToString(Source).Replace("-", "");
}

其它参考23


多样性的另一种变化:


public static byte[] FromHexString(string src)
{
    if (String.IsNullOrEmpty(src))
        return null;

    int index = src.Length;
    int sz = index / 2;
    if (sz <= 0)
        return null;

    byte[] rc = new byte[sz];

    while (--sz >= 0)
    {
        char lo = src[--index];
        char hi = src[--index];

        rc[sz] = (byte)(
            (
                (hi >= '0' && hi <= '9') ? hi - '0' :
                (hi >= 'a' && hi <= 'f') ? hi - 'a' + 10 :
                (hi >= 'A' && hi <= 'F') ? hi - 'A' + 10 :
                0
            )
            << 4 | 
            (
                (lo >= '0' && lo <= '9') ? lo - '0' :
                (lo >= 'a' && lo <= 'f') ? lo - 'a' + 10 :
                (lo >= 'A' && lo <= 'F') ? lo - 'A' + 10 :
                0
            )
        );
    }

    return rc;          
}

其它参考24


没有针对速度进行优化,但比大多数答案(.NET 4.0)更多LINQy:


<Extension()>
Public Function FromHexToByteArray(hex As String) As Byte()
    hex = If(hex, String.Empty)
    If hex.Length Mod 2 = 1 Then hex = "0" & hex
    Return Enumerable.Range(0, hex.Length \ 2).Select(Function(i) Convert.ToByte(hex.Substring(i * 2, 2), 16)).ToArray
End Function

<Extension()>
Public Function ToHexString(bytes As IEnumerable(Of Byte)) As String
    Return String.Concat(bytes.Select(Function(b) b.ToString("X2")))
End Function

其它参考25


两个mashup将两个半字节操作折叠成一个。


可能效率很高的版本:


public static string ByteArrayToString2(byte[] ba)
{
    char[] c = new char[ba.Length * 2];
    for( int i = 0; i < ba.Length * 2; ++i)
    {
        byte b = (byte)((ba[i>>1] >> 4*((i&1)^1)) & 0xF);
        c[i] = (char)(55 + b + (((b-10)>>31)&-7));
    }
    return new string( c );
}


颓废的linq-with-bit-hacking版本:


public static string ByteArrayToString(byte[] ba)
{
    return string.Concat( ba.SelectMany( b => new int[] { b >> 4, b & 0xF }).Select( b => (char)(55 + b + (((b-10)>>31)&-7))) );
}


反过来:


public static byte[] HexStringToByteArray( string s )
{
    byte[] ab = new byte[s.Length>>1];
    for( int i = 0; i < s.Length; i++ )
    {
        int b = s[i];
        b = (b - '0') + ((('9' - b)>>31)&-7);
        ab[i>>1] |= (byte)(b << 4*((i&1)^1));
    }
    return ab;
}

其它参考26


另一种方法是使用stackalloc来降低GC内存压力:


static string ByteToHexBitFiddle(byte[] bytes)
{
        var c = stackalloc char[bytes.Length * 2 + 1];
        int b; 
        for (int i = 0; i < bytes.Length; ++i)
        {
            b = bytes[i] >> 4;
            c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
            b = bytes[i] & 0xF;
            c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
        }
        c[bytes.Length * 2 ] = '\0';
        return new string(c);
}

其它参考27


这是我对它的镜头。我已经创建了一对扩展类来扩展字符串和字节。在大文件测试中,性能与Byte Manipulation 2相当。


下面的ToHexString代码是查找和移位算法的优化实现。它几乎与Behrooz的相同,但事实证明使用foreach​​]]进行迭代,计数器比明确索引for更快。


它位于我的机器上Byte Manipulation 2后面的第二位,并且是非常易读的代码。以下测试结果也很重要:


ToHexStringCharArrayWithCharArrayLookup:41,589.69平均价格(超过1000次运行),1.5X
ToHexStringCharArrayWithStringLookup:50,764.06平均刻度(超过1000次运行),1.2X
ToHexStringStringBuilderWithCharArrayLookup:62,812.87平均价格(超过1000次运行),1.0X


根据上述结果,似乎可以得出结论:



  1. 索引到字符串以执行查找与a的惩罚
    char数组在大文件测试中很重要。

  2. 使用已知容量的StringBuilder与char的惩罚
    用于创建字符串的已知大小的数组甚至更为重要。



这是代码:


using System;

namespace ConversionExtensions
{
    public static class ByteArrayExtensions
    {
        private readonly static char[] digits = new char[] { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'A', 'B', 'C', 'D', 'E', 'F' };

        public static string ToHexString(this byte[] bytes)
        {
            char[] hex = new char[bytes.Length * 2];
            int index = 0;

            foreach (byte b in bytes)
            {
                hex[index++] = digits[b >> 4];
                hex[index++] = digits[b & 0x0F];
            }

            return new string(hex);
        }
    }
}


using System;
using System.IO;

namespace ConversionExtensions
{
    public static class StringExtensions
    {
        public static byte[] ToBytes(this string hexString)
        {
            if (!string.IsNullOrEmpty(hexString) && hexString.Length % 2 != 0)
            {
                throw new FormatException("Hexadecimal string must not be empty and must contain an even number of digits to be valid.");
            }

            hexString = hexString.ToUpperInvariant();
            byte[] data = new byte[hexString.Length / 2];

            for (int index = 0; index < hexString.Length; index += 2)
            {
                int highDigitValue = hexString[index] <= '9' ? hexString[index] - '0' : hexString[index] - 'A' + 10;
                int lowDigitValue = hexString[index + 1] <= '9' ? hexString[index + 1] - '0' : hexString[index + 1] - 'A' + 10;

                if (highDigitValue < 0 || lowDigitValue < 0 || highDigitValue > 15 || lowDigitValue > 15)
                {
                    throw new FormatException("An invalid digit was encountered. Valid hexadecimal digits are 0-9 and A-F.");
                }
                else
                {
                    byte value = (byte)((highDigitValue << 4) | (lowDigitValue & 0x0F));
                    data[index / 2] = value;
                }
            }

            return data;
        }
    }
}


下面是我在我的机器上将代码放入@patridge的测试项目时得到的测试结果。我还添加了一个从十六进制转换为字节数组的测试。运行我的代码的测试运行是ByteArrayToHexViaOptimizedLookupAndShift和HexToByteArrayViaByteManipulation。 HexToByteArrayViaConvertToByte取自XXXX.HixToByteArrayViaSoapHexBinary是来自@Mykroft的回答。



  Intel Pentium III Xeon处理器


    Cores: 4 <br/>
    Current Clock Speed: 1576 <br/>
    Max Clock Speed: 3092 <br/>

  
  

  
  将字节数组转换为十六进制字符串表示形式

  
  

  
  ByteArrayToHexViaByteManipulation2:39,366.64平均价格(超过1000次运行),22.4X

  
  ByteArrayToHexViaOptimizedLookupAndShift:41,588.64平均价格
  (超过1000次运行),21.2X

  
  ByteArrayToHexViaLookup:55,509.56平均价格(超过1000次运行),15.9X

  
  ByteArrayToHexViaByteManipulation:65,349.12平均蜱(超过1000次运行),13.5X

  
  ByteArrayToHexViaLookupAndShift:86,926.87平均价格(超过1000)
  10.2X

  
  ByteArrayToHexStringViaBitConverter:平均139,353.73
  蜱(超过1000次运行),6.3X

  
  ByteArrayToHexViaSoapHexBinary:314,598.77平均价格(超过1000次运行),2.8X

  
  ByteArrayToHexStringViaStringBuilderForEachByteToString:344,264.63
  平均蜱(超过1000次运行),2.6X

  
  ByteArrayToHexStringViaStringBuilderAggregateByteToString:382,623.44
  平均蜱(超过1000次运行),2.3X

  
  ByteArrayToHexStringViaStringBuilderForEachAppendFormat:818,111.95
  平均蜱(超过1000次运行),1.1X

  
  ByteArrayToHexStringViaStringConcatArrayConvertAll:平均839,244.84
  蜱(超过1000次运行),1.1X

  
  ByteArrayToHexStringViaStringBuilderAggregateAppendFormat:867,303.98
  平均蜱(超过1000次运行),1.0X

  
  ByteArrayToHexStringViaStringJoinArrayConvertAll:平均882,710.28
  蜱(超过1000次运行),1.0X

  
  


其它参考28


另一个快速功能......


private static readonly byte[] HexNibble = new byte[] {
    0x0, 0x1, 0x2, 0x3, 0x4, 0x5, 0x6, 0x7,
    0x8, 0x9, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0xA, 0xB, 0xC, 0xD, 0xE, 0xF, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0xA, 0xB, 0xC, 0xD, 0xE, 0xF
};

public static byte[] HexStringToByteArray( string str )
{
    int byteCount = str.Length >> 1;
    byte[] result = new byte[byteCount + (str.Length & 1)];
    for( int i = 0; i < byteCount; i++ )
        result[i] = (byte) (HexNibble[str[i << 1] - 48] << 4 | HexNibble[str[(i << 1) + 1] - 48]);
    if( (str.Length & 1) != 0 )
        result[byteCount] = (byte) HexNibble[str[str.Length - 1] - 48];
    return result;
}

其它参考29


为了表现,我会选择drphrozens解决方案。对解码器的一个微小的优化可以是使用表来表示char以消除<<<<<<<<<<<


显然,这两种方法调用成本很高。如果对输入或输出数据(可能是CRC,校验和或其他)进行某种检查,则可以跳过if (b == 255)...,从而也可以完全调用方法。


使用offset++offset代替offsetoffset + 1可能会带来一些理论上的好处,但我怀疑编译器比我更好地处理这个问题。


private static readonly byte[] LookupTableLow = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static readonly byte[] LookupTableHigh = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80, 0x90, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xA0, 0xB0, 0xC0, 0xD0, 0xE0, 0xF0, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xA0, 0xB0, 0xC0, 0xD0, 0xE0, 0xF0, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static byte LookupLow(char c)
{
  var b = LookupTableLow[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

private static byte LookupHigh(char c)
{
  var b = LookupTableHigh[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

public static byte ToByte(char[] chars, int offset)
{
  return (byte)(LookupHigh(chars[offset++]) | LookupLow(chars[offset]));
}


这只是我的头脑,并没有经过测试或基准测试。