如何在C中将字节数组转换为十六进制字符串?


88

我有:

uint8 buf[] = {0, 1, 10, 11};

我想将字节数组转换为字符串,以便可以使用printf打印该字符串:

printf("%s\n", str);

得到(不需要冒号):

"00:01:0A:0B"

任何帮助将不胜感激。


buf[i]必须转换为unsigned char,否则将溢出buf[i] > 127,即:buf_ptr += sprintf(buf_ptr, "%02X", (unsigned char)buf[i]);
whatacold

Answers:


93
printf("%02X:%02X:%02X:%02X", buf[0], buf[1], buf[2], buf[3]);

以更通用的方式:

int i;
for (i = 0; i < x; i++)
{
    if (i > 0) printf(":");
    printf("%02X", buf[i]);
}
printf("\n");

要连接到字符串,有几种方法可以执行此操作...我可能会保留一个指向字符串末尾的指针并使用sprintf。您还应该跟踪数组的大小,以确保其大小不会超过分配的空间:

int i;
char* buf2 = stringbuf;
char* endofbuf = stringbuf + sizeof(stringbuf);
for (i = 0; i < x; i++)
{
    /* i use 5 here since we are going to add at most 
       3 chars, need a space for the end '\n' and need
       a null terminator */
    if (buf2 + 5 < endofbuf)
    {
        if (i > 0)
        {
            buf2 += sprintf(buf2, ":");
        }
        buf2 += sprintf(buf2, "%02X", buf[i]);
    }
}
buf2 += sprintf(buf2, "\n");

谢谢马克-我的问题有点复杂。我实际上有一个X字节长度的缓冲区。我希望找到一种通用的方式来对X字节执行此操作,并得到一个字符串作为结果。
史蒂夫·沃尔什

刚刚更新以添加用于处理任何给定数量的字节的代码...假设x为长度。
Mark Synowiec 2011年

再次感谢Mark,但是我发现这个问题最棘手的事情是如何将其打印到字符串中。
史蒂夫·沃尔什

5
printf("%02X", (unsigned char)buf[i]);应该用作原始字符,这会导致未签名字符溢出
easytiger 2013年

3
为什么不printf("%02hhX", buf[i])呢?
Hintron

32

对于completude,您也可以轻松地做到这一点,而无需调用任何繁重的库函数(没有snprintf,没有strcat,甚至没有memcpy)。例如,如果您正在编程某些无法使用libc的微控制器或OS内核,这可能很有用。

如果您用google搜索,没有什么真正的幻想。实际上,它并没有比调用snprintf复杂得多,而且速度更快。

#include <stdio.h>

int main(){
    unsigned char buf[] = {0, 1, 10, 11};
    /* target buffer should be large enough */
    char str[12];

    unsigned char * pin = buf;
    const char * hex = "0123456789ABCDEF";
    char * pout = str;
    int i = 0;
    for(; i < sizeof(buf)-1; ++i){
        *pout++ = hex[(*pin>>4)&0xF];
        *pout++ = hex[(*pin++)&0xF];
        *pout++ = ':';
    }
    *pout++ = hex[(*pin>>4)&0xF];
    *pout++ = hex[(*pin)&0xF];
    *pout = 0;

    printf("%s\n", str);
}

这是另一个稍短的版本。它仅避免中间索引变量i和重复的laste case代码(但是终止字符被写入两次)。

#include <stdio.h>
int main(){
    unsigned char buf[] = {0, 1, 10, 11};
    /* target buffer should be large enough */
    char str[12];

    unsigned char * pin = buf;
    const char * hex = "0123456789ABCDEF";
    char * pout = str;
    for(; pin < buf+sizeof(buf); pout+=3, pin++){
        pout[0] = hex[(*pin>>4) & 0xF];
        pout[1] = hex[ *pin     & 0xF];
        pout[2] = ':';
    }
    pout[-1] = 0;

    printf("%s\n", str);
}

下面是回答评论的另一个版本,该评论说我使用“技巧”来知道输入缓冲区的大小。实际上,这不是技巧,而是必要的输入知识(您需要知道要转换的数据的大小)。通过将转换代码提取到一个单独的函数中,我使这一点变得更加清晰。我还为目标缓冲区添加了边界检查代码,如果我们知道自己在做什么,则实际上并没有必要。

#include <stdio.h>

void tohex(unsigned char * in, size_t insz, char * out, size_t outsz)
{
    unsigned char * pin = in;
    const char * hex = "0123456789ABCDEF";
    char * pout = out;
    for(; pin < in+insz; pout +=3, pin++){
        pout[0] = hex[(*pin>>4) & 0xF];
        pout[1] = hex[ *pin     & 0xF];
        pout[2] = ':';
        if (pout + 3 - out > outsz){
            /* Better to truncate output string than overflow buffer */
            /* it would be still better to either return a status */
            /* or ensure the target buffer is large enough and it never happen */
            break;
        }
    }
    pout[-1] = 0;
}

int main(){
    enum {insz = 4, outsz = 3*insz};
    unsigned char buf[] = {0, 1, 10, 11};
    char str[outsz];
    tohex(buf, insz, str, outsz);
    printf("%s\n", str);
}

1
这不是一个把戏,只是一个常数。在问题的上下文中,很明显,我们要转换为十六进制的源的长度是众所周知的(我可以输入一些硬编码的4而不是sizeof)。通常情况下,应在已知长度的某些输入上调用该函数,并且目标缓冲区具有3次+1字节可用。调用者必须确保这一点,转换函数没有理由执行该任务。在某些情况下(但并非总是如此),调用strlen()可能是一种查找源大小的方法。如果要转换为十六进制的数字包含零怎么办?
克里斯,2015年

受您的功能启发,我编写了一个版本,该版本还返回写入输出缓冲区的字节数,类似于snprintf等 。gist.github.com
cellularmitosis/

我认为您应该使用char str [sizeof(buf)* 3 + 1]自动使输出缓冲区的大小正确。
塞西尔·沃德

另外,更多的const可以保护您。例如,“ const unsigned char const * p”,以便可以确保不写入输入缓冲区。一个使地址(或“指针”)为常数或变量,而另一个使该地址处的存储器为只读或非只读。通常会阻止您混淆指针。而且,使用有意义的名称来记录哪些缓冲区和指针用于输入和输出也将有所帮助。
塞西尔·沃德

@Cecil War:除非我的代码是伪造的,否则使用const不会起到什么保护作用,除非您说混合指针或对输入和输出使用相同的指针(确定,仍然可以)。但这也将帮助编译器优化代码。更好的方法是也使用strict关键字(很糟糕,C99不是C ++,但通常作为编译器扩展存在)。您想要调用输入缓冲区in和输出缓冲区更有意义out吗?在现代的C ++优化器中,我也可以选择使用字符串并返回一个副本而不是提供输出缓冲区,这足以使它们不太在意。
kriss

15

这是一种更快的方法:

#include <stdlib.h>
#include <stdio.h>

unsigned char *     bin_to_strhex(const unsigned char *bin, unsigned int binsz,
                                  unsigned char **result)
{
  unsigned char     hex_str[]= "0123456789abcdef";
  unsigned int      i;

  if (!(*result = (unsigned char *)malloc(binsz * 2 + 1)))
    return (NULL);

  (*result)[binsz * 2] = 0;

  if (!binsz)
    return (NULL);

  for (i = 0; i < binsz; i++)
    {
      (*result)[i * 2 + 0] = hex_str[(bin[i] >> 4) & 0x0F];
      (*result)[i * 2 + 1] = hex_str[(bin[i]     ) & 0x0F];
    }
  return (*result);
}

int                 main()
{
  //the calling
  unsigned char     buf[] = {0,1,10,11};
  unsigned char *   result;

  printf("result : %s\n", bin_to_strhex((unsigned char *)buf, sizeof(buf), &result));
  free(result);

  return 0
}

3
这段代码包含一个错误,该错误仅在奇怪的不可打印的输入上显示出来(没有时间深入研究数学上的确切情况)。尝试对十六进制的二进制文件进行编码ca9e3c972f1c5db40c0b4a66ab5bc1a20ca4457bdbe5e0f8925896d5ed37d726,您将会迷失方向ÌaÌe3cÌ72f1c5dÌ40c0b4a66Ìb5bÌ1Ì20cÌ4457bÌbÌ5Ì0Ì8Ì258Ì6Ì5Ìd37Ì726。为了解决这个问题,hex_str需要将for循环第一行中的位更改(input[i] >> 4) & 0x0F为@kriss的答案。然后工作正常。
niemiro 2014年

错误-不检查malloc()失败。
塞西尔·沃德

绝对最好在任何地方都使用无符号字符,因为没有人希望有带符号字符的风险(疯狂的DEC PDP11硬件功能),这样就不会冒有符号比较错误或带符号正确移位而破坏值的风险。公平地说,在这种情况下,代码会在所有位置都进行防御性地执行&0x0F,从而在这里为您提供保护。
塞西尔·沃德

bin输入参数应为const unsigned char const * bin,以将该例程声明为只读存储器。
塞西尔·沃德

1
我已经整合了塞西尔·沃德(Cecil Ward)的主张,感谢您的反馈
Yannuth

14

上面已经存在类似的答案,我添加了此答案以解释以下代码行的确切工作方式:

ptr += sprintf(ptr, "%02X", buf[i])

这很棘手,不容易理解,我在下面的评论中添加了解释:

uint8 buf[] = {0, 1, 10, 11};

/* Allocate twice the number of bytes in the "buf" array because each byte would
 * be converted to two hex characters, also add an extra space for the terminating
 * null byte.
 * [size] is the size of the buf array */
char output[(size * 2) + 1];

/* pointer to the first item (0 index) of the output array */
char *ptr = &output[0];

int i;

for (i = 0; i < size; i++) {
    /* "sprintf" converts each byte in the "buf" array into a 2 hex string
     * characters appended with a null byte, for example 10 => "0A\0".
     *
     * This string would then be added to the output array starting from the
     * position pointed at by "ptr". For example if "ptr" is pointing at the 0
     * index then "0A\0" would be written as output[0] = '0', output[1] = 'A' and
     * output[2] = '\0'.
     *
     * "sprintf" returns the number of chars in its output excluding the null
     * byte, in our case this would be 2. So we move the "ptr" location two
     * steps ahead so that the next hex string would be written at the new
     * location, overriding the null byte from the previous hex string.
     *
     * We don't need to add a terminating null byte because it's been already 
     * added for us from the last hex string. */  
    ptr += sprintf(ptr, "%02X", buf[i]);
}

printf("%s\n", output);

辉煌的逻辑。正在寻找一个小时来解决这个挑战的优雅非C ++字符串!
Mark Terrill

6

我只是想添加以下内容,即使它有点偏离主题(不是标准C语言),但我发现自己经常在寻找它,并且在第一个搜索结果中绊倒了这个问题。Linux内核打印功能,printk还具有格式说明符,用于通过单数格式说明符“直接”输出数组/内存内容:

https://www.kernel.org/doc/Documentation/printk-formats.txt

Raw buffer as a hex string:
    %*ph    00 01 02  ...  3f
    %*phC   00:01:02: ... :3f
    %*phD   00-01-02- ... -3f
    %*phN   000102 ... 3f

    For printing a small buffers (up to 64 bytes long) as a hex string with
    certain separator. For the larger buffers consider to use
    print_hex_dump(). 

...但是,对于标准用户空间似乎不存在这些格式说明符(s)printf


4

函数btox将任意数据转换为十六进制数字的*bb无终止字符串:*xpn

void btox(char *xp, const char *bb, int n) 
{
    const char xx[]= "0123456789ABCDEF";
    while (--n >= 0) xp[n] = xx[(bb[n>>1] >> ((1 - (n&1)) << 2)) & 0xF];
}

#include <stdio.h>

typedef unsigned char uint8;

void main(void) 
{
    uint8 buf[] = {0, 1, 10, 11};
    int n = sizeof buf << 1;
    char hexstr[n + 1];

    btox(hexstr, buf, n);
    hexstr[n] = 0; /* Terminate! */
    printf("%s\n", hexstr);
}

结果: 00010A0B

直播:Tio.run


1

这是执行转换的一种方式:

#include<stdio.h>
#include<stdlib.h>

#define l_word 15
#define u_word 240

char *hex_str[]={"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"};

main(int argc,char *argv[]) {


     char *str = malloc(50);
     char *tmp;
     char *tmp2;

     int i=0;


     while( i < (argc-1)) {
          tmp = hex_str[*(argv[i]) & l_word];
          tmp2 = hex_str[*(argv[i]) & u_word];

          if(i == 0) { memcpy(str,tmp2,1); strcat(str,tmp);}
          else { strcat(str,tmp2); strcat(str,tmp);}
          i++;
    }

    printf("\n*********  %s  *************** \n", str);

}

1

略微修改了Yannith版本。只是我喜欢将其作为返回值

typedef struct {
   size_t len;
   uint8_t *bytes;
} vdata;

char* vdata_get_hex(const vdata data)
{
   char hex_str[]= "0123456789abcdef";

   char* out;
   out = (char *)malloc(data.len * 2 + 1);
   (out)[data.len * 2] = 0;
   
   if (!data.len) return NULL;
   
   for (size_t i = 0; i < data.len; i++) {
      (out)[i * 2 + 0] = hex_str[(data.bytes[i] >> 4) & 0x0F];
      (out)[i * 2 + 1] = hex_str[(data.bytes[i]     ) & 0x0F];
   }
   return out;
}


1

此功能适用于用户/调用者希望将十六进制字符串放入字符数组/缓冲区的情况。在字符缓冲区中使用十六进制字符串时,用户/调用者可以使用其自己的宏/功能将其显示或记录到所需的任何位置(例如,文件)。此函数还允许调用方控制要放入每行中的(十六进制)字节数。

/**
 * @fn 
 * get_hex
 *
 * @brief 
 * Converts a char into bunary string 
 *
 * @param[in]   
 *     buf Value to be converted to hex string
 * @param[in]   
 *     buf_len Length of the buffer
 * @param[in]   
 *     hex_ Pointer to space to put Hex string into
 * @param[in]   
 *     hex_len Length of the hex string space
 * @param[in]   
 *     num_col Number of columns in display hex string
 * @param[out]   
 *     hex_ Contains the hex string
 * @return  void
 */
static inline void
get_hex(char *buf, int buf_len, char* hex_, int hex_len, int num_col)
{
    int i;
#define ONE_BYTE_HEX_STRING_SIZE   3
  unsigned int byte_no = 0;

  if (buf_len <= 0) {
      if (hex_len > 0) {
        hex_[0] = '\0';
      }
      return;
  }

  if(hex_len < ONE_BYTE_HEX_STRING_SIZE + 1)
  {
      return;
  }

  do {
         for (i = 0; ((i < num_col) && (buf_len > 0) && (hex_len > 0)); ++i )
         {
            snprintf(hex_, hex_len, "%02X ", buf[byte_no++] & 0xff);
            hex_ += ONE_BYTE_HEX_STRING_SIZE;
            hex_len -=ONE_BYTE_HEX_STRING_SIZE;
            buf_len--;
         }
         if (buf_len > 1)
         {
             snprintf(hex_, hex_len, "\n");
             hex_ += 1;
         }
  } while ((buf_len) > 0 && (hex_len > 0));

}

示例:代码

#define DATA_HEX_STR_LEN 5000
    char      data_hex_str[DATA_HEX_STR_LEN];

    get_hex(pkt, pkt_len, data_hex_str, DATA_HEX_STR_LEN, 16);
    //      ^^^^^^^^^^^^                                  ^^
    //      Input byte array                              Number of (hex) byte
    //      to be converted to hex string                 columns in hex string

    printf("pkt:\n%s",data_hex_str) 

输出值

pkt:
BB 31 32 00 00 00 00 00 FF FF FF FF FF FF DE E5 
A8 E2 8E C1 08 06 00 01 08 00 06 04 00 01 DE E5 
A8 E2 8E C1 67 1E 5A 02 00 00 00 00 00 00 67 1E 
5A 01 

0

在C语言中没有用于此的原语。我可能会malloc(或可能是alloca)足够长的缓冲区并在输入上循环。我还看到它是通过具有类似于C ++的语义(但不是语法!)的动态字符串库完成的ostringstream,这似乎是更通用的解决方案,但仅在单个情况下可能不值得额外的复杂性。


0

如果要将十六进制值存储在char *字符串中,可以使用snprintf。您需要为所有打印的字符分配空间,包括前导零和冒号。

扩展Mark的答案:

char str_buf* = malloc(3*X + 1);   // X is the number of bytes to be converted

int i;
for (i = 0; i < x; i++)
{
    if (i > 0) snprintf(str_buf, 1, ":");
    snprintf(str_buf, 2, "%02X", num_buf[i]);  // need 2 characters for a single hex value
}
snprintf(str_buf, 2, "\n\0"); // dont forget the NULL byte

所以现在str_buf将包含十六进制字符串。


这样会一遍又一遍地覆盖前2个字符。
xordon 2014年

0

ZincX的解决方案适用于包含冒号分隔符:

char buf[] = {0,1,10,11};
int i, size = sizeof(buf) / sizeof(char);
char *buf_str = (char*) malloc(3 * size), *buf_ptr = buf_str;
if (buf_str) {
  for (i = 0; i < size; i++)
    buf_ptr += sprintf(buf_ptr, i < size - 1 ? "%02X:" : "%02X\0", buf[i]);
  printf("%s\n", buf_str);
  free(buf_str);
}

0

我将在这里为感兴趣的任何人添加C ++版本。

#include <iostream>
#include <iomanip>
inline void print_bytes(char const * buffer, std::size_t count, std::size_t bytes_per_line, std::ostream & out) {
    std::ios::fmtflags flags(out.flags()); // Save flags before manipulation.
    out << std::hex << std::setfill('0');
    out.setf(std::ios::uppercase);
    for (std::size_t i = 0; i != count; ++i) {
        auto current_byte_number = static_cast<unsigned int>(static_cast<unsigned char>(buffer[i]));
        out << std::setw(2) << current_byte_number;
        bool is_end_of_line = (bytes_per_line != 0) && ((i + 1 == count) || ((i + 1) % bytes_per_line == 0));
        out << (is_end_of_line ? '\n' : ' ');
    }
    out.flush();
    out.flags(flags); // Restore original flags.
}

它将打印buffer长度count为的十六进制转储std::ostream out(您可以将其默认设置为std::cout)。每行将包含bytes_per_line字节,每个字节均使用大写的两位数十六进制表示。字节之间将有一个空格。在行尾或缓冲区末尾,它将打印换行符。如果bytes_per_line设置为0,则不会打印new_line。自己动手。


0

为了简单起见,我制作了一个对输入字符串(二进制数据)进行编码的函数:

/* Encodes string to hexadecimal string reprsentation
    Allocates a new memory for supplied lpszOut that needs to be deleted after use
    Fills the supplied lpszOut with hexadecimal representation of the input
    */
void StringToHex(unsigned char *szInput, size_t size_szInput, char **lpszOut)
{
    unsigned char *pin = szInput;
    const char *hex = "0123456789ABCDEF";
    size_t outSize = size_szInput * 2 + 2;
    *lpszOut = new char[outSize];
    char *pout = *lpszOut;
    for (; pin < szInput + size_szInput; pout += 2, pin++)
    {
        pout[0] = hex[(*pin >> 4) & 0xF];
        pout[1] = hex[*pin & 0xF];
    }
    pout[0] = 0;
}

用法:

unsigned char input[] = "This is a very long string that I want to encode";
char *szHexEncoded = NULL;
StringToHex(input, strlen((const char *)input), &szHexEncoded);

printf(szHexEncoded);

// The allocated memory needs to be deleted after usage
delete[] szHexEncoded;

0

基于Yannuth的答案,但进行了简化。

在这里,长度ofdest[]隐含为的两倍len,并且其分配由调用方管理。

void create_hex_string_implied(const unsigned char *src, size_t len, unsigned char *dest)
{
    static const unsigned char table[] = "0123456789abcdef";

    for (; len > 0; --len)
    {
        unsigned char c = *src++;
        *dest++ = table[c >> 4];
        *dest++ = table[c & 0x0f];
    }
}

0

我知道这个问题已经有了答案,但是我认为我的解决方案可以帮助某人。

因此,在我的情况下,我有一个表示键的字节数组,我需要将此字节数组转换为十六进制值的char数组,以便将其打印在一行中。我将代码提取到如下所示的函数中:

char const * keyToStr(uint8_t const *key)
{
    uint8_t offset = 0;
    static char keyStr[2 * KEY_SIZE + 1];

    for (size_t i = 0; i < KEY_SIZE; i++)
    {
        offset += sprintf(keyStr + offset, "%02X", key[i]);
    }
    sprintf(keyStr + offset, "%c", '\0');

    return keyStr;
}

现在,我可以这样使用我的函数:

Serial.print("Public key: ");
Serial.println(keyToStr(m_publicKey));

Serialobject是Arduino库的一部分,并且m_publicKey是我的类的成员,带有以下声明uint8_t m_publicKey[32]


0

您可以使用snprintf和malloc解决。

char c_buff[50];

u8_number_val[] = { 0xbb, 0xcc, 0xdd, 0x0f, 0xef, 0x0f, 0x0e, 0x0d, 0x0c };

char *s_temp = malloc(u8_size * 2 + 1);

for (uint8_t i = 0; i < u8_size; i++)
{
    snprintf(s_temp  + i * 2, 3, "%02x", u8_number_val[i]);
}

snprintf(c_buff, strlen(s_temp)+1, "%s", s_temp );

printf("%s\n",c_buff);

free(s);

输出:bbccdd0fef0f0e0d0c


-2

有什么复杂的解决方案!
Malloc,冲刺并施展哦,我的天。(OZ报价),
而不是任何地方。天哪

,这样的事情怎么样?

main()
{
    // the value
    int value = 16;

    // create a string array with a '\0' ending ie. 0,0,0
    char hex[]= {0,0,'\0'}; 
    char *hex_p=hex;

    //a working variable
    int TEMP_int=0;

    // get me how many 16s are in this code
    TEMP_int=value/16;

    // load the first character up with 
    // 48+0 gives you ascii 0, 55+10 gives you ascii A
    if (TEMP_int<10) {*hex_p=48+TEMP_int;}
        else {*hex_p=55+TEMP_int;}

    // move that pointer to the next (less significant byte)<BR>
    hex_p++;

    // get me the remainder after I have divied by 16
    TEMP_int=value%16;

    // 48+0 gives you ascii 0, 55+10 gives you ascii A
    if (TEMP_int<10) {*hex_p=48+TEMP_int;}
        else {*hex_p=55+TEMP_int;}

    // print the result
    printf("%i , 0x%s",value,hex);

}

好,现在您有两个十六进制数字。仍然需要添加分隔符并注意要转换的其他字节。也许有一个循环?使其成为一个函数,您将拥有与我相似的东西(但相当冗长且难以阅读)。也许您至少应该在其他海报上喊名字之前完成这项工作?
克里斯(Kriss)

1
关于源代码中的注释(不是REM,是注释的BASIC关键字,请避免这样做)一词:用英语说注释代码在做什么是非常不好的做法!是的,程序员应该知道模运算符的含义(给出余数),并且该除法计算一个数字在另一个数字中出现的次数...然后printf打印结果。天啊!
克里斯,2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.