字符编码转换

支持多种字符编码格式的相互转换
编码
编码 格式
字符编码简介
字符编码是将字符映射到二进制数据的方式。不同的编码方式支持不同的字符集,选择合适的编码对于正确处理文本数据至关重要。
常见编码说明
  • UTF-8:通用字符编码,支持所有Unicode字符
  • GBK:中文编码,支持简体中文和繁体中文
  • ASCII:基本拉丁字母、数字和符号
  • ISO-8859-1:西欧语言编码
  • Big5:繁体中文编码
显示格式说明
  • 文本:直接显示字符
  • 十六进制:将二进制数据转换为十六进制字符串
  • Base64:将二进制数据编码为ASCII字符
代码示例
Python:
# UTF-8 转 GBK
text = '测试文本'
utf8_bytes = text.encode('utf-8')
gbk_bytes = utf8_bytes.decode('utf-8').encode('gbk')
print(gbk_bytes.decode('gbk'))

# 转十六进制
hex_str = utf8_bytes.hex()
print(hex_str)

# 转Base64
import base64
base64_str = base64.b64encode(utf8_bytes).decode()
print(base64_str)
        
JavaScript:
// UTF-8 编码
const text = '测试文本';
const encoder = new TextEncoder();
const utf8Bytes = encoder.encode(text);

// 转十六进制
const hexStr = Array.from(utf8Bytes)
    .map(b => b.toString(16).padStart(2, '0'))
    .join('');
console.log(hexStr);

// 转Base64
const base64Str = btoa(String.fromCharCode.apply(null, utf8Bytes));
console.log(base64Str);
        
注意事项
  • 转换时可能丢失不支持的字符
  • 建议使用UTF-8作为主要编码
  • 注意处理编码转换时的异常
  • 十六进制和Base64格式主要用于二进制数据的文本表示