字符编码转换
支持多种字符编码格式的相互转换
编码
编码
格式
字符编码简介
字符编码是将字符映射到二进制数据的方式。不同的编码方式支持不同的字符集,选择合适的编码对于正确处理文本数据至关重要。
常见编码说明
- UTF-8:通用字符编码,支持所有Unicode字符
- GBK:中文编码,支持简体中文和繁体中文
- ASCII:基本拉丁字母、数字和符号
- ISO-8859-1:西欧语言编码
- Big5:繁体中文编码
显示格式说明
- 文本:直接显示字符
- 十六进制:将二进制数据转换为十六进制字符串
- Base64:将二进制数据编码为ASCII字符
代码示例
Python:
# UTF-8 转 GBK text = '测试文本' utf8_bytes = text.encode('utf-8') gbk_bytes = utf8_bytes.decode('utf-8').encode('gbk') print(gbk_bytes.decode('gbk')) # 转十六进制 hex_str = utf8_bytes.hex() print(hex_str) # 转Base64 import base64 base64_str = base64.b64encode(utf8_bytes).decode() print(base64_str)
JavaScript:
// UTF-8 编码 const text = '测试文本'; const encoder = new TextEncoder(); const utf8Bytes = encoder.encode(text); // 转十六进制 const hexStr = Array.from(utf8Bytes) .map(b => b.toString(16).padStart(2, '0')) .join(''); console.log(hexStr); // 转Base64 const base64Str = btoa(String.fromCharCode.apply(null, utf8Bytes)); console.log(base64Str);
注意事项
- 转换时可能丢失不支持的字符
- 建议使用UTF-8作为主要编码
- 注意处理编码转换时的异常
- 十六进制和Base64格式主要用于二进制数据的文本表示