文本编码检测
什么是文本编码?
文本编码是将字符映射为计算机可存储的二进制数据的规则。常见的编码包括 UTF-8(国际通用)、GBK(中文)、Big5(繁体中文)、Shift_JIS(日文)等。
当使用错误的编码打开文件时,就会出现"乱码"现象。本工具可以自动检测文本或文件的编码格式,帮助您识别正确的编码。
使用说明
文本检测:
1. 选择"文本检测"模式,粘贴需要检测的文本内容
2. 点击"检测编码"按钮,查看检测结果
3. 结果包括编码名称、置信度和候选编码
文件检测:
1. 选择"文件检测"模式,拖拽或点击选择文件
2. 系统会自动检测文件编码并显示结果
3. 可预览文件内容确认检测是否正确
注意:所有检测均在浏览器本地完成,文件内容不会上传到服务器
1. 选择"文本检测"模式,粘贴需要检测的文本内容
2. 点击"检测编码"按钮,查看检测结果
3. 结果包括编码名称、置信度和候选编码
文件检测:
1. 选择"文件检测"模式,拖拽或点击选择文件
2. 系统会自动检测文件编码并显示结果
3. 可预览文件内容确认检测是否正确
注意:所有检测均在浏览器本地完成,文件内容不会上传到服务器
常见编码说明
| 编码名称 | 说明 | 适用场景 | 特征 |
|---|---|---|---|
| UTF-8 | 国际通用编码,支持全球所有语言字符,变长编码(1-4字节) | 网页、API、现代系统 | 英文1字节,中文3字节 |
| GBK | 中文编码,包含简体和繁体中文,是GB2312的扩展 | Windows中文系统 | 中文2字节,英文1字节 |
| GB2312 | 早期的简体中文编码,收录6763个汉字 | 旧系统兼容 | 双字节编码 |
| Big5 | 繁体中文编码,主要用于台湾、香港地区 | 繁体中文系统 | 双字节编码 |
| ISO-8859-1 | 西欧语言编码,也称Latin-1,单字节编码 | 西欧语言、旧网页 | 仅支持0-255字符 |
| Shift_JIS | 日文编码,Windows日文系统常用 | 日文系统 | 单双字节混合 |
