五岁小站 - 免费在线工具箱

加载中...

文本编码检测

什么是文本编码?

文本编码是将字符映射为计算机可存储的二进制数据的规则。常见的编码包括 UTF-8(国际通用)、GBK(中文)、Big5(繁体中文)、Shift_JIS(日文)等。 当使用错误的编码打开文件时,就会出现"乱码"现象。本工具可以自动检测文本或文件的编码格式,帮助您识别正确的编码。

使用说明

文本检测:
1. 选择"文本检测"模式,粘贴需要检测的文本内容
2. 点击"检测编码"按钮,查看检测结果
3. 结果包括编码名称、置信度和候选编码

文件检测:
1. 选择"文件检测"模式,拖拽或点击选择文件
2. 系统会自动检测文件编码并显示结果
3. 可预览文件内容确认检测是否正确

注意:所有检测均在浏览器本地完成,文件内容不会上传到服务器

常见编码说明

编码名称 说明 适用场景 特征
UTF-8 国际通用编码,支持全球所有语言字符,变长编码(1-4字节) 网页、API、现代系统 英文1字节,中文3字节
GBK 中文编码,包含简体和繁体中文,是GB2312的扩展 Windows中文系统 中文2字节,英文1字节
GB2312 早期的简体中文编码,收录6763个汉字 旧系统兼容 双字节编码
Big5 繁体中文编码,主要用于台湾、香港地区 繁体中文系统 双字节编码
ISO-8859-1 西欧语言编码,也称Latin-1,单字节编码 西欧语言、旧网页 仅支持0-255字符
Shift_JIS 日文编码,Windows日文系统常用 日文系统 单双字节混合