什么是文本编码？

文本编码是将字符映射为计算机可存储的二进制数据的规则。常见的编码包括 UTF-8（国际通用）、GBK（中文）、Big5（繁体中文）、Shift_JIS（日文）等。当使用错误的编码打开文件时，就会出现"乱码"现象。本工具可以自动检测文本或文件的编码格式，帮助您识别正确的编码。

使用说明

文本检测：
1. 选择"文本检测"模式，粘贴需要检测的文本内容
2. 点击"检测编码"按钮，查看检测结果
3. 结果包括编码名称、置信度和候选编码

文件检测：
1. 选择"文件检测"模式，拖拽或点击选择文件
2. 系统会自动检测文件编码并显示结果
3. 可预览文件内容确认检测是否正确

注意：所有检测均在浏览器本地完成，文件内容不会上传到服务器

常见编码说明

编码名称	说明	适用场景	特征
UTF-8	国际通用编码，支持全球所有语言字符，变长编码（1-4字节）	网页、API、现代系统	英文1字节，中文3字节
GBK	中文编码，包含简体和繁体中文，是GB2312的扩展	Windows中文系统	中文2字节，英文1字节
GB2312	早期的简体中文编码，收录6763个汉字	旧系统兼容	双字节编码
Big5	繁体中文编码，主要用于台湾、香港地区	繁体中文系统	双字节编码
ISO-8859-1	西欧语言编码，也称Latin-1，单字节编码	西欧语言、旧网页	仅支持0-255字符
Shift_JIS	日文编码，Windows日文系统常用	日文系统	单双字节混合

五岁小站

文本编码检测

检测结果

文件信息

文件内容预览

什么是文本编码？

使用说明

常见编码说明