utf-8可以支持繁体中文,utf-8支持简体中文、繁体中文、英文、日文、韩文等。
utf-8(8位通用字符集/unicode转换格式)是unicode的可变长度字符编码。
它可以用来表示unicode标准中的任何字符,并且其编码中的第一个字节仍然与ascii兼容,因此处理ascii字符的原始软件可以继续使用,而无需修改或只需少量修改。因此,它逐渐成为电子邮件、网页和其他存储或传输文本的应用程序中的首选编码。
utf-8编码可以识别中文。
常用汉字的unicode编码范围是4e00-9fa5,包含在utf-83字节编码范围内。
因此,如果文本用utf-8编码,一个汉字将由三个字节组成。
并且这三个字节的第一个的范围将是:11100100-11101001。
使用()读取文件,结果是一个由每个字节的二进制数据转换成unicod
嗯,在windows下,默认好像是gb2312。你用记事本打开源文件,当你保存为utf-8,你可以覆盖它。
你好,我我是一名网络工程师,我我很高兴回答你的问题。欢迎关注,多交流。
utf8的好处:数据显示,:网页可以显示任何语言和字符。只要你的操作系统支持unicod:不需要gb2312和big5之间的转换程序进行数据交换。php中著名的徐公盖和smarty的问题都可以很好的解决。
utf8的缺点:使用的中文网站不多,不利于数据交换。汉字是三个字符,有时候varchar不够用。但总体来说利大于弊,所以我们一直用4字节(头)。
欢迎关注,多交流。