用户名: 密码: 免费注册 忘记密码? 网站地图 | 加入收藏 | 设为首页
首页 | 新闻 | 工具 | 系统 | 办公 | 聊天 | 多媒体 | 网页 | 运营 | 平面 | 欣赏 | 数据库 | 程序 | 服务器 | 组网
网页 | 3dmax | Ghost | Windows Xp| Dreamweaver | photoshop | Flash | office | Alexa | Css | QQ | Asp | PHP | Jsp | Access
Flash MX 2004入门 | 网站推广策略 | CorelDRAW入门 | ASP学习 | 网站建设大师功 | Word入门
  iTbulo.com > 学院 > 网站运营教程 > 研究报道 > 文章正文
字符集的处理 多语言网站开发技术分析
iTbulo.COM 2006-8-16 龙犊整理()

  试想一下:如果一个网站提供了中,英,法,德等多种语言版本的内容,内容全之又全,设计美仑美奂。我们在中文编码环境下浏览这些非中文版本的页面觉得非常完美,现在一个法国客户对你的产品发生了兴趣,当他进到法语版面一看—乱码多多,甚至可能整个版面都一塌里糊涂。你的网站再下大工夫又有什么意义呢?

  所以对提供了多语言版本的网站来说,Unicode字符集应该是最理想的选择。它是一种双字节编码机制的字符集,不管是东方文字还是西方文字,在 Unicode中一律用两个字节来表示,因而至少可以定义65536个不同的字符,几乎可以涵盖世界上目前所有通用的语言的每一种字符。所以在设计和开发多语言网站时,一定要注意先把非中文页面的字符集定义为“utf-8”格式。

  这一步非常重要,原因在于若等页面做好之后再更改字符集设置,可说是一件非常非常吃力不讨好的工作,有时候甚至可能需要从头再来,重新输入网站的文字内容。

  HTML中的META标签:

  <META HTTP-EQUIV=“Content-Type” CONTENT=“text/html; CHARSET=字符集">

  不写,根据浏览器默认字符集显示

  charset=gb2312 简体中文

  charset=big5 繁体中文

  charset=EUC_KR 韩语

  charset=Shift_JIS 或 EUC_JP 日语

  charset= KOI8-R / Windows-1251 俄语

  charset=iso-8859-1 西欧语系(荷兰语,英语,法语,德语,意大利语,挪威语,葡萄牙语,瑞士语.等十八种语言)charset=iso-8859-2 中欧语系

  charset=iso-8859-5 斯拉夫语系(保加利亚语,Byelorussian语,马其顿语,俄语,塞尔维亚语,乌克兰语等)

  charset=uft-8 unicode多语言

  PHP与脚本引擎页码的概念

  由于我们传统使用的内码像Big5,GB2312与unicode并不是一一对应,故两者之间的转换要靠codepage(页码)来实现

  不写,根据服务器端解析引擎默认代码页自动解析并返回浏览器。

  如果制作的网页脚本与WEB服务端的默认代码页不同,则必须指明代码页:

  codepage=936 简体中文GBK

  codepage=950 繁体中文BIG5

  codepage=437 美国/加拿大英语

  codepage=932 日文

  codepage=949 韩文

  codepage=866 俄文

  codepage=65001 unicode UFT-8

上一页  [1] [2] 

文章搜索
相关资讯
相关文章 相关下载
经验共享 如何防范你的个人网站被黑
网站的信息更新频率应该是多少?
网络编辑应做些什么 如何成为网编高手?
用shtml来include网页文件(开启SSI)
站长必备:快速高效的网站文件管理新招
焦点信息