账号:
密码:
CTIMES / 文章 /   
建构全华文的网络世界 - 中文域名技术
 

【作者: 陳玉萱、尹蓓婷】2004年06月28日 星期一

浏览人次:【5060】
  

因特网的发达让各式各样网站与域名越来越多,身处在以英文为强势语言的网络世界,民众需要使用并记忆不熟悉的英文网址,导致顺利拜访目标网站的成功机率普遍不高;而利用浏览器键入相关字的搜寻网站方式,不但准确度不尽理想,亦耗费更多的时间成本。


有鉴于此,台湾网路资讯中心(以下简称TWNIC)于2003年11月宣布「国际标准中文域名注册与解析服务」正式在台上线。以提升政府e化服务品质为例,今年四月协助财政部推出方便好记的报税网站中文网址「http://网路报税.tw」,减少全省民众从事网路报税时记忆长串英文网址以及使用上的不便。而泛用型中文域名迄今亦达两万多笔注册量,许多知名企业例如智冠科技(http://智冠.tw)、雄狮旅游(http://雄狮旅游.tw)、天下集团(http://天下.tw)等都已加入中文域名行列。


中文域名的演进

国际化域名

国际化域名(Internationalized Domain Name,IDN)的发展一直是全球网民超级关心的议题之一。由于全球80%以上的网民来自非英语系的国家,多年来IDN标准的差异,造成上百万个IDN网址存在着许多互操作性与兼容性的问题。长期致力于IDN标准的发展与研究的IETF (Internet Engineering Task Force)为解决这些困扰,于去年(2003年)三月份已完成技术标准的制订工作。


另外,在亚洲方面,针对用户的使用习性与语言文字的共通性,分别有中、日、韩文语言专家及技术专家组成之JET (Joint Engineering Team),与针对中文域名技术的「中文域名协调联合会」(Chinese Domain Name Consortium)等组织,依据各地语言特性,顺利订定相关网址注册技术、注册政策、对照字表、以及IDN软件开发工作等。


泛用型中文域名

泛用型中文域名,系指直接开放申请第二层之中文域名(如:中文.tw),不论企业、组织、个人皆可申请。TWNIC除了推出符合IDN标准之中文域名注册及解析服务(包含注册字原型、一笔繁体域名与一笔简体域名的解析),亦推出支持IDN标准之中文域名解析Client下载程序「中文通」、PUNYCODE转码工具以及协助客户设定DNS或是Web之相关工具等,目的是协助用户顺利设定及应用中文域名。无论您在世界任一角落,只要有一台中文环境之电脑上网,皆可以在全球各地使用中文网域名称拜访网站。例如,只要下载「中文通」软体,在网址列输入「http://台网中心.tw/」或「台网中心」皆可成功连结至台湾网路资讯中心首页。


身为域名注册管理机构,TWNIC自2001年5月起即因应国际域名竞争情势,先期提供泛用型中文域名注册服务,并于2001年7月起提供好帮手下载软件。但因为当时国际技术标准尚未确立,导致中文域名注册及使用人数较少。IETF在2003年三月份发布IDN标准后, TWNIC除积极提升技术层面准备外,并重视保障注册人权益,事先避免域名争议。例如确保「台湾大学.tw」与「台湾大学.tw」得到相同解析网站,避免被不同人注册而产生争议。


此外,Unicode中文字集同一字码区因为繁、简体混杂,需要繁简对照及相关字表,在邀请专家进行密集比对与整理之后,制订「域名专用繁简对照表」,作为新一代中文域名注册作业的依据。经TWNIC域名服务委员会通过后,在2003年11月正式推出符合国际标准的全新泛用型中文域名注册及解析服务,在第一阶段完成注册者也依最新标准及字表转换完成。


现今TWNIC推出因应最新IDN国际认可技术标准(详如 http://中文.tw)之「第二代泛用型中文域名」,与TISNet、亚太在线、中华电信、网络中文、网络家庭、SeedNet及台湾电讯七家.tw受理注册机构,共同提供全新中文域名注册与解析服务,在申请中文域名时,TWNIC同时提供一笔繁体域名与一笔简体域名对照字。


中文域名如何产生

当注册人注册一笔中文域名(「原形域名」),注册系统参照「 中文域名字码对照表」,查询产生一笔「繁体对照域名」、「简体对照域名」,「原形域名」、「繁体对照域名」、「简体对照域名」这三笔域名之 PUNYCODE 将被设定在DNS zone file,也就是说这三笔域名因此是可以被DNS直接解析的。


TWNIC也提供以「相关字」组成「相关字域名组合」的辅助解析服务,避免「相关域名组合」后续被他人注册。辅助解析服务是利用TWNIC提供之辅助解析技术架构与方法,让用户可以用任何一个「相关字域名」来解析到「原形域名」。例如: 当输入的中文域名不在「相关字域名」的范围内,则显示没有解析成功的相关讯息给用户,画面如下:


《图一 中文域名辅助解析系统讯息画面》
《图一 中文域名辅助解析系统讯息画面》

若用户没有安装「中文通」,而输入的中文域名在「相关字域名」的范围内,则先提醒用户安装「中文通」,并显示出「相关字域名」的「原形域名」、「繁体对照域名」、「简体对照域名」这三笔域名来让用户选择。


《图二 申请域名的繁简体选择》
《图二 申请域名的繁简体选择》
《图三 输入『中文.tw』或『中文』皆可的易连功能》
《图三 输入『中文.tw』或『中文』皆可的易连功能》
《图四》
《图四》

IDN协议标准简介

@内文经过IDN Working Group耗时3年多的讨论,IETF终于在2003年3月发布IDN标准协议IDNA-NAMEPREP-PUNYCODE,与另一篇较早发布的相关标准RFC STRINPREP,成为国际化域名的技术标准。


IDNA-NAMEPREP-PUNYCODE对IDN的处理

IDNA主要是定义IDN协议以及和原DNS协议之间的关系与架构。包括在解析IDN时,将IDN从输入、NAMEPREP处理、PUNYCODE处理、输出IDN的PUNYCODE编码到DNS协议,在这过程之间所需的各种先期处理以及之间的搭配关系。


NAMEPREP包括Mapping、Normalization、Prohibition三大处理程序,主要是尽可能将IDN经过对照(Mapping)、正规化(Normalization)、禁止检查(Prohibition)的处理后,得到一个符合标准IDN规格的形式。


PUNYCODE则是将一个经过NAMEPREP处理过之IDN,从一个8位的编码形式转换为7位编码的形式。目前Internet DNS一向是7位ASCII编码的环境,经过这个PUNYCODE转码程序,便将IDN从一个8 位的IDN转换为与现有DNS环境兼容的编码。


IDN标准化后之新兴域名服务

日本JPRS在IDN标准发布后,立刻宣布提供符合IDN标准之日文域名注册服务,并默认一段过渡期,让原有以RACE编码设定的日文域名顺利转换为符合IDN标准之PUNYCODE,后续并推出协助Internet用户将IDN转为PUNYCODE的client下载程序。


TWNIC也在积极研拟后提供新的符合IDN标准的「第二代泛用型中文域名」注册及解析服务,以最顺利的方式,协助Internet用户过渡到IDN标准之中文域名服务,得到DNS正确的解析结果。


未来的IDN标准环境

除了各NIC提供新的注册及解析服务以符合IDN标准之外,Internet DNS环境若要全面提升为IDN标准,须由所有DNS、Web Server管理者配合,将现有的IDN以PUNYCODE来设定才能完成。预期未来操作系统或应用程序厂商亦将提供内定支持IDNA-NAMEPREP-PUNYCODE之IDN标准环境,届时用户可不需下载client软件即可访问到IDN。


JET IDN Admin Guideline

由于IDN标准是技术协议方面的标准,并未包括中文异体字的需求,为避免开放IDN注册服务之后,引起异体中文域名间注册的混淆及争议,目前TWNIC与CNNIC、JPNIC、KRNIC等JET(Joint Engineering Team)成员已积极共同研拟了IDN Administration Guideline。定义了异体字表的Valid Code Point、Preferred Variant、Character Variant三个字段,以及异体字表应用在IDN域名注册管理之处理原则。此Guideline在2004年4月由IETF发布为RFC 3743。(Title: Joint Engineering Team (JET) Guidelines for Internationalized Domain Names (IDN) Registration and Administration for Chinese, Japanese, and Korean。)


CDNC CDN Admin Guideline

由于JET IDN Admin Guideline定义的是一般性的基础原则, 同属CDNC成员的TWNIC与CNNIC以JET IDN Admin Guideline为基础,针对中文域名对异体字对应的需求,共同研拟了CDN Admin Guideline: Registration and Administration Guideline for Chinese Domain Names(http://www.ietf.org/internet-drafts/draft-xdlee-idn-cdnadmin-01.txt),提出在JET IDN Admin Guideline定义之异体字表结构下处理中文域名之原则,并将JET IDN Admin Guideline中之optional process作进一步的说明,预定2004年会有更新版本。


第二代中文域名注册服务

为遵循国际标准、兼顾中文域名异体字对照之需求,TWNIC经审慎研拟提出「第二代中文域名注册服务」,采用IDN标准技术协议,除了延续现阶段中文域名注册的买繁送简政策之外,还额外提供了相关异体字组成之相关域名的辅助解析服务,可事先避免相关域名后续被他人注册。虽然IDN技术标准未包括中文异体字,但TWNIC「第二代中文域名注册服务」能避免可能引发的异体中文域名混淆及争议。


IDN标准的影响与冲击

IETF制定IDN标准过程中希望能尽可能降低对现有DNS环境之影响,而这同时也是所有Internet服务提供商及用户最关心的问题。其影响范围大致以DNS服务器、Web服务器设定与IDN使用三个方面来说明。


在DNS服务器方面,IDN须以PUNYCODE的编码形式来设定。因为PUNYCODE本身就是一种7位的编码,与ASCII编码完全兼容,所以适用于前所有可用的DNS版本,不需为了设定PUNYCODE而重新安装BIND新版本。但若需要使用DNAME指令来设定资源记录(Resource Record),就必须先提升为BIND 9的版本。


在IDN使用方面,在操作系统或应用程序厂商尚未完全推出支持IDN标准产品之前,有一些plug-in形式的client下载软件可协助Internet用户顺利使用IDN。例如,TWNIC配合第二代中文域名注册服务,同步推出的新版client下载软件-「中文通」,它将用户输入的IDN依照IDN标准作IDNA-NAMEPREP-PUNYCODE处理,再将IDN的PUNYCODE编码送到DNS解析。


在Web服务器方面,由于用户端输入的IDN都会先转换为PUNYCODE编码的形式,再到Web服务器访问,所以Web服务器方面也需要以PUNYCODE编码来设定,才能被成功地访问到。


对TWNIC现行中文域名注册政策之影响

TWNIC自2001年5月起先期提供泛用型中文域名注册服务,并于2001年7月起提供好帮手下载软件。在IETF发布IDN标准之际,TWNIC全面提供符合IDN标准之中文域名服务。这可以从中文域名注册政策与解析架构两方面说明。


在注册政策方面,由于现有的TWNIC中文域名注册政策已经符合NAMMEPREP的处理规则,所以不会因为提升为IDN标准之中文域名而需有所改变,原中文域名注册者在权益上与新注册者没有差别,皆随TWNIC全面提升为符合IDN标准之中文域名。


在中文域名解析架构方面,将全面提升为符合IDNA-NAMEPREP-PUNYCODE之IDN标准,在TWNIC管理之DNS辖区,都采用经NAMEPREP处理过的PUNYCODE来设定,而TWNIC的新版client下载软件(中文通)也是向DNS送出中文域名的PUNYCODE来请求解析,所以能得到DNS正确的解析结果。


IDN未来展望

TWNIC自2003年11月17日推出第二代中文域名注册服务后一个月的时间,为转换到IDN标准的过渡时期,因此2003年12月17日起我国即全面提升为IDN标准环境。目前除了TWNIC提供client下载软件「中文通」之外,CNNIC提供了客户端软件(含通用网址),Verisign则提供了I-Nav Plug-in,其他尚有许多各家提供的下载软件。在browser方面,Netscape、Mozilla、Opera等也已经提供支持IDN标准的版本,预期未来有更多的操作系统或应用程序厂商会提供内定支持IDNA-NAMEPREP-PUNYCODE之IDN标准环境,用户不需下载client软件即能访问中文域名。相信藉由因特网的平台,全球性企业将有机会提供在地化的网络服务,台湾品牌亦有更大的机会鸣响国际,拓展因特网华人世界的新商机。


(作者陈玉萱为TWNIC资深工程师;尹蓓婷为TWNIC管理师)


延 伸 阅 读

抗议IETF即将通过有瑕疵的国际化域名技术标准
IETF IDN工作群利用Unicode为基础的技术方案,固然能部分解决英文以外的拼音文字的国际化域名需求,却继承了Unicode为CJK汉字域名带来的授权和解析等严重的问题。本文在两年前提出上述问题,让读者对IDN标准的制订过程有更多认识。

抢救中文域名
使用拼音文字的欧洲人对于IDN技术标准的发展表示满意,但汉字域名的消费者却将面临重大问题。根源于此项技术规范的基础 - Unicode(万国码),这些问题包括汉字域名的多重表示方式、以及伴随而来的域名授权和解析等。本文于2002年发起联署活动以寻求异体字和中文域名系统等问题的解决方案。
中文域名服务发展趋势
网络实名、通用网址、快捷网址和Realname/keyword等服务,多标榜着中文网址服务,服务内容主在简化中文网址输入,与真正中文域名解析服务仍有差异,本文将介绍中文域名现况,以及未来中文域名服务的发展趋势。
相关组织网站
泛用型中文网站:http://中文.twhttp://chinese.twnic.net.tw
IETF网页
IICANN's IDN Committee
PUNYCODE转码工具及DNS、Web辅助设定网页
GNU IDN Library - Libidn
Java IDNA
JPNIC idnkit
IMC idna.pl
VeriSign IDN SDK
相关文章
掌握机联网关键设计 打造工业物联网基础
组织知识的创造
2000年ISP企业宽频服务调查
中文网址系统技术架构与趋势探讨
新闻与分析
comments powered by Disqus
相关讨论
  相关新闻
» 台湾资安环境企业自主程度高 资料应用和产官谘询成焦点
» 仁大资讯Booster5让小店家也能做在地行销
» 中国国家邮政局:春节京东物流量占比最大
» 达梭系统收购IQMS扩展3DEXPERIENCE平台
» 5G前导技术NB-IoT窄频广域物联网应用
  相关产品
» 浩亭展示数位商品 通过射频识别直接进入云端
» MailBase蝉联日本国内邮件归档市场冠军宝座
» 意法半导体扩大对亚马逊FreeRTOS的支援
» DASH提供酒店式服务的住宿平台BlackDoors
» 是德科技与OPPO携手推动5G行动装置的开发和商业化

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2020 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw