账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
数位音频介面标准与量测 (一)
数位音频介面标准(AES3 and IEC 60958)

【作者: 陳建誠】2002年02月05日 星期二

浏览人次:【5456】

早在80年代,藉由CD player等产品的出现,开始朝向数位音频的发展。在早期的作法是把数位讯号停留在一个内部单位,并且转换成类比讯号之后送到下一单位使用。现在较新的趋势是尽可能保留讯号在数位领域(digital domain),也只有这样才能避免讯号不断被转换,进而保持讯号本身品质。


两大公认标准

为了要使不同装置能够在数位领域间沟通,数位音频介面是不可缺少的,目前有许多数位音频介面应用在不同的的领域上,其中最被大家所公认的世界音频标准为:AES3与IEC60958- 4,AES3一般都称为专业性标准,而IEC60958-3则称为消费性标准。


专业性与消费性这两种标准间有些许的差异,而这些差异会使得两者互不相容。严格来说,专业性与消费性这两种界面是不应该被混合在一起。但事实上,两者极为相似,在很多情形下,接上正确的电源后,被嵌入在讯号中的音频讯号,是很容易的从一个标准传达到另一个标准。


相容性的产生

相容性是指仪器内的相互联系,不会因规格有所不同而造成性能或机能的降低。为了达到这些标准的一致性,数位音频仪器的使用者,应该预料到其中的相容性问题。


一般而言,数位音频介面应传达三种讯息:


1. 时间


2. 音频资料


3. 非音频资料


其中一些讯息可能会因为符合界面要求而改变或减少其音频讯号。我们需就界面的习性与性能方面去考虑,例如一个接收器能承受多少讯号抖动(incoming jitter)或是一个范围很宽的Frame rate以及一个发送器能否同时性地一直维持其精确性。接下来我们就来谈谈数位介面的介面格式。


Biphase编码

在还没使用Bi-phase编码前,PCM ( pulse code modulation )音频讯号很难确实地被传送与接收。举例来说,假设在一段时间内,所传送的讯号像DC讯号,即所有的bits全部是1(或是0),为了要正确地传递这讯号,与界面相关联的电路必须是可以通过DC的。如果是传递一个 「数位DC」讯号,clock速率可以说是没有或很少变化,那么一个分离式的同步连接器是不可或缺的。


应用方式

为了处理这些界面的问题,数位资料便改成Bi-phase编码方式。其优点在于:若界面讯号中间,资料为一大串零时,也没有所谓的DC效应,这样就可以将讯号做AC-coupled通过变压器或是通过一连串的电容器。


Bi-phase编码的运作模式为:每一个data bit有一个time slot(图一),而这个time slot开始时会对前一state做转换动作,并且结束于下一个转换,而这也是下个time slot的开始。


假设这个data bit是一个 "1",在这个time slot中间加入了转态;而在下一个data "0"时,却不会因此也在中间加转态。这意思是就算一个有data 0的数位DC讯号,在每个time slot还是有转态。这个计时器还是维持很规律的转调,这时界面的讯号明显地表现为AC,而转调的方向(或讯号两极性)会变为互不相关。这种编码的组合使得接收器在接收资料时,可以很容易的重新建立取样频率。



《图一 Bi-phase编码的运作模式》
《图一 Bi-phase编码的运作模式》

由上面叙述得知,Biphase编码方式可归纳如下(图二):


1.每一笔资料编码方式是由2个UI组成。


2.第一个UI:目前资料和前一笔资料相反。


3.第二个UI:若资料为1时,与第1个 UI 资料相反。


若资料为0时,与第1个 UI 资料相同。


《图二 Bi-phase编码方式》
《图二 Bi-phase编码方式》

因此当一资料呈现有转态时,资料为1。


当资料为转态时,资料为0。


Bi-phase coding 的优点

Bi-phase coding 在传输上的优点如下:


1.不会有连续2个以上的1出现,故传输时的接收端很容易判读接收讯号是否正确。


2.DC成分很少,即不会有一连串1或0的资料出现在同一个Frame,缺少DC意味着当讯号经一长距离传输时,讯号振幅会因Cable阻抗衰减,剩下的讯号仍是对称均匀,以致于讯号也能很容易被正确判读出来。


3. 由于Bi-phase coding对极性不灵敏,即使对信号作反相也无影响,故对于接收端的界面影响不大。


Unit interval (单位区间)

量测界面的时间参数很多,通常使用的量测单位为单位区间(Unit interval)简称为UI,这是介于转态间最短的间隔。 Bi-phase编码采用一个bit两次转态的编码原则(data "1"),这表示一个time slot被限定宽为2 UI。例如在一个Frame中有64bits,则会有128个UI。通常在数位领域中,Delay和Jitter通常都用UI表示多于nanoseconds,因为UI和Sample rate有密切的关系。


较不易分析抖动和延迟

在48KHz的取样频率下,一个UI大约是162.7ns。相对的,在44.1KHz的取样频率下,一个UI约177ns。所以UI和取样频率的关系是相对的,在分析Jitter和Delay时,使用UI较容易表现出讯号的失真现像。


Frame (框架)

界面的资料传送是连续性的,为了识别各种不同位元的资料,资料流就被分成64 time slot (或是​​128UI) 的Frame。由于time slots与data bits是一样的,所以1个Frame经常是被说成64 bits。


每个Frame中包含了两个Sub-frame,可以用来传送两个资料的通讯管道,例如Channel 1资料放在Sub-frame1,而Channel 2资料放在Sub-frame2。 (图三)为一个Frame,其中含有64个time slots (数字0到63),一个Frame长为128UI。



《图三 一个Frame的架构》
《图三 一个Frame的架构》

每个Sub-frame的前4个time slots传送前导讯号,而这也记录了Sub-frame的开始与识别Sub-frame的型态。接下来的24个time slots是传送音频资料,从LSB(least significant bit)开始传送,一共传送24个位元。而最后4个time slots是传送:有效位元、使用者位元、通道状态位元、以及同位元。


Preambles(前导讯号)

前导讯号是一个特殊的资料型态,传送Sub-frame中最先的4个time slots,除了Sub-frame外,还记录了每段的开始。一共有三种前导讯号,藉由持续3UI所产生一个或两个脉波,来中断双阶段编码规则(Bi-phase Coding Rule);而中断规则的意思是这种型态不可能发生在任何资料内。


为了区分每资料段(Block)的开始,在每192个Frame中,Sub-frame1则是开始在一个X 前导讯号,Sub-frame2总是开始于一个Y 前导讯号,若此Frame为资料段的起始Frame,则Sub-frame1中的X 前导讯号,将被Z 前导讯号所取代。


由于传送的界面讯号可有效地反应出一般或被转化两极​​性,前导讯号可被视为一个负缘转态的开始(图四)或正缘转态的开始(图五)。


《图四 负缘转态开始的前导讯号》
《图四 负缘转态开始的前导讯号》
《图五 正缘转态开始的前导讯号》
《图五 正缘转态开始的前导讯号》

在Bi-phase编码规则中,在每个time slot间都有个转态,但是只有在前导讯号例外,因为在前导讯号中有两个time slots,是没有任何转态。这些违反Bi-phase编码是在time slot 0之后,每个前导讯号是在同个地方,这是为了确认一个新的Sub-frame已经开始,而接下来的位元也确认了是哪种Sub- frame。


图三中SYNC位元数就是图四与图五中的讯号位置。这些前导讯号宽有8UI,所以在相同的时间内是相当于4个位元。这三种前导讯号连续三个UI保持在相同的准位,这情形是不可能在其他音频资料或是辅助资料中发生。这三个单位UI的长脉冲呈现一个低频的部分相对于整个串列资料,所以他们是最不受cable attenuation和cable induced jitter影响,所以我们常利用前导讯号来量测IC内部clock jitter。


Audio data (音频资料)

在前导讯号后,音频资料的LSB被先传送出来,对音频讯号来说,当音频资料少于24位元时,调整资料的最高位元放置在MSB地方,剩余的bits全部补0。如(图六)所示。


《图六 音频数据的传送模式》
《图六 音频数据的传送模式》

辅助音频资料

有一些音频讯号,只传送20位元或少于主要的音频资料,所以利用前导讯号之后的前四个位元来当另一种讯号,而这讯号即为辅助音频资料(auxiliary audio data)。如(图七)所示,如果这辅助音频资料被采用,通道状态(Channel State)将表示出最高的字长为20位元,​​decoder会特别处理这辅助音频讯号,使得任何讯号资料都无法加进主要的音频资料中。可惜的是很多decoder都无法处理这辅助音频资料。


《图七 信道状态将表示出最高的字长》
《图七 信道状态将表示出最高的字长》

辅助音频讯号的使用机会很少,其中一种是应用在声音通讯方面,如AES3建议将辅助位元用来作bits调整的功用。例如:使用辅助音频讯号来放置音频讯号的压缩资料,也是一种可行的方式。


Validity bit (有效位元)

有效位元本来就是用某种方式来证明传递资料的正确性;如果这位元为1,可以被确认的是,资料在转换过程中,资料出现问题。所以有一些应用上的作法为:若发现有资料有错误时,有效位元就设定为1,并把资料隐藏起来。这种应用对CD players来说,相当普遍。


当一个讯号被标记成无效时,一个接收端决定应该如何去表现,这种困惑对这位有效的位元的功能性来说,并不是一件很容易的事。当使用IEC60958或是AES3​​格式来传送资料时,若PCM音频讯号无法很流畅时,这位元应被设定为1。这样就有机会让播放器的输出变成为无声,若能试图将正确的音频资料再重现,这么做会更好。


防止噪音或爆音

对于在传递AES3或是IEC60958压缩资料音频方面,这位元需要被设定为1,这么一来linear PCM接收器就可以辨识出何时必须要无声。这潜在的优点是在Channel State模式中,在读取非音频(non-audio)位元时,可以确认这讯号不是linear PCM音频,进而去阻止接收器从这资料中产生高度噪音或爆音。


User bit (使用者位元)

使用者位元可被用来传输使用者特殊的资讯,即消费性设备的特殊应用资讯,例如CD或是DCC。在消费性的规格方面,IEC60958-3已经定义在资料流中传送分组格式资讯,且为了保护使用者资料,限定在使用不同种类仪器时的规则,如(图八)所示。



《图八 用户位层级与应用范围》
《图八 用户位层级与应用范围》

在消费性格式中,资料流中的Sub-frame1与Sub-frame2相结合,而形成一组为2 bits/Frame的型态。这表示在一个44.1 kHz的Frame速率中,资料速率为88200 bits/sec,此即所谓的使用者资料流(user-data stream)。


专业规格可容纳的资料

对AES3与IEC 60958-4专业规格来说,已经有Channel State资料,所以可以容许不同格式当使用者资料(user-data),如:


1. 每个资料段中,有192 bits当Channel State


2. AES18 (packet based)


3. IEC 60958-3使用者资料的格式


对专业格式来说(除了IEC60958-3使用者资料格式外),使用者资料流(user-data stream)是由Sub-frame1与Sub-frame2中的user bit所组成。因此,共有两组资料流,每组有1 bit/Frame。在理论上,可以结合两个使用者资料流其速率为2 bits/Frame,当作两个Sub-frame传送同一个Channel。不过到目前为止,专业性格式的应用较少人采取使用者资料(user-data)。


Channel Status bit (通道状态位元)

在一被传送的资料段(block)中,Channel State共有192位元,其Frame是开始于前导讯号"Z",这视为这资料段的第一位元,而这个Z 前导讯号有时被称为"block start"。每个Sub-frame1与Sub-frame2都有独立的Channel State位元,所以经常是有两组资料段(block)。常常这两组资料段还传送同一个资料,所以有很多接收器只检测其中一个Sub-frame的资料。


如(图九)为消费性格式的Channel State栏位、(图十)为消费性格式的Channel State栏位解释,(图十一)为专业性格式的Channel State栏位,从这些图中得知,两者资料段内容解释差异很大。



《图九 消费性格式的Channel State字段》
《图九 消费性格式的Channel State字段》

《图十 消费性格式的Channel State字段解释》
《图十 消费性格式的Channel State字段解释》

《图十一 专业性格式的Channel State字段》
《图十一 专业性格式的Channel State字段》

Channel State位元干扰

有些Channel State位元还会影响仪器处理音频资料:特别是在non-audio和emp​​hasis的领域中,对诠释资料的方式,有着重大不相同处。


以"non-audio"来说,如果non-audio位元被设定为1时,音频资料就不适合当linear PCM解码资料。


当音频讯号是使用在压缩资料格式时,例如MPEG、DTS以及Dolby AC-3,这些都是"non-audio",若把它们的音频资料,直接当成是linear PCM并不恰当,而且还会造成高度的噪音。传递这些压缩资料形式的标准为:以消费性应用方面,标准是IEC61937,而SMPTE337M就是对专业性方面的应用标准。


以"emphasis"来说,如果emphasis领域表示这讯号已经加强,那de-emphasis应该被应用在任何数位到类比的转换。在消费性格式中,只有CD 格式才有支援emphasis;在零点与极点中,它具有一个高频提升与50ms及15ms的时间常数。专业形式支持这个形式的有:J-17 emphasis,它的时间常数差不多为333ms及38.5ms。


就消费性与专业性形式来说,这些资料段里位元的意义所解释都不同。


Parity bit (同位元)

同位元是用来维持资料的偶数相同,作为错误检查。特别的是在界面讯号中,偶数相同是表示在资料time slots 4 to 31中,共有偶数个中间层的转态(即为1的意思)。


偶同位

偶同位对每个Sub-frame开始与在同方向的转态有影响。因此,一个AES3或是IEC60958传送器并不需要去计算同位元。由于在Sub-frame中,同位元是最后的位元,所以接收端只需要核对第二个Sub-frame的同位元状态,因为它总是与先前的Sub-frame的状态相同。


Bi-phase编码资料若被干扰是可被查出,因为在消失不见的转态中,至少有一个会在time slot的边界上。比起使用同等位元,检查Bi-phase编码的干扰,可以更有帮助的来确认错误。


结论

在迅速崛起的IA时代中,数位音频传输介面已经是一大家公认的标准,在目前IA设备中,数位音频传输介面是不可或缺的,数位讯号规格几乎都必须符合IEC60958或AES3规范,所以在数位音频讯号领域,如DVD、VCD、CD、音效卡、甚至合成数位视讯,涉及内部资料传送的工作者,了解IEC60958以及AES3规范是必要的。


相关文章
三波长堆栈雷射二极管设计
蓝光DVD与HD-DVD发展动向
可录式DVD用高功率红光雷射最新技术动向
综观DVD晶片产业发展趋势
剖析DVD新储存规格技术发展趋势
comments powered by Disqus
相关讨论
  相关新闻
» R&S在关键通信世界CCW 2024展示测试方案 协助成功过渡至任务关键宽频通讯
» 是德科技成功验证符合窄频非地面网路标准的新测试案例
» UL健康建筑验证标志全台首发 由南山人寿取得头筹
» Durr和R&S合作开展ADAS/AD功能测试 适用於终检和定期技术检验
» R&S SMB100B微波信号产生器 可用於类比信号产生


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK85E0LXGLESTACUK1
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw