音源
贡献者:angelazhang 浏览:850次 创建时间:2015-06-23
-
音源,即音色资源,总共分为两大类。第一类群是硬体音源,呈现方式以电子乐器最为常见,内部硬体拥有庞大的声库支持,一般来说拥有市面上最杰出音色采样;第二类群是软体音源,此类音源要在电脑上的MIDI介面运行,需要有宿主软体的支持,常见格式为VST,由宿主载入使用,音色优劣单纯以开发商采样水准决定,公正的评鉴,优秀的音源可以达到以假乱真的效果。
目录
1音源定义
·概要
·分类
·两层含义
2音源基础
3MIDI
·音源
·音源分类
·建议
·FM
4硬音源
5发展
1音源定义
概要
从字面意思理解就是声音的来源,即声音来自何方。它主要把声音完全准确地表现出来。
分类
分为两种形式,外置式,它不受声卡的制约,声音的质量能很好地保存下来,但是成本要求很高。内置式,也称音源字卡。就是声音的源头,没有音源,用音响系统还原声音也就无从谈起。
两层含义
音源的另一层含义,是指播放音源载体的设备。时间上连续、而且幅度随时间连续变化的讯号称为模拟讯号(例如声波就是模拟讯号,音响系统中传输的电流、电压讯号也是模拟讯号),记录和处理模拟讯号的音源就是模拟音源,例如磁带/卡座、LP/LP唱机。模拟音源记录和处理的讯号是声音(准确地说应该是从声音转换而来的电讯号)的本来面目,可以直接用传统的放大器放大,处理起来方便直接;数码音源记录、处理的都是0和1排列组合形成的抽象二进制数据流,非常不直观。声波是模拟的,不能直接为数码音源使用,必然通过转换设备转为数字讯号,才能记录在数码音源载体上。播放时,数码音源设备读出的数据不能直接由传统的放大器放大,必须先转换为模拟讯号才行。可见,数码音源讯号处理过程要复杂得多。但数码音源优点很突出:信噪比和动态范围远胜模拟音源,讯号经多次复制和多个传输环节后质量不下降,这一点模拟音源无论如何也办不到。
2音源基础
什么是音源?音响系统常用的音源有哪些?
顾名思义,音源就是声音的源头,没有音源,用音响系统还原声音也就无从谈起。
音源有两层含义,一是指记录声音的载体,只有先把声音记录在某种载体上,才谈得上用音响设备把载体上的声音还原出来,这些载体是音响系统中声音的来源,所以叫音源。常见的音源载体有CD(小型激光唱片)、盒式磁带、LP(密纹唱片)等,现在又出现了DVD-A(音频DVD)、SACD(超级音频CD)等更先进的新型载体。上述载体中,磁带是可以反复录放的,也就是说,使用者可以更改磁带上的内容,而其他载体的讯息由工厂一次性灌制在里面,无法再改变。当然,随着电脑的日益普及,最早为电脑工业设计的CD-R/CD-RW光盘逐渐进入音响领域,用CD-R/CD-RW就可以自己录制讯息,不象CD只有工厂出来的录音成品。
什么叫模拟音源和数码音源?主要区别?
时间上连续、而且幅度随时间连续变化的讯号称为模拟讯号(例如声波就是模拟讯号,音响系统中传输的电流、电压讯号也是模拟讯号),记录和处理模拟讯号的音源就是模拟音源,例如磁带/卡座、LP/LP唱机;时间上不连续、幅度只有0和1两种变化的讯号称为数字讯号,记录和处理数字讯号的音源叫做数码音源,例如CD/CD机、DVD-A/DVD-A播放机、SACD/SACD播放机等。
模拟音源记录和处理的讯号是声音(准确地说应该是从声音转换而来的电讯号)的本来面目,可以直接用传统的放大器放大,处理起来方便直接;数码音源记录、处理的都是0和1排列组合形成的抽象二进制数据流,非常不直观。声波是模拟的,不能直接为数码音源使用,必须通过转换设备转为数字讯号,才能记录在数码音源载体上。播放时,数码音源设备读出的数据不能直接由传统的放大器放大,必须先转换为模拟讯号才行。可见,数码音源的讯号处理过程要复杂得多。但数码音源优点很突出:信噪比和动态范围远胜模拟音源,讯号经多次复制和多个传输环节后质量不下降,这一点模拟音源无论如何也办不到。
为何数码音源能有这么出色的性能呢?关键在于数字讯号中只有0、1两种状态,无论外界干扰有多强,只要不影响到对0、1这两种逻辑状态的识别,最后都可以通过整形电路将干扰去除,100%的复原原始讯号。而模拟讯号的讯息就直接承载在幅度变化上,如果受到一点外界干扰,幅度就可能变化,讯息也就失真了,这种讯息的损伤是永久性的,无法再修复。
CD的规格如何?
CD的规格是索尼和飞利浦公司联手制定的。声音讯号采用44.1kHz的频率采样,每个采样点进行16bit量化,然后以LPCM(线性脉冲编码调制)方式编码成数字讯号,数字讯号用模压的办法保存在特制的盘片上,做成CD片。CD片的片基一般用塑料制作,其中一个表面为模压的讯号层,讯号层上有一个个压出来的坑点,这些坑点就代表了0、1两种讯息。讯号层之外再镀上一层极薄的铝膜(也有镀金的),用于读取讯号时加强激光反射。CD片有两种尺寸,最常见的一种直径为12cm,数据容量650MB,大约存储74分钟音乐;另一种称为Mini CD,直径8cm,数据容量大约185MB,能存储20分钟左右的音乐。
取样、取样率、量化、量化精度等的含义?
取样也叫采样,是把连续的模拟量用一个个离散的点来表示。显然,取样点需要足够密集,才能很好地表达原始模拟讯号的特征。每秒钟取样的次数叫取样率,CD的取样率为44.1kHz,表示每秒钟取样44100次。
所谓量化,通俗地说,就是度量采样后离散讯号幅度的过程,当然,度量结果用二进制数来表示。量化精度是就是度量时分级的多少,好比一把尺子上刻度划分的多少,显然,分级越多度量结果便越精确。CD的量化精度为16bit(16位二进制数),换算为十进制,分级数等于65536(216)。也就是说,以CD的标准,可以分辨出1/65536级的幅度变化。问题来了,如果讯号的幅度变化比1/65536级还小呢?答案很简单:量不出结果,就象用精细到1mm的尺子去量一根头发的直径一样。量不出结果就没有数据,将来还原成模拟讯号时就会形成背景噪声,专业术语叫量化噪声。量化噪声是数码音源信噪比提高的主要限制,对于CD规格,假设最强讯号为一个单位,噪声大小就是1/65536个单位,因此信噪比为65536(216),即96dB。
CD规格定为16bit/44.1kHz有什么根据?
先说44.1kHz取样率的来由,这是根据著名的“乃奎斯特取样定理”得出的结果。“乃奎斯特取样定理”说:在模拟讯号数字化的过程中,如果保证取样频率大于模拟讯号最高频率的2倍,就能100%精确地再还原出原始的模拟讯息。音频的最高频率为20kHz,所以取样率至少应该大于40kHz,为了留一点安全系数,再考虑到工程上的习惯,CD标准最终选择了44.1kHz这个数值。
16bit又怎么来的呢?在量化精度一问的解答中已经说过,量化精度和最终的信噪比有着直接的联系,当初制定标准时,一个主要的出发点就是要获得尽量高的信噪比。飞利浦的工程师倾向于14bit,他们认为14bit已经能获得84dB的信噪比(20log214),比起模拟音源60dB左右的最高值已经有了质的提高。但崇尚规格至上的索尼工程师认为14bit无论如何也不够,坚持16bit的提议,最后索尼的提议获得通过。为什么不用更高的量化精度?比如20bit、24bit?因为更高的量化精度意味着更大的数据量,CD的存储容量已经不够了。
16bit/44.1kHz、24bit/192kHz的含义?
两组数字分别是CD和DVD-A的规格,斜线前的数字表示量化精度,斜线后的数字表示取样率,详见量化精度和取样率的解答。
A/D转换、D/A转换、ADC、DAC的意思?
A/D转换=模拟/数字转换,意思是模拟讯号转换为数字讯号;D/A转换=数字/模拟转换,意思是数字讯号转换为模拟讯号;ADC=模拟/数字转换器,DAC=数字/模拟转换器。
什么是超取样?超取样有何作用?
超取样是CD机中采用的一种技术,用于提高放音质量。CD片上的数据讯号被读出后,通过DSP电路的插值处理,将44.1kHz的标准取样率提升一倍到数倍,这就是超取样。为什么要超取样呢?这涉及到D/A转换之后的噪声滤除问题。数码讯号经过D/A转换之后,会在音频频带以外的高端产生一个镜象频带,这是一种噪声,必须用低通滤波器滤除,否则经过非线性器件后会折回到音频频带内,对放音效果产生很大的破坏。该镜像噪声频带的位置和取样频率有关,频率越高,镜像频带就离音频频带越远。对于标准取样频率来说,必须用衰减十分陡峭的滤波器才能滤掉靠近音频频带的镜像噪声。但衰减陡峭的滤波器很难设计,相位失真很大,难免会影响到音频频带的高端部分,使音质下降,这就是早期的CD机数码味比较重的重要原因。如果采用超取样,就可以把镜像噪声推到远离音频频带的位置,这时只需要衰减平缓的低通滤波器就行了,设计难度大大降低,相位特性得以改善,使放音质量获得显著的改善。
什么是HDCD?
高解析度CD,是美国太平洋微音公司在现有CD格式的基础上推出的一种“增强型CD”,它利用CD格式中富余的存储容量来记录扩展讯息,使声音的解析度提高到20bit。HDCD可以在普通CD机上播放,但要获得20bit的解析度,机器需要具备HDCD解码线路。
什么是MD?
Mini Disc(迷你磁光盘)的缩写,索尼公司开发的一种数码音乐媒介,象磁带一样可以反复录放,但因为采用数码工作方式,没有磁带复制后音质下降的问题。MD的音质稍逊于CD,这是因为MD使用了ATRAC(适应性转换声学编码)有损压缩编码方式,而CD的PCM讯号是不压缩的,没有损失。MD目前在随身听上获得了比较成功的运用。
DVD-A、SACD、CD的区别?
DVD-A称为音频DVD,是DVD家族的一个分支,它的物理规格和普通视频DVD相同,单面单层的数据容量约为4.7GB,但DVD-A只存储声音或者声音加静止画面,不存储活动视频影像。DVD-A的数据格式采用了跟CD相同的LPCM线性脉冲编码调制方式,但取样率和量化精度都比CD高得多。当存储多声道音乐时,DVD-A的取样率为96kHz,存储双声道音乐时取样率高达192kHz,重放的频宽最高可达96kHz。量化精度在各种情况下均为24bit,因而拥有144dB的超高动态范围(每一比特对应6dB动态)。
SACD称为超级音频CD,是索尼公司开发的新型高质量数码音乐格式,其性能与DVD-A相当,远胜传统CD。但SACD的数据格式不同于DVD-A,是索尼公司开发的DSD直接数据流格式。
DVD-A、SACD跟现在的CD机兼容吗?我现在的CD片会不会被淘汰?
DVD-A片无法在CD机上播放,但SACD片可以,因为SACD是双层结构,高密度的DSD讯号层在里面,表面还有一层内容完全相同的普通CD讯号层,可以被CD机读取。现在面市的DVD-A、SACD播放机几乎都可以播放CD,即使将来CD逐渐被DVD-A和SACD取代了,现在投在CD上的心血也不会白费。
什么是杜比降噪系统?
杜比降噪系统是美国杜比实验室为磁带录音机开发的电路,在几乎不损害原始讯号质量的前提下,用于降低磁带固有的背景噪声(咝咝声)。杜比降噪系统有好几种类型:杜比A用于专业录音设备,降噪量20dB;杜比B和杜比C用于民用录音设备,例如盒式磁带录音机和卡座,降噪量分别为10dB、20dB;杜比S是杜比实验室为民用录音设备开发的高性能降噪系统,降噪量高达24dB。
3MIDI
MIDI音源
音源
通俗的讲,音源就是一架电子琴。比如YAMAHA的,ROLAND的等等。
大家都知道,不同的电子琴都拥有自己的音色采样。比如YAMAHA的钢琴和ROLAND的钢琴就不一样。
电脑里也是这样的,每块声卡有自己的音色库,在A声卡上制作的MIDI拿到B声卡上,只要不是一个厂家出的,90%播放效果与A声卡上不同。
为了解决这个问题,Microsoft在WinMe后统一使用Roland GS音源,如果您在安装完WinMe(Win2K,WinXP,Win 2003)后不需要手动安装声卡驱动,一般就会默认地使用了Rorland GS音源。同时,如果在控制面板中查看声音与多媒体设置的MIDI输出,会看到Microsoft GS Wavetable标志。
所以现在网上流传的MIDI,不少是基于这一款音源的。
音源分类
发展到现在,音源大体上分为硬音源与软音源。
所谓硬音源,通常指声卡本身把音色库集成在芯片上,回放时直接播放,基本不占用系统资源(比如CPU)。它的优点是速度快,没有延迟;缺点是不统一,基于A声卡做的MIDI不在A种声卡上播放将大失所望;再有就是价格不一,好的声卡价格高高在上,比如SB LIVE系列。总不能让大家都买块SB LIVE来听你做的MIDI吧。
另一种硬音源是存在一种叫做音源卡上的,这种卡与声卡不同,是专业用来制作MIDI的,它基本上就是一个音色库,有些高级一些的可以回放MIDI和更新音色。优缺点和在硬声卡的基础上,还加上一个就是不是所有人都买一样的音源卡(更不利于交流)。
硬件音源参数有采样频率,量化精度和波形容量,以及最大复音数几个重要的参数。[1]
采样频率指的是录制的波形的采样频率,根据傅里叶采样定律,采样率要大于模拟信号最高频率的2倍,才能正确还原出模拟信号的频域数据出来。一般来说采样频率越高音质越好。一般电话的采样率是8K,所以音质仅仅能够接受而已,CD的采样率是44.1K,现在的音源多为22K和44.1K,96K的采样率。采样频率越高的话,需要的波形记忆体容量也越大。
量化精度指的是波形的量化精度,比如说8bit的就可以把波形分为256个阶梯,16bit可以把波形分为65536个阶梯。量化精度越高波形就越细腻。现在市场上的电子琴音源一般是16bit的,高端产品也有24bit的。和采样频率一样,量化精度越高,需要的波形记忆体容量就越大。[1]
波形容量指的是音源的波表的大小。一般来说现在的电子琴至少是4M以上。高端琴一般都是100M以上,可以用采样频率,量化精度和音色数量计算波形容量。显然波形容量越大,音色越多,音质越好,当然成本也增加。
最大复音数指的是音源能够同时发出的采样数。比如说雅马哈的PSR-E433的最大复音数是32。那么这台电子琴就只能同时发出32个单声道采样的声音(比如吉他),或者16个双声道采样的声音(比如钢琴和管风琴音色)。超出这个范围的音符会被音源丢弃,也就是不发声。一般来说音源会丢弃最先按下的音符。保证最后按下的音符可以发声。最大复音数越大,表示乐器同时发出的音就越多,音乐就更丰富。更加适合于创作,当然价格也越高。
另外就是一般的GM音源内置了混响和合唱效果器,GS和XG音源在GM的基础上增加了MFX效果器,提供更多的变化。
软音源就是独立于硬件,由软件计算产生声音的回放。它们通常都是基于波表技术,就是把各种音色记录成表格形式,然后根据乐曲进行“查表”,然后进行一些包络等计算,从而实现回放的。
目前的软音源主要有:
YAMAHA XG系列:100,100+,50,70等;
ROLAND GS系列:VSC32, VSC88等;
Jet、WinGroove等。
这些音源都支持自身的MIDI标准,MIDI本来是乐器的数字接口,广义上是希望成为各种乐器之间交流的语言,但是事实上它成为了一种不能相互翻译的语言。
MIDI标准目前主要分三种:GM、GS和XG
GM是General MIDI的简称。它仅提供最基本的MIDI支持,比如音色选择、音量控制、力度控制、速度控制、声道调整、感情控制、滑音控制、持音控制(相当于钢琴的延音踏板)等。对于一般的MIDI,细心些做,可以做出比较满意的曲子。
但是随着人们对音乐的要求,GM显然有点力不从心了,于是各种新的标准都纷纷出来,一展自己的风范。其中表现出众的就是YAMAHA的XG标准和ROLAND的GS标准(在软音源界中)。
GS音源总体上音色明亮有力,特别是钢琴音色,我特别喜欢,最后出的VSC32的钢琴音色更是完美,令人爱不释手。不过其管乐,比如长笛等就表现得电子味很浓,所有使用到长笛的乐曲令人不知所用的是何乐器。说白了就是不真实。另外,它有个最令底层MIDI制作人员不满的就是它的50ms限制。所有的RPN(注册了的参数号)、N-RPN(未注册的参数号)和部分Controller(控制器)都需要间隔50ms来实现,也就是不能在同一时刻执行多个控制参数,同时在一些配置较低的计算机上,连Wheel(滑音)控制都受到影响。大家都知道,音乐是时间与空间(在某一时间,你的手没有按到那个键[位置]就表示演奏失败)的艺术,某个效果来迟了50ms或者被遗漏,都会给敏感的人一下子听出来。
XG音源也有延迟,所有的软音源都有延迟,因为声音在播放之前要经过计算,再快的计算机也不能不用时间就完成这些计算,但是没有50ms的限制,所有的控制参数都能“立刻”实现,这是我坚持使用XG音源的其中一个重要原因。当然YAMAH XG音源也有其不足的一面:特别是它的钢琴音色,听起来比较虚渺,密度不够,打击乐也不如GS来得实在,听上去都比较柔弱。但是XG通过其广阔的控制参数及强大的Sysx(系统码),足以弥补这些过失。通过调整这些参数和系统码,可以对每一音色进行修改,甚至是技击乐。我在流行钢琴网上发表的《罗密欧与茱丽叶》就是最好的一个例子,只要精通这些参数,原则上可以创造出所有需要的音色。这一部分国内还很少人掌握(因为连知道有这么回事的人本来就不多)。
GS和XG音源的共性就是兼容GM。这句话是网上评论GM、GS和XG的人说的。我不完全赞成这一观点:所谓兼容,应该指用GM做的东西在GS、XG上听至少不会比用GM听起来难听。但事实上并非如此,有些GM标准的MIDI,放在GS、XG上听简直就是噪音。这里面最大的原因是各种音源的乐器采样的音量不统一,在GM上调整好的各种乐器的音量搭配都是基于GM上的音色库,如果这一音色库的某一音色在另外一款音源上特别小声,就导致听不到;反之,如果特别大声,就可能成为噪音的创造者。如果兼容不指这一意义,那么GS和曲子放到XG上也能播放,那为什么不说XG兼容GS呢?
软音源的优点就是独立于硬件,只要安装相应的音源,就可以听到基于该音源的乐子的效果,该效果是制作该曲子的人所希望听者听到的。这一点是软音源产生的根本目的。所以,有经验的MIDI制作人,都不厌其烦的希望听者能使用指定的音源来回放自己做的曲子。否则,一个本来很好的曲子,因为其“解释者”的“误解”则导致成垃圾的例子是屡见不鲜的。
建议
根据以上的分析,GM音乐对于现在的音乐来说表现不够,一般推荐使用GS或者XG标准的音源来制作MIDI。但是从目前的软件上说,部分对硬件还是有一定要求的
对不用或少用控制参数的制作人:
GS或者XG都OK
对经常做滑弦效果的制作人:
因为GS的50ms,建议用XG,除非CPU很快,CPU不好的用GM也比GS好
对希望把音乐做的细腻的制作人:
GS、XG都OK
使用GS时注意其50ms的限制,还是可以把MIDI做得好的,日本一部分MIDI制作者这方面很强,大家有机会认识的话一定要好好向人家学习
使用XG比较自由,基本没有限制,但是CPU至少不能低于333MHZ(我的就是)。
另外对于机器配置高的人,不妨试试使用多种音源,可以取长补短。
可能很多人觉得不可思议,多种音源可以一起使用吗?
答案是肯定的,我最爱用的Cakewalk Pro Audio就支持多音源回放同一MIDI,比如钢琴希望用GS的,就指定钢琴轨的输出端是GS,长笛用XG的,就指定对应的轨道用XG,甚至可以考虑使用Jet和WinGroove等较好的音源中的出色音色。如果设备齐全,指定到多个声卡上的音源也不是不可一试的,再有Reality这一款基于外部音色库的音色库管理软件,更值得有经验的人一试。综合各种音源的优点,来制作一个MIDI,最后把它录制成WAV或者MP3,感受一下制作真正自己的音乐的心情吧……
就算CPU承受不了同时支持多种音源,也可以分轨录制,然后再合成。Cakewalk Pro Audio也能完成WAVE的混合。
FM
现在的音源技术主要采用波表,在此之前,MIDI合成是采用FM算法,它本身没有乐器的音色采样,仅靠基本的波形合成,比如正弦波、方波和三角波等。
4硬音源
电脑就是硬音源
最近一段时间,用“巨人”和“Hypersonic2”工作、生活、娱乐、休闲的时候比较多。这两大巨头,都可以独立运行。象Steinberg的虚拟BASS手等软音源,也是这种模式。很明显,厂家的目的就是让你把计算机变成一台硬件MIDI音源。
扩展一下思路,用电脑播放MIDI,也用这两大巨头做为MIDI音源。实现的办法很简单,一根MIDI线,配合MIDI接口,自进自出。Windows控制面板音频设备选项中的MIDI一项,输出端口做好对应设置。
电脑已经安装的所有的MIDI音序器软件,比如Cubase、Sonar、BB、Jammer、Guitar Pro……等等之类,都可以照此办理。
不想一个通道一个通道加载音色的话,就直接按GM办理。比如H2就有这个选项,激活后一了百了,不过音色就不丰富了。H2自带的GM也只能算堪用而已。还有一点,MIDI事件中头部的弯音轮控制数值,如果MIDI文件不规范,缺乏这些必要的事件,独立运行的软音源有时就不能很好的响应,需手工更改。默认是2,改为12即可。
我对微软自带的GS软波表深恶痛绝已久,现在爽了……
这一招并不希罕,不过没有引起更多人的关注。尽管我人微言轻,但还是呼吁一下吧。象GigaStudio就完全可以这么玩。一句话,MIDI接口自进自出,一根MIDI线就够了。最大的好处,除了把电脑变成硬音源,另外还能大大提高工作效率,简单到无需音序器软件,一个媒体播放器就可以全部搞定。
用来干细活,也不耽误事。实践证明,更加稳定和节约资源。这种情况下,软音源中保存音色信息、各类调整的重要性就猛然彰显出来了。不过这个办法不能直接混缩为音频——除非在母体中挂接。有一个不错的办法,真正的online无损。DirrectWire。我前几天刚撰文,可以参阅一下。不过,坏消息就是ESI中档以下的音频卡,都不带MIDI接口,需要另配子卡。除了ESI等韩国产品,其它公司的专业卡都不支持DirectWire。
5发展
不过,科技始终在发展。前景还是越来越乐观的。当然,思想也要更加解放,思维不能太僵化。保持每天都学习一些新东西、接受一些新观念、了解一些新技术,哪怕仅仅记住一个英文单词……否则,永远只是不断提问题、被别人忽悠的半文盲,到死都是。改行也不行,另一个行业也是如此,这个时代就是这么残酷,除非你甘心和忍耐。智商较高、资质不凡的,还可以直接领导、参与和预测。天才类人物,我真心建议不要玩这个,去搞政治和民运为佳,中国的民主、自由、资本、法治之路,我寄重大希望、甚至生命于你。
再扩展一下思路,某些很垃圾的用计算机键盘弹奏的小软件,如果加上虚拟性质的MIDI接口的话,就可以派上更大用场了……。
由此也可知,各类软波表,安装的时候都自动给电脑装了一到数个虚拟性质的MIDI接口,在提供MIDI音源的同时,还可以由用户指定使用这些虚拟的MIDI接口。而软音源则不行。仅提供音源,不安装接口。这一点,也是两者的另一个区别吧。象GigaStudio那种全面到变态的冬冬,实属莫测高深,我辈高山仰止…… 。
开放分类
参考资料
百度百科
贡献者
本词条在以下词条中被提及:
关于本词条的评论共:(0条)