汽车噪声声品质主观听审实验研究
一直在研究汽车噪声声品质的评价方法,最近尝试性地做了一次主观听审评价实验,在这把实验的过程发出来希望对此方面感兴趣和正在研究相关方面的同学和前辈们大家一起讨论讨论。(做的肯定很不完善,过程也很简单,但希望大家拍砖的时候轻点,我是在没有一分钱资金支持的情况下自己摸索着做的)为了方便大家阅读,将整个过程分成几楼发出来。 首先是噪声样本的采集、筛选和前处理:样本的采集这一部分我完全是没有做,因为就学校实验室那些设备(mic传感器,信号采集系统)和几个破样车根本没法满足做主观听审实验的要求。
我的样本都是其它的一些机构和企业实验得到的(在此感谢提供给我样本的每一个人),基本都是用人工头采集的(有几个车外噪声可能是用mic传感器测得的),将音频全部转化位wav格式、位速都在1000kbps以上、采样大小16位、音频采样级别48KHz以上。
通过筛选和前处理,得到14个噪声样本,每个长度为5秒。包括大货车,中型客车,中级轿车,高级轿车,高级跑车甚至还有一个F1的车外噪声。
其实从研发的角度来看,做声品质研究和改进的主要车型应该是中高级轿车和跑车;我选择一些客车货车和F1噪声的原因是这样可以使得样本的差异性比较大,方便得出实验结果。
我做这个实验本身的目的不是为了研究这几个噪声的声品质,而是研究实验的过程。
[ 本帖最后由 jolly_sham 于 2007-12-14 13:12 编辑 ] 之后就是实验的设备:电脑(笔记本电脑),声卡(主板集成),耳机(森海赛尔px200),和音频播放软件(foobar2000)。
讲到这我就顺便提下我读研是选择这个课题的原因:第一是我是车辆工程的,第二我也算是半个音乐发烧友,对一些音频播放设备比较感兴趣,对此也比较了解。
对于以上的播放系统,我是很不满意,集成声卡性能比较差,耳机阻抗太低,灵敏度太高,导致回放过程中有电流声干扰(其实不是很明显,有人还听不出来,可能是我的耳朵比较灵敏吧)。
准备向导师申请点资金,换一个台式机上的独立PCI声卡,加专业的监听耳机(森海赛尔HD600/650,我的梦想啊) 现在是最主要的听审过程了:先说一下听审人员的选择,目前整个实验还没有做完,只做了十几个人,现在做的都是我的同学(车辆工程研究生,男性为主,22至30周岁,一般都有较多的坐车和驾车经验),都是免费来给我做小白鼠的。
在实验的开始,首先让他们看一下《听审人员注意事项》,如下
1.
以下你将听到14个不同的汽车噪声样本,每个样本持续大约5秒钟
2.
首先你将试听以熟悉每个样本,然后才是正式的听审过程
3.
样本是随机乱序播放的,在听完每个噪声样本后,请对其进行打分(1~10分,1分最差,10分为最佳)
4.
打分的内容包括:声品质的优劣程度(好听与否);运动性(听上去是否具有动感);豪华性(听上去是否具有豪华感)
5.
请把你所打的分告诉测试人员,由他进行记录
6.
如对听的某个不确定,可以要求重听该样本,直到确定为止
并还对他们进行一些相关概念的解释,之后进行听审。
听审过程中先顺序播放一遍噪声样本,让他们进行熟悉,之后随机乱序播放3遍,分别让他们对样本的声品质,运动性,和豪华性进行打分。 实验的结果:本来准备做20~25人的,目前只做了十多个人,所以最后的统计结果还没有出来。但是从目前取得数据来看,我可以估计出下列结果
从对这些样本的评价结果来讲,这个实验已经是失败了:得出的数据与一致性太差,结果也与实际情况大相径庭:有客车的声品质优于高级轿车的,有货车的声品质运动性比高级跑车得分高的,最离谱的是有一张评分表上F1的声音豪华性得了10分的(晕死,要死劳斯莱斯的声音做成F1样,还有人买吗?)。连车辆工程的研究生得到的结果都是这样的,我都不敢想象非经验组(文化层次较低,驾车和乘车经验较少)会做出什么样的结果
做出来数据与实际情况符合较好的只有我自己,我师兄(也是做这个nvh方向的)和另一个同学(驾车乘车较经验比较丰富,对车辆相当有研究)
还好我现在只是研究下这个评价的过程,要不我要去跳楼了 对实验的总结和展望:在主观听审过程中,听审团的作用和影响非常之大,建立一个高水平的听审团对于主观评价有很大的帮助。
总结出来的经验还有很多,等我整理整理再和大家讨论。
大家请多指教啊! 我提点建议:
1)打分的内容包括:声品质的优劣程度(好听与否);运动性(听上去是否具有动感);豪华性(听上去是否具有豪华感),你这几个指标都没有客观评价量对应吧?优劣程度可以,但是运动性,豪华性,我觉得老百姓很难给出合适的评分,我也不知道运动性是什么感觉,难道是发动机的强劲轰鸣声?豪华性我也没感觉,这几个好像是日本人提出的。我觉得还是用有客观量对应的指标来做主观评价,如响度,低沉度,尖锐度,粗糙度等。
2)打分方法建议用成对比较法,1到10打分对打分者太难把握。
支持你的课题,可以提供更多样本(暂时没解决好导出wav的问题),多交流。 原帖由 hyl2323 于 2007-12-14 19:42 发表 http://www.chinavib.com/forum/images/common/back.gif
我提点建议:
1)打分的内容包括:声品质的优劣程度(好听与否);运动性(听上去是否具有动感);豪华性(听上去是否具有豪华感),你这几个指标都没有客观评价量对应吧?优劣程度可以,但是运动性,豪华性, ...
首先要谢谢hyl2323 版主的大力支持,关于你提的两点建议,都很实际,对于第一点可能是我在这个上面解释的不够清楚:声品质的优劣程度(好听与否),其实就是噪声的声品质,也就是主观评价中研究的最基本的东西。后面两点,是针对中高档乘用车两种类型(轿车和跑车)所提出的不同偏向性指标,也就是高级轿车所应有的声音和高级跑车所应有的声音。这两个指标首先是由日本人提出来的吧,但现在欧美也有很多公司和科研机构在研究。我在这对其进行打分,也只是尝试性的实验一下,在以后的听审实验中,没有建立一个高水平的听审团之前我暂时不会做这两个指标了。
对于你说的“用有客观量对应的指标来做主观评价,如响度,低沉度,尖锐度,粗糙度等”我觉得在这点上你有所误区,主观评价实验就是主观的,如果有客观计算量相对应,就不需要进行主观评价了,我们现在进行的工作就是为了建立主观参量与客观参量(心理声学参量)之间的关系,然后才能建立用客观参量描述的声品质评价体系。这个是我的个人意见,希望你多和我探讨。
对于你提的第二点,我是十分的赞同,主要我现在做的这个是试验性的实验,本身是研究实验过程的,所以实验的各种方法和条件都要尝试一下才能得出结果:打分法和成对比较法得到的结果的差别,听审人员构成对实验结果的影响,是否盲听(听审前是否告知样本的车型,品牌,价格,工况等)对实验结果的影响,还有样本播放顺序的影响等等。
这次我先用打分法是因为打分法的工作量相对比较少一点,但是我估计成对比较法的精度大概会好一些吧。 我准备在今年年前就主要研究下这个听审实验的实验方法,过了年之后如果hyl2323兄你能提供一些精度、一致性、可比性较好的车内噪声样本话,我准备再做一次正式的听审实验。当然之前先要解决好实验设备,听审人员的培训等问题。 谢谢你的以意见,声品质主观评价方面,我也是刚接触,需要好好研究一下。 对lz的这些我不是太懂,但我还是对你的实验很感兴趣!我想如果我当初有机会,可能也会选择你这个方向,呵呵!
就有那么一点小小的建议:自己和对该实验熟悉的人我觉得不能拿来做实验,因为这个暗示性太强了!我自己也曾经这样做过,结果发现自己听的时候,能很轻易地分辨出听到的是那种声音,而自己本来就对这个实验有一些期望结果,我认为这样的结果肯定不能拿来用。
对于hyl2323 版主提到的成对比较法,我也想请教一下:不知道我们所说的成对比较法是不是一样的操作方法,因为如果比较对象超过6个的话,实验组数和实验时间会很多很长,影响实验准确性。不知道有没有解决的方法?
同济的毛东兴老师好像有一种分组成对比较法,但没试过,不知道效果怎么样 koor说的很好!主观评价是要注意很多细节的,如评审人之间不要相互讨论,不要评价听审人的结果优劣等,原因是群体决策中,由于群体成员心理相互作用影响,易屈于权威或大多数人意见,形成所谓的“群体思维”。群体思维削弱了群体的批判精神和创造力,损害了决策的质量。
另外,也不能告知哪个声音对应哪辆车,如果两辆车车内噪声本来是相近的,但由于一辆是高档车,一辆是中档车,人们不由自主地就认为高档车要好一些,这正是koor所讲的期望的影响。
成对比较法应该是应用较多的,成对比较法确是毛东兴老师一片文章里提出的,我只看了看原理,没有做过,需要实验验证。 原帖由 koor 于 2007-12-18 10:49 发表 http://www.chinavib.com/forum/images/common/back.gif
就有那么一点小小的建议:自己和对该实验熟悉的人我觉得不能拿来做实验,因为这个暗示性太强了! ...
koor说得很好,我自己在这个实验里只是做一个参照用的,在正式的以评价声品质为目的实验中,我自己的评价是不能计入总分的,其它人也不应该知道样本的参数 原来在这里找到组织!我现在正在做这方面的事情。我马上要做实验了,就是采集数据,用B&K的设备,评审团实验后面做,希望多在你们那里吸取点经验。我留个联系方式,QQ:41968456
希望我们一起来探讨相关问题。 现在我也有头疼的事情,就是我的声卡和耳机也不合要求!我现在也在担心陪审团培训的问题,现在也没有样本给测试者演示各个指标的标准,比如什么样的是十分烦躁的,什么样的算尖锐的。而且我还想找点影响因素,要写论文嘛,呵呵