学术出版物

使用混合频谱图-tasnet进行实时低延迟音乐源分离

近年来,用于音乐解混音的深度学习取得了重大进展。然而,很少有人关注这些神经网络如何适应实时低延迟应用,这可能对助听器、混音音频流和现场表演有所帮助。在本文中,我们研究了针对此用例调整文献中的当前解混模型所涉及的各种挑战。随后,受Hybrid Demucs架构的启发,我们提出了混合频谱图时域音频分离网络(HS-TasNet),它利用了频谱域和波形域的优势。对于23 ms的延迟,HS-TasNet在MusDB测试集上获得的总体信噪失真比(SDR)为4.65,并通过额外的训练数据增加到5.55。这些结果证明了高效解混音在实时低延迟音乐应用中的潜力

Mouterde, Thomas & Corteel, Etienne: Satvik Venkatesh, Arthur Benilov, Philip Coleman, Frederic Roskam

2024年IEEE声学、语音和信号处理国际会议(ICASSP)

2020年4月

扩声系统中音频网络的要求和解决方案

市场对新商业模式和具有完全数字化技术结构的场馆的多功能性的需求促进了完全网络化的视听和扩声系统的快速发展。与此同时,ProAV行业正在经历一个幻灭阶段,即网络解决方案在专业应用中的适用性和面向未来的能力。虽然大多数成熟的媒体网络解决方案都建立在标准的传统以太网上,但事实证明,该技术无法满足大规模扩声系统在音频性能、可用性、可靠性和可扩展性方面的要求。领先的扩声制造商已经解决了这一基本问题,并自2016年以来开发了一种名为MILAN的协作方法,该方法基于开放确定性IEEE AVB或TSN网络技术。本文描述了导致这一决定的用户和市场要求,并解释了MILAN及其底层技术如何满足对音频性能、可靠性、易用性和可扩展性的最高要求。

Mouterde, Thomas & Corteel, Etienne: Henning Kaltheuner, Genio Kronauer, Morten Lave and Etienne Corteel

AES 2024 国际声学与扩声会议

2024年1月

关于沉浸式现场音乐活动中影响节奏感准确性的因素

空间音频在大型现场音乐活动中越来越常见。 在这种类型的活动中,扬声器可以被广泛隔开,这可能会导致某些信号源之间的到达时间差异很大。这些时间差异反过来可能会影响音乐或旋律中对节奏的感知情况,因为乐器之间的同步发生了变化。本文介绍了一项感知实验的结果,该实验研究了不同因素(例如乐器的性质或音乐流派)因为声音传播时间差异所导致的感知差异。结果表明,不同的乐器甚至在同一段音乐中也可能对时间的变化表现出更多或更少的敏感性。 基于这些发现,我们制定了混合和扩声系统设计准则,旨在为大多数观众保持最佳的音乐质量。

Mouterde, Thomas & Corteel, Etienne: Thomas Mouterde, Nicolas Epain, Samuel Moulin, Etienne Corteel

AES 2024 国际声学与扩声会议

2024年1月

关于全频扬声器和低频扬声器之间对于扩声时间对齐的感知

大多数音频增强系统采用全频扬声器和低频扬声器的组合,以便为观众提供一致的声压级水平,同时最大限度地提高频率带宽。一般需要主系统(全频)和子系统(低频扬声器)系统之间进行时间对齐,以确保在低频段上高效叠加。本研究调查了主系统和子系统之间的时间错位如何影响音质听感。我们进行了一项听力测试,要求听众根据主系统和子系统之间的相对延迟对音质进行评估。此外,还要求试验参与者使用频率描述或时间描述来延迟的感觉。我们的结果表明,整体听感质量不会随着延迟的增加而线性下降,并且它反映了频谱和时间衰退的存在。最后,当子系统相对于主系统延迟时,时间衰退影响会更为常见,而频率衰退则对延迟的方向影响很少。

Mouterde, Thomas & Corteel, Etienne: Thomas Mouterde, Samuel Moulin, Nicolas Epain, Etienne Corteel

AES 2024 国际声学与扩声会议

2024年1月

探索主动声学环境中的听感干扰和染色评估

在主动声学中,来自房间内麦克风的信号经过处理并馈送到同一房间的扬声器,从而延长混响时间并改变房间听感。在接近反馈前增益条件下,该系统的性能受到可听性和染色可接受性的限制。 文献中已经提出了一些听力测试,以评估感知,但以前尚未明确染色何时变得干扰听音或不可接受的门槛。 在本文中,我们重新审视了反馈前增益的预测,并展示了如何用来平衡一个主动的声学系统。然后,我们展示了新的听力测试,要求听者评估8通道主动声学系统在两个房间中所引入的变化的听力和干扰程度并进行评分。 我们表明,干扰程度取决于初始房间声学以及循环的增加;对略有烦人的衰退听感的门槛从5.4 dB到8.5 dB不等。 这些门槛的是以脉冲响应计算的客观测量为前提讨论的。共振感知与回声时间在某些频段的增长速度比其他频段快得多。 通过幅度响应的标准差也表明可以很好地预测它,当值为 0.62 时对应的是听感干扰的衰退。

Mouterde, Thomas & Corteel, Etienne: Philip Coleman, Nicolas Epain, Satvik Venkatesh, Frédéric Roskam

AES 2024 国际声学与扩声会议

2024年1月

L-Acoustics 教学平台,一个用于现场扩声工作混合学习方式的在线工具

L-Acoustics 是一个法国音频品牌,以在现场音响领域引入多项颠覆性技术而闻名,例如 1992 年采用全频线阵列,以及最近推广的大规模沉浸式音频扩声系统。 为了帮助终端用户掌握这些新工具,培训和教育一直是公司的核心基础。除了现在明确从职业教育的角度设计的课程外,L-Acoustics教育团队还继承了公司创新的基因,并推出了一个在线平台来支持其混合学习战略。 这个交互式学习工具是本文的重点,描述了它如何通过学习测验、视频、教程、认证测试和供学习社区交流的在线空间来增强学习者在讲师指导下的课程和自主学习活动中的体验。

Mouterde, Thomas & Corteel, Etienne: François Montignies, Etienne Corteel, Lucile Diemert, Thomas Mouterde

欧洲声学协会第10届大会

2023年9月

L-Acoustics扬声器系统和沉浸式音频的职业教育规划

L-Acoustics在现场音响行业引入了几项颠覆性技术,例如 1992 年采用全频线阵列,以及最近推广的大规模沉浸式音频扩声系统。为了帮助终端用户掌握这些新工具,培训和教育一直是公司的核心基础。 本文解释了与现场音响领域相关的教育挑战,以及L-Acoustics决定如何克服这些挑战。 制定一个针对终端用户的方案,其内容包含课程结构和教学方式细则,令其从传统的产品培训转变为职业教育。 不同的工作概况、相关的学习目标和课程满足了现场音响专业人员的发展。 此外,该方案被证明是对初级教育课程的良好补充,将为学生在现场声音行业的多种就业机会做好准备。

Mouterde, Thomas & Corteel, Etienne: François Montignies, Etienne Corteel, and Katerina Panagopoulou

音频工程学会音频教育国际会议

2023年9月

使用扩声扬声器系统中的抛物线方程模拟低频噪声污染

音响系统设计人员习惯于使用自由场模拟软件优化扬声器系统,以提高观众的体验。 然而,在设计阶段也必须考虑减少噪音污染,噪音的传播可能受到风、温度和地面阻力等不均匀的气候条件的影响。 本文提出了一种使用抛物线方程模拟环境对扬声器系统产生的远距离声压级影响的方法,考虑了立体声主系统与吊挂或地面堆叠低频扬声器的相关情况。 结果显示,使用地面堆叠方式的低频扬声器系统的声压级变化更大。本文讨论了主系统和低频扬声器之间分频频率的影响

Mouterde, Thomas & Corteel, Etienne: Mouterde, Thomas; Perrot, Joris; Lihoreau, Bertrand; Corteel, Etienne

第153届音频工程学会大会

2022年10月

对于扩声应用中的梳状滤波的频段和空间听感研究

大多数扩声系统由多个扬声器系统组成,其目的是覆盖整个观众区。 这项研究探讨了两台组全频扬声器之间叠加覆盖区域中可能出现的频率干涉和空间听感。 通过听力测试,以确定延迟源延迟、相对电平和角度分离对频谱染色听感和空间印象 (宽度、定位偏移、图像分离)听感的影响。 结果表明,当频率在空间上分离时,即使方位角很小(10°),频谱染色也会大大降低。 还发现,染色可听性取决于音轨和引入的延迟之间的相互作用。 最后,可感知的空间衰退的类型主要取决于空间分离度和较晚到达的声源的相对电平(滞后声源)。

Mouterde, Thomas & Corteel, Etienne: Moulin, Samuel & Corteel, Etienne

AES 2022 年春季大会

2022年5月

分布式补声系统的空间渲染,实现沉浸式现场声音的回放

现场声音回放中的补声系统旨在覆盖主系统无法解决的听音区域。 在靠近观众的区域,例如靠近观众的第一排或挑台下,应使用分布式系统,因为单个声源无法覆盖整个区域。 这些系统通常使用单通道下混信号,不提供空间信息。 本文研究了分布式补声的多种空间渲染算法。 提出了一个框架来评估这些算法在空间和视听一致性方面的性能。 空间补声算法在这两个感知维度上提供了良好的性能,同时确保了与主系统的覆盖和对齐,而与音频对象的定位无关。其他算法倾向于一个或另一个维度,或者可能无法确保任何音频对象位置在覆盖范围内的准确

Mouterde, Thomas & Corteel, Etienne: Corteel, E.; Moulin, S.; Roskam, F.

Reproduced Sound 2021, Proceedings of the Institute of Acoustics, Vol. 43. Pt. 2. 2021

11/2021

关于吊挂和地面堆叠低频扬声器配置在噪声污染方面的比较

在大型户外扩声活动中,除了观众体验和听力健康问题外,噪音污染问题也越来越多地被考虑在内。 除其他因素外,低频扬声器相对于主系统的位置会更多影响远距离的声压级,这可能被视为噪声污染。 在这篇论文中,首先进行自由场模拟,表明低频声波的位置对于后部和侧面有较大影响,但对系统前部噪音水平的影响有限。 然后,研究了风对低频能量传播的影响。 模拟结果表明,与吊挂低频扬声器相比,风对地面堆叠的影响更大,导致地面堆叠的低频在下风情况下声级更高。 参考资料:T. Mouterde 和 E. Corteel,“关于噪声污染的吊挂和地面堆叠低频扬声器配置的比较”,论文 10533,(2021 年 10 月)。

Mouterde, Thomas & Corteel, Etienne: Mouterde, Thomas & Corteel, Etienne

AES 2021 年秋季展

2021年10月

用于现场声音的 3D 音频

3D音频最近才开始渗透到现场音响行业。这是由于现场声音的特殊性,尤其是巡回演出,表演可以在非常多样化的环境中进行,并面向多达数以万计的观众。 应对这些挑战,以提供一致的高质量成果,需要具体的技术和做法。 本文描述了现场扩声的具体限制,这些限制导致必须选择足够强大的算法,以适应各种尺寸和扬声器布局的必要性 拟议了一个框架,以评估在现场音频环境中扫频算法的性能。概述了扬声器系统设计的重要性。 这里提出了一种方法和评估标准,以成功地将3D音频扩展到覆盖大规模的观众。 在大型场馆中创建虚拟环境及其在场馆之间的可移植性会产生特定的限制,本文将会描述这些限制并提出解决方案。 最后,介绍了主要应用和参考文献。参考资料:Etienne Corteel、Guillaume Le Nost、Frédéric Roskam,现场声音的 3D 音频, 3D 音频(第 1 版),Routledge,2021 年。

2021年7月

揭开扬声器线缆影响的神秘面纱

如今,体育设施、主题公园和娱乐场所等专业的音频安装不仅需要基于100V/70V定压扬声器的公广系统,而且还需要高音质、高声压和更宽的频率响应,而满足这些的是低阻系统。 由于线缆长度有时可能超过一百米,因此在驱动全频放大信号时可能导致高功率损失。 本文介绍了扬声器线缆的电模型,其中包括两种电磁现象,表面效应和诱导效应。 研究了下列参数 - 线缆长度:最长到200米,线缆缆直径从4到10平方毫米,不同阻抗与各种扬声器的关系。 其次是对在功放和扬声器音圈之间连接时对音频信号的影响的深入解释。 除了所有功率损失的模拟,还呈现了一项音量测量,突出说明了模型的准确性。 这个强大的工具可以是声音设计师和集成商预测长线缆对扬声器输出影响的一个很好的资源。 参考:Bertin, Nicolas & Montignies, Francois。 (2015). 消除扬声器线缆的影响。 声学研究所,2015年。

Mouterde, Thomas & Corteel, Etienne: Bertin, Nicolas & Montignies, Francois

2015年11月

观众对低频范围内扬声器系统响应的影响,第 1 部分:幅度

扬声器系统的响应受观众在场的影响。但是,扬声器系统调试是在没有观众的情况下进行的,对时间对齐系统组件使用均衡滤波器和延迟。观众因素是否考虑对决定与是至关重要的。 在本文中,用有限元素方法模拟了扬声器系统在低频率不同声源高度和观众密度的平面听力区域的影响大小。 结果表明,观众通过地面反射对吊挂声源有所影响,并且不断在地面叠加形成了低通滤波器效果的情况。 本文介绍并讨论了对典型扬声器系统配置的影响。

Mouterde, Thomas & Corteel, Etienne: Mouterde, Thomas; Corteel, Etienne; Melon, Manuel

AES 大会文件 #10398

2020 年 10 月 22 日第 149 届大会上发表的文章,线上

使用流体力学仿真计算对扬声器空气流动产生非线性声损耗预测

低音反射设计可以在其谐振频率附近表现出强烈的非线性行为,有显著出现音响损失并同时出现噪声。这些现象主要是由于在端口进入和发出的气流震荡和分离导致的。 该文提出了一种预测给定扬声器、箱体体积和端口几何形状产生的非线性声学损耗的方法。 该方法包括将计算流体动力学(CFD)模拟与扬声器非线性运动建模相结合。 测试安装在一个给定扬声器外壳上的四个不同端口几何形状。将计算出的声学损耗与测量结果进行比较,显示出良好的一致性。 结果表明,所提方法可以预测Helmoltz频率附近的非线性损耗且平均误差小于1 dB。

Mouterde, Thomas & Corteel, Etienne: Pene, Yves; Horyn, Yoachim; Combet, Christophe

AES 大会文件 #10359

在2020年6月1日至5日举行的第148届大会上发表的文章,线上

基于一阶反射分析的大规模扬声器系统调试最佳的测量位置

本文研究了一阶反射在扩声系统对大规模观众的扩声时的影响。 在现场,只能进行很少的声学测量来制定调试决策。 然后,选择正确的测量位置时很重要的挑战,以便准确地反映扬声器系统的响应。 对每一个一阶反射(例如,地板或侧壁反射)进行模拟,以表征平均频率响应及其在目标受众区域的变化。然后,研究了在减少测量位置位置后不同位置测量的代表性。 结果表明,分布在目标受众区域的八个测量位置的集合可以代表给出扬声器系统响应调试的合理解决方案

Mouterde, Thomas & Corteel, Etienne: Moulin, Samuel; Corteel, Etienne; Montignies, François

AES 大会文件 #10234

文章发表于2019年10月16日至19日在美国纽约举行的第147届大会上

关于吊挂与地面堆叠低频扬声器配置的效率

现代的现场演出扬声器系统由宽频段声源组成,通常是可变曲率线声源,并结合超低音使用。 虽然通常的做法是吊挂全频以改善观众的能量分配,而由于实际限制和据称吊挂配置的效率损失,大多数低频扬声器配置仍使用地面堆叠的方式。 本文旨在评估吊挂低频扬声器对大型观众区域的效率,与其地面堆叠方式的对比。 我们使用有限的线阵列箱体模拟来确定若干因素的影响:混乱效应,高度效应。 结果表明,在场地后区吊挂的配置仍然有效,同时在观众前区避免了声压级过大的情况。

Mouterde, Thomas & Corteel, Etienne: Corteel, Etienne; Coste Dombre, Hugo; Combet, Christophe; Horyn, Yoachim; Montignies, François

AES 大会文件 #10051

2018年10月17日至20日在美国纽约州纽约市举行的第145届大会上发表的文章

极端气候条件下的大规模露天扩声

极端的气候条件对声音的传播有深远的影响。本文介绍了两个必须考虑这个问题的安装案例:科切拉音乐艺术节的主舞台和好莱坞露天剧场。这里介绍的方法将优化音响系统设计与信号处理相结合,以部分补偿选定区域的损耗。

Mouterde, Thomas & Corteel, Etienne: Corteel, Etienne; Sugden, Scott; Montignies, François

AES Convention Paper #P2.3

AES大会文件 #P2.3

用于箱体衍射效应的分布式边缘偶极子 (DED) 模型

本文提出了一个简单的模型来解释安装在箱体中的直射式扬声器组件在箱体边缘衍射对辐射声场的影响。所提出的方法被称为分布式边缘偶极子(DED)模型,因为它是基于Kirchoff Approximation(KA)开发的,使用分布式偶极子,其轴垂直于挡板边缘作为基本衍射源。 DED模型首先针对薄圆形挡板的测量结果进行测试,然后应用于具有厚矩形挡板的真实扬声器。 研究了前向声压级和整个覆盖区域,并最终证明对DED模型的预测结果与实验测量结果吻合度较高。

Mouterde, Thomas & Corteel, Etienne: Urban, Marcel; Heil, Christian; Pignon, C.; Combet, C.; Bauman, P.

AES 日志, Vol. 52, No. 10 - 2004 年 10 月

2004年10月14日

波前雕塑技术

光学中的菲涅耳方法被引入声学领域。菲涅耳分析提供了一种有效、直观的方法来理解复杂的干扰现象,并允许定义有效耦合离散声源所需的标准,并在扩声应用中实现对给定受众几何形状的覆盖。从所谓的波前雕塑技术的基础上得出的标准。

Mouterde, Thomas & Corteel, Etienne: Urban, Marcel; Heil, Christian; Bauman, Paul

AES Journal, Vol. 51, n°10 - 2003 年 10 月

2003年10月15日