我收集了大量由不同艺术家在现场表演中录制的音频/视频盗版。几十年来,这些录音都来自非常不同的来源和人,收藏中的所有录音都只是音频/视频文件。由于馆藏很大,馆藏的总运行时长大概是几百个小时。
每个录音的质量各不相同:一些录音听起来很棒(我们称之为“10”),但其中一些听起来更像是噪音(“1”),仍然是特定艺术家收藏家的兴趣点。让我这样说,“质量”是指它对我或其他任何人来说看起来和听起来“有多好” (而不是录音编码或压缩的音频/视频编解码器设置;而不是特定的艺术家表演——这是个人品味的问题,而不是音频/视频质量)。当我十多年前开始收集盗版时,我记得,我可以找到其中许多的特征,例如“质量:A+”(非常好)或“质量:B-”(没那么糟糕,但会引起人们的兴趣)集电极。)
例如:
如果现场录音听起来好像是在工作室录制的,那么它可能会被评估为“9”甚至“10”(无论使用有损或无损音频编解码器);
如果录音显示出明显的视觉 VHS 伪影,例如蓝/红/绿条纹(只是因为录音是在磁带上录制的),但整体画面非常好,则可以将其评估为“5+”到“7” ";
如果录音听起来非常“低音”并且低频在高频中占主导地位,则可能会将其评估为“3-”,因为音频可能被认为质量非常低,等等。如果存在这样的事情,我想它也可能会适用于音频、视频和图像;
和更多...
是否可以以软件的方式分析录音,而不是听/看,以“确定”/“评估”其主观质量?
这个问题看起来非常类似于Analyzing the quality of a music track (and possible audio quality evaluation ) ,但不能真正说出它有多接近。
(请注意,我在这方面的知识为零,可能使用错误的术语并且可能会提出一些不真实的问题。我试图找出它的唯一原因是通过将“质量”标签放入其中来编辑文件元数据,从而评估整个系列的平均/整体质量没有花费数周时间聆听或观看所有录音,无论我可能使用什么硬件。也不确定这个问题是否最好在软件推荐或声音设计中提出。)