训练与推理对音频的预处理不一样是什么原因？这个会对模型推理的效果有影响吗 #185

zhangyuzyy · 2024-08-28T04:15:50Z

请问一下，训练与推理对音频的预处理不一样是为什么？
训练：
使用/scripts/data.py中的代码
whisper_feature = audio_processor.audio2feat(audio_path)
将whisper_feature 保存成了npy，然后使用DataLoader

推理时使用的scripts/finetuned_inference.py中的代码
whisper_feature = audio_processor.audio2feat(audio_path)
whisper_chunks = audio_processor.feature2chunks(feature_array=whisper_feature,fps=fps)

为什么在训练的时候，不需要使用 audio_processor.feature2chunks方法呢？

czk32611 · 2024-08-29T06:21:39Z

hello，在https://github.com/TMElyralab/MuseTalk/blob/train_codes/train_codes/DataLoader.py#L195进行feature2chunks了。这样保存的空间会小一些

zhangyuzyy · 2024-09-06T02:43:20Z

感谢，理解了

zhangyuzyy closed this as completed Sep 6, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

训练与推理对音频的预处理不一样是什么原因？这个会对模型推理的效果有影响吗 #185

训练与推理对音频的预处理不一样是什么原因？这个会对模型推理的效果有影响吗 #185

zhangyuzyy commented Aug 28, 2024

czk32611 commented Aug 29, 2024

zhangyuzyy commented Sep 6, 2024

训练与推理对音频的预处理不一样是什么原因？这个会对模型推理的效果有影响吗 #185

训练与推理对音频的预处理不一样是什么原因？这个会对模型推理的效果有影响吗 #185

Comments

zhangyuzyy commented Aug 28, 2024

czk32611 commented Aug 29, 2024

zhangyuzyy commented Sep 6, 2024