Why don't we take the source from the person (we want the voice to sound like),because it's preserved,/ and borrow the filter from someone (about the same age and size),because they can articulate speech,and then mix them?
意译:
如果你想要这个声音像某个人,你可以先从那个人那儿采集声源,因为声源是已经加工/储存过的,然后,你找一个与声源来源对象年龄和身材相仿的人,从他/她那儿借用滤波器(频谱),因为他们能讲话,最终,将两者合成.我们为何不这么做呢?
声源会让音色近似某个人,而滤波器则能实现让这个音色讲出你设定的话语.貌似可以用来破解声纹识别...
----------------------------------------------
我觉得,正因为是演讲,才要把长句变成短句,把话讲清楚,原句也是断成5个部分的,很多字幕都是意译的,直译的话句子太长,估计大家都一头雾水了.
为了跟原句信息一致,我觉得把最后一句调到前面就可以,你试试看吧,
我们为何不这么做呢?\
如果你想要这个声音像某个人,你可以先采集他的声源,\
因为声源是已经加工储存过的,\
然后,你找一个与声源来源对象年龄和身材相仿的人借用滤波器(频谱),\
因为他们能讲话,最终,将两者合成\