关于 python 对语音处理的问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
pangpang
V2EX    Python

关于 python 对语音处理的问题

  •  
  •   pangpang 2016-07-10 14:27:43 +08:00 4860 次点击
    这是一个创建于 3385 天前的主题,其中的信息可能已经有所发展或是发生改变。

    近期想用 python 对语音处理,去除里面的人声,然后对背景声音进行分析,来初略判断所处环境。(别问为什么,都是有苦衷的) 但是本人对语音处理不是很熟悉不知道有什么好的开源项目学习一下或者现成的库

    22 条回复    2016-07-11 22:46:08 +08:00
    SeanChense
        1
    SeanChense  
       2016-07-10 15:44:49 +08:00 via iPhone
    这怕是不是简单一两个库就能解决的,而且有没有这种库都还是问题。

    你自己要做的就是把信号源中把人的声音剥离出来,那么就要定义什么是人的声音。在时域是什么样的,在频域是什么样的,各自特征值是什么。然后设计一个滤波器,把不要的噪声剔除。
    完成了以上工作,我猜发个 SCI 可能问题不大。
    SeanChense
        2
    SeanChense  
       2016-07-10 15:46:40 +08:00 via iPhone
    或许已经有类似的研究了,楼主需要了解的是数字信号处理。查查看一些期刊论文。
    kamikat
        3
    kamikat  
       2016-07-10 16:12:23 +08:00
    pangpang
        4
    pangpang  
    OP
       2016-07-10 16:37:21 +08:00
    @SeanChense 谢谢,我近期学习一下,本行是无线网络方向的,对数字信号确实不了解
    pangpang
        5
    pangpang  
    OP
       2016-07-10 16:38:36 +08:00
    @kamikat 谢谢啦
    TaMud
        6
    TaMud  
       2016-07-10 17:19:50 +08:00
    TaMud
        7
    TaMud  
       2016-07-10 17:20:14 +08:00
    如果你能搞出来,直接投简历 google,ms 都可以
    264768502
        8
    264768502  
       2016-07-10 18:16:49 +08:00 via iPad
    pangpang
        9
    pangpang  
    OP
       2016-07-10 19:48:14 +08:00
    @TaMud 看来要达成这个目标需要付出挺多精力了
    pangpang
        10
    pangpang  
    OP
       2016-07-10 19:48:33 +08:00
    @264768502 谢谢
    pangpang
        11
    pangpang  
    OP
       2016-07-10 19:50:02 +08:00
    @SeanChense 其实我的目的只是某个人的声音特征就够了,别人的我也不关心。这样想的话好像还能变简单一点了
    shakespaces
        12
    shakespaces  
       2016-07-10 20:07:22 +08:00 via Android
    这的确是个大项目,应该是单独拿出来都能立项的
    JhZ7z587cYROBgVQ
        13
    JhZ7z587cYROBgVQ  
       2016-07-10 20:59:13 +08:00
    结合楼主的描述和回复,我已经脑补了各种剧情 = =
    TaMud
        14
    TaMud  
       2016-07-10 21:09:08 +08:00
    中科讯飞,百度,微软, google ,都想解决这个问题
    pangpang
        15
    pangpang  
    OP
       2016-07-10 21:37:55 +08:00
    @jason0916 别这样,我已经够可怜了
    HFcbyqP0iVO5KM05
        16
    HFcbyqP0iVO5KM05  
       2016-07-11 06:37:37 +08:00 via Android
    去人声的没有,去噪声可以用 Adobe Audition 。 或者可以反着来去噪了再和原声对比求差?
    qcts33
        17
    qcts33  
       2016-07-11 10:34:48 +08:00
    本行无线网络,没学过数字信号处理?我读书少,你不要骗我……
    本来想说 python 不适合这种信号处理任务,但发现 scipy 里面基本的滤波器设计都有
    不过这种任务确实体现不出 python 的优势,我觉得还是 MATLAB 实在,至少设计滤波器这种事情就没有必要反复敲代码了
    puyaraimondii
        18
    puyaraimondii  
       2016-07-11 11:47:43 +08:00
    前期去噪,预处理方法可以,根据你的数据选择合适的方案
    去除人声可以根据声音频率特征,找一个或几个合适的 window function 就行
    背景声音分析我只知道你在有了足够的背景声音库的基础上采用的方法,例如 DTW,HMM,ANN 等等,或者 Machine Learning 也有一堆,其他的方案不了解
    万方,知网那一堆数据库搜搜的话其实挺多可以参考的
    暂时只想到这些,同在学习
    pangpang
        19
    pangpang  
    OP
       2016-07-11 15:03:49 +08:00
    @qcts33 ^_^不能说没学过,只是不是强项。遇到数字信号方面,请教都是实验室的其他人
    pangpang
        20
    pangpang  
    OP
       2016-07-11 15:04:04 +08:00
    @puyaraimondii 谢谢啦
    pangpang
        21
    pangpang  
    OP
       2016-07-11 15:04:13 +08:00
    @puyaraimondii 谢谢指教
    JhZ7z587cYROBgVQ
        22
    JhZ7z587cYROBgVQ  
       2016-07-11 22:46:08 +08:00
    @pangpang 别太难过了,祝你好运少年
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2739 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 38ms UTC 14:34 PVG 22:34 LAX 07:34 JFK 10:34
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86