这里有没有人用python做生物研究的? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
yech1990
V2EX    Python

这里有没有人用python做生物研究的?

  •  
  •   yech1990 2013-01-31 03:13:37 +08:00 8368 次点击
    这是一个创建于 4641 天前的主题,其中的信息可能已经有所发展或是发生改变。
    生物信息博士一枚,做实验,写点代码。想学一学python,发现python的论坛气氛都很浓,就没发现用python做科研的啊。。。
    31 条回复    1970-01-01 08:00:00 +08:00
    dndx
        1
    dndx  
       2013-01-31 03:28:21 +08:00 via iPad   1
    不是学生物的,不过我看到很多做生物研究的用的是 perl ,不知何故。

    可能 Python 做科学计算貌似国内不多,或者都是学院派,默默无闻型的。
    toothpaste
        2
    toothpaste  
       2013-01-31 06:32:52 +08:00
    @dndx +1
    我一个做生物的朋友十分推崇perl, 十分不明白.
    zhensun
        3
    zhensun  
       2013-01-31 08:16:06 +08:00
    具体是做什么?
    hfeeki
        4
    hfeeki  
       2013-01-31 08:36:53 +08:00
    有专门为生物研究开发的Python版本:
    biopython : http://biopython.org/
    bioSQL:http://biopython.org/wiki/BioSQL
    python好用,易学,功能强大,而且还有很多同行在用。
    luikore
        5
    luikore  
       2013-01-31 08:40:16 +08:00
    perl和ruby都有很多一行能搞定的字符串函数, 还有模拟awk的命令行参数
    zhensun
        6
    zhensun  
       2013-01-31 08:41:21 +08:00
    这东西主要还是因为库。
    Part
        7
    Part  
       2013-01-31 09:03:10 +08:00
    @yech1990 求推荐研究生~
    cassyfar
        8
    cassyfar  
       2013-01-31 09:07:39 +08:00
    这东西主要还是库, LZ是做模拟神经,大脑之类的吗
    chunshuai
        9
    chunshuai  
       2013-01-31 09:08:56 +08:00
    @Part @yech1990 +1 同求
    kaiqiz89
        10
    kaiqiz89  
       2013-01-31 09:27:56 +08:00 via Android
    你哪个学校的?
    HowardMei
        11
    HowardMei  
       2013-01-31 10:57:33 +08:00   1
    不懂生物,但一直关注开源工程计算。生物学家用perl比较多,大概喜欢它对弱格式文本处理的强悍,就像 @luikore 提的,而python里需要额外库支持:https://github.com/gvalkov/python-oneliner
    bioperl 也最老最成熟,其它语言的bio库都是从它port过去的,包括biopython

    不过python在计算领域发展较快,开发很活跃,模仿matlab的开源集成安装包有蛮多:
    http://www.sagemath.org 最老,偏数学计算
    http://www.enthought.com/products/ 集成作图,与matlab交互,有商业支持
    http://code.google.com/p/pythonxy/ 较新,偏GUI,打包IDE和QT设计器
    https://store.continuum.io/cshop/anaconda 偏大数据性能,有商业版本

    学校里写论文ipython notebook用处比较大,可以仿真、作图、写markdown/latex,
    以网页形式展现:
    http://blog.fperez.org/2012/09/blogging-with-ipython-notebook.html
    然后转换成pdf等格式。
    最重要ipython支持本地和在线两种部署,用来教学,在线提交作业很方便,MIT有在EC2上开搞的部署工具StarCluster:
    http://star.mit.edu/cluster/docs/latest/plugins/ipython.html
    zhensun
        12
    zhensun  
       2013-01-31 12:16:15 +08:00
    现在 matlab 很多都用 R 来代替了。
    empilot
        13
    empilot  
       2013-01-31 14:11:51 +08:00
    yech1990
        14
    yech1990  
    OP
       2013-01-31 15:03:39 +08:00
    @zhensun 主要做进化,也做其他的
    yech1990
        15
    yech1990  
    OP
       2013-01-31 15:10:54 +08:00
    @chunshuai @Part @kaiqiz89 这里的研究生主要还是做分子和细胞的实验,编程都算入门的级别。中大的。
    kaiqiz89
        16
    kaiqiz89  
       2013-01-31 18:10:43 +08:00 via Android
    @yech1990 中山大学?
    kaiqiz89
        17
    kaiqiz89  
       2013-01-31 18:13:24 +08:00 via Android
    @yech1990 干毛?算遗传距离?
    Todd_Leo
        18
    Todd_Leo  
       2013-01-31 19:57:57 +08:00
    发现很多人都在用R来做生物学上的计算
    yech1990
        19
    yech1990  
    OP
       2013-01-31 20:01:32 +08:00
    @kaiqiz89 是。不全是。
    kaiqiz89
        20
    kaiqiz89  
       2013-01-31 21:09:36 +08:00 via Android
    @yech1990 我们实验室有个教授,也是搞生物信息学的,专长就是在进化……

    他说他就是要推翻达尔文,他的理论大致概括出来就是变异会随着物种进化程度升高而降低,他的理论还没被认可,但是也没有人举出反例。

    叫黄石
    yech1990
        21
    yech1990  
    OP
       2013-01-31 21:56:15 +08:00
    @kaiqiz89 有没有文献的链接?这个名字不好搜 #
    frogs
        22
    frogs  
       2013-01-31 22:10:20 +08:00   1
    借问一句 生物信息学现在钱景咋样 XD
    Vienta
        23
    Vienta  
       2013-01-31 23:04:06 +08:00
    @frogs 和生物沾边的暂时都没有大质变,我是学四年生物的,现在iOS
    Vienta
        24
    Vienta  
       2013-01-31 23:06:09 +08:00
    @yech1990 楼主,一直不明白生物信息到底是啥,和编程有什么关系,我本科四年生物,现在已经转战iOS了,要是生物信息也能够编程,而不是那些无聊的概念和抽象到根本没有得到实际证明的理论,我也想混个那个玩玩
    yech1990
        25
    yech1990  
    OP
       2013-02-01 01:25:42 +08:00
    @Vienta 计算应该是现在生物学的主流,从做分子到做生态都离不开计算了。编程在生命科学研究中的重要性国外有很多讨论,搬运一篇《computational thinking in the era of big data biology》。
    原因的话,一方面与历史有关,生物学是一个喜欢收集数据的物种,在达尔文时代之前就有收集标本的习惯,随便一套植物学志,动物学志都有过万页吧,只是当时没有计算机来处理。不过现在的生物学已经很少研究形态学了。
    一方面是当今的生物学已经深入到基因,蛋白的角度,很多人不理解这有多少东西好算的。很不负责任的估算一下:一个人的基因组的数据量是3个G(10的9次方),转录组之类的会更大,如果要比较100个人样本的差异,那应该就有300G吧,加上annotation的话会更大。其实这也不算什么,大美利坚做了很多烧钱的项目,比如花几十个billion把1000个癌症病人的所有癌细胞(每个人大概有10的14次方个细胞,癌组织会少一点)都测序,每个细胞也都有3G的数据,这样的数据量的话如果不借助编程的话是搞不定的。 同理蛋白结构,网络的拓扑结构之类的都是需要算的。
    说点实的,现在TOP500的supercomputer其中有很大一部分就在进行生物学计算来的。
    ^_^,至于有没有趣的看个人了,想想如果通过计算能知道有些人为什么容易得癌症,有些病毒为什么更容易突变,还算挺有趣的。 不过生物信息学还算有前途,没钱途的东西。
    enzyme
        26
    enzyme  
       2013-02-01 04:41:23 +08:00
    生物信息有很多方向。有面向算法的,开发软件的,亦有研究进化模型,推导理论的,还有更多的是用于二代测序应用的。

    其实涉及很多的计算问题。简单的例子如下:

    人个体之间的不同的最根本是源于你我的基因组不同。人类的基因组大约有3*10^9个ATCG四个碱基,这些ATCG的不同排列造成了个体之间的差异。

    举个简单的粗糙不严谨的例子:
    以二型糖尿病为例,简单鉴定一个健康人与患者的基因组差异不能够解释为什么患病,因为这些差异可能是因为身高等其他性状的不同。而通过测序多个患者与健康人的基因组,全基因组关联分析,则有可能真正找到究竟是那些基因变异增加了患病的风险。需要大量计算。

    至于,为什么会有很多人用perl。可能一是因为习惯原因,perl有很多这方面的库了,2是可能perl在写一些一次性用的脚本上很方便。虽然,有时quick and dirty,但能干活儿。
    azalea
        27
    azalea  
       2013-02-01 10:30:54 +08:00
    我是读生信的,一直用Python,不过就是处理下文本文件,画画图什么的。具体工作还是要用对应软件,比如short read aligner用Bowtie,找相似序列用BLAST。最近打算转向R。
    zhensun
        28
    zhensun  
       2013-02-01 11:47:09 +08:00
    Matlab 转向 R 比较常见。
    Vienta
        29
    Vienta  
       2013-02-01 17:44:32 +08:00
    @yech1990 感谢你的回答,看到后面的一句话,确实是道出了我们这些学生物的童鞋的小命了。哈哈,我相信它会是很有前景的,本科同学八成以上都在读研了,读完研出来相信也会好点。我呢,其实学的也不错,不过最后对它已经不感兴趣了,所以就转了,现在也做这个也挺好,能创造点东西。毕竟大学不只是是学某个专业嘛,学的也是学习力。祝楼主好运
    kaiqiz89
        30
    kaiqiz89  
       2013-02-01 18:27:48 +08:00 via Android
    @yech1990 www.sklmg.edu.cn/articles_98.shtml 我们实验室网站

    @enzyme 5看你头像,搞遗传的?
    unionx
        31
    unionx  
       2013-08-17 04:15:46 +08:00
    话说我最近开始bioinfo了,LZ可以看看这个网站,用py解决bioinfo问题的教学网站:

    rosalind.info
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2996 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 13:05 PVG 21:05 LAX 06:05 JFK 09:05
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86