花了几天建立的一个小网站,博客聚合: voosee.com - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
lala
V2EX    分享创造

花了几天建立的一个小网站,博客聚合: voosee.com

  •  
  •   lala2011-07-01 07:23:52 +08:00 11565 次点击
    这是一个创建于 5224 天前的主题,其中的信息可能已经有所发展或是发生改变。
    之前有玩聚网,当时我对内容聚合并不熟,所以了解不深,不过最近看郑昀的博客,觉得还真是牛人啊。

    http://www.voosee.com

    主要就是博客聚合,然后根据社会分享次数来淘出被分享次数多的文章,很简单的想法和实现。现在为了测试用,voosee只聚合互联网、科学相关的博客,未来如果有可能,想扩展到其他内容。

    目前有一个困难就是文本分类,如果聚合的内容杂了,如果用算法自动进行第一轮文本分类,本人编程一般,语义分析就更不熟了,有推荐阅读的文章,请留言告知,:D

    其实有冲动想做这么一个东西的触因是hacker monthly。我觉得博客文章里面,有些是极有营养的,完全可以成为杂志内容,所以想通过聚合筛选出一些文章来做电子杂志,丰富阅读,我都开始找inDesign的东西来看了,呵呵。自己设计杂志一件很酷的事情,也是最吸引我的地方,虽然本人理工科出身,对于”设计“两字却常有羡慕之情,看到UI好的网站,总想”上下其手,欲罢不能“。

    技术方面主要如下:
    python+django+appengine
    利用amazon ec2 west 做的反向,不知道国内速度怎么样。

    网站目前还超级简单,评论系统想用DISQUS,我想尽量避免“用户注册”这件事情,希望大家多提意见,谢谢啦。
    55 条回复    2019-01-03 09:47:18 +08:00
    mactive
        1
    mactive  
       2011-07-01 09:09:17 +08:00
    界面很清爽
    PS:http://adsoftheworld.com/ 这里有很多优秀的广告
    yava555
        2
    yava555  
       2011-07-01 10:20:14 +08:00
    cool,很喜欢这个网站,阅读起来很舒服。

    如果筛选质量再高点的话,就完美了。
    yava555
        3
    yava555  
       2011-07-01 10:21:00 +08:00
    与之前的玩聚SR有点相似
    ailogx
        4
    ailogx  
       2011-07-01 10:22:15 +08:00 via Android
    估计推荐算法还要改进
    lala
        5
    lala  
    OP
       2011-07-01 10:25:46 +08:00
    @yava555 谢谢,筛选完全是按照被分享次数的,可能得提高一下筛选的门槛。

    @allogx 算法太简单了,现在还处于测试阶段,接下来慢慢调整
    lala
        6
    lala  
    OP
       2011-07-01 10:28:03 +08:00
    @mactive 谢谢,有机会一定好好学习一下。。。

    最近发现点点网虽然赤裸抄袭,上面好像也有不少质量不错的创意图片和文章
    ming1016
        7
    ming1016  
       2011-07-01 11:17:12 +08:00
    这个不错哦,界面体验都不错,我也弄了个类似的
    http://www.starming.com/fun/chosen/
    frittle
        8
    frittle  
       2011-07-01 11:31:43 +08:00
    不错,喜欢
    lala
        9
    lala  
    OP
       2011-07-01 11:34:26 +08:00
    @ming1016 你的这个很酷啊,点点网是“轻”博客,内容不会太“重”,这样的显示方式不错,不过点开内容之后,最下面的回到主界面“小栏”不是特别明显。

    ui很酷,黑色的确适合图片
    lepture
        10
    lepture  
       2011-07-01 12:08:26 +08:00
    我目前在做的 http://www.feedbundle.com
    无算法,纯人工。也是博客聚合,不过和你的思路不一样。

    之前也是放在gae上的,现在迁移出来了。 tornado + mongodb + memcache + nginx
    waylybaye
        11
    waylybaye  
       2011-07-01 13:02:48 +08:00
    amazon ec2 west 国内速度不太好,上网高峰期不稳定, tokyo 的速度快。。

    再打个小广告,评论系统的话可以看下我在做的
    http://baye.me

    都是用的django 啊...
    yava555
        12
    yava555  
       2011-07-01 13:40:35 +08:00
    @lala 分享次数? 来自微博还是Google Reader
    xleoman
        13
    xleoman  
       2011-09-19 13:12:01 +08:00
    @lala 兄弟是否方便留个联系方式?
    kamal
        14
    kamal  
       2011-09-19 15:51:30 +08:00
    跟我的gr订阅严重重合啊。
    yishanhe
        15
    yishanhe  
       2011-09-19 17:21:50 +08:00
    评论系统直接做成发微博博文或者发社交网状态(根据用户连接的社交网络来定)这样会不会更好?可以和社会化分享结合起来
    love
        16
    love  
       2011-09-19 17:50:51 +08:00
    界面看上去很舒服。
    建议加上快捷键,比如j上一条 k下一条之类的。
    lmessi
        17
    lmessi  
       2011-09-19 17:58:04 +08:00
    蛮好的
    lala
        18
    lala  
    OP
       2011-09-20 12:55:18 +08:00
    @xleoman 联系方式?可以用[email protected]

    @yishanhe 评论系统我很纠结,不过想做成利用微博登录的,可以同步,不过目前没有时间写,而且GAE大涨价,我目前很没有热情, :(

    @love 快捷要添加比较快,这个建议相当不错,谢谢,我找个时间加上去,呵呵。。。
    chuck911
        19
    chuck911  
       2011-09-20 14:15:42 +08:00
    @lala 我也正想说评论系统可以用 @waylybaye 的http://baye.me/
    后来看到他已经在#11说了
    可以用各种微博登录,嵌入也很方便
    不过,@waylybaye,我觉得,登录界面,应该把“使用以下微博账号登录:”放在主要位置,而不是baye帐号的登录框,这样对新用户来说更亲和一点,毕竟现在baye.me用户很少
    berryphone
        20
    berryphone  
       2011-09-20 15:18:21 +08:00
    貌似不错的样子 舒服看着
    zythum
        21
    zythum  
       2011-09-20 15:23:45 +08:00
    感觉不错。真心的。
    zythum
        22
    zythum  
       2011-09-20 15:31:32 +08:00
    还有就是左边栏的滚动条藏得不错。
    xleoman
        23
    xleoman  
       2011-09-20 23:36:48 +08:00
    期待进一步更新!
    waylybaye
        24
    waylybaye  
       2011-09-23 15:23:03 +08:00
    @chuck911 感谢建议,我目前也正打算淡化账户注册等流程,下一版本会有很大改变 :D
    xspio
        25
    xspio  
       2011-09-24 20:49:02 +08:00
    网站很不错

    感觉有点像RSS阅读

    挺喜欢的
    appgam
        26
    appgam  
       2011-09-24 21:21:29 +08:00
    喜欢环保型
    terrylin
        27
    terrylin  
       2011-10-13 11:18:31 +08:00
    网站访问不了了?
    terrylin
        28
    terrylin  
       2011-10-13 11:19:28 +08:00
    @lala 网站访问不了了,上海电信
    unstop
        29
    unstop  
       2011-10-13 11:40:48 +08:00
    非常棒,希望进一步优化UI。
    cynial
        30
    cynial  
       2011-10-13 12:03:28 +08:00
    域名不存在了?
    lala
        31
    lala  
    OP
       2011-10-14 03:07:31 +08:00
    @terrylin @cynial 昨天短暂时间不行了,具体什么原因我也不清楚,原以为亚马逊的反向代理出问题了,没想过一会儿就好了。。。。

    @unstop 谢谢,Google的新定价让我很失望,原来是不需要花钱的,一天可能几美分(存储超过免费额度),新定价后,一天要三四美元。。。。都不知道要不要继续在GAE上跑,不知道其他人怎么打算的,重写代码的话,现在很没有这个时间的, ;-(
    Tiny
        32
    Tiny  
       2011-10-14 08:43:59 +08:00
    @zythum 你说的滚动条藏哪儿了 没找到。。
    zhutou
        33
    zhutou  
       2011-10-14 08:51:05 +08:00
    挺不错的,加油
    zythum
        34
    zythum  
       2011-10-14 10:51:47 +08:00
    @Tiny 那说明真的藏得很好。再找找。朱一笑而不语。
    wangxuezhong
        35
    wangxuezhong  
       2011-10-23 20:12:38 +08:00
    真心不错
    yqjun
        36
    yqjun  
       2011-10-23 20:36:01 +08:00
    好牛……向LZ学习!!!
    somegen
        37
    somegen  
       2011-10-23 21:20:22 +08:00
    能独立出来视图观看非常酷啊
    Sundyme
        38
    Sundyme  
       2011-10-24 02:10:04 +08:00
    看了一下,很不错!
    linusef
        39
    linusef  
       2011-10-24 06:56:13 +08:00
    有一个“很小的”问题,靠左的布局对高分辨率的用户来说需要适应。
    yangg
        40
    yangg  
       2011-10-24 09:20:21 +08:00
    不错,前几天朋友推荐了,连续看了好几天了
    benzhe
        41
    benzhe  
       2011-10-24 10:05:05 +08:00
    订阅好几天了,内容不错
    wiwiyu
        42
    wiwiyu  
       2011-11-10 16:32:55 +08:00
    终于找到了,原来是你做的!球源码啊 ~~~
    flied
        43
    flied  
       2011-11-10 16:54:36 +08:00
    网站挺好的,不过我说点别的问题,这样直接全文抓取其他网站内容是否合适。

    每篇文章的流量和阅读都是在这个网站发生,有很大的问题。

    lala
        44
    lala  
    OP
       2011-11-11 02:09:33 +08:00
    @flied 抓取的都是Rss feed,feed一般是网站或者博客主人自己定制的输出方式,可全文、可不全文,他们有全部的控制权,我们只是显示他们定制的、愿意被其他软件或者网站展示的内容而已,所以在版权上是没有不妥的,就像google reader一样。

    也许你的疑问是流量和阅读都在这个网站上发生,这不是影响了内容创作者的利益了吗?所有的rss reader都有这个问题。我想,看创作者本身的目的,如果只是为了内容得到更广的传播,这是有利的。如果想不减少自己网站的访问量,他们会选择只输出部分内容,而非全文,所以rss feed只是方便文章传播的方式,一定会影响其他网站的流量(也有可能增加的啊。。毕竟传播范围广了),可是影响的大小在他们可控范围内。
    sunnymiao
        45
    sunnymiao  
       2012-01-29 16:54:53 +08:00
    @lala 请问热文怎么没有rss呢。。订阅全部实在是受不了啊。。
    ColinZeus
        46
    ColinZeus  
       2012-01-29 22:00:55 +08:00
    @lepture 域名不错。。。
    lala
        47
    lala  
    OP
       2012-01-31 10:24:49 +08:00
    @sunnymiao 现在的已经是热文了,虽然热文有点多 ;-)
    zhfsxtx
        48
    zhfsxtx  
       2012-01-31 13:33:57 +08:00
    @lala 几天时间就完成一个站,羡慕
    Mianco
        49
    Mianco  
       2012-02-14 10:17:17 +08:00 via iPhone
    @lala 楼主你有信箱吗?有点技术问题请教你可以吗?
    citydog
        50
    citydog  
       2012-02-14 10:22:27 +08:00
    推荐把友言给废了,换评论啦,友言我这里时常打不开,即使能打开,也很慢~~
    heroicYang
        51
    heroicYang  
       2012-02-14 10:54:29 +08:00
    原来VooSee的主人在这里~昨天看到这个站就觉着很不错!
    lala
        52
    lala  
    OP
       2012-02-14 13:50:03 +08:00
    @Mianco popbuzz.me at gmail.com
    @citydog 评论啦我这两天看看,友言我也觉得慢,也常出错
    @heroicYang 谢谢,其实我觉得我太懒了,不然是应该继续开发的,最起码也要有一个app出来,容易阅读、保存和分享什么的。。。
    iveney
        53
    iveney  
       2012-02-14 13:53:57 +08:00
    算法事,social recommendation 很靠 :p
    qq286735628
        54
    qq286735628  
       2012-02-14 14:44:21 +08:00
    我之前也想做这种RSS聚合,尤其是很多人都在关注某一个方面的时候,会很有意思~

    每位阅读者,都可以提交RSS地址,丰富里面的内容~

    每一篇文章,每一个RSS地址,都有一个评分系统~

    首页出现的内容,是按综合评分得出的权重来展示,而不仅仅是时间轴来展示~

    所有的评价,都要基于真实的用户~

    让网站只把最真实,最有价值的东西展示给读者~
    reborm
        55
    reborm  
       2019-01-03 09:47:18 +08:00
    后期有标签,分类,筛选就好了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2090 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 00:56 PVG 08:56 LAX 17:56 JFK 20:56
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86