奖金 3w+ 奖金 3w+ 奖金 3w+
大数据比赛开始啦,真实 9000w 条用户数据开放下载,极具实验研究价值,戳
http://www.nowcoder.com/activity/calendar
![]() | 1 markmx 2015-12-24 11:03:48 +08:00 要先报名吗? |
![]() | 2 Sequencer 2015-12-24 11:08:58 +08:00 via iPhone ![]() 就是我不用小公司服的主要原因 拿用做比 呵呵呵呵 |
8 songco 2015-12-24 11:40:20 +08:00 奖金有点少... |
![]() | 10 xuxanwan 2015-12-24 11:47:17 +08:00 早上看到的一篇报道里面周鸿说: >[用户把自己的数据交给互联网公司,换取它提供的各种各样服务,这是一个契约的关系]( http://xhpfm.mobile.zhongguowangshi.com:8091/v200/newshare/468290) so, 认了吧, 这些数据是他们的..人为刀俎我为鱼肉.. |
![]() | 11 yanyuechuixue 2015-12-24 11:56:01 +08:00 via Android 这个公司,我记住了。 以后不用相关服务。 |
![]() | 12 jzp113 2015-12-24 12:00:11 +08:00 那几个编程的题目蛮简单的。就是不喜欢用 java |
![]() | 13 caixiexin 2015-12-24 12:07:56 +08:00 via Android 所谓的脱敏数据吗 |
![]() | 14 Sequencer 2015-12-24 12:42:53 +08:00 append: 如果要收集的我得不在用面,而是要另外明的用一面用是否送一份匿名商,在除了少人看用之外看。 Google 、 Apple 是否送匿名信息是可的。 包括很多,源件都有送匿名信息的。 如果是源件,或者其他比良心的件我都勾用改善服和支持者,同些信息的用途也明表示出。然如果用於的,用都不勾。 我用 Google 和 iCloud 的日,他把我的用於比? 有使用些件,敢件,有明的面用是否活? 想到之前的某大直接拿校校卡行大分析,有束的分析感到度反感。\\ @nowcoder 能理解者除了私之外法在用上收其他利益的苦衷,但是是希望在做些之前,用能知道自己的信息被拿去做大。 |
![]() | 15 nowcoder OP @jzp113 编程题支持 c++, python 和 c#。 那个练习卷是给你熟悉环境用的。比较简单。正式比赛会难一些。 |
![]() | 16 dqh3000 2015-12-24 12:50:22 +08:00 |
17 dream7758521 2015-12-24 12:52:24 +08:00 via Android 居然是中华万年历,传说中广告超多,频繁唤醒 |
18 m8syYID5eaas8hF7 2015-12-24 12:52:28 +08:00 @Sequencer 也不算吧,用户点赞别的用户也可以看到,这个本来就是公开的数据啊 |
19 hellokittyer 2015-12-24 12:57:19 +08:00 直接上个下载地址吧 |
20 JQ 2015-12-24 13:08:13 +08:00 要报名才能看到数据 ?有测试数据么 |
![]() | 21 young 2015-12-24 13:25:52 +08:00 ![]() |
![]() | 22 jiezhi 2015-12-24 13:38:50 +08:00 虽然没搞过这个,先把数据拿下来备用:-D |
![]() | 23 a40049 2015-12-24 15:57:12 +08:00 虽然想报名,但是看到必须填写手机号,还是算了 |
![]() | 24 SourceMan 2015-12-24 16:09:12 +08:00 V2ex 可以通过遍历用户 ID 拿到用户的信息, L 大真是不为我们的“隐私”着想!!! 23333~ |
25 s7lx 2015-12-24 16:19:20 +08:00 ![]() 只要数据不想参加比赛的可以看这里 http://pan.baidu.com/s/1bobAO9L 密码 ste5 |
![]() | 26 billwang 2015-12-24 22:09:55 +08:00 中华万年历记住了,以后再也不用。 |
![]() | 27 meantobe 2015-12-24 22:35:34 +08:00 ![]() 2006 年 8 月, AOL 出于好意而公开了一大批查询日志样本,供人研究。这些日志涉及三个多月以来 65 万用户的 2000 万查询,已经做了匿名处理,因此从理论上讲,不存在任何可以用于辨识个人身份的信息。尽管是善意之举,但人们也很快就发现这些日志在实践中不会像 AOL 想象的那样做到完全匿名。每个用户在查询时都会被赋予一个随机但唯一的标识符,有了这个标识符,就很容易知道同一个人都查询过什么内 容。进而,确定一些人的身份也就成为可能。因为不少人都搜索过自己名字、地址、社会保险号以及其他个人信息,通过搜索相关性分析暴露出来的信息比 AOL 认为的多,也肯定比原始用户自己想到的多得多。 AOL 很快从自己网站上删除了这些日志,当然为时已晚。这些数据早已被传播得满世界都是了,而且至今仍可以找到,甚至还附有帮你分析它们的一些工具。 Brian W. Kernighan 《世界是数字的》 |