细思恐极!用 iPhone 备忘录扫描文件竟被识别内容! - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
v2lhr
V2EX    分享发现

细思恐极!用 iPhone 备忘录扫描文件竟被识别内容!

  •  1
     
  •   v2lhr 2020-08-07 13:20:45 +08:00 7983 次点击
    这是一个创建于 1903 天前的主题,其中的信息可能已经有所发展或是发生改变。

    由于报销需要发票扫描件,因此今天我用 iphone 的备忘录扫描了我的医院发票,存储后文件居然被命名为:Medicine fee !这就意味着 iPhone 识别了我的文件内容!这样搞对于私密文件来说也太危险吧!!

    65 条回复    2020-08-19 15:55:51 +08:00
    bruce00
        1
    bruce00  
       2020-08-07 13:30:58 +08:00
    现在各家的拍照、扫描都会整点识别功能进来。。iphone 应该是离线识别吧
    sidkang
        2
    sidkang  
       2020-08-07 13:33:25 +08:00
    各家都有加类似的功能啊,比如照片里都有人脸识别
    lloovve
        3
    lloovve  
       2020-08-07 13:33:45 +08:00 via iPhone
    不科学啊,你多扫描几次,看看都是什么名字,每个都是同样名字会有问题吧
    takemeaway
        4
    takemeaway  
       2020-08-07 13:36:44 +08:00
    iPhone 小技巧里面都说了。
    你有机密吗? 机密的地方不允许带手机的
    crs0910
        5
    crs0910  
       2020-08-07 13:36:45 +08:00 via iPhone
    它还可以搜索到图片内容
    lifeforwater
        6
    lifeforwater  
       2020-08-07 13:41:12 +08:00   8
    1 楼这回复绝了,类比下:
    xx 酒店装有摄像头 > 现在各家酒店都有,xx 酒店的摄像头应该是离线的
    back0893
        7
    back0893  
       2020-08-07 13:42:37 +08:00
    没啥问题,
    不是国产的,安全
    learningman
        8
    learningman  
       2020-08-07 13:46:10 +08:00   2
    只要清楚地认识到:“现代社会个人不存在隐私”这个事实,并且学会掩耳盗铃,日子就会舒服很多。
    说不是国产的安全。。。。我不禁怀疑是反串还是思想出了问题
    Leonard
        9
    Leonard  
       2020-08-07 13:50:09 +08:00   1
    @lifeforwater 这类比明显不对,酒店摄像头就算离线,相关工作人员也可以看,手机摄像头离线只有自己能看
    ScotGu
        10
    ScotGu  
       2020-08-07 13:51:03 +08:00   12
    这就是科技进步呀!

    顺便炸个鱼~ 如果标题中的 iPhone 改成任何国产品牌,尤其是小华,那绝对是大型讨伐现场了。
    Leonard
        11
    Leonard  
       2020-08-07 13:53:47 +08:00   1
    @ScotGu 如果是偷偷上传被发现,哪个品牌都一样被讨伐,如果识别了以后主动给用户看,性质就不一样
    xz410236056
        12
    xz410236056  
       2020-08-07 14:21:22 +08:00   2
    恐个屁啊,第一次用 iPhone 啊,本来就是作为功能推出的。你也说了是扫描!不是拍照。那是两个功能。
    hoyixi
        13
    hoyixi  
       2020-08-07 14:27:47 +08:00
    FaceID: 你都不要 face 了,还在乎啥? :)

    另外,各个手机(操作系统、浏览器、电商、各种社交 App )厂商的后台云肯定掌握着你的隐私大数据,然后我个人觉得区别就是:这些数据会不会给第三方,依据什么标准共享给第三方
    yov123456
        14
    yov123456  
       2020-08-07 14:27:48 +08:00   4
    苹果 wwdc 说了。。都是离线模型识别的。。
    waylybaye
        15
    waylybaye  
       2020-08-07 14:30:08 +08:00   1
    不用怕,苹果的 OCR 是设备端的识别,不是云端的。
    yukiww233
        16
    yukiww233  
       2020-08-07 14:34:06 +08:00
    谷歌 ml kit 的离线物体识别模型只有几 M
    已经是很成熟的技术了
    xingyuc
        17
    xingyuc  
       2020-08-07 14:46:18 +08:00
    离不离线开了飞行再试试
    ios 闭源,只能抓个包试试?
    xinghen57
        18
    xinghen57  
       2020-08-07 14:51:15 +08:00 via iPhone
    楼上正解。
    好奇楼主来着吐槽,是求心理安慰么?
    ifxo
        19
    ifxo  
       2020-08-07 14:57:48 +08:00
    恐个 p,你说的每一句话淘宝都能听见
    v2lhr
        20
    v2lhr  
    OP
       2020-08-07 15:24:40 +08:00
    @xinghen57 图个屁心里安慰,我是觉得完全不应该未经用户同意就识别文件内容,还有告知大家这个发现,算是提醒一下大家而已。反正我第一反应是震惊。
    v2lhr
        21
    v2lhr  
    OP
       2020-08-07 15:31:11 +08:00
    @ScotGu 还真可能是...
    v2lhr
        22
    v2lhr  
    OP
       2020-08-07 15:33:25 +08:00
    @yov123456 我开始也想这会不会是离线的,但是以我有限的知识觉得不太可能
    otakustay
        23
    otakustay  
       2020-08-07 15:35:53 +08:00
    据我所知,iOS 的识别是 on device AI,纯离线的
    GG668v26Fd55CP5W
        24
    GG668v26Fd55CP5W  
       2020-08-07 15:40:27 +08:00 via iPhone
    不但能识别,默认设置下你的备忘录还会上传到 iCloud 上呢
    oIMOo
        25
    oIMOo  
       2020-08-07 15:41:40 +08:00
    首先要明确一点,你使用备忘录前,是仅在本地储存,还是需要 iCloud 备份?

    前者的话,你把它联网权限禁掉了之后再试试。
    如果是离线识别,那就问题不大。

    后者的话,你是担心它知道你存了什么?
    这又分为机器知道,还是人知道。
    前者像楼上说的照片搜索,后者就是明知道储存里有大量的银行卡信息,员工也没权限+没能力访问到(比如存在 Apple Pay 的银行卡信息)。

    大概就是这样吧。
    BadReese
        26
    BadReese  
       2020-08-07 15:45:42 +08:00
    有什么好猜的 网络一关再扫一次不就行了
    kera0a
        27
    kera0a  
       2020-08-07 15:46:49 +08:00 via iPhone
    @v2lhr
    判断是不是离线识别,不需要啥知识,有手就行。
    拔掉手机卡,关闭家里的 WIFI 电源,再扫一次其他没扫过的文件看是否能识别。
    est
        28
    est  
       2020-08-07 15:49:52 +08:00
    其实不一定需要 OCR 识别内容的。现在图像分类是端到端的了。

    什么意思呢?就是一个黑盒子可以把任意图片归类到它觉得最适合的一个类别。

    具体怎么识别的,谁也无法解释。
    rockeyshao
        29
    rockeyshao  
       2020-08-07 16:04:24 +08:00 via iPhone
    苹果其实不是非常干净,不过至少人家敢承认,之前上传 siri 语音都承认了,不过在国内不怎么好起诉苹果
    pikaconan
        30
    pikaconan  
       2020-08-07 16:48:03 +08:00
    这在贴吧叫破事水...
    DAMNYOU
        31
    DAMNYOU  
       2020-08-07 16:50:40 +08:00
    屁大点事,你应该庆幸 那是 iPhone 获取了你的信息,如果是安卓的。。呵呵,而且这是明面上的,暗地里的说出来 估计你都要吓死

    你手机没有任何一丝隐私,你的手机剪贴板一天不知道要被多少软件读取多少次,那都是你没有感知的。
    nomansky
        32
    nomansky  
       2020-08-07 16:52:50 +08:00
    连出行健康码大家都习以为常了,一个 orc 识别有啥好惊讶的...
    Yangz
        33
    Yangz  
       2020-08-07 16:54:53 +08:00
    @bruce00 嗯嗯,确实是离线的来着
    dddd1919
        34
    dddd1919  
       2020-08-07 17:12:40 +08:00
    离线识别,在线上传
    yintao0303
        35
    yintao0303  
       2020-08-07 17:38:44 +08:00
    搜索还能搜到图片中的文字呢。
    dingdangnao
        36
    dingdangnao  
       2020-08-07 17:46:15 +08:00
    屁大个事也恐。。
    reedthink
        37
    reedthink  
       2020-08-07 18:19:25 +08:00
    这个视频 https://www.bilibili.com/video/BV1zf4y1X7i5 ,3:30 有介绍这个功能。顺带一提,手机的算力搭配如今成熟的识别模型,做这个功能没什么难的。
    no1xsyzy
        38
    no1xsyzy  
       2020-08-07 18:25:23 +08:00   1
    @v2lhr #22 你这知识也太有限了……
    训练好的模型用(相对)特化的电路运行没多少消耗的,iPhone 的确有加神经网络模块
    树莓派不用说,就是 RISC-V 一个宣传点就是极低功耗的即时离线机器视觉模块,差不多鼠标拖进去直接流片就行
    稍微关注点数码的新闻就不至于……
    yeeyeung
        39
    yeeyeung  
       2020-08-07 19:03:27 +08:00   1
    楼主的意思应该是扫描功能加不加 OCR 需要用户指定而不是自动化完成
    otakustay
        40
    otakustay  
       2020-08-07 20:55:45 +08:00
    @yeeyeung 这种要求唯独对苹果来说不现实,这家公司就喜欢替用户做决定
    devlnt
        41
    devlnt  
       2020-08-08 05:46:48 +08:00
    你扫的应该是有二维码的发票吧。。。
    s1th
        42
    s1th  
       2020-08-08 06:10:22 +08:00 via iPhone
    竟然有说苹果不太干净的,哈哈,苹果不太干净,其他家应该是在泥坑里垃圾堆打滚了。矮个子里拔高,一群公司被特靠谱干翻,真当人家是闲的蛋疼就抓着你最大的公司怼?
    uasier
        43
    uasier  
       2020-08-08 09:50:04 +08:00
    @s1th 然后就是 tiktok,wechat
    再然后会是谁呢,
    反正你的意思就是国内公司都是该的呗。
    uasier
        44
    uasier  
       2020-08-08 09:52:22 +08:00
    @uasier 因为他们"不干净",哈哈哈
    v2lhr
        45
    v2lhr  
    OP
       2020-08-08 10:13:00 +08:00
    @devlnt 没有二维码的
    v2lhr
        46
    v2lhr  
    OP
       2020-08-08 10:13:35 +08:00
    @yeeyeung 是,识别前应该明确告知用户
    lshzhhi
        47
    lshzhhi  
       2020-08-08 10:53:08 +08:00 via iPhone   2
    @uasier 微信去年三月刚被人拖了库,爆了“聊天记录只在本地存储”的数十亿条聊天记录和大量大陆账户的身份证号和手机号信息

    祝您个人隐私平安,银行账户平安
    jon
        48
    jon  
       2020-08-08 10:53:13 +08:00
    又在对房间里的大象视而不见
    js9527
        49
    js9527  
       2020-08-08 11:12:51 +08:00 via iPhone
    说句不好听的,苹果都这样了,其他品牌手机更可想而知!
    xuanbg
        50
    xuanbg  
       2020-08-08 11:37:18 +08:00
    离线识别并不代表就安全!完全可以在线上传数据嘛。


    备忘录肯定是上传数据到 iCloud 的,所以……
    zhjie
        51
    zhjie  
       2020-08-08 12:16:43 +08:00
    这不就相当于你用手机拍了照,相册里面存了你的照片,
    然后震惊!我的手机竟然有我拍的照片!!!!
    mazyi
        52
    mazyi  
    PRO
       2020-08-08 16:15:08 +08:00 via iPhone
    细思极恐,用 google photo 拍照居然识别出了我的 jb 和别人的 jb,这么搞对私密器官来说也太危险了吧
    Yucher
        53
    Yucher  
       2020-08-08 16:39:53 +08:00 via iPhone
    @lifeforwater #6 杠精行为
    minamike
        54
    minamike  
       2020-08-08 18:01:03 +08:00 via iPhone
    这不是自带备忘录的特性吗...
    uasier
        55
    uasier  
       2020-08-08 19:19:45 +08:00
    uasier
        56
    uasier  
       2020-08-08 19:23:59 +08:00
    uasier
        57
    uasier  
       2020-08-08 19:35:40 +08:00
    @lshzhhi 我想表达的是社交软件天下一般黑,然后你说的事情我也查了一下,我认为你的说法十分的不严谨,“聊天记录只在本地存储”和数据传输的时候被截取(网吧环境),被记录,导致被保存,不是一件对立的事情。
    再附上一个有趣的仓库 https://github.com/ffffffff0x/Dork-Admin
    uasier
        58
    uasier  
       2020-08-08 19:37:38 +08:00
    当然这个有些偏题,因为这个主题说的是公司主题滥用隐私数据,而不是无法有效管理个人隐私数据
    dingwen07
        59
    dingwen07  
       2020-08-09 06:30:54 +08:00 via iPhone
    用过 Office Lens 吗?那个也会识别内容
    zhouweiluan
        60
    zhouweiluan  
       2020-08-10 10:54:55 +08:00
    众所周知
    Apple 注重本地计算,所以 Apple 设备的性能都做得非常高。
    Google 注重云端计算,所以 Android 设备的性能要求可以做得非常低。
    wakhh
        61
    wakhh  
       2020-08-12 16:17:15 +08:00
    @uasier chrome 浏览器本地保存的密码太不安全了,他还提示我 33 条密码已泄露,请尽快修改,我想打死他。chrome 存储到本地的历史记录 cookie 密码都是 sqlite 文件,都能被各种浏览器导入,工具导入读取。之前看 Tmp 缓存和文件读取记录,发现未知进程一直偷偷复制这些数据库文件,最早的时候是完全复制,导致 C 盘爆满,后来观测几天,就改成了增量复制,但怎么研究,都发现不出来是哪个恶心的 PC 软件。所以我现在已经不用 chromeb 保存密码了。
    wakhh
        62
    wakhh  
       2020-08-12 16:17:53 +08:00
    chrome 浏览器本地保存的密码太不安全了,他还提示我 33 条密码已泄露,请尽快修改,我想打死他。chrome 存储到本地的历史记录 cookie 密码都是 sqlite 文件,都能被各种浏览器导入,工具导入读取。之前看 Tmp 缓存和文件读取记录,发现未知进程一直偷偷复制这些数据库文件,最早的时候是完全复制,导致 C 盘爆满,后来观测几天,就改成了增量复制,但怎么研究,都发现不出来是哪个恶心的 PC 软件。所以我现在已经不用 chromeb 保存密码了。
    @v2lhr @ScotGu @lifeforwater @yov123456 @learningman @xz410236056 @lshzhhi @Leonard @waylybaye @no1xsyzy @yeeyeung @bruce00 @sidkang @lloovve @takemeaway @crs0910 @back0893 @hoyixi @yukiww233 @xingyuc @xinghen57 @ifxo @otakustay @falcon05 @oIMOo @BadReese @kera0a @est @rockeyshao @luhe @DAMNYOU @nomansky @Yangz @dddd1919 @yintao0303 @dingdangnao @reedthink @devlnt @s1th @uasier @jon @js9527 @xuanbg @zhjie @mazyi @Yucher @minamike @dingwen07 @zhouweiluan
    crs0910
        63
    crs0910  
       2020-08-12 17:43:22 +08:00   1
    xingyuc
        64
    xingyuc  
       2020-08-13 08:53:09 +08:00
    @wakhh 我前段时间也发现了,部分软件开发者真是没有下限,真特么想捅他;
    @crs0910 你这个太麻烦了,我也是才发现了读取这么简单,https://github.com/cckuailong/HackChrome
    wakhh
        65
    wakhh  
       2020-08-19 15:55:51 +08:00
    @xingyuc 我发现我泄露的密码都是局域网内的各种局域网 ip 网站,密码 123456,admin 那种。。。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3850 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 10:15 PVG 18:15 LAX 03:15 JFK 06:15
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86