都在讨论 app 监听,那智能家居的监听是不是存在 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
CarrySHI
V2EX    信息安全

都在讨论 app 监听,那智能家居的监听是不是存在

  •  
  •   CarrySHI 2021-01-21 17:01:39 +08:00 4562 次点击
    这是一个创建于 1800 天前的主题,其中的信息可能已经有所发展或是发生改变。
    家里的天猫精灵,小艾同学包括电视的语音助手之类的,这些会不会实时监听你的对话呢
    32 条回复    2021-01-22 13:17:35 +08:00
    wgbx
        1
    wgbx  
       2021-01-21 17:18:37 +08:00
    理论上可以,实际上没必要
    Jooooooooo
        2
    Jooooooooo  
       2021-01-21 17:36:44 +08:00   1
    如果说监听是为了卖广告赚钱

    那干监听这件事就收不回成本

    用户画像不必搞得这么重
    cherryas
        3
    cherryas  
       2021-01-21 19:07:04 +08:00   2
    外国不是爆过亚马逊音箱监听用户说话吗?国内可能更注重保护隐私吧。
    mengdodo
        4
    mengdodo  
       2021-01-21 19:10:03 +08:00
    @cherryas 我觉得不是国内更注重,而是还没成气候
    0x000007b
        5
    0x000007b  
       2021-01-21 19:17:29 +08:00
    @Jooooooooo 直接在软件内放训练好的 AI 模型,不用云端去计算,直接监听完了提取关键词发回去.
    Osk
        6
    Osk  
       2021-01-21 19:20:01 +08:00 via Android
    @Jooooooooo 专用芯片 /加速单元理论上可以做离线解析或关键词唤醒,才不会宝贵的服务器资源分析语音内容呢
    hoyixi
        7
    hoyixi  
       2021-01-21 19:20:08 +08:00
    @Jooooooooo #2
    做实验还得养小白鼠呢,监听的话,都是现成的
    XuanFei990
        8
    XuanFei990  
       2021-01-21 19:51:12 +08:00   3
    其他的不清楚,前年我们做的一个 AI 语音芯片,实现类似的唤醒功能,以及几十条命令词,本地识别方案,大体功能就是模拟前端有一个 VAD ADC,超低功耗模式一直工作中,检测到人说话,立即开启录音模式,录制几秒语音,然后硬件 AI 核心对语音处理,分析是否是唤醒词,如果是,设备整体唤醒,可以连续录制十几秒或者几十秒,看 ram 大小,以及你想录多长。。可以将原始录音数据,上传到 CPU,供用户自己进一步分析,也可以丢弃数据。唤醒词以及命令词模型也可以动态的升级固件的方式更新。

    基本上用在手表,平板,耳机,小音箱,电梯呼叫系统等需要离线以及在线语音控制的场合。小爱同学这类音响,离线识别唤醒词,命令词基本上也是一样的做法,没有 asic 的时候,据说是 DSP 的方式,纯软件算法。。语义分析对话这种应该都是录音回传服务器,再传回来的做法。本地的话成本过于高了。
    Overfill3641
        9
    Overfill3641  
       2021-01-21 19:56:50 +08:00
    手机还要担心耗电过高引起怀疑,智能家居一般插电的话 嘿嘿
    XuanFei990
        10
    XuanFei990  
       2021-01-21 19:59:13 +08:00
    @Osk 现在不用理论上,现在基本上都是硬件 ASIC 芯片的解决方案,而且还低功耗,而且芯片还可以做的非常小,塞进手机里边,可以支持很多唤醒词,唤醒之后还可以支持很多命令词,都是本地识别。也可以保存一段录音数据,你想怎么用,看你。
        11
    oIMOo  
       2021-01-21 20:00:42 +08:00   3
    有个老梗:
    你在家给朋友讲了个笑话,朋友笑了、苹果笑了、谷歌笑了、亚马逊笑了、阿里笑了、腾讯笑了、小米也笑了。
    oIMOo
    sasalemma
        12
    sasalemma  
       2021-01-21 20:04:09 +08:00   1
    @Jooooooooo 卖广告不能发家致富,免费的 ai 训练样本才是最值钱的。
    Jooooooooo
        13
    Jooooooooo  
       2021-01-21 20:11:50 +08:00
    @0x000007b
    @Osk
    @hoyixi
    @sasalemma


    说的确实好像是那么一回事, 但几位开有发过相关的监控业务吗?

    reddit 上有过亚马逊 echo 的员工专门说过, 没唤醒的情况下不会收集用户的声音.
    stark123
        14
    stark123  
       2021-01-21 20:30:11 +08:00
    @XuanFei990 Siri 小爱 小艺,我都用过,和人工智障没什么区别,这还是我把手机放在嘴边、认真说话的前提下。非杠,你公司做的能比这三家强?
    terence4444
        15
    terence4444  
       2021-01-21 20:34:46 +08:00 via iPhone
    智能家居是最好的监听设备,一直通电还一直联网。
    Osk
        16
    Osk  
       2021-01-21 20:41:45 +08:00 via Android
    @Jooooooooo
    1, 他敢说 echo 即使没唤醒也会收集声音吗?
    2, 国外公司总的来说对隐私这块透明度要好一点点。而与之对比的某些大厂的节操是个问题。


    我只是用户,我拒绝使用这些语音助手的原因:有一次去听语音助手上传的语音,真的是一言难尽,一些误触发的片段听起来很尬,也很怕。
    xianxiaobo
        17
    xianxiaobo  
       2021-01-21 20:43:03 +08:00
    当然,不然怎么触发
    Jooooooooo
        18
    Jooooooooo  
       2021-01-21 20:45:32 +08:00
    @Osk 他就是 echo 开发者怎么不敢说. 没唤醒只会本地监听唤醒的命令.
    Osk
        19
    Osk  
       2021-01-21 20:48:52 +08:00 via Android
    @Jooooooooo 假设这种情况:万一代码里真的在干无节操的事,他给抖出来了,我们猜猜他会不会被律师团队给搞残?
    Jooooooooo
        20
    Jooooooooo  
       2021-01-21 20:54:15 +08:00   1
    @Osk 这么说吧, 这么多家做类似产品的团队, 全世界都没听过任何一家有类似的行为. 也没听说过有哪家公司是有相关团队在做类似的事情, 无论是手机里的 app, 还是智能音箱.

    如果有的话, 总是会有相关消息泄露的. (比如按照用户输入法行为去投放广告, 虽然搜狗不明说, 但很多人都知道
    chonger
        21
    chonger  
       2021-01-21 21:06:10 +08:00
    这种事,有能力做的地方不敢做,敢做的地方没这能力,不过以后难说,总有开先河的。
    XD2333
        22
    XD2333  
       2021-01-21 21:17:25 +08:00   1
    这还用说,当然在录了呀,还会上传云端做数据分析。
    taobibi
        23
    taobibi  
       2021-01-21 21:22:24 +08:00   2
    我老觉得讨论大数据 隐私的 核心 是这些大数据是否和你的身份绑定。就像一开始训练人脸识别一样。也是大量的无名氏照片喂给 ai,这时候并不是问题。问题真正的发生是大量的身份证和照片一起喂给了 ai
    billlee
        24
    billlee  
       2021-01-21 21:44:20 +08:00
    @Osk #6 不需要理论上了,Pixel 4 的语音处理 ASIC 可以本地实时把手机播放的声音转成字幕、在息屏状态下持续监听环境中播放的音乐并与本地数据库匹配歌名。
    XuanFei990
        25
    XuanFei990  
       2021-01-21 21:48:35 +08:00
    @stark123 只能说你什么都不懂,我的是本地识别,你说的那个是需要联网做的。能一样么。
    cmdOptionKana
        26
    cmdOptionKana  
       2021-01-21 21:51:09 +08:00
    不可能。因为:

    1. 如果全程录音,只要一有人说话就录音,上传到服务器分析。现在国内大厂的 app 至少几个亿的真实用户,每天上传多少流量?服务器需要分析多少 TB 的数据?

    据那些信监听的人的反映,都是短时间内就出结果马上推广告,最慢的也是第二天就推广告,这么大的数据量这么快的分析速度,可能吗?

    2. 假设在本地分析,手机跑 AI 还不发热可能吗?

    3. 假设只设少量关键词来触发。据那些信监听的人的反映,都说很冷门的关键词,这不是很矛盾吗?事先设关键词,而且还设冷门关键词,动用到 24 小时监听几亿用户这么大规模的事情,就为了做那几个冷门的广告?

    4. 如果监听去做流行产品的广告呢?这也很矛盾,因为流行的广告就无法证明有监听。
    wanguorui123
        27
    wanguorui123  
       2021-01-21 21:52:37 +08:00
    理论上可以,但是只需要向服务端发送数据清洗后的数据就可以了,没必要发送原始数据。

    大概思路:本地识别->转化为文本->关键名词提取->上报关键字
    laydown
        28
    laydown  
       2021-01-21 21:58:46 +08:00
    这些设备是最自然地监听并录音设备啊!
    XuanFei990
        29
    XuanFei990  
       2021-01-21 22:00:27 +08:00
    @stark123 目前的本地识别芯片都只做唤醒词和命令词,你说的那种自然对话的,目前根本没有本地离线识别的芯片方案。说的都不是一回事。

    手表,小音箱,智能耳机,智能 mic 这类产品大部分时间靠电池供电的,不可能用通用芯片,一直监听说话,分析关键字,功耗压不住,现在都是本地识别芯片,低功耗,uW 级别,VAD 监测,然后唤醒主芯片,匹配唤醒词,然后录音再上传服务器,靠云端解决更复杂的分析,如果有需求的话。

    另外我们也给某米某为授权过语音类功能的芯片 IP 。
    stark123
        30
    stark123  
       2021-01-21 22:38:49 +08:00
    @XuanFei990 现在说的就是手机 /手机里的 app 监听并上传的事情。
    CarrySHI
        31
    CarrySHI  
    OP
       2021-01-22 09:41:12 +08:00
    @stark123 讨论的是设备,不是手机 app 上传的事,智能设备是需要插电并且 24H 联网使用的,不同于手机 app 靠电池那种情况
    haf007
        32
    haf007  
       2021-01-22 13:17:35 +08:00
    智能音箱可以本地分析,上传关键词,
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     981 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 23:26 PVG 07:26 LAX 15:26 JFK 18:26
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86