
诺基亚尔实验室和美国纽约大学、美国兰卡斯特大学管理学院合著的论文《 To Block or Not to Block: Accelerating Mobile Web Pages On-The-Fly Through Javascript Classification 》设计了一个服务 - SlimWeb 通过识别并删除网页的关键 JS 以优化性能。
ML 驱动的 JS 分类器,以 90% 的准确率对 JS 元素进行分类;页面加载时间减少了 50%,与最先进的解决方案( JSCleaner )相比减少了 30% 以上;用户体验提高 60%以上,同时保持与原始页面 90%以上的相似度;SlimWeb 包含三大部分:
ML Classifier:机器学习创建的 JS 分类器。服务爬取流的,识别这些中使的 JS 元素,然后使分类器标记这些元素并将它们的类别存储在数据库中SlimWeb Service:JS 标签服务。它会定期更新标签并与终端的浏览器插件同步。SlimWeb plugin: 浏览器插件,负责拦截关键的 JS 元素。这些元素是根据从服务收到的标签。当请求时,插件先检查每个 JS 元素是否在本地可的标签,以便即阻关键元素。在没有标签的情况下,插件认为相应的 JS 元素是关键的,并从 Web 请求它。 1 sanebow 2023-02-05 10:05:40 +08:00 via iPhone 主意不错,训练标签怎么打的 |
2 hanbing135 2023-02-05 13:41:38 +08:00 感觉思路很牛啊 |
3 Contextualist 2023-02-05 20:09:49 +08:00 @sanebow 本着对他们 ML 模型的好奇扫了一眼原文:模型的输入是应该是各个 <script src="..."> 元素里 src ,输出对应的功能类别(如广告、统计、社交)。训练数据集用的是 https://github.com/patrickhulce/third-party-web 整理的来自 https://httparchive.org/ 的标签 |