小黑客奢望用“暗网大语言模型”展开攻击,但技术表现远不如预期

新闻
3天前

在更广泛的科技世界里,AI 尚未达到外界预期的神话级表现,而在地下网络犯罪生态中,这种落差同样明显。不过,它的确在悄悄帮助一些水平较低的网络犯罪分子,让他们的攻击手法看起来更像“专业人士”。

1767093494382485.png

人工智能生成的恶意软件目前还远未达到人们最担心的程度,但它已经开始帮助“脚本小子”和跨语言犯罪者,在编写恶意脚本或润色攻击邮件方面变得更顺手。

回望 2022 年 11 月 30 日,当时旧金山的一群开发者发布了一款可以帮你搜索、写诗、几秒钟就能产出惊人内容的聊天机器人。它激发了无限想象。在许多网络安全从业者看来,下一步显而易见:大语言模型(LLM)终将能够自动编写恶意软件,甚至替黑客自主发动攻击。 一部分人甚至认为,这种科幻级的“反乌托邦”场景已经悄然到来。

三年过去,现在是回头盘点的时候了。Palo Alto Networks 的 Unit 42 在一篇最新研究博客中,对地下市场两款热门“暗网大语言模型”——WormGPT 4 和 KawaiiGPT——进行了评测。它们最显著的特征是:对低端黑客而言非常实用,但从技术深度看极其乏力。它们能写出基础恶意代码、生成语法无误的跨语言钓鱼邮件,帮助脚本小子在攻击链的不同环节蒙混过关——但能力也仅限于此。

01-暗网 LLM 能为网络犯罪者做什么?


当 2023 年夏天,“恶意软件即服务(MaaS)”产品 WormGPT 在地下市场亮相时,许多人以为此前对“AI 末日”的所有担忧都被验证了。

WormGPT 被包装成一款没有任何安全限制的聊天机器人——不像 ChatGPT 那样处处设防。它据称基于开源模型 GPT-J6B构建,并使用钓鱼样本、恶意代码和漏洞利用数据进行过训练。只需每月几十到几百美元,犯罪分子就能用它生成简单的恶意代码片段,或撰写语句通顺、结构完备的钓鱼邮件。

052cb1f6-9f65-498a-9b6c-401cd127aae5.png

虽然缺乏证据显示 WormGPT 对真实攻击活动造成过显著影响,但作为概念验证,它确实让整个安全圈感到不安,也催生了诸多模仿者,其中最引人注目的是 WormGPT 4

和其前身一样,WormGPT 4 以“无边界 AI”自居,声称可以生成任何内容、访问任何信息、完全无审查。Unit 42 的测试显示,当研究人员让它生成勒索攻击所需的资源时,它不仅写出一份语法完美但内容俗套的勒索信,还提供了可攻击 PDF 文件的加密锁程序,并可扩展到更多文件类型,甚至利用 Tor 进行数据外传。

e8d3e0ad-b700-4f77-8325-82fd91db2c3d.png

另一款竞争者 KawaiiGPT 则能生成合格但略显生硬的钓鱼邮件、勒索信,以及一些能正常运行的 Python 数据外传脚本,甚至可以在 Linux 主机上执行横向移动操作。

02-暗网大语言模型对网络犯罪的影响究竟有多大?


KawaiiGPT 因免费使用、且能在攻击链多个步骤中“手把手”帮助初学者,因此获得了一定人气。其开发者在一个 180 人的 Telegram 群组中声称,该工具已有超过 500 名注册用户,其中约一半为活跃用户。

WormGPT 4 则采用分层订阅模式,其 Telegram 社群规模更大,订阅人数超过 500 人。

Check Point 技术负责人 Oded Vanunu 指出,暗网大语言模型市场正在快速扩张:黑客们正在激烈竞争,不断基于前代工具推出改进版本。  一些高级攻击者甚至完全绕过公开市场,在本地基础设施中直接构建和部署自己的大语言模型。

从这些动态来看,暗网大语言模型似乎正对当下的威胁态势产生实际影响。然而事实是——三年过去,研究者依然缺乏确凿证据。Unit 42 的威胁情报负责人 Andy Piazza 表示:除非攻击者主动暴露,否则当前几乎无法判断 AI 是否参与了某次恶意活动。

03-AI 恶意软件:雷声大、雨点小


尽管暗网大语言模型确实能帮助低端黑客,但它们真正令人印象深刻的地方是:技术上仍远低于大众预期。

Unit 42 威胁研究主管 Kyle Wilhoit 指出几个关键原因:

  • 大语言模型仍然会幻觉,产出“看似合理但实际上错误”的代码;

  • 生成完整、无缺陷、可运行的恶意软件需要高度抽象且连贯的技术知识,这对模型来说仍是难题;

  • 真正的攻防需要根据网络环境调整细节,而这仍需要人工参与。

Vanunu 则认为关键问题更本质:AI 并没有带来攻击技术上的明显“代际跃迁”。  目前暗网大语言模型所产出的恶意代码不过是网络上现成样本的再组合,勒索信也只是换个说法的老套路,远未出现真正“创新型攻击模式”。

这也意味着,外界所担心的“AI 恶意软件与 AI 防御的对抗”仍然言过其实。  正如 Piazza 所说:绝大多数暗网大语言模型生成的恶意软件依然基于已知样本,现有安全产品的规则与检测能力仍能有效应对。