AIエージェントのARTEMISが脆弱性の発見に活用できそうではあるが...

We present the first comprehensive evaluation of AI agents against human cybersecurity professionals in a live enterprise environment. We evaluate ten cybersecurity professionals alongside six existing AI agents and ARTEMIS, our new agent scaffold, on a large university network consisting of $\sim$ 8,000 hosts across 12 subnets.

https://arxiv.org/html/2512.09882v1

ARTEMIS placed second overall, discovering 9 valid vulnerabilities with an 82% valid submission rate and outperforming 9 of 10 human participants. While existing scaffolds such as Codex and CyAgent underperformed relative to most human participants, ARTEMIS demonstrated technical sophistication and submission quality comparable to the strongest participants.

https://arxiv.org/html/2512.09882v1

We observe that AI agents offer advantages in systematic enumeration, parallel exploitation, and cost—certain ARTEMIS variants cost $18/hour versus $60/hour for professional penetration testers. We also identify key capability gaps: AI agents exhibit higher false-positive rates and struggle with GUI-based tasks.

https://arxiv.org/html/2512.09882v1

⇧ といった概要。

気になるのは、対象の「マシン」が8000台と数が多いのだが、肝心の「Webアプリケーション」の構成とかが謎なのよね...

というのも、

宮永好道（みやながよしみち、1930年 - 1999年 1月23日）は、元シャープ顧問、コラムニスト。兵庫県神戸市生まれ。

宮永好道 - Wikipedia

「パソコンは、ソフトが無ければただの箱」の名言を残した人物としても知られる。また、「Dr.パソコン」、秋葉原界隈の「パソコン仙人」の異名を持つ。

宮永好道 - Wikipedia

⇧ とありますように、「ハードウェア」には、何某かの「ソフトウェア」が存在しているのが一般的な気がしますと。

そういった意味では、やはり、

ライブラリやフレームワークのバージョンが混在している
変更容易性の低いソースコードになっている
冗長で複雑なSQL文が入り乱れている

といったような「Webアプリケーション」が動作しているような環境で検証しないと意味が無いような気はしてしまいますな...

何と言っても、「幻覚（ハルシネーション）」の問題や「回答」の「冪等性」が無い問題なども解決できていないこともあり、「有識者」による「ファクトチェック」は依然として必要な状況は続くことになりそうではありますと。

ただ、「犯罪者」や「犯罪組織」などによって「AI」が「悪用」されている昨今の状況においては、『目には目を、歯には歯を』という言葉のように、「AIにはAIを」駆使していかねばならない状況になっていそうではありますと。

ちなみに、「犯罪」に発展していなくても、

www.publickey1.jp

オープンソースで開発されている「curl」コマンド（以下cURL）のバグ報奨金プログラムに、AIを用いて作成されたいい加減なバグレポートが殺到した結果、開発者であるDaniel Stenberg氏が「もう限界に達した」「事実上、DDoSを受けているようなものだ」と訴えています。

AIによる無効なバグレポートが、Curlのバグ報奨金プログラムに殺到。「事実上、DDoS攻撃を受けているようなものだ」と開発者が訴え－ Publickey

⇧ 不利益を被るように強制する行為に加担している可能性もあり得るので、「AI」のご利用は計画的にということですかね...

で、

qiita.com

【AI slop】AI生成によるゴミをプルリクするのをやめろ #GitHub - Qiita

⇧ 上記サイト様によりますと、まぁ、そうなるよね、な展開になっておりました。

【AI slop】AI生成によるゴミをプルリクするのをやめろ #GitHub - Qiita

⇧ いや、「Microsoft」は本当にどうしようもない企業になって参りましたな...

確か、「GitHub」は「Microsoft」が買収してましたからな...

GitHub（ギットハブ）は、ソフトウェア開発のプラットフォームであり、ソースコードをホスティングする。コードのバージョン管理システムにはGitを使用する。Ruby on RailsおよびErlangで記述されており、アメリカのカリフォルニア州サンフランシスコ市に拠点を置くGitHub社によって保守されている。主な開発者はクリス・ワンストラス、P.J.ハイエット、トム・プレストン・ワーナー（英語版）である。

GitHub - Wikipedia

運営会社のGitHub, Inc.は2018年よりマイクロソフト傘下となっている。

GitHub - Wikipedia

概要

2018年6月4日にマイクロソフトがGitHub社を75億USドル（約8200億円）で買収すると発表。CEOのサティア・ナデラは買収後もGitHub社を独立企業として維持する意向を示し、ワンストラスはマイクロソフトのテクニカルフェローとなることも発表された。10月末に買収手続きは完了し、予定通りXamarin創業者のナット・フリードマンがCEOに就任、マイクロソフト傘下として新たなスタートを切った。