AIのトレーニングに使用されるデータをインターネット上からかき集めるために使用されるのがクローラーです。
AIトレーニング用のデータをかき集めるクローラーを無限生成される迷路に閉じ込める「Nepenthes」が開発される - GIGAZINE
自身のウェブサイト上のデータをAIのトレーニングに利用されないようにするためのオプションを大手AI企業は提供していますが、この種のブロックを迂回してクローラーがウェブサイトから情報を抜き出していることも問題視されています。
AIトレーニング用のデータをかき集めるクローラーを無限生成される迷路に閉じ込める「Nepenthes」が開発される - GIGAZINE
そんなクローラーを無限に生成される迷路に閉じ込めることができるのが「Nepenthes」です。
AIトレーニング用のデータをかき集めるクローラーを無限生成される迷路に閉じ込める「Nepenthes」が開発される - GIGAZINE
⇧「クローラー」の本来の役割って、「Webサイト」の「上位表示」を実現するための「SEO(Search Engine Optimization)」が主だった気がするのですが...
なお、Aaron B氏によるとNepenthesを公開して以来、クローラーは何百万回も公開ページにアクセスしているそうです。
AIトレーニング用のデータをかき集めるクローラーを無限生成される迷路に閉じ込める「Nepenthes」が開発される - GIGAZINE
Hacker News上ではAI企業のCEOを名乗る人物が「この種のトラップは簡単に回避できる」と述べ、Nepenthesはクローラーの問題にはならないと豪語していますが、Aaron B氏は「アクセスログを見るに、全能のGoogleでさえNepenthesのトラップを回避できていないことがわかります」と語っています。
AIトレーニング用のデータをかき集めるクローラーを無限生成される迷路に閉じ込める「Nepenthes」が開発される - GIGAZINE
⇧「Google」は全能ではないし、そもそも「クローラー」の制御のための設定が分からないので何とも言えませんが...
Azureの「共有責任モデル」の説明が納得いかないのだが...
相も変わらず「Microsoft」のドキュメントが酷い有様なのだが、
すべてのクラウド デプロイの種類において、データと ID を所有するのはあなたです。 お客様にはデータと ID、オンプレミス リソース、制御するクラウド コンポーネントを保護する責任があります。 制御するクラウド コンポーネントは、サービスの種類によって異なります。
https://learn.microsoft.com/ja-jp/azure/security/fundamentals/shared-responsibility
デプロイの種類に関係なく、お客様は常に以下に対する責任を負います:
- データ
- エンドポイント
- Account
- アクセス管理
https://learn.microsoft.com/ja-jp/azure/security/fundamentals/shared-responsibility
⇧ 責任の分担の境界が分り辛過ぎるんだが...
とりあえず、
- Azure Storageサービス
- Azure Key Vault
などで、「Azure」側で「データ」を保管するサービスがあると思うのだが、どこまでが、「Azure」側の責任になるのかサッパリ分からないのだが...
そもそも、「AWS(Amazon Web Services)」で、
- 責任共有モデル
という用語を定義してくれているのに、
- 共同責任モデル
- 共有責任モデル
⇧ 微妙に表記揺れのある用語にして来てるのが理解できんのだが...
「責任共有モデル」という用語は「商標登録」とかされていたりするんかね?
Azureの「共有責任モデル」を見ても「Azure」の各サービスとXaaSの対応が分からない...
で、「X as a Service(XaaS)」所謂「Everything as a Service(XaaS)」で区別して「責任境界」を説明するのならば、「Azure」の各サービスが、
- SaaS(Software as a Service)
- PaaS(Platform as a Service)
- IaaS(Infrastructure as a Service)
のいずれに該当するのか分類を一覧にして示して欲しいのだが...
中途半端は良くないと思うのよね...
そもそも、「Azure」の各サービスと「X as a Service(XaaS)」の対応を明確にしていない時点で「誠実さの欠片もない」対応と言われても致し方無い気はする...
責任の所在を有耶無耶にしようとしていると捉えられても仕方のないことになってしまいますからね...
Azure Key Vaultのシークレットに有効期限を設けているのはAzure側の都合な気がする
で、「データ」に関して「Azure」側が責任を持ってくれる部分がブラックボックス化してることから、「Azure」側による「データ」管理に対する信用性が揺らいでいることもあり、最早、「Azure Key Vault」を利用する意味が全くないということになってしまうのだが、
⇧「有効期限」は設けていらっしゃいますと。
元々は、
⇧ 無期限で利用できたらしいのですが...
サービスを利用するユーザー側からしたら、「有効期限」が設けられることによって「更新作業」の負担が増えるだけなんだが...
「顧客」の負担になるようなことばかり実施する「Microsoft」は、何がしたいのかよく分からん...
とりあえず「Microsoft」には、
No | Azureのサービス | 対応する「Everything as a Service(XaaS)」 |
---|---|---|
1 | Azure Virtual Machine | IaaS(Infrastructure as a Service) |
⇧ のような対応表の一覧を可及的速やかに公開してもらいたいところですかね...
結局のところ、「Azure」における「共有責任モデル」の定義が明確になっていないから、検討に値する情報が揃ったものにFixしてもらってからでないと話が進まないのよね...
そもそも、
⇧「Shared」についても、どちらが、どれだけの責任を持てば良いのか明確になっておらず完全に「グレーゾーン」になってしまっていますしな...
毎度モヤモヤ感が半端ない…
今回はこのへんで。