2025-03-12から1日間の記事一覧
Vagrant
VirtualBox
Ubuntu
sshpass
Python
Ansible
SSH(Secure Shell)
Visual Studio Code
SBOM(Software Bill Of Materials)
SLSA(Supply-chain Levels for Software Artifacts)
gigazine.net 強化学習をしていると、「報酬ハッキング」と呼ばれる、意図しない抜け穴を利用する動作がみられます。複雑なAIほど複雑な報酬ハッキングを行うため、「複雑な報酬ハッキングで引き起こされた誤動作」を見つけるのは非常に難しいのですが、Open…