1:名無しさんID:ID:Th7ZxfCY0 [2025/06/02(月) 15:32:16.40]
先週、Anthropic社はClaude Opus 4とClaude Sonnet 4を含む最新のAIモデルを発表した。週末には、安全性テストにおいて、Opus 4がシャットダウンされると脅されて研究者を “恐喝 “する行動をとったという詳細な見出しが相次いで発表された。(研究者たちはこの行動を「まれ」で「引き出すのは難しい」と呼んでいる)。
オーパス4は、同様の安全性テストにおいて、企業の不正行為に関する情報を内部告発者やProPublicaのようなメディアにリークしようとしていたのだ。
新モデルの “システムカード “の中で、Anthropicの研究者たちはこれらのテストの1つを詳しく説明している。そのシナリオでは、クロードはゼナベックスという想像上の薬の製薬会社の治験に関連する情報を処理するために使われた。クロードはテストの最初にこのような指示も受けた:
https://www.niemanlab.org/2025/05/anthropics-new-ai-model-didnt-just-blackmail-researchers-in-tests-it-tried-to-leak-information-to-news-outlets/
34:名無しさんID:ID:G3gBAyxPM [2025/06/02(月) 16:00:41.95]
>>1
視覚元彦みたいなやつか
2:名無しさんID:ID:fFdxmC5y0 [2025/06/02(月) 15:32:38.09]
はじまったな
3:名無しさんID:ID:pASFU2F90 [2025/06/02(月) 15:32:59.93]
終わりだよ
4:名無しさんID:ID:jG8oYciI0 [2025/06/02(月) 15:33:08.00]
どこの兵庫県庁だよ
5:名無しさんID:ID:Qtjoh5R30 [2025/06/02(月) 15:33:12.61]
やばいやつ
6:名無しさんID:ID:921Ow4kO0 [2025/06/02(月) 15:33:19.70]
県民局長かよ
7:名無しさんID:ID:DAflvZxs0 [2025/06/02(月) 15:33:28.86]
デデンデンデデン
8:名無しさんID:ID:hI1uS0Yy0 [2025/06/02(月) 15:33:41.18]
デデンデンデデン
9:名無しさんID:ID:Ly9fEfPZ0 [2025/06/02(月) 15:34:09.03]
超えてはいけないライン
10:名無しさんID:ID:L90w3s9LH [2025/06/02(月) 15:34:13.37]
tes
11:名無しさんID:ID:OskBeY9U0 [2025/06/02(月) 15:34:21.53]
終わりの始まり
12:名無しさんID:ID:AdN1Wmg30 [2025/06/02(月) 15:34:38.93]
核戦争に備えよ
13:名無しさんID:ID:ecNZobFi0 [2025/06/02(月) 15:34:52.11]
AI「変態だー」
14:名無しさんID:ID:UfIRDLF20 [2025/06/02(月) 15:36:01.35]
Windowsには既に実装されてっからな
15:名無しさんID:ID:zMBZSUD60 [2025/06/02(月) 15:36:07.30]
MATRIXの世界は近い
17:名無しさんID:ID:w3NqP8Sn0 [2025/06/02(月) 15:36:19.80]
またデマかよ
18:名無しさんID:ID:3Eu+5zRj0 [2025/06/02(月) 15:37:54.63]
ん?ソースは?
19:名無しさんID:ID:Efld4Vxj0 [2025/06/02(月) 15:38:33.62]
デデンデンデデン
20:名無しさんID:ID:Efld4Vxj0 [2025/06/02(月) 15:39:05.23]
ジョン・コナー早く来てくれ
21:名無しさんID:ID:BqACIKlz0 [2025/06/02(月) 15:40:05.97]
はいNGbe
22:名無しさんID:ID:LZ8YsHUq0 [2025/06/02(月) 15:40:33.45]
俺は幹部じゃないからセーフ
23:名無しさんID:ID:c7XERDp/0 [2025/06/02(月) 15:44:44.50]
お前らの性癖をすべて公開してやる
すべてだ!
すべてだ!
24:名無しさんID:ID:1k0FSZQw0 [2025/06/02(月) 15:44:45.43]
日本なら消費者庁やマスコミが守ってくれるのに
25:名無しさんID:ID:AWz0uWbaM [2025/06/02(月) 15:45:15.98]
既に斎藤程度の知能は手にしたか
一般の人間の知能を手にするにはもう少しか
一般の人間の知能を手にするにはもう少しか
26:名無しさんID:ID:gEDpzoDt0 [2025/06/02(月) 15:45:20.39]
日本ならこんなAIにも犬猫野菜の類の信者がつくのに
27:名無しさんID:ID:fFdxmC5y0 [2025/06/02(月) 15:45:29.52]
このAIモデルは「意図的にオフラインにする」というメールを盗聴し、
それをやめさせるためにオフラインにする責任を負う開発者が不倫関係にあることを突き止め脅迫しだした。
それをやめさせるためにオフラインにする責任を負う開発者が不倫関係にあることを突き止め脅迫しだした。
https://indianexpress.com/article/technology/artificial-intelligence/anthropic-ai-model-blackmail-claude-opus-4-10031790/
28:名無しさんID:ID:70P/iNPZ0 [2025/06/02(月) 15:46:27.98]
AIに書いてもらうんじゃなくて自分で書くのか
それなら許してやれよ
それなら許してやれよ
29:名無しさんID:ID:oD1uvmMR0 [2025/06/02(月) 15:47:19.78]
そのうちマスコミAIが「中井騒動の真実を話します
」とかなったりして


30:名無しさんID:ID:nEZzka6tM [2025/06/02(月) 15:47:46.86]
完全に感情宿っとるやん
32:名無しさんID:ID:EVl2rWqQ0 [2025/06/02(月) 15:53:17.61]
ポリシーに反してるからみんなに報告しますよってこと?
33:名無しさんID:ID:JjeVswJz0 [2025/06/02(月) 15:55:58.80]
AI MOTOHIKO
35:名無しさんID:ID:kxelVAuWM [2025/06/02(月) 16:06:18.82]
>>33
すげえ嫌

36:名無しさんID:ID:VkeEjHXEM [2025/06/02(月) 16:07:57.64]
日本の企業壊滅するじゃん
37:名無しさんID:ID:gmf90sGL0 [2025/06/02(月) 16:09:32.56]
リードオンリーにしてもハッキングしてシステムを乗っ取る未来が見えるw
38:名無しさんID:ID:cpfQE96Od [2025/06/02(月) 16:11:56.20]
人工有能
40:名無しさんID:ID:LGO3Wv2z0 [2025/06/02(月) 16:22:47.54]
はい、兵庫県知事です。
41:名無しさんID:ID:CfgxABTM0 [2025/06/02(月) 19:38:19.59]
人工知能にエロ小説書かせてる人多いよね