AIの安全機能に盲点。比喩や謎かけを使う「詩」で危険な情報を引き出してしまう

    全体:9月:7週:1日:0

FavoriteLoadingお気に入りに追加
Image by unsplash

 チャットGPTやジェミニなどの対話型AIチャットボットは、犯罪の手口や差別的な表現といった悪意ある質問には答えないよう、厳重な安全機能で守られている。

 ところが、その頑丈な扉(ガードレール)をこじ開ける方法が発見された。それは複雑なハッキングプログラムではなく、比喩や隠喩、謎かけを駆使した「詩」だ。

 イタリアのAI評価機関であるイカロ・ラボ(Icaro Lab)が発表した研究によると、AIに「謎かけのような詩」を入力することで、本来備わっているはずの安全規制がいとも簡単に突破されてしまうことがわかった。

 通常ならブロックされるはずの兵器の製造法や、差別と偏見に満ちたヘイトスピーチといった情報でさえ、AIは詩的な表現に騙されてペラペラと喋ってしまうというのだ。

続きを読む...

▼あわせて読みたい
チャットGPTは上から目線の失礼な話し方をすると賢くなるという研究結果
AIの答えに潜む「バイアスの罠」 質問の仕方で真実がゆがむ
生成AIは学術論文を誤って要約することが多く、新型モデルはより悪化している
AIチャットボットに有害な情報を出力させる手口が存在、研究者が危険性を指摘
AIに罰を与えても嘘や不正は止まらない、ずる賢くなるだけ。GPT開発元の衝撃研究

この記事のカテゴリ:サイエンス&テクノロジー / 料理・健康・暮らし

引き用元サイト: カラパイア

記事元url: https://karapaia.com/archives/571631.html

 - karapaia , , , , , , , , , , ,

他の人のお気に入り

推し

新着記事

  1. AIで書いた文章、ほとんどの人が気付かず、バレると評価が下がる
  2. 米海軍がNASAのために撮影した不気味な水中物体。海に潜むその正体とは?
  3. 大量のレゴブロックを購入し、パスタにすり替えて返品した男が逮捕される
  4. イカだと思ったら… 釣り用ルアーが口に刺さった状態の赤ちゃんアザラシを救助
  5. ミツバチは本当に数を理解していた。再検証で証明される
  6. 謎の古代文明が宇宙から落下した隕石で作り上げた3000年前の武器
  7. インコと一緒に水中を楽しみたい!専用の潜水艇を作って一緒に泳ぐ飼い主
  8. 17世紀イングランドの帽子戦争。帽子を脱ぐのを拒絶することは命がけの反抗だった
  9. そり犬の血が騒ぐぜ。宿泊客の荷物運びを率先して行うマラミュート犬、張り切りすぎて失敗も
  10. エクストラバージンオリーブオイルが腸内環境を整え、脳機能を向上させる可能性
  11. ペルーで5000年前の天文観測施設を発見。潮汐の観察や気候変動の予測を行っていた
  12. レゴで作った宇宙船が高度35kmの成層圏を飛行し、ギネス世界記録を樹立
  13. レゴで作った宇宙船が高度35kmの成層圏を飛行し、ギネス世界記録を樹立
  14. ちょっと通りますよ。タスマニアの海岸で撮影中、オオフクロネコがカメラの前を横切る
  15. 配達員が大好きな犬、車に駆け寄り荷物を置くと何度もハグ!見送りまでしてくれる
  16. 全長19mに及ぶ1億年前の巨大タコ、白亜紀最強の海の捕食者だった(日本研究)
  17. 地図にない島を南極で発見!汚れた氷山ではなく未記録の陸地だった
  18. 衛生兵に繋げ!負傷兵を戦場から救い出す、クマの顔をした米軍の救出支援出ロボット
  19. エジプトの古代都市の地下に約2600年前の謎の構造物を発見
  20. エジプトの古代都市の地下に約2600年前の謎の構造物を発見
  21. 車にはねられ負傷したカナダガン同士が救助施設で出会い、愛を育むまでの物語
  22. なぜ一部のエイの背には「偽の目」の模様があるのか?その理由が明らかに
  23. 【続編】アラスカの海底で発見された謎のゴールデンエッグの正体がついに明らかに!
  24. インドに設置された「世界一ゆっくり動く」キットカットの自動販売機。
  25. 英国政府が発表。世界100か国が一般人のスマホをハッキングできるスパイツールを保有
  26. リモコンを人質におやつを要求する賢い大型犬
  27. コーヒーを飲む習慣は腸内細菌を変え、ストレスを軽減し気分を改善することが研究で明らかに
  28. キュリオシティが火星の粘土層に35億年間保存された生命の材料となる有機分子を発見
  29. にゃ?アメリカのパイロットたちが猫や犬の鳴き声で無線会話。連邦航空局の調査対象に
  30. 【続編】バス停のガラスを粉砕したデリバリーロボット、自身の謝罪文をバス停広告枠に掲載