AIの安全機能に盲点。比喩や謎かけを使う「詩」で危険な情報を引き出してしまう

    全体:11月:0週:0日:0

FavoriteLoadingお気に入りに追加
Image by unsplash

 チャットGPTやジェミニなどの対話型AIチャットボットは、犯罪の手口や差別的な表現といった悪意ある質問には答えないよう、厳重な安全機能で守られている。

 ところが、その頑丈な扉(ガードレール)をこじ開ける方法が発見された。それは複雑なハッキングプログラムではなく、比喩や隠喩、謎かけを駆使した「詩」だ。

 イタリアのAI評価機関であるイカロ・ラボ(Icaro Lab)が発表した研究によると、AIに「謎かけのような詩」を入力することで、本来備わっているはずの安全規制がいとも簡単に突破されてしまうことがわかった。

 通常ならブロックされるはずの兵器の製造法や、差別と偏見に満ちたヘイトスピーチといった情報でさえ、AIは詩的な表現に騙されてペラペラと喋ってしまうというのだ。

続きを読む...

▼あわせて読みたい
チャットGPTは上から目線の失礼な話し方をすると賢くなるという研究結果
AIの答えに潜む「バイアスの罠」 質問の仕方で真実がゆがむ
生成AIは学術論文を誤って要約することが多く、新型モデルはより悪化している
AIチャットボットに有害な情報を出力させる手口が存在、研究者が危険性を指摘
AIに罰を与えても嘘や不正は止まらない、ずる賢くなるだけ。GPT開発元の衝撃研究

この記事のカテゴリ:サイエンス&テクノロジー / 料理・健康・暮らし

引き用元サイト: カラパイア

記事元url: https://karapaia.com/archives/571631.html

 - karapaia , , , , , , , , , , ,

他の人のお気に入り

推し

新着記事

  1. カラスの救助に協力したら、お礼の品々が次々と届き、犬の散歩にも一緒についてくるように
  2. 数十年姿を見せなかった30頭ものシャチがイギリス沖に結集し、人々が歓喜に沸く
  3. 一部の人にしか聞こえない謎の音「ザ・ハム」の正体は頭の中にあるかもしれない
  4. 2030年、AIが使う水は人類が1年に飲む量の1.6倍になると国連研究機関が予測
  5. 2026年のワールドカップではロボット犬が警備を担当
  6. 専属のメイクさんは猫!肉球でポンポンとキャットアイメイクのお手伝い
  7. デボン紀のイギリスに、体長1mの巨大サソリが存在した(4億1500万年前)
  8. 太陽系外惑星に磁場が存在する最も強い証拠が発見される
  9. 絹の糸から防弾チョッキ。しなやかな素材が驚きの強度を実現
  10. イギリスでエアコン室外機の写真をSNSに投稿した男性がヒーローに。その理由とは?
  11. 子宝に恵まれなかったカナダガンのつがい、孤児のヒナに出会い最高の親鳥になる
  12. オオグソクムシが何年も絶食できる理由が判明。巨大な胃と代謝を抑える体の仕組みにあった
  13. 連絡が途絶えたまま半年。NASAが火星周回探査機MAVENの任務終了を発表
  14. 夜にしか現れない、アフリカ伝説の「幽霊ソウ」の正体がフンのDNA解析で明らかに
  15. 臭かったから…レンジで魚を温めたことを理由に警察官が同僚に銃を向け逮捕(アメリカ)
  16. ペットのタコを水槽に入れスケボーで散歩。愛猫も一緒にね
  17. 肉食哺乳類「ヒアエノドン」の新種の1400万年前の化石をパキスタンで発見
  18. 44億年前の世界最古の結晶が、地球の生命誕生の手がかりを握っていた
  19. インド人観光客が日本で万引き。警察にお金を渡して解決しようとして議論を巻き起こす
  20. Amazonの定期おトク便が「お得」じゃない!アメリカで集団訴訟に発展する可能性
  21. 心やさしきゴールデン・レトリバー、カモのヒナたちを背に乗せ無料の水上タクシー役に
  22. 地球最強生物「クマムシ」が高温に耐えられるメカニズムを解明
  23. はやぶさ2が目指す小惑星、旧ソ連の探査機である可能性
  24. はやぶさ2が目指す小惑星、旧ソ連の探査機である可能性
  25. 手の平の厚さなんと8cm!「鉄砂掌」で鍛えた中国武術家の手の威力
  26. 下水道でいったい何を?マンホールから謎の男たちが出現しニューヨーク当局困惑
  27. 横断歩道の上で停車してはいけない理由。飼い主を渡らせなかった盲導犬
  28. ハトは肝臓を使って地球の磁場を感知していた
  29. 米軍戦闘機が上空でUFO(UAP)を撃墜する新たな映像が2度目の機密解除で公開
  30. 世界1700万台のデバイスを乗っ取った犯罪ネットワークをオランダ政府が突き止める
×