AIの安全機能に盲点。比喩や謎かけを使う「詩」で危険な情報を引き出してしまう
全体:1月:1週:1日:0

チャットGPTやジェミニなどの対話型AIチャットボットは、犯罪の手口や差別的な表現といった悪意ある質問には答えないよう、厳重な安全機能で守られている。
ところが、その頑丈な扉(ガードレール)をこじ開ける方法が発見された。それは複雑なハッキングプログラムではなく、比喩や隠喩、謎かけを駆使した「詩」だ。
イタリアのAI評価機関であるイカロ・ラボ(Icaro Lab)が発表した研究によると、AIに「謎かけのような詩」を入力することで、本来備わっているはずの安全規制がいとも簡単に突破されてしまうことがわかった。
通常ならブロックされるはずの兵器の製造法や、差別と偏見に満ちたヘイトスピーチといった情報でさえ、AIは詩的な表現に騙されてペラペラと喋ってしまうというのだ。
▼あわせて読みたい
・チャットGPTは上から目線の失礼な話し方をすると賢くなるという研究結果
・AIの答えに潜む「バイアスの罠」 質問の仕方で真実がゆがむ
・生成AIは学術論文を誤って要約することが多く、新型モデルはより悪化している
・AIチャットボットに有害な情報を出力させる手口が存在、研究者が危険性を指摘
・AIに罰を与えても嘘や不正は止まらない、ずる賢くなるだけ。GPT開発元の衝撃研究
この記事のカテゴリ:サイエンス&テクノロジー / 料理・健康・暮らし
引き用元サイト: カラパイア
記事元url: https://karapaia.com/archives/571631.html
推し
新着記事
- 飼い主の墓のそばに10年住み続けた犬がきっかけで、ブラジルで新州法が可決
- 2億1500万年前の新属新種のワニを発見。泳ぐより陸を走るための細長い体を持っていた
- Youtubeで最初に投稿された動画がイギリスの博物館で展示中
- ニューヨークの博物館で引き出しの下から190年前の隠し通路が発見される
- お手柄!ラマの群れが泥棒を取り囲んで逮捕に協力
- 人差し指が長い男性は脳が大きくなる?胎児期のエストロゲンが脳の進化を促した可能性
- 差し指が長い男性は脳が大きくなる?胎児期のエストロゲンが脳の進化を促した可能性
- 99%がダークマターの可能性がある、ほぼ見えない銀河を新たに発見
- 古代ローマ人がヒトの便を薬として使用していたことを示す、初の物質的証拠を発見
- Amazonの配達員がナビに従った結果、配送車を水没させてしまう(イギリス)
- 雪中トンネルを作ったのはなんとリス!餌場と餌場をつないでいた
- 対話型AIが妄想の共犯者に。ユーザーの誤った信念を増幅し、現実を侵食していく理由
- 対話型AIが妄想の共犯者に。ユーザーの誤った信念を増幅し、現実を侵食していく理由
- 古代ギリシャの魔法のエリクサーの正体が明らかに。猛毒を秘薬に変える化学式が判明
- ミケランジェロが描いた「右足」の小さなデッサンがなんと42億円で落札
- ダイバーと仲良くなったイルカ、海のゴミ拾いに協力する(ギリシャ)
- 巨大みがすぎてAI疑惑すら浮上した犬、バーニードゥードルは予想外の成長だった
- ホモ・サピエンスの世界最古となる6万7800年前の洞窟壁画がインドネシアで発見
- ルーマニアの5000年前の氷窟から目覚めさせた未知の細菌。現代の抗生物質に耐性があった
- 「いきとーよ!」海外で人気の生存確認アプリが日本でも登場
- やさしい世界。小学校の先生が子供たちのデザイン通りの帽子を作ってプレゼント
- 横断歩道を渡らなかったニワトリが現行犯逮捕されるも、終始不機嫌で反省の色はなし
- AI生成画像を見抜くのが得意な人がいる。その理由はもって生まれた物体認識能力にあった
- いきなりブラックホール!アンドロメダ銀河の星が超新星爆発せずに変化するのを観測
- アメリカの12歳少年が核融合炉に成功。ギネス記録更新に挑む
- アメリカの12歳少年が核融合に成功。ギネス記録更新に挑む
- フロリダの寒波で凍りついたヤモリを保護。奇跡の復活劇はこのあとすぐ!
- ヒョウとクロヒョウが仲良く並んで水を飲む姿をインドでの保護区で激写
- ジュラ紀の始祖鳥は現代の鳥と同じ口の構造を持ち、飛行のエネルギーを確保していた
- 2023年、地球に衝突した強力な粒子の発生源は「原始ブラックホール」の大爆発だった可能性