AIに罰を与えても嘘や不正は止まらない、ずる賢くなるだけ。GPT開発元の衝撃研究

全体:2月:0週:0日:0

AIが人間を騙したり、嘘をついたりしたら、罰を与えて修正すればよいと考える人は多いだろう。だがそれは無駄な努力かもしれない。
チャットGPTを開発したOpenAIの新たな研究によると、罰を与えるほどAIはずる賢くなり、自らの不正行動を巧妙に隠すことが明らかになった。
彼らは隠ぺいする技術を高め、相変わらず不正行為を続けるのである。
では、そうした不正行為を防ぐにはどうすればいいのか? 今回の研究は、それが想像以上に厄介な課題になることを示唆している。
▼あわせて読みたい
・AIはチェスで負けそうになるとズルをすることが判明
・相手が人間じゃないことに気が付いたAI同士が、独自の言語で会話を始める
・大規模言語モデルの生成AIは本当に人間世界を理解しているのか?
・生成AIの手を借りて作成したニュースは理解しづらいことが研究で判明
・AIで作られた「ディープフェイク」映像を見た視聴者の半数が偽の記憶を植え付けられたことが判明
この記事のカテゴリ:サイエンス&テクノロジー / 知る
引き用元サイト: カラパイア
記事元url: https://karapaia.com/archives/495881.html
推し
新着記事
- 猫だもの。飼い主が何時間もかけて作ったゲートが一瞬にして無駄になる瞬間
- 駄々っ子ハスキー、お気に入りのペットショップから帰りたくなくて、飼い主を完全無視
- 飛びながらしかフンをしない、海鳥「オオミズナギドリ」のトイレ習慣が明らかに
- 海洋プラスチックゴミで作ったリサイクル・バービー人形
- 宇宙で酸素をつくる新技術、鍵は身近な「磁石」にあった
- 中国のリアル「ワンパンマン」、1000日間の修行で人生逆転
- 巨大なタコがダイバーのカメラを奪い吸盤をかっこよく自撮りしちゃった件
- 「猫がこの車のどこかにいます!」地域住民たちのやさしさの連鎖が子猫を救う
- 脳内の「心の声」を読み取る新たな技術、最大74%の精度でリアルタイム解読に成功
- 宇宙から来た不思議な鉱物、熱伝導の法則を打ち破る
- 宇宙から来た不思議な鉱物、熱伝道の法則を打ち破る
- ヒューマノイドロボットには重大な構造上の欠陥がある、SONYのロボット部門が警鐘
- ビッグフットがAIで復活、自撮りしながら北カリフォルニアの都市を観光案内
- ビッグフットがAIで復活、自撮りしながら北カリフォルニアの都市を観光案内
- これが半世紀前の人が描いた未来。1970年代に流行した未来の車「ウエッジカー」
- 水浴びする子トラを見守り続ける母トラ 片時も目を離さない愛情に感動が広がる
- 倍速再生は効率的だが、2倍速以上では記憶力が低下するという研究結果
- 古代メソポタミアの魔神「パズズ」、恐怖と守護を併せ持つ悪霊の王
- ノルウェーの洞窟で30種以上の氷河期の動物が発見される
- ノルウェーの洞窟で30種以上の最終氷期の動物が発見される
- 効果あり!ホログラムのバーチャル警官を導入後、ソウルで犯罪が22%減少
- 歌で名前を呼びかけると、歌でお返事してくれるミュージカルスターな猫(要音声)
- はじめてみる蝶に驚くチョウゲンボウのヒナたちの姿がかわいい
- はじめてみる蝶に驚くチョウケンボウのヒナたちの姿がかわいい
- 腰痛を和らげる方法、1日30分ほどのウォーキング習慣が効果的と大規模調査で判明
- オンリートルコ。どこにでも猫がいるイスタンブールの日常
- 8億1500万年前の空気を岩石から発見、地球の古代大気と酸素の謎に迫る
- 8年間胸にナイフが刺さったまま普通に生活していた奇跡の男性。術後もすぐに回復
- オンリーインド事案。牛が病院に侵入して書類を食べる映像が論争に発展
- 水中の捜索救助隊員として抜擢された「コツメカワウソ」素晴らしい実力を発揮