yoshi’s blog

海外で話題のニュース/論文/技術情報を翻訳

【10秒解説】ジェネレーティブAIとは(Generative AI)

目次

ジェネレーティブAIGenerative AI)10秒解説

  • Gartner社が2022年の戦略的テクノロジのトップ・トレンドとして紹介。
    2025年までに生成される全データの10%はGenerative AI由来になると予測。
  • マシンラーニングの一種で、既存データの内容を学習し、全く新しいものを生み出すことができる。
    例えば、全く新しいソフトウェアコード開発、製薬開発をすることができる。
  • 一方、詐欺、政治的な偽情報の拡散、なりすまし等に悪用される可能性もある。

利用例

  • 顔画像の生成(例:実在する有名人から生成した顔画像)

    f:id:yoshi_umi:20220306221903p:plain

  • 画像の自動色付け

    f:id:yoshi_umi:20220306221730p:plain

  • テキスト情報から画像に変換(例:「小さなピンクの花びらと大きな中央のオレンジと黒い雄しべの塊を持つ花」という情報から画像を生成)

    f:id:yoshi_umi:20220306222302p:plain

技術的な話し

Generative AIには主に下記の3つの技術が使われている。

  1. Generative adversarial networks (GANs)
    ・"Generator"と"Discriminator"の2つの相対する機能が互いにぶつかりあいながら、Generativeなモデルを作り出す。
     - Generatorが既存データから新規または既存データに似たフェイクデータを作り出す。
     - Discriminatorがどのデータが本物で偽物かを見分ける。
    ・上記のフローを繰り返しながらGeneratorはより本物に近いデータを生成できるようになり、Discriminatorはより本物を見分ける精度が上がっていく。このフローはDiscriminatorが本物と偽物が区別できなくなるまで続けられる。

    f:id:yoshi_umi:20220304223440p:plain

  2. Transformers
    ・代表的なものにGPT-3LaMDAWu-Daoがある。
    Wikipediaなどの大量データをインプットとし学習を行い、人間らしい文章の生成を行う。
    言語モデルが代表的だが、同様の仕組みでWebsiteのデザイン、DevOps、コーディングなどの分野にも応用できる。
  3. Variational Auto Encoders (VAE)
    情報を圧縮し、圧縮した情報から元の情報に戻す仕組みを持つAuto Encoderの一種。Auto Encoderはただ単にデータの圧縮と再構築をするだけだが、、VAEは確率モデルの理論を導入しており、未知のデータを確率的に作成できる。

課題

  • 能力の過大評価:Generative AIは訓練用に大量のデータを必要としており、無から何かを生み出しているわけではない。所詮、既存データから差分を見つけているという前提は念頭に置かないといけない。
  • 予期しない結果の出力をすることがある。
  • データプライバシー、セキュリティ:大量データを前提とするため、今まで以上のデータ管理の重要性が求められる。

所感

  • 今後、間違いなくGenerative AIの活用は広がっていくだろう。防犯、自動運転、芸術、画像情報復元など活用範囲は無限大。
  • 利点も多いが、偽情報の拡散が増加する危険性は高い。
    個人的には今後Generative AIで生成した情報かどうかを見極める技術の需要があがっていくと予想。Generative AIかどうかを検知するためのGenerative AI的なものが出てくるでしょう。

参考

www.gartner.com

research.aimultiple.com

research.aimultiple.com

research.aimultiple.com

VAE関連

Variational AutoEncoder( VAE ) - アルゴリズム解説

猫でも分かるVariational AutoEncoder

Variational Autoencoder徹底解説 - Qiita