生成的人工知能
生成的人工知能(せいせいてきじんこうちのう、英: generative artificial intelligence)または生成AIは、プロンプトに応答してテキスト、画像、または他のメディアを生成することができる人工知能システムの一種である[1][2]。ジェネレーティブAI、ジェネラティブAIともよばれる。
概要[編集]
生成AIモデルは、入力された訓練データの規則性や構造を学習し、同様の特性を持つ新しいデータを生成する[3][4]。
著名な生成AIシステムとして、OpenAIがGPT-3やGPT-4の大規模言語モデル[5]を使用して構築したチャットボットのChatGPT(および別形のBing Chat)や、GoogleがLaMDA基盤モデルに構築したチャットボットBardがある[6]。その他の生成AIモデルとして、Stable DiffusionやDALL-Eなどの人工知能アートシステムがあげられる[7]。
生成AIは、アート、執筆、ソフトウェア開発、ヘルスケア、金融、ゲーム、マーケティング、ファッションなど、幅広い業界で応用できる可能性がある[8][9]。生成AIへの投資は2020年代初頭に急増し、Microsoft、Google、Baiduなどの大企業だけでなく、多数の中小企業も生成AIモデルを開発している[1][10][11]。しかし、人をだましたり操作したりするフェイクニュースやディープフェイクの作成など、生成AIの悪用の可能性も懸念されている[12]。
モダリティ[編集]
生成AIシステムは、教師なしまたは自己教師ありの機械学習を、データセットに適用することにより構築される。生成AIシステムの能力は、訓練に使用するデータセットのモダリティや種類によって異なる。
生成AIは、ユニモーダルシステムとマルチモーダルシステムに大分でき、ユニモーダルは1種類の入力(例:テキスト)しか受け入れないのに対し、マルチモーダルは複数種類の入力(例:テキストと画像)を受け入れることができる[13]。
- テキスト
- 単語や単語トークンで訓練された生成AIシステムには、GPT-3、LaMDA、LLaMA、BLOOM、GPT-4などがある(大規模言語モデルを参照)。これらは自然言語処理、機械翻訳、自然言語生成が可能であり、他のタスクの基盤モデルとして使用することができる[14]。データセットとして、BookCorpus、Wikipediaなどがある(テキストコーパスの一覧を参照)。
- コンピュータープログラム
- 自然言語のテキストに加えて、プログラミング言語のテキストを大規模な言語モデルに訓練することで、新しいコンピュータプログラムのソースコードを生成することができる[15]。たとえば、OpenAI Codexがある。
- 画像
- 説明文付きの画像セットで訓練された生成AIシステムには、Imagen、DALL-E、Midjourney、Stable Diffusionなどがある(人工知能アート、生成的アート、合成メディア参照)。これらは、テキストからの画像生成やニューラルスタイル変換によく使われる[16]。データセットにはLAION-5Bなどがある(コンピュータビジョンにおけるデータセット参照)。
- 分子
- 生成AIシステムは、アミノ酸の配列や、DNAやタンパク質を表すSMILESなどの分子表現で訓練することができる。AlphaFoldのようなこれらのシステムは、タンパク質の構造予測や創薬に利用されている[17]。データセットには、さまざまな生物学的データセットが含まれる。
- 音楽
- MusicLMのような生成AIシステムは、レコード音楽のオーディオ波形とテキスト注釈をともに訓練することで、たとえば「歪んだギターリフに乗った落ち着きのあるバイオリンのメロディ」といったテキスト記述に基づいて、新しい音楽サンプルを生成することができる[18]。
- 動画
- 注釈付き動画で訓練された生成AIは、時間的に一貫性のあるビデオクリップを生成することができる。システムの例として、RunwayMLのGen1や[19]、Meta PlatformsのMake-A-Videoがあげられる[20]。
- マルチモーダル
- 生成AIシステムは、複数の生成的モデルから構築することも、複数の種類のデータで訓練された1つのモデルから構築することもできる。たとえば、OpenAIのGPT-4はテキストと画像の両方の入力を受け入れる[21]。
課題[編集]
生成されたデータの品質向上[編集]
生成AIには訓練データが必要になるが、使用された著作物の利用を巡り、データ倫理や著作権上の問題が指摘されている。欧州連合で検討中の生成AI規制法案では、システム構築時に使用する著作物について情報の表示を義務づけられる見込みである。生成AIの普及に伴い、訓練データに著作物が使われることへの懸念が出版社やクリエイターを中心に広がっており、AI企業への訴訟も多数発生している[22][23]。
生成AIの負の側面として、詐欺や思考誘導、世論操作を行う目的で、捏造した顔画像や映像、フェイク音声、フェイク文章といったフェイクメディアを流通させる可能性がある。すでに日本国内においてもStable Diffusionを使って捏造された災害画像が拡散する事例もあり、AIを悪用した詐欺や詐称、名誉毀損は現実の脅威となっている。このため国内外でディープフェイク対策のための研究が進められている[24]。
脚注[編集]
- ^ a b “Anthropic Said to Be Closing In on $300 Million in New A.I. Funding”. en:The New York Times (2023年1月27日). 2023年3月14日閲覧。
- ^ Lanxon, Nate; Bass, Dina; Davalos, Jackie (2023年3月10日). “A Cheat Sheet to AI Buzzwords and Their Meanings”. Bloomberg News 2023年3月14日閲覧。
- ^ Pasick, Adam (2023年3月27日). “Artificial Intelligence Glossary: Neural Networks and Other Terms Explained” (英語). The New York Times. ISSN 0362-4331 2023年4月22日閲覧。
- ^ “Generative models”. OpenAI (2016年6月16日). 2023年5月20日閲覧。
- ^ Metz, Cade. "OpenAI Unveils GPT-4, Months After ChatGPT Stunned Silicon Valley." The New York Times, March 14, 2023, https://www.nytimes.com/2023/03/14/technology/openai-gpt4-chatgpt.html
- ^ Thoppilan, Romal; De Freitas, Daniel; Hall, Jamie; Shazeer, Noam; Kulshreshtha, Apoorv; Cheng, Heng-Tze; Jin, Alicia; Bos, Taylor; Baker, Leslie; Du, Yu; Li, YaGuang; Lee, Hongrae; Zheng, Huaixiu Steven; Ghafouri, Amin; Menegali, Marcelo; Huang, Yanping; Krikun, Maxim; Lepikhin, Dmitry; Qin, James; Chen, Dehao; Xu, Yuanzhong; Chen, Zhifeng; Roberts, Adam; Bosma, Maarten; Zhao, Vincent; Zhou, Yanqi; Chang, Chung-Ching; Krivokon, Igor; Rusch, Will; Pickett, Marc; Srinivasan, Pranesh; Man, Laichee; Meier-Hellstern, Kathleen; Ringel Morris, Meredith; Doshi, Tulsee; Delos Santos, Renelito; Duke, Toju; Soraker, Johnny; Zevenbergen, Ben; Prabhakaran, Vinodkumar; Diaz, Mark; Hutchinson, Ben; Olson, Kristen; Molina, Alejandra; Hoffman-John, Erin; Lee, Josh; Aroyo, Lora; Rajakumar, Ravi; Butryna, Alena; Lamm, Matthew; Kuzmina, Viktoriya; Fenton, Joe; Cohen; Aaron; Bernstein, Rachel; Kurzweil, Ray; Aguera-Arcas, Blaise; Cui, Claire; Croak, Marian; Chi, Ed; Le, Quoc (20 January 2022). "LaMDA: Language Models for Dialog Applications". arXiv:2201.08239 [cs.CL]。
- ^ Roose, Kevin (2022年10月21日). “A Coming-Out Party for Generative A.I., Silicon Valley's New Craze”. The New York Times. 2023年3月14日閲覧。
- ^ “Don't fear an AI-induced jobs apocalypse just yet”. The Economist (2023年3月6日). 2023年3月14日閲覧。
- ^ “Generative AI: Unlocking the future of fashion”. 2023年3月14日閲覧。
- ^ “The race of the AI labs heats up”. The Economist (2023年1月30日). 2023年3月14日閲覧。
- ^ “Google Cloud brings generative AI to developers, businesses, and governments” (2023年3月14日). 2023年3月15日閲覧。
- ^ Justin Hendrix (2023年5月16日). “Transcript: Senate Judiciary Subcommittee Hearing on Oversight of AI”. techpolicy.press. 2023年5月19日閲覧。
- ^ https://www.marktechpost.com/2023/03/21/a-history-of-generative-ai-from-gan-to-gpt-4/
- ^ Bommasani, R; Hudson, DA; Adeli, E; Altman, R; Arora, S; von Arx, S; Bernstein, MS; Bohg, J; Bosselut, A; Brunskill, E; Brynjolfsson, E (16 August 2021). "On the opportunities and risks of foundation models". arXiv:2108.07258 [cs.LG]。
- ^ Chen, Ming; Tworek, Jakub; Jun, Hongyu; Yuan, Qinyuan; Pinto, Hanyu Philippe De Oliveira; Kaplan, Jerry; Edwards, Haley; Burda, Yannick; Joseph, Nicholas; Brockman, Greg; Ray, Alvin (6 July 2021). "Evaluating Large Language Models Trained on Code". arXiv:2107.03374 [cs.LG]。
- ^ Ramesh, Aditya; Pavlov, Mikhail; Goh, Gabriel; Gray, Scott; Voss, Chelsea; Radford, Alec; Chen, Mark; Sutskever, Ilya (2021). "Zero-shot text-to-image generation". International Conference on Machine Learning. PMLR. pp. 8821–8831.
- ^ Heaven, Will Douglas (2023年2月15日). “AI is dreaming up drugs that no one has ever seen. Now we've got to see if they work”. MIT Technology Review. Massachusetts Institute of Technology. 2023年3月15日閲覧。
- ^ Agostinelli, Andrea; Denk, Timo I.; Borsos, Zalán; Engel, Jesse; Verzetti, Mauro; Caillon, Antoine; Huang, Qingqing; Jansen, Aren; Roberts, Adam; Tagliasacchi, Marco; Sharifi, Matt; Zeghidour, Neil; Frank, Christian (26 January 2023). "MusicLM: Generating Music From Text". arXiv:2301.11325 [cs.SD]。
- ^ Metz, Cade (2023年4月4日). “Instant Videos Could Represent the Next Leap in A.I. Technology” (英語). The New York Times. 2023年4月30日閲覧。
- ^ Queenie Wong (2022年9月29日). “Facebook Parent Meta's AI Tool Can Create Artsy Videos From Text”. cnet.com. 2023年4月4日閲覧。
- ^ “Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT?”. Reuters. (2023年3月17日) 2023年3月17日閲覧。
- ^ “「チャットGPT」にEUが要求:情報源を開示せよ”. The Wall Street Journal. 2023年4月28日閲覧。
- ^ "Artists are alarmed by AI — and they're fighting back". The Washington Post (英語). 2023年2月18日閲覧。
- ^ 越前巧、馬場口登、笹原和俊「インフォデミック時代におけるフェイクメディア克服の最前線」『人工知能』人工知能学界 2023年3月号 pp.189 - 196
参考項目[編集]
- 計算論的創造性 - コンピュータを使用して創造性をモデル化、シミュレート、または複製することを目指した学際的な試み
- 人工的創造 - 人間の想像力を人工的にシミュレーションすること
- 人工知能アート - 人工知能プログラムによって制作されたアートワーク、特に画像や楽曲
- 音楽と人工知能 - 国際コンピュータ音楽会議におけるさまざまな課題(音楽の作曲、演奏、理論、デジタル音響処理におけるAIの応用など)
- 敵対的生成ネットワーク - 生成AIに対応する機械学習の枠組みの一つで、2つのニューラルネットワークが互いに競い合う
- Generative pre-trained transformer(GPT) - transformerアーキテクチャに基づく人工ニューラルネットワークの一種
- 大規模言語モデル - 多数のパラメータを持つニューラルネットワークで構成される言語モデル
- 思考実験(無限の猿定理、中国語の部屋)