「畳み込みニューラルネットワーク」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
doi
3行目: 3行目:
[[機械学習]]において、'''畳み込みニューラルネットワーク'''(たたみこみニューラルネットワーク、{{lang-en-short|Convolutional neural network}}、略称: '''CNN'''または'''ConvNet''')は、{{仮リンク|順伝播型ニューラルネットワーク|en|Feedforward neural network|label=順伝播型}}人工ディープ[[ニューラルネットワーク]]の一種である。画像や動画認識に広く使われているモデルである。
[[機械学習]]において、'''畳み込みニューラルネットワーク'''(たたみこみニューラルネットワーク、{{lang-en-short|Convolutional neural network}}、略称: '''CNN'''または'''ConvNet''')は、{{仮リンク|順伝播型ニューラルネットワーク|en|Feedforward neural network|label=順伝播型}}人工ディープ[[ニューラルネットワーク]]の一種である。画像や動画認識に広く使われているモデルである。


CNNは最小限の[[データ前処理]]しか必要としないように設計された[[多層パーセプトロン]]のバリエーションを使用する<ref name="LeCun">{{cite web|url=http://yann.lecun.com/exdb/lenet/|title=LeNet-5, convolutional neural networks|last=LeCun|first=Yann|accessdate=16 November 2013}}</ref>。CNNは、その重み(行列の)共有構造と並進不変特性に基づいて、'''シフト不変'''(shift invariant)あるいは'''位置不変'''(space invariant)'''人工ニューラルネットワーク'''('''SIANN''')とも呼ばれている<ref name=":0">{{Cite journal|last=Zhang|first=Wei|date=1988|title=Shift-invariant pattern recognition neural network and its optical architecture|url=https://drive.google.com/file/d/0B65v6Wo67Tk5Zm03Tm1kaEdIYkE/view?usp=sharing|journal=Proceedings of annual conference of the Japan Society of Applied Physics|volume=|issue=|doi=|pmid=|access-date=|via=}}</ref><ref name=":1">{{Cite journal|last=Zhang|first=Wei|date=1990|title=Parallel distributed processing model with local space-invariant interconnections and its optical architecture|url=https://drive.google.com/file/d/0B65v6Wo67Tk5ODRzZmhSR29VeDg/view?usp=sharing|journal=Applied Optics|volume=29|issue=32|doi=|pmid=|access-date=|via=}}</ref>。
CNNは最小限の[[データ前処理]]しか必要としないように設計された[[多層パーセプトロン]]のバリエーションを使用する<ref name=fukuneoscholar>{{cite journal | last1 = Fukushima | first1 = K. | year = 2007 | title = Neocognitron | url = | journal = Scholarpedia | volume = 2 | issue = 1| page = 1717 | doi=10.4249/scholarpedia.1717}}</ref><ref name="intro">{{cite journal|last=Fukushima|first=Kunihiko|title=Neocognitron: A Self-organizing Neural Network Model for a Mechanism of Pattern Recognition Unaffected by Shift in Position|journal=Biological Cybernetics|year=1980|volume=36|issue=4|pages=193–202|url=http://www.cs.princeton.edu/courses/archive/spr08/cos598B/Readings/Fukushima1980.pdf|accessdate=16 November 2013|doi=10.1007/BF00344251|pmid=7370364}}</ref><ref name="LeCun">{{cite web|url=http://yann.lecun.com/exdb/lenet/|title=LeNet-5, convolutional neural networks|last=LeCun|first=Yann|accessdate=16 November 2013}}</ref>。CNNは、その重み(行列の)共有構造と並進不変特性に基づいて、'''シフト不変'''(shift invariant)あるいは'''位置不変'''(space invariant)'''人工ニューラルネットワーク'''('''SIANN''')とも呼ばれている<ref name=":0">{{Cite journal|last=Zhang|first=Wei|date=1988|title=Shift-invariant pattern recognition neural network and its optical architecture|url=https://drive.google.com/file/d/0B65v6Wo67Tk5Zm03Tm1kaEdIYkE/view?usp=sharing|journal=Proceedings of annual conference of the Japan Society of Applied Physics|volume=|issue=|doi=|pmid=|access-date=|via=}}</ref><ref name=":1">{{Cite journal|last=Zhang|first=Wei|date=1990|title=Parallel distributed processing model with local space-invariant interconnections and its optical architecture|url=https://drive.google.com/file/d/0B65v6Wo67Tk5ODRzZmhSR29VeDg/view?usp=sharing|journal=Applied Optics|volume=29|issue=32|doi=|pmid=|access-date=|via=}}</ref>。


畳み込みネットワークは[[生物学]]的過程から[[数理生物学|発想]]を得た<ref name="robust face detection">{{cite journal|last=Matusugu|first=Masakazu|year=2003|title=Subject independent facial expression recognition with robust face detection using a convolutional neural network|url=http://www.iro.umontreal.ca/~pift6080/H09/documents/papers/sparse/matsugo_etal_face_expression_conv_nnet.pdf|journal=Neural Networks|volume=16|issue=5|pages=555–559|doi=10.1016/S0893-6080(03)00115-1|author2=Katsuhiko Mori|author3=Yusuke Mitari|author4=Yuji Kaneda|accessdate=17 November 2013}}</ref>。畳み込みネットワーク中の[[人工神経|ニューロン]]間の結合パターンは、動物の[[視覚野]]の配置から着想を得ている。{{仮リンク|視野|en|Visual field|FIXME=1}}{{要曖昧さ回避|date=2018-8-21}}の限定された領域における刺激にのみ応答する個々の[[大脳皮質|皮質ニューロン]]は[[受容野]]と呼ばれる。異なるニューロンの受容野は全視野を覆うように部分的に重なり合っている。
畳み込みネットワークは[[生物学]]的過程から[[数理生物学|発想]]を得た<ref name="robust face detection">{{cite journal|last=Matusugu|first=Masakazu|year=2003|title=Subject independent facial expression recognition with robust face detection using a convolutional neural network|url=http://www.iro.umontreal.ca/~pift6080/H09/documents/papers/sparse/matsugo_etal_face_expression_conv_nnet.pdf|journal=Neural Networks|volume=16|issue=5|pages=555–559|doi=10.1016/S0893-6080(03)00115-1|author2=Katsuhiko Mori|author3=Yusuke Mitari|author4=Yuji Kaneda|accessdate=17 November 2013}}</ref>。畳み込みネットワーク中の[[人工神経|ニューロン]]間の結合パターンは、動物の[[視覚野]]の配置から着想を得ている。{{仮リンク|視野|en|Visual field|FIXME=1}}{{要曖昧さ回避|date=2018-8-21}}の限定された領域における刺激にのみ応答する個々の[[大脳皮質|皮質ニューロン]]は[[受容野]]と呼ばれる。異なるニューロンの受容野は全視野を覆うように部分的に重なり合っている。

2020年1月24日 (金) 05:16時点における版

機械学習において、畳み込みニューラルネットワーク(たたみこみニューラルネットワーク、: Convolutional neural network、略称: CNNまたはConvNet)は、順伝播型人工ディープニューラルネットワークの一種である。画像や動画認識に広く使われているモデルである。

CNNは最小限のデータ前処理しか必要としないように設計された多層パーセプトロンのバリエーションを使用する[1][2][3]。CNNは、その重み(行列の)共有構造と並進不変特性に基づいて、シフト不変(shift invariant)あるいは位置不変(space invariant)人工ニューラルネットワークSIANN)とも呼ばれている[4][5]

畳み込みネットワークは生物学的過程から発想を得た[6]。畳み込みネットワーク中のニューロン間の結合パターンは、動物の視覚野の配置から着想を得ている。視野[要リンク修正][要曖昧さ回避]の限定された領域における刺激にのみ応答する個々の皮質ニューロン受容野と呼ばれる。異なるニューロンの受容野は全視野を覆うように部分的に重なり合っている。

CNNは他の画像分類アルゴリズムと比較して比較的小さい前処理を用いる。これは、CNNが、伝統的なアルゴリズムでは人の手で設計されていたフィルターを学習することを意味する。この特徴量設計における予備知識と人間の努力からの独立がCNNの大きな利点である。

CNNは画像・動画認識レコメンダシステム[7]自然言語処理[8]に応用されている。

脚注

  1. ^ Fukushima, K. (2007). “Neocognitron”. Scholarpedia 2 (1): 1717. doi:10.4249/scholarpedia.1717. 
  2. ^ Fukushima, Kunihiko (1980). “Neocognitron: A Self-organizing Neural Network Model for a Mechanism of Pattern Recognition Unaffected by Shift in Position”. Biological Cybernetics 36 (4): 193–202. doi:10.1007/BF00344251. PMID 7370364. http://www.cs.princeton.edu/courses/archive/spr08/cos598B/Readings/Fukushima1980.pdf 2013年11月16日閲覧。. 
  3. ^ LeCun, Yann. “LeNet-5, convolutional neural networks”. 2013年11月16日閲覧。
  4. ^ Zhang, Wei (1988). “Shift-invariant pattern recognition neural network and its optical architecture”. Proceedings of annual conference of the Japan Society of Applied Physics. https://drive.google.com/file/d/0B65v6Wo67Tk5Zm03Tm1kaEdIYkE/view?usp=sharing. 
  5. ^ Zhang, Wei (1990). “Parallel distributed processing model with local space-invariant interconnections and its optical architecture”. Applied Optics 29 (32). https://drive.google.com/file/d/0B65v6Wo67Tk5ODRzZmhSR29VeDg/view?usp=sharing. 
  6. ^ Matusugu, Masakazu; Katsuhiko Mori; Yusuke Mitari; Yuji Kaneda (2003). “Subject independent facial expression recognition with robust face detection using a convolutional neural network”. Neural Networks 16 (5): 555–559. doi:10.1016/S0893-6080(03)00115-1. http://www.iro.umontreal.ca/~pift6080/H09/documents/papers/sparse/matsugo_etal_face_expression_conv_nnet.pdf 2013年11月17日閲覧。. 
  7. ^ van den Oord, Aaron; Dieleman, Sander; Schrauwen, Benjamin (2013-01-01). Burges, C. J. C.. ed. Deep content-based music recommendation. Curran Associates, Inc.. pp. 2643–2651. http://papers.nips.cc/paper/5004-deep-content-based-music-recommendation.pdf 
  8. ^ Collobert, Ronan; Weston, Jason (2008-01-01). “A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning”. Proceedings of the 25th International Conference on Machine Learning. ICML '08 (New York, NY, USA: ACM): 160–167. doi:10.1145/1390156.1390177. ISBN 978-1-60558-205-4. https://doiorg/10.1145/1390156.1390177. 

関連項目