コンピュータビジョン
この記事は英語版の対応するページを翻訳することにより充実させることができます。(2023年12月) 翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
|
この記事には複数の問題があります。 |
| 人工知能 |
|---|
|
|
コンピュータビジョン(computer vision)はコンピュータがデジタルな画像、または動画をいかによく理解できるか、ということを扱う研究分野である。工学的には、人間の視覚システムが行うことができるタスクを自動化することを追求する分野である。
この分野はコンピュータが実世界の情報を取得する全ての過程を扱うため、画像センシングのためのハードウェアから情報を認識するための人工知能的理論まで幅広く研究されている。また、近年[いつ?]ではコンピュータグラフィックスとコンピュータビジョンの融合が注目を集めている。
研究対象を大別すると、
- 画像センサ
- 2次元画像処理
- 3次元画像処理
- ステレオ法(コンピュータステレオビジョン)
- エピポーラ幾何
- Shape from X
- 因子分解法 (factorization)
- 認識・識別
- 情報提示
が挙げられる。
これらの技術はロボットビジョン、ウェアラブルコンピュータなどとも深く結びついている。
また、背景知識として信号処理、線型代数などが要求される。人間の目と脳に匹敵するコンピュータビジョンの開発はAI完全な問題とされている。
付録
[編集]コンピュータビジョンの応用分野は、[1] 例えば生産ラインを高速で流れるボトルを検査する産業用マシンビジョンシステムのようなタスクから、周囲の世界を理解できる人工知能やコンピュータ、あるいはロボットの研究まで多岐にわたる。コンピュータビジョンとマシンビジョンの分野は大きく重なっている。コンピュータビジョンは、多くの領域で用いられる画像の自動解析という基盤技術を扱う。マシンビジョンは一般に、産業用途において自動検査やロボット制御を実現するために、画像の自動解析を他の手法・技術と統合するプロセスを指す。コンピュータビジョンの多くの応用では、コンピュータは特定のタスクを解くよう事前にプログラムされているが、現在では機械学習に基づく手法がますます一般的になっている。コンピュータビジョンの応用例には、次のようなシステムがある:[2][3][4]
- 製造工程などにおける自動検査;
- 識別タスクにおける人の支援(例:種の同定システム);[5]
- プロセス制御(例:産業用ロボットの制御);
- イベント検出(例:映像監視や人数カウント。例えば飲食業において);
- MediaPipeは、AIを用いたエッジデバイス上の計算のためのGoogleのオープンソース・プラットフォームであり、例えば顔認識、画像分類、物体検出などに利用できる;
- 作物のモニタリング。例えば、オープンソースのVision Transformersモデル は、農家がイチゴの病害を精度98,4%で自動検出できるように開発された。
- 物体または環境のモデリング(例:医用画像解析や地形モデリング);
- ナビゲーション(例:自動運転車や移動ロボット);
- 拡張現実の動作を可能にするための、3D座標における表面または平面のトラッキング。
- 産業や建設分野における対象物の状態分析。
- 障害のある人を支援する機器・アプリケーション向けの、リアルタイム自動読唇。
道路を走行するためにコンピュータビジョンを使う自動運転車や、写真の中の人物を特定する顔認識プログラムを想像してほしい。画像処理向けAIを開発するチームは、推論結果を得るために効率的な実行環境にしばしば依存している。[6]
2024年におけるコンピュータビジョンの主要分野は、産業(市場規模5,22十億米ドル)、[7] 医療(市場規模2,6十億米ドル)、 軍事(市場規模996,2百万米ドル)。
出典・脚注
[編集]- ^ “Top 12 Practical Applications of Computer Vision: How AI Is Revolutionizing Industries”. pragmile.com. 2026年3月1日閲覧。
- ^ “Design and application of industrial machine vision systems”. www.sciencedirect.com. 2026年3月1日閲覧。
- ^ “50 Computer Vision Examples and Real-World Applications”. blog.roboflow.com. 2026年3月1日閲覧。
- ^ “Top 50+ Real-World Computer Vision Applications Across Industries”. www.lightly.ai. 2026年3月1日閲覧。
- ^ “Plant Species Identification Using Computer Vision Techniques: A Systematic Literature Review”. ncbi.nlm.nih.gov. 2026年3月1日閲覧。
- ^ “How to make an AI: A Step-by-Step Guide”. litslink.com. 2026年3月1日閲覧。
- ^ “What Is Computer Vision and How Is It Being Used in Healthcare?”. healthtechmagazine.net. 2026年3月1日閲覧。
関連項目
[編集]- OpenCV - オープンソースの汎用的なコンピュータビジョンライブラリ。様々な画像処理が標準機能として実装されている。
- Matrox Imaging Library
- 情報学
- マシンビジョン
- 物体認識
- 視覚と自然言語の融合研究 - コンピュータビジョンと自然言語処理の融合分野
外部リンク
[編集]- 画像処理ポータル 画像機器総覧 画像機器総覧は画像処理に関連する製品、技術情報を紹介しているポータルサイト
- CVPR
- ICCV2007
- PAMI
- 数分でComputer Vision を概観