Computer Vision Terms Glossary: Computer Vision Terms in 2024
A
Activation Function
アクティベーション関数は、人工神経ネットワーク内のニューロンの出力に適用される数学的関数で、非線形性を導入し、複雑なマッピングを学ぶことを可能にします。
Anomaly Detection
Anomaly Detection は、予想される行動から大きく異なるパターンまたはインスタンスを識別し、標識付けるプロセスです。
Artificial Neural Networks (Anns)
人工ニューラルネットワーク(ANNs)は、人間の脳の生物学的ニューラルネットワークにインスピレーションを与えた計算モデルであり、複雑なタスクを解決するために使用されます。
B
Background Subtraction
Background Subtraction は、コンピュータビジョンのプロセスで、ビデオまたは画像のシーケンスから前面のオブジェクトまたは領域を隔離し、抽出することを含む。
Backpropagation
Backpropagation は、人工のニューラルネットワークの訓練に使用されるアルゴリズムで、ネットワークのパラメータに関して損失機能のグラディエントが再計算され、重量を更新するために使用される。
Bag-Of-Words (Bow)
Bag-of-Words (BoW) は、自然言語処理とコンピュータビジョンにおける人気のある機能表示技術であり、テキストや画像を非分類された機能のコレクションとして扱います。
Biometric Identification
バイオメトリック識別は、指紋、虹膜パターン、または歩行分析などの独自の身体的または行動的特徴に基づいて個人を識別するプロセスであり、しばしばセキュリティやアクセス制御システムに使用されます。
Biometrics
バイオメトリックは、個人の独自の身体的または行動的特徴の測定と分析を指し、しばしば識別目的で使用されます。
C
Camera Calibration
カメラカリブレーションは、カメラのパラメータと固有性質を推定し、正確な3D再構築または測定を可能にするプロセスです。
Camera Pose Estimation
Camera Pose Estimationは、カメラの観測されたシーンに対する3D位置と方向性を決定する作業であり、しばしば拡張現実やロボットアプリケーションで使用される。
Classification
分類は、入力データをその特徴や特徴に基づいて事前定義されたクラスまたはカテゴリに分類するプロセスである。
Computer Vision
コンピュータビジョンは、コンピュータがデジタル画像やビデオから視覚情報を理解し解釈することを可能にすることに焦点を当てた研究分野です。
Convolutional Neural Network
Convolutional Neural Network (CNN) は、視覚データ、特に画像を処理および分析するために設計された神経ネットワークの一種です。
Convolutional Neural Network (Cnn)
Convolutional Neural Network (CNN) は、コンピュータビジョンタスクで一般的に使用される深いニューラルネットワークの一種で、画像などのグリッドのようなデータを処理するために特別に設計されています。
Convolutional Neural Networks
Convolutional Neural Networks (CNNs) は、コンピュータビジョンタスクで頻繁に使用される視覚データを処理および分析するために特別に設計された深層学習モデルです。
Corner Detection
角検出は、コンピュータビジョンのプロセスで、画像内の角や興味のある点を識別し、位置づけることを含む。
D
Data Annotation
Data Annotation は、トレーニングおよび評価の目的のためにメタデータまたは真実情報でデータをラベルまたはタグ化するプロセスです。
Data Augmentation
Data Augmentation は、既存のデータにさまざまな変換や修正を適用することによって、トレーニングデータセットのサイズや多様性を人工的に増やすためのテクニックです。
Data Labeling
Data Labeling は、画像やビデオなどのデータに注釈やラベルを割り当て、機械学習モデルのトレーニングまたは検証データセットを作成するプロセスです。
Deep Learning
Deep Learningは、複数の層を持つ人工ニューラルネットワークを訓練し、データから機能を学習し抽出することに焦点を当てている機械学習のサブフィールドです。
Deep Neural Networks
深層ニューラルネットワークは複雑な人工ニューラルネットワークで、複数の隠された層を有し、より複雑なパターンや抽象を学び処理するように設計されています。
Depth Estimation
深度推定は、2D画像やビデオからシーンの3D深度情報を推定する作業です。
Depth Map
深度マップは、通常、ステレオビジョンまたは深度推定アルゴリズムによって生成されるシーンの距離または深度情報の2D表示です。
E
Edge Detection
エッジ検出は、画像内のオブジェクトの境界またはエッジを識別することを含むコンピュータビジョンのプロセスです。
Edge Enhancement
Edge Enhancement は、画像内のエッジの可視性と強調を向上させるためのテクニックです。
F
Facial Recognition
Facial Recognitionは、コンピュータアルゴリズムを使用して、顔の特徴に基づいて個人を識別し、検証する技術です。
Feature Descriptor
A Feature Descriptor is a compact representation of a keypoint or local feature within an image, typically used for tasks such as feature matching, image registration, or object recognition. 機能記述器は、画像内のキーポイントまたはローカル機能のコンパクトな表示であり、通常、機能の匹敵、画像登録、またはオブジェクト認識などのタスクに使用されます。
Feature Detection
Feature Detection は、画像内の特定の構造やパターンを識別するプロセスであり、例えばエッジやコーナーです。
Feature Extraction
機能抽出は、画像などの原始データを重要かつ有意義な情報をキャプチャする表示に変換するプロセスです。
Feature Matching
Feature Matching は、コンピュータビジョンのプロセスで、画像間の機能やキーポイントを比較し、一致させることです。
Fine-Tuning
Fine-tuning は、事前訓練されたモデルが特定のタスクまたはデータセットにさらに訓練または適応される移転学習のプロセスです。
Foreground Detection
フォーグラウンド検出(Foreground Detection)は、ビデオまたは画像のシーケンス内の静的またはダイナミックな背景からフォーグラウンドオブジェクトを分離するためのテクニックです。
Foreground Estimation
Foreground Estimation は、画像やビデオ内のフォーグラウンドピクセルまたは領域を推定するタスクで、フォーグラウンド抽出、オブジェクトトラッキング、または監視などのタスクにしばしば使用されます。
Foreground Segmentation
フォーグラウンドセグメントは、画像やビデオの背景からフロントオブジェクトを分離するプロセスです。
G
Generative Adversarial Network
Generative Adversarial Network (GAN) は、2つのニューラルネットワーク、ジェネレーターと差別器で構成される深層学習アーキテクチャの一種で、現実的なデータを生成するために敵対的な方法で訓練されています。
Generative Adversarial Networks
Generative Adversarial Networks (GANs) は、2つのニューラルネットワーク、ジェネレーターと差別装置で構成される深層学習モデルで、現実的な合成データを生成するために協力する。
Generative Adversarial Networks (Gans)
Generative Adversarial Networks (GANs) は、新しいデータサンプルを生成するために、ジェネレーターと差別ネットワークから構成される深層学習モデルのクラスです。
Gesture Recognition
ジェスチャー認識は、コンピュータビジョン技術を使用して、手の動きや体の姿勢などの人間のジェスチャーを解釈し、理解するプロセスです。
H
Heatmap
ヒートマップは、画像内の情報の強度または密度を表すためにカラーコーディングを使用する視覚化技術です。
Histogram Equalization
Histogram Equalization は、そのピクセルの強度を再分布することによって画像の対比性とダイナミック範囲を向上させるための技術です。
Histogram Of Oriented Gradients (Hog)
HOG(Histogram of Oriented Gradients)は、オブジェクト検出および認識に一般的に使用される機能説明器で、局所のオブジェクトの形状および外観に関する情報を抽出します。
Human Pose Estimation
Human Pose Estimationは、画像やビデオ内の人のポーズまたは体のキーポイントの位置を推定する作業です。
I
Image Annotation
Image Annotation は、オブジェクト境界ボックス、セグメントマスク、または記述ラベルなどのメタデータで画像をラベル化またはタグ化するプロセスを指し、監督された学習や分析を可能にする。
Image Classification
Image Classification は、コンピュータビジョンのタスクまたはカテゴリをそのコンテンツまたは特性に基づいて入力画像に割り当てることに関連するタスクです。
Image Compression
画像圧縮は、画像のファイルサイズを減らすために使用される技術を指し、視覚品質の許容可能なレベルを維持します。
Image Denoising
Image Denoising は、画像から騒音や望ましくないアーティファクトを除去するプロセスです。
Image Enhancement
Image Enhancement は、画像の品質または視覚的外観を向上させるために使用される技術を指します。
Image Inpainting
Image Inpainting は、画像の欠落または破損した部分を、信頼できるコンテンツで埋め込む作業です。
Image Morphing
Image Morphing は、中間フレームの連続を作成することによって、一つの画像を別の画像にスムーズに変換するプロセスです。
Image Processing
画像処理は、数学的操作を使用して画像を強化、分析、または変更するために使用される技術を指します。
Image Recognition
画像認識は、コンピュータシステムがデジタル画像内のオブジェクトやパターンを識別し、分類する能力です。
Image Recognition System
画像認識システムは、画像内のオブジェクト、パターン、または機能を認識し、識別するように設計されたコンピュータビジョンシステムであり、しばしば監視、品質管理、または自動ナビゲーションなどのさまざまなアプリケーションに使用されます。
Image Reconstruction
画像再構築は、限られたまたは不完全な画像データから高品質の画像を生成するプロセスであり、しばしば医療イメージングやリモートセンサーアプリケーションで使用されます。
Image Registration
画像登録は、同じシーンの異なる画像を共通の座標システムに調和または変換するプロセスです。
Image Restoration
Image Restoration は、通常、デノイジング、デブラーリング、または inpainting などのテクニックを通じて、劣化または損傷した画像の視覚的品質を向上させるプロセスを含みます。
Image Retrieval
Image Retrieval は、画像コンテンツに基づいて、特定のクエリ画像に類似または関連する大規模な画像データベースから画像を取得するタスクです。
Image Segmentation
イメージセグメントは、画像を複数の有意義なセグメントまたは領域に分割するプロセスです。
Image Segmentation Algorithms
イメージセグメントアルゴリズムは、強度、色、テクスチャ、または動きなどの特定の基準に基づいて、意味のある領域またはセグメントに画像を分割するために使用される計算方法または技術です。
Image Segmentation Evaluation
Image Segmentation Evaluation は、生成された分割結果を地上の真実の注釈や手動のラベルと比較することによって、画像の分割アルゴリズムの品質と正確性を評価することを意味します。
Image Stitching
Image Stitching は、複数の画像を重複する視点フィールドと組み合わせ、より大きな複合画像を作成するプロセスです。
Image Super-Resolution
Image Super-Resolution は、低解像度の入力画像から高解像度の画像を生成するプロセスです。
Image Synthesis
イメージ合成は、データの入力画像の特定のセットまたは望ましい属性とリアルかつ視覚的に一致する新しい画像を生成するプロセスであり、しばしばコンピュータグラフィックス、仮想現実、または深層学習のためのデータ拡張に使用されます。
Image-Based Lighting
Image-Based Lightingは、高ダイナミックレンジ(HDR)画像を使用して、現実世界のシーンの照明情報を正確にキャプチャし、表示し、そのシーン内のコンピュータ生成オブジェクトの現実的なレンダリングと照明を可能にします。
Image-Based Localization
Image-Based Localization は、カメラやロボットの位置と方向性を、自動ナビゲーションや拡張現実などのタスクにしばしば使用される画像から得られた視覚情報を用いて環境内で評価する作業です。
Image-Based Modeling
Image-Based Modelingは、仮想現実、拡張現実、または3Dビジュアル化などのアプリケーションを可能にする2D画像のセットからオブジェクトまたはシーンの3Dモデルを再構築する技術です。
Image-Based Rendering
イメージベースのレンダリング(IBR)は、入力画像のセットに基づいてシーンまたはオブジェクトの新しい視点を生成し、3D再構築または視点合成を可能にする技術です。
Instance Recognition
インスタンス認識は、画像内のオブジェクトのインスタンスを認識し、識別するタスクであり、しばしばその位置、ポーズ、およびインスタンス特有の情報を識別することを含む。
Instance Segmentation
インスタンスセグメントは、単にオブジェクトをセグメントするだけでなく、同じオブジェクトクラスの個々のインスタンスを区別するというより高度な形式の画像セグメントです。
K
Keypoint Description
Keypoint Description は、画像内の特定のキーポイントのコンパクトで差別的な記述子を生成するプロセスです。
Keypoint Detection
Keypoint Detection は、イメージ内の特定の関心点またはキーポイントを識別し、位置づけるプロセスです。
L
Loss Function
損失関数は、コスト関数または客観関数とも呼ばれ、モデルの予測された出力とトレーニング中の真の目標出力の間の差異またはエラーを測定します。
M
Matched Filtering
Matched Filtering is a signal processing technique used in image processing to enhance the detection of specific patterns or features in an image by filtering it with a template or matching filter. マッチされたフィルタリングは、テンプレートまたはマッチングフィルターでそれをフィルタリングすることによって、画像の特定のパターンまたは機能の検出を強化するために画像処理で使用されるシグナル処理技術です。
Mean Average Precision (Map)
Mean Average Precision (mAP) は、オブジェクト検出と認識アルゴリズムのパフォーマンスを評価するための一般的な評価メトリックです。
Mean-Shift
Mean-Shift is an iterative algorithm used to find the modes or peaks in a probability density function, often applied to image segmentation and tracking. Mean-Shiftは、確率密度関数におけるモードまたはピークを見つけるために使用されるイテラティブアルゴリズムで、しばしば画像のセグメントおよびトラッキングに適用されます。
Model Evaluation
モデル評価は、訓練された機械学習モデルのパフォーマンスまたは精度をさまざまな指標や評価基準を使用して評価するプロセスです。
Motion Detection
モーション検出は、ビデオシーケンス内のオブジェクトの動きを検出し、追跡するプロセスで、しばしば監視や活動認識に使用されます。
Motion Estimation
Motion Estimationは、ビデオシーケンス内の連続フレーム間の動きを推定するプロセスであり、ビデオ圧縮、オブジェクトトラッキング、ビデオ安定化などのタスクに使用することができます。
Motion Tracking
モーション・トラッキングは、画像のシーケンスを分析して、物体の動きを追跡したり、カメラ自体の動きをキャプチャすることを意味します。
O
Object Detection
オブジェクト検出は、画像やビデオ内のオブジェクトを識別し、位置づけることを含むコンピュータビジョンのタスクです。
Object Recognition
Object Recognition は、画像またはビデオ内の特定のオブジェクトまたはインスタンスを識別し、分類する作業です。
Object Segmentation
Object Segmentation は、画像を異なる領域またはセグメントに分割するプロセスであり、各セグメントは別々のオブジェクトまたは興味のある領域を表しています。
Object Tracking
Object Tracking は、画像またはビデオフレームの連続で物体または人の動きを追跡し、監視するプロセスです。
Optical Character Recognition
Optical Character Recognition(OCR)は、画像やスキャンされた文書からテキストを抽出し、編集可能で検索可能なテキストに変換するための技術です。
Optical Character Recognition (Ocr)
OCR(Optical Character Recognition)は、テキストの画像を機械で読み取れるテキストに変換するための技術です。
Optical Flow
Optical Flow は、画像またはビデオフレームの連続内のオブジェクト、表面、およびエッジの明らかな動きのパターンです。
Overfitting
Overfitting は機械学習の現象で、モデルがトレーニングデータでうまく行うが、新しい、目に見えないデータで一般化し、うまく行わない。
P
Pattern Recognition
パターン認識は、データ内のパターンや規則性を識別し、分類する作業であり、しばしばコンピュータビジョンでは、オブジェクト認識や画像分析に使用されます。
Pooling
パウリングは、機能マップの空間的次元を減らし、計算の複雑さを減らし、ネットワークを空間的変異に対してより強力にするコンボラクシャルニューラルネットワーク(CNNs)の技術です。
Pose Estimation
Pose Estimation は、画像またはビデオ内の物体または人の姿勢、位置、方向を推定する作業です。
Precision
精度は、正確に予測された正しいインスタンスの割合を予測された正しいインスタンスの合計から測定するためのパフォーマンスメトリクスです。
R
Real-Time Object Detection
リアルタイムオブジェクト検出は、リアルタイムでビデオまたは画像ストリーム内のオブジェクトを検出し、認識する作業であり、自動運転、ロボット、または監視システムなどのアプリケーションで頻繁に使用されます。
Real-Time Tracking
リアルタイム・トラッキングとは、ビデオシーケンス内のオブジェクトの動きをリアルタイムで継続的に正確に追跡するプロセスです。
Recall
Recall は、正しく予測されたポジティブなインスタンスの割合を実際のポジティブなインスタンスの合計数から測定するためのパフォーマンスメトリックです。
Recurrent Neural Networks (Rnns)
Recurrent Neural Networks (RNNs) は、それぞれのステップに同じ重量を繰り返し適用するセクションデータ処理のために設計された人工神経ネットワークの一種です。
Region Of Interest (Roi)
ROIとは、画像やビデオフレーム内の特定の領域または部分を指し、分析または処理に特に興味があります。
Robot Vision
ロボットビジョン(Robot Vision)は、ロボットが視覚情報を使用して環境を認識し、理解し、相互作用することを可能にすることに焦点を当てているコンピュータビジョンのサブフィールドです。
S
Saliency Detection
Saliency Detection は、画像またはシーンの内で最も視覚的に特徴的な領域またはオブジェクトを識別するプロセスです。
Scale-Invariant Feature Transform (Sift)
Scale-Invariant Feature Transform (SIFT) は、スケールと回転に変わらず、画像内のローカルな特徴を検出し、記述する人気のある機能検出と記述技術です。
Semantic Feature Extraction
Semantic Feature Extraction is the process of extracting high-level semantic or meaningful features from images. Semantic Feature Extraction is the process of extracting high-level semantic or meaningful features from images. Semantic Feature Extraction is the process of extracting high-level semantic or meaningful features from images.
Semantic Segmentation
セマンティックセグメンテーションは、イメージをそれぞれの意味に基づいて異なる領域またはセグメントに分割するプロセスです。
Semantic Understanding
セマンティック理解は、視覚データからより高いレベルの意味や理解を抽出し、低レベルの機能抽出やパターン認識を超えています。
Shadow Detection
Shadow Detection は、画像やビデオ内の影の領域と非影の領域を識別し、区別する作業であり、しばしばオブジェクト認識、シーン理解、または自律的なナビゲーションなどのさまざまなアプリケーションに使用されます。
Spatial Filtering
空間フィルタリングは、ピクセルごとにピクセルの周辺を用いて新しい出力画像を生成する画像のフィルタリングの種類であり、しばしばノイズ削減、エッジ強化、または機能抽出などのタスクに使用されます。
Speeded Up Robust Features (Surf)
Speeded Up Robust Features (SURF) は、SIFT よりも効率的に設計された画像のローカル機能を検出し、記述する機能検出および記述技術です。
Stereo Vision
ステレオビジョンは、深さと3D情報を推定するために、異なる視点から撮影された2つ以上の画像を使用する技術です。
Structured Light
構造光は、正確な3D再構築または深度推定を可能にするために、既知の地理的形状または照明のパターンをシーンまたはオブジェクトにプロジェクトする技術です。
Super-Resolution
スーパー解像度は、画像の解像度を元の品質を超えて向上させるプロセスです。
Superpixel Segmentation
Superpixel Segmentationは、ピクセルを感覚的に有意義で一貫した領域に集め、しばしばさまざまなコンピュータビジョンタスクのプロセッサステップとして使用する技術です。
Supervised Learning
監督学習は、アルゴリズムがラベルまたは注釈された例を使用してパターンや関係を学ぶ機械学習の一種です。
T
Texture Analysis
テクスチャ分析は、画像内のテクスチャパターンを特徴付け、記述するプロセスです。
Texture Synthesis
テクスチャ合成は、データサンプルのテクスチャに似た新しいテクスチャを生成するプロセスであり、テクスチャ分析、画像編集、またはコンピュータグラフィックスなどのタスクにしばしば使用されます。
Transfer Learning
転送学習は、一つのタスクまたはドメインからの事前訓練されたモデルや知識が異なるが関連するタスクまたはドメインに適用される機械学習のテクニックです。
U
Underfitting
Underfitting は、機械学習の現象で、モデルが単純すぎるか、データの基礎構造をキャプチャする能力が欠如し、パフォーマンスが低下する。
Unsupervised Learning
無監督学習は、アルゴリズムがタグ付けまたは注釈された例なしにデータのパターンや関係を学ぶ機械学習の一種です。
V
Video Compression
ビデオ圧縮は、ビデオのサイズまたはデータ速度を減らす過程を指し、しばしば効率的なストレージまたは転送のために使用される視覚品質の許容可能なレベルを維持します。
Video Object Detection
ビデオオブジェクト検出は、ビデオシーケンス内の興味のあるオブジェクトを検出し、位置付け、しばしばリアルタイムまたはほぼリアルタイムのシナリオで行います。
Video Stabilization
ビデオ安定化は、ビデオシーケンスから望ましくないカメラの動きや振動を除去するプロセスであり、よりスムーズで安定したビデオ出力につながります。
Video Summarization
ビデオ概要は、しばしばキーフレームを選択または重要なイベントを抽出することによって、長いビデオシーケンスの簡潔な概要または表示を生成するプロセスです。
Video Surveillance
ビデオ監視は、ビデオカメラを使用して特定の地域や施設の活動を監視し、記録する。
Visual Object Tracking
Visual Object Tracking は、ビデオ シーケンス内の興味のあるオブジェクトを追跡または追跡する作業であり、しばしば閉鎖、スケールの変更、または視点の変動が存在する場合です。
Visual Odometry
Visual Odometryは、入力ビデオシーケンスの分析に基づいてカメラの軌道または動きを推定するプロセスです。
Visual Saliency
Visual Saliency は、画像内の領域またはオブジェクトの顕著さまたは重要性を指し、しばしば画像の品質評価、オブジェクト認識、またはビデオの概要化などのタスクに使用されます。
Visual Search
Visual Search は、ユーザーがテキストベースの検索用語ではなく、画像をクエリとして使用する大規模な画像データベースを検索することを可能にするプロセスです。