AI アノテーション用語集

アノテーション用語集

ANNOTEQのご利用をご検討中のお客様、またAIのモデル構築をご検討中の方のために、AIモデル構築におけるアノテーション用語や関連する用語の意味や用途を多数、最大限わかりやすく解説しております。
用語は随時更新されます。ぜひご活用ください。
用語 解説
AI学習モデル
INPUT(入力)に対して、何をOUTPUT(出力)するか、を判断する人工知能の脳を指します。
実際のモノとしては「関数(数式)」になります。

このモデルによって、犬の写真をINPUTすると、その写真が「犬」の写真であることを判断(OUTPUT)し、ある統計データをINPUTすると、その後の予測(OUTPUT)ができるようになります。

AIプロダクトの構築においては、このモデルが非常に重要であり、モデルの精度によって、プロダクトの価値が大きく左右されます。
アノテーション AI学習モデルを構築する上で非常に重要なプロセスの一つです。

AIプロダクトの構築プロセスにおいて、AIモデルが特徴や法則を学習することができるようになるためには、学習のための教師データを取り込むことが必要になります。
この教師データを構築する作業が「アノテーション」と呼ばれるものです。

そのため、この教師データを疎かにすると、AIモデルは特定のINPUTに対して、正しいOUTPUTができないようになるため、アノテーション作業は、作業とは言え非常に重要なプロセスとなっています。

具体的には、写真の中から特定の物体を検出するための教師データとなる「Bounding Box(囲い込み)」や、同じく写真の中から、複数の物体の領域を抽出する「Segmentation」などの作業があります。
例)工場の検品業務における欠陥製品の発見、自動運転における白線・人・信号の認識 等

他にも、音声データから文字を起こす作業や、手書き文字から正しい文字データを作る作業など、構築したいAIプロダクトごとに様々な作業がアノテーション作業の対象となります。
クラウドソーシング AIモデルの学習には、多くの教師データが必要となります。
但し、そのアノテーション作業を実際に実施することは非常に労力と工数がかかる作業となるため、クラウドソーシングを活用するケースが多くなっています。

一般的に「インターネット上の不特定多数に作業を委託することが可能な仕組み」を総称してクラウドソーシングと呼びます。

実際に、Google社は、マイクロタスク型のクラウドソーシングネットワークを保有するFigureEight社とパートナーシップを組み、Googleサービスの強化を行なっています。

※参照:https://jp.techcrunch.com/2018/07/25/2018-07-24-figure-eight-partners-with-google-to-give-automl-developers-better-training-data/
Bounding Box Bounding Boxとは、AIモデルを構築するためのアノテーション作業の一つであり、一般的には、ある画像から、特定の物体を検出するモデルを構築するための作業として行われます。

作業としては、ある画像の中から犬の位置を特定し、アノテーションツールを活用して犬の位置を囲う、といった画像の中の対象物の囲い込み作業になります。囲った位置を座標として取り出し、AIモデルの学習に活用します。
Semantic Segmentation(セマンティックセグメンテーション) Semantic Segmentationとは、AIモデルを構築するためのアノテーション作業の一つであり、画像の中に何が写っているのか、を領域ごとに判断するモデルを構築するための作業として行われます。

作業としては、例えば道路の画像の中で、どこまでが道路で、どこに白線があり、どこにブロックがあるのか、というように、画像内の詳細の情報をピクセル単位で抽出し、対象の区分(道路、白線、ブロックetc.)に分類する作業です。
アノテーションツール AIモデル構築におけるプロセスであるアノテーション作業を行いやすくしてくれる作業システムを指します。
デスクトップにインストールして使用するツールからサーバで動くツール、クラウドで提供されているツールなど様々なツールが存在します。
labelImg Microsoft社の提供する、動画や画像に対してBounding Box等のアノテーション作業を可能にしてくれるアノテーションツールです。

VoTT:https://github.com/Microsoft/VoTT/releases
VoTT Github上で提供されている、画像アノテーション用のアノテーションツールです。

labelImg:https://github.com/tzutalin/labelImg
JSONデータ BoundingBoxやSemanticSegmentationのアノテーション作業を実施後、作業のアウトプットは一般的にJSON形式のファイルデータとして出力されます。

JSONデータには、対象クラスの画像のXY座標等が記述されており、このデータを用いてAIモデルは学習を行います。
labelImg Microsoft社の提供する、動画や画像に対してBounding Box等のアノテーション作業を可能にしてくれるアノテーションツールです。

VoTT:https://github.com/Microsoft/VoTT/releases
※当サイトに掲載されている情報の正確性について、随時、更新・改訂を行い、株式会社ユニメディアとして万全を期すように努めておりますが、当サイトに掲載されている用語の利用に際して利用者が何らかの損害を被ったとしても、株式会社ユニメディアは、いかなる民事上の責任を負うものではありませんので、ご了承くださいませ。
※当サイト内の文章・画像等の内容の無断転載及び複製等の行為はご遠慮くださいませ。
※当サイトに記載の内容に問題がある場合、当社宛までご連絡くださいませ。