SlideShare uma empresa Scribd logo
1 de 18
Baixar para ler offline
Bag-of-Featuresに基づく物体認識 (2)
         - 一般物体認識 - の締め

          Akisato Kimura @ NTT CS Labs.
                    Twitter ID: @_akisato
データセット
       研究を進める上でとても重要.
           他の人の研究を実装しなくても,精度評価ができる.
           自分の研究をする上で,利点・弱点が見えやすくなる.
       その一方で,過信は禁物.
           Torralba & Efros “Unbiased look at data bias”, CVPR2011




(Cf. 原田先生の関東CV講演資料 http://www.isi.t.u-tokyo.ac.jp/~harada/pdf/trend_in_scene_object_recognition_cvpr2011.pdf)

    2                                       関西CVPRML勉強会 2012.2.18
これからデータセットを紹介しますが
       とにかく大量にあります.
           漏れがあったら教えて下さい.絶対に漏れがあります.
       目的も非常に多様です.
           一般物体認識,画像アノテーション,属性認識,
            物体領域検出,物体領域抽出,…


       羅列するだけだとつまらないので
           中身を見ながら,どうやって使っていければ面白いか,
            どんなものがあると良いのか,議論できれば,と思います.
               あわよくば,へーしゃで作って公開できれば… と妄想




    3                              関西CVPRML勉強会 2012.2.18
統制された小規模データセット(1)
       Columbia Object Image Library (COIL-20/100)
        http://www.cs.columbia.edu/CAVE/software/softlib/coil-20.php
        http://www.cs.columbia.edu/CAVE/software/softlib/coil-100.php
           特定物体認識 (7.2K/36K枚,20/100クラス)
       Corel 5K (注: 商用画像のため,画像そのものはon-lineでは取れません)
        http://lear.inrialpes.fr/people/guillaumin/data.php
           画像アノテーション (5K枚)
       Caltech 101/256
        http://www.vision.caltech.edu/Image_Datasets/Caltech101/
        http://www.vision.caltech.edu/Image_Datasets/Caltech256/
           一般物体認識 (~30K枚,101/256クラス)
       PASCAL Visual Object Classes (VOC) Challenge
        http://pascallin.ecs.soton.ac.uk/challenges/VOC/
           一般物体認識/検出 (15K枚,20クラス)/領域分割 : 一般物体認識のdefacto




    4                               関西CVPRML勉強会 2012.2.18
統制された小規模データセット(1)
       IAPR TC-12
        http://www.imageclef.org/photodata
           画像アノテーション (20K枚,20クラス),画像説明文生成
       MSRC
        http://research.microsoft.com/en-us/projects/objectclassrecognition/default.aspx
           一般物体認識 (10K枚)/領域抽出 (830枚,32クラス) : 領域抽出のdefacto
       LSP15
        http://www.cs.unc.edu/~lazebnik/
           シーン認識 (4.5K枚,15クラス) : シーン認識のdefacto
       MIT Indoor 67
        http://web.mit.edu/torralba/www/indoor.html
           シーン認識




    5                                      関西CVPRML勉強会 2012.2.18
統制された中規模データセット
       LabelMe http://labelme.csail.mit.edu/
           タスク: 画像アノテーション (200K枚,70Kクラス)
       ImageNet Large Sale Visual Recognition Challenge
        http://www.image-net.org/challenges/LSVRC/2011/
           タスク: 一般物体認識/検出 (1.15M枚,1Kクラス)
           一般物体認識を対象とした統制データセットでは最大規模
       NUS-WIDE     http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm
           タスク: 画像アノテーション (300K枚,5Kクラス)
       ImageCLEF Wikipedia Image Retrieval Datasets
        http://www.imageclef.org/wikidata
           タスク: 画像アノテーション,画像説明文生成 (200K枚,50クラス)
       SUN397     http://people.csail.mit.edu/jxiao/SUN/
           タスク: シーン認識 (130K枚,900クラス) : おそらく今後のシーン認識のdefacto




    6                                関西CVPRML勉強会 2012.2.18
非統制の大規模データセット(0)
       まずはここを見ましょう.
        http://d.hatena.ne.jp/n_hidekey/20120115/1326613794
         大規模データセットを作ること自体も研究課題に




                          以下では,ここに挙がっていないものを紹介します.




    7                          関西CVPRML勉強会 2012.2.18
非統制の大規模データセット(1)
       Visual Synset    [GeorgiaTech + Google @ ICCV2011]
        http://cpl.cc.gatech.edu/projects/VisualSynset/
         タスク: 画像アノテーション (200M枚,300Kクラス)
         ただし,アノテーション+画像URLだけの配布




    8                         関西CVPRML勉強会 2012.2.18
非統制の大規模データセット(2)
       Classemes          [Dartmouth + MSRC @ ECCV2010]
        http://www.cs.dartmouth.edu/~lorenzo/projects/classemes/
         属性認識 (2.7Kクラス)
         本来はdescriptor抽出のために作られたのだが…
             Descriptorは超コンパクトで(比較的)高性能です




                Walking,
    9           straight           関西CVPRML勉強会 2012.2.18
統制された大規模データセット
    ImageNet [Prinston @ ICCV2009]
     http://www.image-net.org/
        タスク: 一般物体・シーン認識 (14M枚,20Kクラス)
        クラスの概念的階層構造も公開 (WordNet対応)




    10                     関西CVPRML勉強会 2012.2.18
映像データセット(1)
    TREC Video Retrieval Evaluation (TRECVID)
     http://trecvid.nist.gov/
        統制された映像ベンチマークとして唯一無二の存在
        2012 competitionで予定されているタスク
          SIN : 所定の単語に適合する映像区間を探す
                このタスクが最も一般物体認識に近い
            KIS : 所定の文章に適合する映像区間を探す
            SED : 所定の人物行動を含む映像区間を探す
            INS : 所定の画像サンプルと同クラスの映像区間を探す
                このタスクも一般物体認識に関連する
            MED : 所定のイベントに適合する映像区間を探す

    11                    関西CVPRML勉強会 2012.2.18
映像データセット(2)
    YouTube data     http://netsg.cs.sfu.ca/youtubedata/
        YouTube APIから回収したメタデータを整理して提供
        ので,映像そのものは自分で取りに行かないといけない




    12                      関西CVPRML勉強会 2012.2.18
画像検索API
    画像をたくさん集めたいだけならば,活用しない手はない.
    Yahoo!
     http://developer.yahoo.com/search/image/V1/imageSearch.html
    Google Picasa
     http://code.google.com/intl/ja/apis/picasaweb/overview.html
        画像検索API http://developers.google.com/image-search は廃止予定
    Bing
     http://www.bing.com/toolbox/bingdeveloper/
        検索系APIが一体になっている
    Yahoo! Japan
     http://developer.yahoo.co.jp/webapi/search/imagesearch/v2/ima
     gesearch.html
    YouTube
     http://code.google.com/intl/ja/apis/youtube/overview.html
    13                         関西CVPRML勉強会 2012.2.18
Social annotation
    単純画像/映像共有系
        Flickr http://www.flickr.com
        Picasa http://picasa.google.com/intl/ja/
        YouTube http://www.youtube.com
    位置情報共有系
        Foursquare http://ja.foursquare.com
        Panoramio http://www.panoramio.com
    Social media直結
        Twitpic http://twitpic.com
        Photobucket http://photobucket.com (Twitterバックエンド)
        mixiフォト http://photo.mixi.jp
        Instagram http://instagr.am
        画ちゃんこ! http://gotchanco.com
    14                           関西CVPRML勉強会 2012.2.18
まとめ                    と称した雑感(1)
    一般物体認識を含めた認識系は



                             とても赤い海
        一般物体認識は機械学習手法のベンチマークへ
            にも関わらず,本質的な問題は未解決のまま
        属性認識・転移学習がこの1年くらいの中心に
            と言っても,そう長く持つほどの分野でもなさそう
        Social mediaとの連携は,近いうちに間違いなく訪れる.
            純粋なsocial media研究との違いを出せるか? が課題
        その次は何か? ないかもしれない.

    15                    関西CVPRML勉強会 2012.2.18
まとめ                    と称した雑感(2)
    にもかかわらず,一方では                                   課題山積


                                                  (注:MS PPT内蔵GrabCutの結果)



        実は,決め手となる応用先が見つかっていない.
            同じ問題にみんなが群がるのはその影響?
        大規模化と信頼性とのトレードオフからどう脱却するか?
            正解データを作るための苦労は果てしない
            Amazon MTの結果をきれいにするためのAmazon MTの結果をきれ
             いにするためのAmazon MTの結果をきうわなにをするや
        そもそも,画像を見てみんな同じタグをつけるの?
            認識の過程には避けようがない不定性がある

    16                    関西CVPRML勉強会 2012.2.18
参考文献
    原田達也
     “CVPR2011における一般物体シーン認識のトレンド,”
      第14回関東CV勉強会 http://ow.ly/9984J

    n_hidekeyの日記 http://d.hatena.ne.jp/n_hidekey/
        次世代BoVWまとめ,大規模画像データセット,Paper
         Gestalt など,その他にも興味深い記事があります.
    高橋昌一郎 「知性の限界」 講談社
     http://amazon.jp/dp/4062880482/
        認識過程にある不定性について理解できます.
        書評 http://blog.livedoor.jp/dankogai/archives/51437132.html


    17                           関西CVPRML勉強会 2012.2.18
おしまい




18     関西CVPRML勉強会 2012.2.18

Mais conteúdo relacionado

Mais procurados

3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向Kensho Hara
 
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知るKazuki Nakajima
 
CNNチュートリアル
CNNチュートリアルCNNチュートリアル
CNNチュートリアルIkuro Sato
 
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3Toshinori Hanya
 
Introduction to YOLO detection model
Introduction to YOLO detection modelIntroduction to YOLO detection model
Introduction to YOLO detection modelWEBFARMER. ltd.
 
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までーDeep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までーnlab_utokyo
 
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single MachineFast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single MachineTakuya Minagawa
 
物体検出の話Up用
物体検出の話Up用物体検出の話Up用
物体検出の話Up用Takashi Abe
 
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2Daiki Shimada
 
R-CNNの原理とここ数年の流れ
R-CNNの原理とここ数年の流れR-CNNの原理とここ数年の流れ
R-CNNの原理とここ数年の流れKazuki Motohashi
 
[論文紹介] Convolutional Neural Network(CNN)による超解像
[論文紹介] Convolutional Neural Network(CNN)による超解像[論文紹介] Convolutional Neural Network(CNN)による超解像
[論文紹介] Convolutional Neural Network(CNN)による超解像Rei Takami
 
畳み込みニューラルネットワークが なぜうまくいくのか?についての手がかり
畳み込みニューラルネットワークが なぜうまくいくのか?についての手がかり畳み込みニューラルネットワークが なぜうまくいくのか?についての手がかり
畳み込みニューラルネットワークが なぜうまくいくのか?についての手がかりtm_2648
 
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Hirokatsu Kataoka
 
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)cvpaper. challenge
 
Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?
Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?
Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?kazuki ide
 
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -Hironobu Fujiyoshi
 

Mais procurados (20)

3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
 
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
 
CNNチュートリアル
CNNチュートリアルCNNチュートリアル
CNNチュートリアル
 
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
Object Detection & Instance Segmentationの論文紹介 | OHS勉強会#3
 
Introduction to YOLO detection model
Introduction to YOLO detection modelIntroduction to YOLO detection model
Introduction to YOLO detection model
 
MIRU2018 tutorial
MIRU2018 tutorialMIRU2018 tutorial
MIRU2018 tutorial
 
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までーDeep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
 
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single MachineFast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
 
20150414seminar
20150414seminar20150414seminar
20150414seminar
 
物体検出の話Up用
物体検出の話Up用物体検出の話Up用
物体検出の話Up用
 
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
 
R-CNNの原理とここ数年の流れ
R-CNNの原理とここ数年の流れR-CNNの原理とここ数年の流れ
R-CNNの原理とここ数年の流れ
 
[論文紹介] Convolutional Neural Network(CNN)による超解像
[論文紹介] Convolutional Neural Network(CNN)による超解像[論文紹介] Convolutional Neural Network(CNN)による超解像
[論文紹介] Convolutional Neural Network(CNN)による超解像
 
畳み込みニューラルネットワークが なぜうまくいくのか?についての手がかり
畳み込みニューラルネットワークが なぜうまくいくのか?についての手がかり畳み込みニューラルネットワークが なぜうまくいくのか?についての手がかり
畳み込みニューラルネットワークが なぜうまくいくのか?についての手がかり
 
ILSVRC2015 手法のメモ
ILSVRC2015 手法のメモILSVRC2015 手法のメモ
ILSVRC2015 手法のメモ
 
20150930
2015093020150930
20150930
 
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)
 
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)
 
Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?
Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?
Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?
 
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
次世代セキュリティを牽引する画像解析技術の最新動向 - 距離情報を用いた物体認識技術 -
 

Destaque

SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)Takanori Ogata
 
20110904cvsaisentan(shirasy) 3 4_3
20110904cvsaisentan(shirasy) 3 4_320110904cvsaisentan(shirasy) 3 4_3
20110904cvsaisentan(shirasy) 3 4_3Yoichi Shirasawa
 
関西CVPRML勉強会(特定物体認識) 2012.1.14
関西CVPRML勉強会(特定物体認識) 2012.1.14関西CVPRML勉強会(特定物体認識) 2012.1.14
関西CVPRML勉強会(特定物体認識) 2012.1.14Akisato Kimura
 
Leveraging Visual Question Answering for Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answering for Image-Caption Ranking (関東CV勉強会 ECCV ...Yoshitaka Ushiku
 
画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量takaya imai
 
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチHironobu Fujiyoshi
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成Yoshitaka Ushiku
 

Destaque (7)

SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 
20110904cvsaisentan(shirasy) 3 4_3
20110904cvsaisentan(shirasy) 3 4_320110904cvsaisentan(shirasy) 3 4_3
20110904cvsaisentan(shirasy) 3 4_3
 
関西CVPRML勉強会(特定物体認識) 2012.1.14
関西CVPRML勉強会(特定物体認識) 2012.1.14関西CVPRML勉強会(特定物体認識) 2012.1.14
関西CVPRML勉強会(特定物体認識) 2012.1.14
 
Leveraging Visual Question Answering for Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answering for Image-Caption Ranking (関東CV勉強会 ECCV ...
 
画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
 
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成
 

Semelhante a 関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)

東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太Preferred Networks
 
Creating and Using Links between Data Objects
Creating and Using Links between Data ObjectsCreating and Using Links between Data Objects
Creating and Using Links between Data ObjectsMitsuo Yamamoto
 
広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16Akisato Kimura
 
TERAS Conference
TERAS ConferenceTERAS Conference
TERAS ConferenceKeiju Anada
 
機械学習応用システムの開発技術 (機械学習工学) の現状と今後の展望
機械学習応用システムの開発技術(機械学習工学)の現状と今後の展望機械学習応用システムの開発技術(機械学習工学)の現状と今後の展望
機械学習応用システムの開発技術 (機械学習工学) の現状と今後の展望 Nobukazu Yoshioka
 
手と物体とのInteractionを検出するアプリケーションの開発
手と物体とのInteractionを検出するアプリケーションの開発手と物体とのInteractionを検出するアプリケーションの開発
手と物体とのInteractionを検出するアプリケーションの開発Morpho, Inc.
 
物体検出コンペティションOpen Imagesに挑む
物体検出コンペティションOpen Imagesに挑む物体検出コンペティションOpen Imagesに挑む
物体検出コンペティションOpen Imagesに挑むHiroto Honda
 
Pred net使ってみた
Pred net使ってみたPred net使ってみた
Pred net使ってみたkoji ochiai
 
【2016.12】cvpaper.challenge2016
【2016.12】cvpaper.challenge2016【2016.12】cvpaper.challenge2016
【2016.12】cvpaper.challenge2016cvpaper. challenge
 
[DL輪読会]Deep Face Recognition: A Survey
[DL輪読会]Deep Face Recognition: A Survey[DL輪読会]Deep Face Recognition: A Survey
[DL輪読会]Deep Face Recognition: A SurveyDeep Learning JP
 
Opencv object detection_takmin
Opencv object detection_takminOpencv object detection_takmin
Opencv object detection_takminTakuya Minagawa
 
2012 kanemotolablecture1
2012 kanemotolablecture12012 kanemotolablecture1
2012 kanemotolablecture1ytanno
 
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状Keiichiro Ono
 
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)Shintaro Yoshida
 
Machine learning microservice_management
Machine learning microservice_managementMachine learning microservice_management
Machine learning microservice_managementyusuke shibui
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Preferred Networks
 
20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasyYoichi Shirasawa
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~nlab_utokyo
 

Semelhante a 関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット) (20)

東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
 
Creating and Using Links between Data Objects
Creating and Using Links between Data ObjectsCreating and Using Links between Data Objects
Creating and Using Links between Data Objects
 
広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16広島画像情報学セミナ 2011.9.16
広島画像情報学セミナ 2011.9.16
 
TERAS Conference
TERAS ConferenceTERAS Conference
TERAS Conference
 
CNTK deep dive
CNTK deep diveCNTK deep dive
CNTK deep dive
 
機械学習応用システムの開発技術 (機械学習工学) の現状と今後の展望
機械学習応用システムの開発技術(機械学習工学)の現状と今後の展望機械学習応用システムの開発技術(機械学習工学)の現状と今後の展望
機械学習応用システムの開発技術 (機械学習工学) の現状と今後の展望
 
手と物体とのInteractionを検出するアプリケーションの開発
手と物体とのInteractionを検出するアプリケーションの開発手と物体とのInteractionを検出するアプリケーションの開発
手と物体とのInteractionを検出するアプリケーションの開発
 
物体検出コンペティションOpen Imagesに挑む
物体検出コンペティションOpen Imagesに挑む物体検出コンペティションOpen Imagesに挑む
物体検出コンペティションOpen Imagesに挑む
 
Pred net使ってみた
Pred net使ってみたPred net使ってみた
Pred net使ってみた
 
【2016.12】cvpaper.challenge2016
【2016.12】cvpaper.challenge2016【2016.12】cvpaper.challenge2016
【2016.12】cvpaper.challenge2016
 
[DL輪読会]Deep Face Recognition: A Survey
[DL輪読会]Deep Face Recognition: A Survey[DL輪読会]Deep Face Recognition: A Survey
[DL輪読会]Deep Face Recognition: A Survey
 
Opencv object detection_takmin
Opencv object detection_takminOpencv object detection_takmin
Opencv object detection_takmin
 
2012 kanemotolablecture1
2012 kanemotolablecture12012 kanemotolablecture1
2012 kanemotolablecture1
 
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
 
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
 
ICCV2019 report
ICCV2019 reportICCV2019 report
ICCV2019 report
 
Machine learning microservice_management
Machine learning microservice_managementMachine learning microservice_management
Machine learning microservice_management
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
 
20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy20120623 cv勉強会 shirasy
20120623 cv勉強会 shirasy
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
 

Mais de Akisato Kimura

Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...Akisato Kimura
 
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...Akisato Kimura
 
多変量解析の一般化
多変量解析の一般化多変量解析の一般化
多変量解析の一般化Akisato Kimura
 
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移についてCVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移についてAkisato Kimura
 
NIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imaginationNIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imaginationAkisato Kimura
 
CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"Akisato Kimura
 
CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)Akisato Kimura
 
Computational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cuesComputational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cuesAkisato Kimura
 
NIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear timeNIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear timeAkisato Kimura
 
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...Akisato Kimura
 
ICCV2013 reading: Learning to rank using privileged information
ICCV2013 reading: Learning to rank using privileged informationICCV2013 reading: Learning to rank using privileged information
ICCV2013 reading: Learning to rank using privileged informationAkisato Kimura
 
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...Akisato Kimura
 
IJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphsIJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphsAkisato Kimura
 
関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.10.28関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.10.28Akisato Kimura
 
関西CVPR勉強会 2012.7.29
関西CVPR勉強会 2012.7.29関西CVPR勉強会 2012.7.29
関西CVPR勉強会 2012.7.29Akisato Kimura
 
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -Akisato Kimura
 
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明Akisato Kimura
 
立命館大学 AMLコロキウム 2011.10.20
立命館大学 AMLコロキウム 2011.10.20立命館大学 AMLコロキウム 2011.10.20
立命館大学 AMLコロキウム 2011.10.20Akisato Kimura
 
関西CVPRML勉強会 2011.9.23
関西CVPRML勉強会 2011.9.23関西CVPRML勉強会 2011.9.23
関西CVPRML勉強会 2011.9.23Akisato Kimura
 

Mais de Akisato Kimura (20)

Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
 
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
 
多変量解析の一般化
多変量解析の一般化多変量解析の一般化
多変量解析の一般化
 
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移についてCVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
 
NIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imaginationNIPS2015 reading - Learning visual biases from human imagination
NIPS2015 reading - Learning visual biases from human imagination
 
CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"CVPR2015 reading "Global refinement of random forest"
CVPR2015 reading "Global refinement of random forest"
 
CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)CVPR2015 reading "Understainding image virality" (in Japanese)
CVPR2015 reading "Understainding image virality" (in Japanese)
 
Computational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cuesComputational models of human visual attention driven by auditory cues
Computational models of human visual attention driven by auditory cues
 
NIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear timeNIPS2014 reading - Top rank optimization in linear time
NIPS2014 reading - Top rank optimization in linear time
 
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
 
ICCV2013 reading: Learning to rank using privileged information
ICCV2013 reading: Learning to rank using privileged informationICCV2013 reading: Learning to rank using privileged information
ICCV2013 reading: Learning to rank using privileged information
 
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
 
IJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphsIJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphs
 
関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.10.28関西CVPR勉強会 2012.10.28
関西CVPR勉強会 2012.10.28
 
関西CVPR勉強会 2012.7.29
関西CVPR勉強会 2012.7.29関西CVPR勉強会 2012.7.29
関西CVPR勉強会 2012.7.29
 
ICWSM12 Brief Review
ICWSM12 Brief ReviewICWSM12 Brief Review
ICWSM12 Brief Review
 
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
 
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
 
立命館大学 AMLコロキウム 2011.10.20
立命館大学 AMLコロキウム 2011.10.20立命館大学 AMLコロキウム 2011.10.20
立命館大学 AMLコロキウム 2011.10.20
 
関西CVPRML勉強会 2011.9.23
関西CVPRML勉強会 2011.9.23関西CVPRML勉強会 2011.9.23
関西CVPRML勉強会 2011.9.23
 

Último

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 

Último (9)

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 

関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)

  • 1. Bag-of-Featuresに基づく物体認識 (2) - 一般物体認識 - の締め Akisato Kimura @ NTT CS Labs. Twitter ID: @_akisato
  • 2. データセット  研究を進める上でとても重要.  他の人の研究を実装しなくても,精度評価ができる.  自分の研究をする上で,利点・弱点が見えやすくなる.  その一方で,過信は禁物.  Torralba & Efros “Unbiased look at data bias”, CVPR2011 (Cf. 原田先生の関東CV講演資料 http://www.isi.t.u-tokyo.ac.jp/~harada/pdf/trend_in_scene_object_recognition_cvpr2011.pdf) 2 関西CVPRML勉強会 2012.2.18
  • 3. これからデータセットを紹介しますが  とにかく大量にあります.  漏れがあったら教えて下さい.絶対に漏れがあります.  目的も非常に多様です.  一般物体認識,画像アノテーション,属性認識, 物体領域検出,物体領域抽出,…  羅列するだけだとつまらないので  中身を見ながら,どうやって使っていければ面白いか, どんなものがあると良いのか,議論できれば,と思います.  あわよくば,へーしゃで作って公開できれば… と妄想 3 関西CVPRML勉強会 2012.2.18
  • 4. 統制された小規模データセット(1)  Columbia Object Image Library (COIL-20/100) http://www.cs.columbia.edu/CAVE/software/softlib/coil-20.php http://www.cs.columbia.edu/CAVE/software/softlib/coil-100.php  特定物体認識 (7.2K/36K枚,20/100クラス)  Corel 5K (注: 商用画像のため,画像そのものはon-lineでは取れません) http://lear.inrialpes.fr/people/guillaumin/data.php  画像アノテーション (5K枚)  Caltech 101/256 http://www.vision.caltech.edu/Image_Datasets/Caltech101/ http://www.vision.caltech.edu/Image_Datasets/Caltech256/  一般物体認識 (~30K枚,101/256クラス)  PASCAL Visual Object Classes (VOC) Challenge http://pascallin.ecs.soton.ac.uk/challenges/VOC/  一般物体認識/検出 (15K枚,20クラス)/領域分割 : 一般物体認識のdefacto 4 関西CVPRML勉強会 2012.2.18
  • 5. 統制された小規模データセット(1)  IAPR TC-12 http://www.imageclef.org/photodata  画像アノテーション (20K枚,20クラス),画像説明文生成  MSRC http://research.microsoft.com/en-us/projects/objectclassrecognition/default.aspx  一般物体認識 (10K枚)/領域抽出 (830枚,32クラス) : 領域抽出のdefacto  LSP15 http://www.cs.unc.edu/~lazebnik/  シーン認識 (4.5K枚,15クラス) : シーン認識のdefacto  MIT Indoor 67 http://web.mit.edu/torralba/www/indoor.html  シーン認識 5 関西CVPRML勉強会 2012.2.18
  • 6. 統制された中規模データセット  LabelMe http://labelme.csail.mit.edu/  タスク: 画像アノテーション (200K枚,70Kクラス)  ImageNet Large Sale Visual Recognition Challenge http://www.image-net.org/challenges/LSVRC/2011/  タスク: 一般物体認識/検出 (1.15M枚,1Kクラス)  一般物体認識を対象とした統制データセットでは最大規模  NUS-WIDE http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm  タスク: 画像アノテーション (300K枚,5Kクラス)  ImageCLEF Wikipedia Image Retrieval Datasets http://www.imageclef.org/wikidata  タスク: 画像アノテーション,画像説明文生成 (200K枚,50クラス)  SUN397 http://people.csail.mit.edu/jxiao/SUN/  タスク: シーン認識 (130K枚,900クラス) : おそらく今後のシーン認識のdefacto 6 関西CVPRML勉強会 2012.2.18
  • 7. 非統制の大規模データセット(0)  まずはここを見ましょう. http://d.hatena.ne.jp/n_hidekey/20120115/1326613794  大規模データセットを作ること自体も研究課題に 以下では,ここに挙がっていないものを紹介します. 7 関西CVPRML勉強会 2012.2.18
  • 8. 非統制の大規模データセット(1)  Visual Synset [GeorgiaTech + Google @ ICCV2011] http://cpl.cc.gatech.edu/projects/VisualSynset/  タスク: 画像アノテーション (200M枚,300Kクラス)  ただし,アノテーション+画像URLだけの配布 8 関西CVPRML勉強会 2012.2.18
  • 9. 非統制の大規模データセット(2)  Classemes [Dartmouth + MSRC @ ECCV2010] http://www.cs.dartmouth.edu/~lorenzo/projects/classemes/  属性認識 (2.7Kクラス)  本来はdescriptor抽出のために作られたのだが…  Descriptorは超コンパクトで(比較的)高性能です Walking, 9 straight 関西CVPRML勉強会 2012.2.18
  • 10. 統制された大規模データセット  ImageNet [Prinston @ ICCV2009] http://www.image-net.org/  タスク: 一般物体・シーン認識 (14M枚,20Kクラス)  クラスの概念的階層構造も公開 (WordNet対応) 10 関西CVPRML勉強会 2012.2.18
  • 11. 映像データセット(1)  TREC Video Retrieval Evaluation (TRECVID) http://trecvid.nist.gov/  統制された映像ベンチマークとして唯一無二の存在  2012 competitionで予定されているタスク  SIN : 所定の単語に適合する映像区間を探す  このタスクが最も一般物体認識に近い  KIS : 所定の文章に適合する映像区間を探す  SED : 所定の人物行動を含む映像区間を探す  INS : 所定の画像サンプルと同クラスの映像区間を探す  このタスクも一般物体認識に関連する  MED : 所定のイベントに適合する映像区間を探す 11 関西CVPRML勉強会 2012.2.18
  • 12. 映像データセット(2)  YouTube data http://netsg.cs.sfu.ca/youtubedata/  YouTube APIから回収したメタデータを整理して提供  ので,映像そのものは自分で取りに行かないといけない 12 関西CVPRML勉強会 2012.2.18
  • 13. 画像検索API  画像をたくさん集めたいだけならば,活用しない手はない.  Yahoo! http://developer.yahoo.com/search/image/V1/imageSearch.html  Google Picasa http://code.google.com/intl/ja/apis/picasaweb/overview.html  画像検索API http://developers.google.com/image-search は廃止予定  Bing http://www.bing.com/toolbox/bingdeveloper/  検索系APIが一体になっている  Yahoo! Japan http://developer.yahoo.co.jp/webapi/search/imagesearch/v2/ima gesearch.html  YouTube http://code.google.com/intl/ja/apis/youtube/overview.html 13 関西CVPRML勉強会 2012.2.18
  • 14. Social annotation  単純画像/映像共有系  Flickr http://www.flickr.com  Picasa http://picasa.google.com/intl/ja/  YouTube http://www.youtube.com  位置情報共有系  Foursquare http://ja.foursquare.com  Panoramio http://www.panoramio.com  Social media直結  Twitpic http://twitpic.com  Photobucket http://photobucket.com (Twitterバックエンド)  mixiフォト http://photo.mixi.jp  Instagram http://instagr.am  画ちゃんこ! http://gotchanco.com 14 関西CVPRML勉強会 2012.2.18
  • 15. まとめ と称した雑感(1)  一般物体認識を含めた認識系は とても赤い海  一般物体認識は機械学習手法のベンチマークへ  にも関わらず,本質的な問題は未解決のまま  属性認識・転移学習がこの1年くらいの中心に  と言っても,そう長く持つほどの分野でもなさそう  Social mediaとの連携は,近いうちに間違いなく訪れる.  純粋なsocial media研究との違いを出せるか? が課題  その次は何か? ないかもしれない. 15 関西CVPRML勉強会 2012.2.18
  • 16. まとめ と称した雑感(2)  にもかかわらず,一方では 課題山積 (注:MS PPT内蔵GrabCutの結果)  実は,決め手となる応用先が見つかっていない.  同じ問題にみんなが群がるのはその影響?  大規模化と信頼性とのトレードオフからどう脱却するか?  正解データを作るための苦労は果てしない  Amazon MTの結果をきれいにするためのAmazon MTの結果をきれ いにするためのAmazon MTの結果をきうわなにをするや  そもそも,画像を見てみんな同じタグをつけるの?  認識の過程には避けようがない不定性がある 16 関西CVPRML勉強会 2012.2.18
  • 17. 参考文献  原田達也 “CVPR2011における一般物体シーン認識のトレンド,”  第14回関東CV勉強会 http://ow.ly/9984J  n_hidekeyの日記 http://d.hatena.ne.jp/n_hidekey/  次世代BoVWまとめ,大規模画像データセット,Paper Gestalt など,その他にも興味深い記事があります.  高橋昌一郎 「知性の限界」 講談社 http://amazon.jp/dp/4062880482/  認識過程にある不定性について理解できます.  書評 http://blog.livedoor.jp/dankogai/archives/51437132.html 17 関西CVPRML勉強会 2012.2.18
  • 18. おしまい 18 関西CVPRML勉強会 2012.2.18